diff --git a/REDMI.md b/REDMI.md index e1e44ef..e576df7 100644 --- a/REDMI.md +++ b/REDMI.md @@ -1 +1,53 @@ -# PRAKTIKUMmachinelearning \ No newline at end of file +# PRAKTIKUMmachinelearning + +Muhammad Bintang Mudzaffar +202310715001 F5A2 + +# Regression +Regression adalah metode supervised learning untuk memprediksi nilai numerik/kontinu berdasarkan hubungan antara input (features) dan output. +Artinya, regresi mencari pola matematis pada data sehingga model bisa menghasilkan angka baru dari data baru. + +Tujuan Regresi +-Memahami hubungan antara variabel independen (X) dan variabel dependen (Y). +-Memprediksi nilai masa depan atau nilai yang tidak diketahui. +-Melihat pengaruh masing-masing variabel terhadap target. + +jenis-jenis regression +1. Linear Regression +Hubungan linear (garis lurus) antara X dan Y,Hanya 1 variabel input,Rumus: Y = a + bX,Contoh: jam belajar → nilai. + +2. Multiple Linear Regression +Sama seperti linear regression, tapi dengan lebih dari 1 variabel input,Rumus: Y = a + b₁X₁ + b₂X₂ + .,Contoh: harga rumah → luas, kamar, lokasi, dll. + +3. Polynomial Regression +Hubungan tidak linear, tetapi bisa dibentuk menjadi kurva (ada X², X³),Mengatasi data yang pola hubungan X–Y melengkung,Rumus: Y = a + b₁X + b₂X² + ... + +4. Nonlinear Regression +Hubungan benar-benar tidak linear dan tidak bisa dijelaskan oleh garis atau polinomial sederhana,Bentuknya bisa eksponensial, logaritmik, atau sigmoid.Contoh: pertumbuhan populasi, reaksi kimia. + +# Classification +Classification adalah metode supervised learning untuk mengelompokkan data ke dalam kelas/kategori tertentu. +Outputnya bukan angka kontinu, tetapi label seperti: +-Spam / Not spam +-Sakit / Sehat +-Kucing / Anjing + +Tujuan Classification +-Memprediksi kelas yang tepat berdasarkan pola pada data. +-Mengelompokkan data baru ke dalam kategori tertentu. +-Membantu pengambilan keputusan (misalnya sistem diagnosis penyakit). + +Jenis-jenis Classification +1. Decision Tree +Model berbentuk pohon keputusan,Membagi data berdasarkan pertanyaan seperti “apakah X > 5?”,Mudah dipahami, hasilnya jelas,Risiko: bisa overfitting jika pohon terlalu dalam. + +2. K-Nearest Neighbor (KNN) +Klasifikasi berdasarkan tetangga terdekat,Data baru akan ikut kelas mayoritas dari K data paling dekat,Sederhana, tetapi lambat untuk dataset besar,Butuh perhitungan jarak (Euclidean, Manhattan, dll). + +3. Logistic Regression +Meski namanya regresi, ini dipakai untuk klasifikasi,Menghasilkan probabilitas suatu data termasuk kelas tertentu,Cocok untuk binary classification (ya/tidak, 0/1),Simple dan cepat. + +4. Support Vector Machine (SVM) +Mencari garis/pembatas terbaik (hyperplane) yang memisahkan kelas,Sangat bagus untuk dataset kecil dan pola kompleks,Bisa menangani data non-linear dengan kernel (RBF, polynomial),Relatif berat untuk dataset yang sangat besar. + +Kucing / Anjing \ No newline at end of file