PRAKTIKUMmachinelearning
Muhammad Bintang Mudzaffar
202310715001 F5A2
Regression
Regression adalah metode supervised learning untuk memprediksi nilai numerik/kontinu berdasarkan hubungan antara input (features) dan output. Artinya, regresi mencari pola matematis pada data sehingga model bisa menghasilkan angka baru dari data baru.
Tujuan Regresi -Memahami hubungan antara variabel independen (X) dan variabel dependen (Y). -Memprediksi nilai masa depan atau nilai yang tidak diketahui. -Melihat pengaruh masing-masing variabel terhadap target.
jenis-jenis regression
-
Linear Regression Hubungan linear (garis lurus) antara X dan Y,Hanya 1 variabel input,Rumus: Y = a + bX,Contoh: jam belajar → nilai.
-
Multiple Linear Regression Sama seperti linear regression, tapi dengan lebih dari 1 variabel input,Rumus: Y = a + b₁X₁ + b₂X₂ + .,Contoh: harga rumah → luas, kamar, lokasi, dll.
-
Polynomial Regression Hubungan tidak linear, tetapi bisa dibentuk menjadi kurva (ada X², X³),Mengatasi data yang pola hubungan X–Y melengkung,Rumus: Y = a + b₁X + b₂X² + ...
-
Nonlinear Regression Hubungan benar-benar tidak linear dan tidak bisa dijelaskan oleh garis atau polinomial sederhana,Bentuknya bisa eksponensial, logaritmik, atau sigmoid.Contoh: pertumbuhan populasi, reaksi kimia.
Classification
Classification adalah metode supervised learning untuk mengelompokkan data ke dalam kelas/kategori tertentu. Outputnya bukan angka kontinu, tetapi label seperti: -Spam / Not spam -Sakit / Sehat -Kucing / Anjing
Tujuan Classification -Memprediksi kelas yang tepat berdasarkan pola pada data. -Mengelompokkan data baru ke dalam kategori tertentu. -Membantu pengambilan keputusan (misalnya sistem diagnosis penyakit).
Jenis-jenis Classification
-
Decision Tree Model berbentuk pohon keputusan,Membagi data berdasarkan pertanyaan seperti “apakah X > 5?”,Mudah dipahami, hasilnya jelas,Risiko: bisa overfitting jika pohon terlalu dalam.
-
K-Nearest Neighbor (KNN) Klasifikasi berdasarkan tetangga terdekat,Data baru akan ikut kelas mayoritas dari K data paling dekat,Sederhana, tetapi lambat untuk dataset besar,Butuh perhitungan jarak (Euclidean, Manhattan, dll).
-
Logistic Regression Meski namanya regresi, ini dipakai untuk klasifikasi,Menghasilkan probabilitas suatu data termasuk kelas tertentu,Cocok untuk binary classification (ya/tidak, 0/1),Simple dan cepat.
-
Support Vector Machine (SVM) Mencari garis/pembatas terbaik (hyperplane) yang memisahkan kelas,Sangat bagus untuk dataset kecil dan pola kompleks,Bisa menangani data non-linear dengan kernel (RBF, polynomial),Relatif berat untuk dataset yang sangat besar.