51 lines
2.6 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# PRAKTIKUMmachinelearning
Muhammad Bintang Mudzaffar
202310715001 F5A2
# Regression
Regression adalah metode supervised learning untuk memprediksi nilai numerik/kontinu berdasarkan hubungan antara input (features) dan output.
Artinya, regresi mencari pola matematis pada data sehingga model bisa menghasilkan angka baru dari data baru.
Tujuan Regresi
-Memahami hubungan antara variabel independen (X) dan variabel dependen (Y).
-Memprediksi nilai masa depan atau nilai yang tidak diketahui.
-Melihat pengaruh masing-masing variabel terhadap target.
jenis-jenis regression
1. Linear Regression
Hubungan linear (garis lurus) antara X dan Y,Hanya 1 variabel input,Rumus: Y = a + bX,Contoh: jam belajar → nilai.
2. Multiple Linear Regression
Sama seperti linear regression, tapi dengan lebih dari 1 variabel input,Rumus: Y = a + b₁X₁ + b₂X₂ + .,Contoh: harga rumah → luas, kamar, lokasi, dll.
3. Polynomial Regression
Hubungan tidak linear, tetapi bisa dibentuk menjadi kurva (ada X², X³),Mengatasi data yang pola hubungan XY melengkung,Rumus: Y = a + b₁X + b₂X² + ...
4. Nonlinear Regression
Hubungan benar-benar tidak linear dan tidak bisa dijelaskan oleh garis atau polinomial sederhana,Bentuknya bisa eksponensial, logaritmik, atau sigmoid.Contoh: pertumbuhan populasi, reaksi kimia.
# Classification
Classification adalah metode supervised learning untuk mengelompokkan data ke dalam kelas/kategori tertentu.
Outputnya bukan angka kontinu, tetapi label seperti:
-Spam / Not spam
-Sakit / Sehat
-Kucing / Anjing
Tujuan Classification
-Memprediksi kelas yang tepat berdasarkan pola pada data.
-Mengelompokkan data baru ke dalam kategori tertentu.
-Membantu pengambilan keputusan (misalnya sistem diagnosis penyakit).
Jenis-jenis Classification
1. Decision Tree
Model berbentuk pohon keputusan,Membagi data berdasarkan pertanyaan seperti “apakah X > 5?”,Mudah dipahami, hasilnya jelas,Risiko: bisa overfitting jika pohon terlalu dalam.
2. K-Nearest Neighbor (KNN)
Klasifikasi berdasarkan tetangga terdekat,Data baru akan ikut kelas mayoritas dari K data paling dekat,Sederhana, tetapi lambat untuk dataset besar,Butuh perhitungan jarak (Euclidean, Manhattan, dll).
3. Logistic Regression
Meski namanya regresi, ini dipakai untuk klasifikasi,Menghasilkan probabilitas suatu data termasuk kelas tertentu,Cocok untuk binary classification (ya/tidak, 0/1),Simple dan cepat.
4. Support Vector Machine (SVM)
Mencari garis/pembatas terbaik (hyperplane) yang memisahkan kelas,Sangat bagus untuk dataset kecil dan pola kompleks,Bisa menangani data non-linear dengan kernel (RBF, polynomial),Relatif berat untuk dataset yang sangat besar.