53 lines
2.6 KiB
Markdown
53 lines
2.6 KiB
Markdown
# PRAKTIKUMmachinelearning
|
||
|
||
Muhammad Bintang Mudzaffar
|
||
202310715001 F5A2
|
||
|
||
# Regression
|
||
Regression adalah metode supervised learning untuk memprediksi nilai numerik/kontinu berdasarkan hubungan antara input (features) dan output.
|
||
Artinya, regresi mencari pola matematis pada data sehingga model bisa menghasilkan angka baru dari data baru.
|
||
|
||
Tujuan Regresi
|
||
-Memahami hubungan antara variabel independen (X) dan variabel dependen (Y).
|
||
-Memprediksi nilai masa depan atau nilai yang tidak diketahui.
|
||
-Melihat pengaruh masing-masing variabel terhadap target.
|
||
|
||
jenis-jenis regression
|
||
1. Linear Regression
|
||
Hubungan linear (garis lurus) antara X dan Y,Hanya 1 variabel input,Rumus: Y = a + bX,Contoh: jam belajar → nilai.
|
||
|
||
2. Multiple Linear Regression
|
||
Sama seperti linear regression, tapi dengan lebih dari 1 variabel input,Rumus: Y = a + b₁X₁ + b₂X₂ + .,Contoh: harga rumah → luas, kamar, lokasi, dll.
|
||
|
||
3. Polynomial Regression
|
||
Hubungan tidak linear, tetapi bisa dibentuk menjadi kurva (ada X², X³),Mengatasi data yang pola hubungan X–Y melengkung,Rumus: Y = a + b₁X + b₂X² + ...
|
||
|
||
4. Nonlinear Regression
|
||
Hubungan benar-benar tidak linear dan tidak bisa dijelaskan oleh garis atau polinomial sederhana,Bentuknya bisa eksponensial, logaritmik, atau sigmoid.Contoh: pertumbuhan populasi, reaksi kimia.
|
||
|
||
# Classification
|
||
Classification adalah metode supervised learning untuk mengelompokkan data ke dalam kelas/kategori tertentu.
|
||
Outputnya bukan angka kontinu, tetapi label seperti:
|
||
-Spam / Not spam
|
||
-Sakit / Sehat
|
||
-Kucing / Anjing
|
||
|
||
Tujuan Classification
|
||
-Memprediksi kelas yang tepat berdasarkan pola pada data.
|
||
-Mengelompokkan data baru ke dalam kategori tertentu.
|
||
-Membantu pengambilan keputusan (misalnya sistem diagnosis penyakit).
|
||
|
||
Jenis-jenis Classification
|
||
1. Decision Tree
|
||
Model berbentuk pohon keputusan,Membagi data berdasarkan pertanyaan seperti “apakah X > 5?”,Mudah dipahami, hasilnya jelas,Risiko: bisa overfitting jika pohon terlalu dalam.
|
||
|
||
2. K-Nearest Neighbor (KNN)
|
||
Klasifikasi berdasarkan tetangga terdekat,Data baru akan ikut kelas mayoritas dari K data paling dekat,Sederhana, tetapi lambat untuk dataset besar,Butuh perhitungan jarak (Euclidean, Manhattan, dll).
|
||
|
||
3. Logistic Regression
|
||
Meski namanya regresi, ini dipakai untuk klasifikasi,Menghasilkan probabilitas suatu data termasuk kelas tertentu,Cocok untuk binary classification (ya/tidak, 0/1),Simple dan cepat.
|
||
|
||
4. Support Vector Machine (SVM)
|
||
Mencari garis/pembatas terbaik (hyperplane) yang memisahkan kelas,Sangat bagus untuk dataset kecil dan pola kompleks,Bisa menangani data non-linear dengan kernel (RBF, polynomial),Relatif berat untuk dataset yang sangat besar.
|
||
|
||
Kucing / Anjing |