2.6 KiB
Raw Blame History

PRAKTIKUMmachinelearning

Muhammad Bintang Mudzaffar
202310715001 F5A2

Regression

Regression adalah metode supervised learning untuk memprediksi nilai numerik/kontinu berdasarkan hubungan antara input (features) dan output. Artinya, regresi mencari pola matematis pada data sehingga model bisa menghasilkan angka baru dari data baru.

Tujuan Regresi -Memahami hubungan antara variabel independen (X) dan variabel dependen (Y). -Memprediksi nilai masa depan atau nilai yang tidak diketahui. -Melihat pengaruh masing-masing variabel terhadap target.

jenis-jenis regression

  1. Linear Regression Hubungan linear (garis lurus) antara X dan Y,Hanya 1 variabel input,Rumus: Y = a + bX,Contoh: jam belajar → nilai.

  2. Multiple Linear Regression Sama seperti linear regression, tapi dengan lebih dari 1 variabel input,Rumus: Y = a + b₁X₁ + b₂X₂ + .,Contoh: harga rumah → luas, kamar, lokasi, dll.

  3. Polynomial Regression Hubungan tidak linear, tetapi bisa dibentuk menjadi kurva (ada X², X³),Mengatasi data yang pola hubungan XY melengkung,Rumus: Y = a + b₁X + b₂X² + ...

  4. Nonlinear Regression Hubungan benar-benar tidak linear dan tidak bisa dijelaskan oleh garis atau polinomial sederhana,Bentuknya bisa eksponensial, logaritmik, atau sigmoid.Contoh: pertumbuhan populasi, reaksi kimia.

Classification

Classification adalah metode supervised learning untuk mengelompokkan data ke dalam kelas/kategori tertentu. Outputnya bukan angka kontinu, tetapi label seperti: -Spam / Not spam -Sakit / Sehat -Kucing / Anjing

Tujuan Classification -Memprediksi kelas yang tepat berdasarkan pola pada data. -Mengelompokkan data baru ke dalam kategori tertentu. -Membantu pengambilan keputusan (misalnya sistem diagnosis penyakit).

Jenis-jenis Classification

  1. Decision Tree Model berbentuk pohon keputusan,Membagi data berdasarkan pertanyaan seperti “apakah X > 5?”,Mudah dipahami, hasilnya jelas,Risiko: bisa overfitting jika pohon terlalu dalam.

  2. K-Nearest Neighbor (KNN) Klasifikasi berdasarkan tetangga terdekat,Data baru akan ikut kelas mayoritas dari K data paling dekat,Sederhana, tetapi lambat untuk dataset besar,Butuh perhitungan jarak (Euclidean, Manhattan, dll).

  3. Logistic Regression Meski namanya regresi, ini dipakai untuk klasifikasi,Menghasilkan probabilitas suatu data termasuk kelas tertentu,Cocok untuk binary classification (ya/tidak, 0/1),Simple dan cepat.

  4. Support Vector Machine (SVM) Mencari garis/pembatas terbaik (hyperplane) yang memisahkan kelas,Sangat bagus untuk dataset kecil dan pola kompleks,Bisa menangani data non-linear dengan kernel (RBF, polynomial),Relatif berat untuk dataset yang sangat besar.

Kucing / Anjing