diff --git a/README.md b/README.md index a8f89a4..6e6204a 100644 --- a/README.md +++ b/README.md @@ -26,4 +26,23 @@ Atribut yang digunakan dalam dataset ini meliputi: Atribut input merepresentasikan kondisi kesehatan pasien, seperti jumlah kehamilan, kadar glukosa darah, tekanan darah, kadar insulin, indeks massa tubuh, serta faktor genetik. Sementara itu, atribut target (Outcome) menunjukkan kondisi pasien, yaitu terindikasi diabetes atau tidak. -Pada tahap awal penelitian, dilakukan penyesuaian dataset dengan menghapus atribut yang tidak relevan. Selanjutnya, dataset melalui tahap preprocessing untuk memastikan data yang digunakan memiliki kualitas dan konsistensi yang baik sebelum digunakan dalam proses pemodelan. \ No newline at end of file +Pada tahap awal penelitian, dilakukan penyesuaian dataset dengan menghapus atribut yang tidak relevan. Selanjutnya, dataset melalui tahap preprocessing untuk memastikan data yang digunakan memiliki kualitas dan konsistensi yang baik sebelum digunakan dalam proses pemodelan. + +# Jenis Metode yang Digunakan +Penelitian ini menggunakan pendekatan **klasifikasi**, yang bertujuan untuk +mengelompokkan data pasien ke dalam dua kelas, yaitu pasien diabetes dan +non-diabetes, berdasarkan pola yang dipelajari dari data latih. + +# Tahapan Penelitian +Tahapan penelitian dilakukan secara sistematis sebagai berikut: +1. Pengumpulan dataset dari sumber publik +2. Preprocessing data, meliputi pembersihan data dan penyesuaian atribut +3. Pembagian dataset menjadi data latih dan data uji dengan rasio 80% : 20% +4. Penerapan algoritma klasifikasi pada data latih +5. Evaluasi performa model + +# Cross Validation +Untuk meningkatkan keandalan dan konsistensi hasil penelitian, diterapkan +teknik **cross validation** pada proses pelatihan model. Metode ini bertujuan +untuk meminimalkan bias akibat pembagian data latih dan data uji, serta +memberikan gambaran performa model yang lebih stabil. \ No newline at end of file