Update README.md

This commit is contained in:
202310715145 SUMIH 2026-01-22 22:43:30 +07:00
parent 96e99a91af
commit f768dc9574

View File

@ -27,3 +27,22 @@ Atribut yang digunakan dalam dataset ini meliputi:
Atribut input merepresentasikan kondisi kesehatan pasien, seperti jumlah kehamilan, kadar glukosa darah, tekanan darah, kadar insulin, indeks massa tubuh, serta faktor genetik. Sementara itu, atribut target (Outcome) menunjukkan kondisi pasien, yaitu terindikasi diabetes atau tidak.
Pada tahap awal penelitian, dilakukan penyesuaian dataset dengan menghapus atribut yang tidak relevan. Selanjutnya, dataset melalui tahap preprocessing untuk memastikan data yang digunakan memiliki kualitas dan konsistensi yang baik sebelum digunakan dalam proses pemodelan.
# Jenis Metode yang Digunakan
Penelitian ini menggunakan pendekatan **klasifikasi**, yang bertujuan untuk
mengelompokkan data pasien ke dalam dua kelas, yaitu pasien diabetes dan
non-diabetes, berdasarkan pola yang dipelajari dari data latih.
# Tahapan Penelitian
Tahapan penelitian dilakukan secara sistematis sebagai berikut:
1. Pengumpulan dataset dari sumber publik
2. Preprocessing data, meliputi pembersihan data dan penyesuaian atribut
3. Pembagian dataset menjadi data latih dan data uji dengan rasio 80% : 20%
4. Penerapan algoritma klasifikasi pada data latih
5. Evaluasi performa model
# Cross Validation
Untuk meningkatkan keandalan dan konsistensi hasil penelitian, diterapkan
teknik **cross validation** pada proses pelatihan model. Metode ini bertujuan
untuk meminimalkan bias akibat pembagian data latih dan data uji, serta
memberikan gambaran performa model yang lebih stabil.