29 lines
1.5 KiB
Markdown
29 lines
1.5 KiB
Markdown
# PERBANDINGAN ALGORITMA MACHINE LEARNING DALAM KLASIFIKASI PENYAKIT DIABETES
|
|
|
|
Repository ini berisi implementasi, dan dokumentasi penelitian
|
|
mengenai perbandingan beberapa algoritma machine learning dalam melakukan
|
|
klasifikasi penyakit diabetes. Penelitian ini disusun untuk memenuhi tugas
|
|
mata kuliah **Pembelajaran Mesin**.
|
|
|
|
# Anggota Kelompok:
|
|
1. Adhwa Ardista Khoirunisa (202310715146)
|
|
2. Putri Adelia Azizah (202310715084)
|
|
3. Sumih (202310715145)
|
|
|
|
# Deskripsi Dataset
|
|
Dataset yang digunakan dalam penelitian diperoleh dari platform Kaggle. Dataset terdiri dari 2.000 data dengan 9 atribut, yang mencakup 8 atribut input dan 1 atribut target (Outcome). Dataset ini dapat diakses melalui tautan berikut: https://www.kaggle.com/datasets/sitirahmahbasri/data-penyakit-diabetes
|
|
|
|
Atribut yang digunakan dalam dataset ini meliputi:
|
|
1. Pregnancies
|
|
2. Glucose
|
|
3. BloodPressure
|
|
4. SkinThickness
|
|
5. Insulin
|
|
6. BMI
|
|
7. DiabetesPedigreeFunction
|
|
8. Age
|
|
9. Outcome (label kelas)
|
|
|
|
Atribut input merepresentasikan kondisi kesehatan pasien, seperti jumlah kehamilan, kadar glukosa darah, tekanan darah, kadar insulin, indeks massa tubuh, serta faktor genetik. Sementara itu, atribut target (Outcome) menunjukkan kondisi pasien, yaitu terindikasi diabetes atau tidak.
|
|
|
|
Pada tahap awal penelitian, dilakukan penyesuaian dataset dengan menghapus atribut yang tidak relevan. Selanjutnya, dataset melalui tahap preprocessing untuk memastikan data yang digunakan memiliki kualitas dan konsistensi yang baik sebelum digunakan dalam proses pemodelan. |