Update README.md

This commit is contained in:
202310715065 ANANDA DWI PRASETYO 2025-11-21 18:53:46 +07:00
parent 98c60f4a09
commit 4f9358aa7d

View File

@ -60,7 +60,7 @@ Tujuan K-Means
# Hasil dan Pembahasan
A. Eksplorasi Data Awal
A. EKSPLORASI DATA AWAL
Dataset yang digunakan terdiri dari 24 wilayah provinsi di Indonesia, dengan tiga variabel utama:
1. Jumlah Pendidik SMA/Sederajat
@ -73,14 +73,14 @@ Berdasarkan eksplorasi awal:
3. Rasio guru per sekolah memiliki nilai minimum 20 dan maksimum 33,3, dengan rata-rata sekitar 24,7.
Secara umum, terdapat perbedaan signifikan antara wilayah-wilayah yang memiliki jumlah pendidik dan sekolah besar (seperti Jawa Barat dan Jawa Timur) dengan wilayah yang memiliki kapasitas lebih kecil (seperti Papua Barat, Gorontalo, dan Maluku Utara).
B. Persiapan data
B. PERSIAPAN DATA
Clustering dilakukan menggunakan dua fitur utama:
1. Jumlah pendidik
2. Jumlah sekolah
Sebelum proses clustering, data dinormalisasi menggunakan StandardScaler, sehingga setiap fitur berada dalam skala yang sama. Hal ini penting agar variabel dengan nilai besar (jumlah pendidik) tidak mendominasi proses pengelompokan.
C. Penentuan Jumlah Cluster Optimal
C. PENENTUAN JUMLAH CLUSTER OPTIMAL
Metode evaluasi yang digunakan:
1. Elbow Method (Inertia)
@ -91,7 +91,7 @@ a. K = 2 : 0.731
b. K = 3 : 0.595
Meskipun K=2 memiliki nilai lebih tinggi, namun K=3 dipilih karena menghasilkan segmentasi yang lebih baik secara interpretasi kebijakan (rendah, sedang, tinggi) dan masih dalam kategori skor baik (>0.5). Sehingga jumlah cluster optimal ditetapkan sebagai K = 3.
D. Implementasi K-Means Clustering
D. IMPLEMENTASI K-MEANS CLUSTERING
Proses K-Means dilakukan dengan K = 3, menghasilkan:
1. Inertia : 3.68
@ -99,14 +99,14 @@ Proses K-Means dilakukan dengan K = 3, menghasilkan:
3. Davies-Bouldin Index : 0.464 (semakin kecil semakin baik),
Ini menunjukkan model clustering stabil dan cukup baik dalam memisahkan data.
E. Hasil Pengelompokkan
E. HASIL PENGELOMPOKKAN
Berdasarkan perhitungan rata-rata jumlah pendidik per cluster, tiga kategori ditetapkan:
1. Cluster 0: Kepadatan Rendah
2. Cluster 1: Kepadatan Tinggi
3. Cluster 2: Kepadatan Sedang
F. Interpretasi Per Cluster
F. INTERPRETASI PER CLUSTER
1. Cluster Kepadatan Rendah
Berisi 14 wilayah, seperti: Papua, Kalimantan Timur, Maluku, NTB, Gorontalo, dll. Memiliki nilai pendidik dan sekolah paling rendah. Rasio guru per sekolah: 22,31, di bawah standar ideal (2530).