Update README.md
This commit is contained in:
parent
98c60f4a09
commit
4f9358aa7d
12
README.md
12
README.md
@ -60,7 +60,7 @@ Tujuan K-Means
|
||||
|
||||
# Hasil dan Pembahasan
|
||||
|
||||
A. Eksplorasi Data Awal
|
||||
A. EKSPLORASI DATA AWAL
|
||||
|
||||
Dataset yang digunakan terdiri dari 24 wilayah provinsi di Indonesia, dengan tiga variabel utama:
|
||||
1. Jumlah Pendidik SMA/Sederajat
|
||||
@ -73,14 +73,14 @@ Berdasarkan eksplorasi awal:
|
||||
3. Rasio guru per sekolah memiliki nilai minimum 20 dan maksimum 33,3, dengan rata-rata sekitar 24,7.
|
||||
Secara umum, terdapat perbedaan signifikan antara wilayah-wilayah yang memiliki jumlah pendidik dan sekolah besar (seperti Jawa Barat dan Jawa Timur) dengan wilayah yang memiliki kapasitas lebih kecil (seperti Papua Barat, Gorontalo, dan Maluku Utara).
|
||||
|
||||
B. Persiapan data
|
||||
B. PERSIAPAN DATA
|
||||
|
||||
Clustering dilakukan menggunakan dua fitur utama:
|
||||
1. Jumlah pendidik
|
||||
2. Jumlah sekolah
|
||||
Sebelum proses clustering, data dinormalisasi menggunakan StandardScaler, sehingga setiap fitur berada dalam skala yang sama. Hal ini penting agar variabel dengan nilai besar (jumlah pendidik) tidak mendominasi proses pengelompokan.
|
||||
|
||||
C. Penentuan Jumlah Cluster Optimal
|
||||
C. PENENTUAN JUMLAH CLUSTER OPTIMAL
|
||||
|
||||
Metode evaluasi yang digunakan:
|
||||
1. Elbow Method (Inertia)
|
||||
@ -91,7 +91,7 @@ a. K = 2 : 0.731
|
||||
b. K = 3 : 0.595
|
||||
Meskipun K=2 memiliki nilai lebih tinggi, namun K=3 dipilih karena menghasilkan segmentasi yang lebih baik secara interpretasi kebijakan (rendah, sedang, tinggi) dan masih dalam kategori skor baik (>0.5). Sehingga jumlah cluster optimal ditetapkan sebagai K = 3.
|
||||
|
||||
D. Implementasi K-Means Clustering
|
||||
D. IMPLEMENTASI K-MEANS CLUSTERING
|
||||
|
||||
Proses K-Means dilakukan dengan K = 3, menghasilkan:
|
||||
1. Inertia : 3.68
|
||||
@ -99,14 +99,14 @@ Proses K-Means dilakukan dengan K = 3, menghasilkan:
|
||||
3. Davies-Bouldin Index : 0.464 (semakin kecil semakin baik),
|
||||
Ini menunjukkan model clustering stabil dan cukup baik dalam memisahkan data.
|
||||
|
||||
E. Hasil Pengelompokkan
|
||||
E. HASIL PENGELOMPOKKAN
|
||||
|
||||
Berdasarkan perhitungan rata-rata jumlah pendidik per cluster, tiga kategori ditetapkan:
|
||||
1. Cluster 0: Kepadatan Rendah
|
||||
2. Cluster 1: Kepadatan Tinggi
|
||||
3. Cluster 2: Kepadatan Sedang
|
||||
|
||||
F. Interpretasi Per Cluster
|
||||
F. INTERPRETASI PER CLUSTER
|
||||
|
||||
1. Cluster Kepadatan Rendah
|
||||
Berisi 14 wilayah, seperti: Papua, Kalimantan Timur, Maluku, NTB, Gorontalo, dll. Memiliki nilai pendidik dan sekolah paling rendah. Rasio guru per sekolah: 22,31, di bawah standar ideal (25–30).
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user