From 19ca14f3bd6812abbbca687d550a7b7649f193ae Mon Sep 17 00:00:00 2001 From: 202310715065 ANANDA DWI PRASETYO <202310715065@mhs.ubharajaya.ac.id> Date: Fri, 21 Nov 2025 18:28:29 +0700 Subject: [PATCH] Update README.md --- README.md | 12 ++++++++++-- 1 file changed, 10 insertions(+), 2 deletions(-) diff --git a/README.md b/README.md index 65df6c1..3bc8e08 100644 --- a/README.md +++ b/README.md @@ -23,6 +23,8 @@ Pada tahun 2023, Indonesia mencatat jumlah tenaga pendidik pada jenjang SMA dan # Analisis Dataset: Clustering +Clustering merupakan salah satu metode unsupervised learning, yang mana dataset akan dipartisi menjadi kelompok atau cluster yang berbeda berdasarkan ukuran kesamaan tertentu. Metode ini akan mengelompokkan objek-objek ke dalam cluster berdasarkan karakteristik yang memiliki tingkat kemiripan yang signifikan jika berada dalam satu kluster, dan memiliki perbedaan yang cukup besar jika objek berada dalam kluster yang berbeda. + Algoritma yang paling cocok untuk mengolah dataset ini adalah Clustering Algoritma yang disarankan: 1. K-Means Clustering @@ -39,8 +41,6 @@ Alasan Dataset jumlah pendidik per wilayah sangat cocok untuk clustering karena: Pada penelitian ini data dianalisis dengan metode analisis clusterya itu K-Means Clustering yang mana termasuk dalam metode non hirarki. K-Means menggunakan pendekatan yang berbeda dengan metode lain seperti Fuzzy C-Means, Agglomerative Hierarchical Clustering, dan K-Medoids. K-Means hanya memungkinkan suatu data menjadi bagian dari satu cluster, sedangkan metode lain seperti Fuzzy C-Means memungkinkan suatu data tidak hanya menjadi bagian dari satu cluster saja. -Clustering merupakan salah satu metode unsupervised learning, yang mana dataset akan dipartisi menjadi kelompok atau cluste ryang berbeda berdasarkan ukuran kesamaan tertentu. Metode ini akan mengelompokkan objek-objek ke dalam cluster berdasarkan karakteristik yang memiliki tingkat kemiripan yang signifikan jika berada dalam satu kluster, dan memiliki perbedaan yang cukup besar jika objek berada dalam kluster yang berbeda. - K-Means adalah metode pengelompokan non-hierarki yang membagi data menjadi k kelompok (cluster) berdasarkan kedekatannya dengan centroid (titik pusat cluster). Cara Kerja K-Means: @@ -57,3 +57,11 @@ Tujuan K-Means 1. Meminimalkan jarak antar data dalam satu cluster. 2. Memaksimalkan perbedaan antar cluster. 3. Menghasilkan pengelompokan wilayah yang mencerminkan kesamaan jumlah pendidik. + +# Hasil Penelitian: k-Means Clustering +File CSV tersebut adalah output akhir dari analisis K-Means Clustering yang berfungsi untuk: + +1. Mengelompokkan provinsi berdasarkan jumlah pendidik +2. Menentukan kategori kepadatan pendidik (rendah/sedang/tinggi) +3. Menjadi bahan grafik, tabel, dan laporan penelitian +4. Digunakan untuk pembahasan pemerataan pendidik