Update README.md

This commit is contained in:
202310715065 ANANDA DWI PRASETYO 2025-11-21 18:28:29 +07:00
parent 86036cff8d
commit 19ca14f3bd

View File

@ -23,6 +23,8 @@ Pada tahun 2023, Indonesia mencatat jumlah tenaga pendidik pada jenjang SMA dan
# Analisis Dataset: Clustering # Analisis Dataset: Clustering
Clustering merupakan salah satu metode unsupervised learning, yang mana dataset akan dipartisi menjadi kelompok atau cluster yang berbeda berdasarkan ukuran kesamaan tertentu. Metode ini akan mengelompokkan objek-objek ke dalam cluster berdasarkan karakteristik yang memiliki tingkat kemiripan yang signifikan jika berada dalam satu kluster, dan memiliki perbedaan yang cukup besar jika objek berada dalam kluster yang berbeda.
Algoritma yang paling cocok untuk mengolah dataset ini adalah Clustering Algoritma yang paling cocok untuk mengolah dataset ini adalah Clustering
Algoritma yang disarankan: Algoritma yang disarankan:
1. K-Means Clustering 1. K-Means Clustering
@ -39,8 +41,6 @@ Alasan Dataset jumlah pendidik per wilayah sangat cocok untuk clustering karena:
Pada penelitian ini data dianalisis dengan metode analisis clusterya itu K-Means Clustering yang mana termasuk dalam metode non hirarki. K-Means menggunakan pendekatan yang berbeda dengan metode lain seperti Fuzzy C-Means, Agglomerative Hierarchical Clustering, dan K-Medoids. K-Means hanya memungkinkan suatu data menjadi bagian dari satu cluster, sedangkan metode lain seperti Fuzzy C-Means memungkinkan suatu data tidak hanya menjadi bagian dari satu cluster saja. Pada penelitian ini data dianalisis dengan metode analisis clusterya itu K-Means Clustering yang mana termasuk dalam metode non hirarki. K-Means menggunakan pendekatan yang berbeda dengan metode lain seperti Fuzzy C-Means, Agglomerative Hierarchical Clustering, dan K-Medoids. K-Means hanya memungkinkan suatu data menjadi bagian dari satu cluster, sedangkan metode lain seperti Fuzzy C-Means memungkinkan suatu data tidak hanya menjadi bagian dari satu cluster saja.
Clustering merupakan salah satu metode unsupervised learning, yang mana dataset akan dipartisi menjadi kelompok atau cluste ryang berbeda berdasarkan ukuran kesamaan tertentu. Metode ini akan mengelompokkan objek-objek ke dalam cluster berdasarkan karakteristik yang memiliki tingkat kemiripan yang signifikan jika berada dalam satu kluster, dan memiliki perbedaan yang cukup besar jika objek berada dalam kluster yang berbeda.
K-Means adalah metode pengelompokan non-hierarki yang membagi data menjadi k kelompok (cluster) berdasarkan kedekatannya dengan centroid (titik pusat cluster). K-Means adalah metode pengelompokan non-hierarki yang membagi data menjadi k kelompok (cluster) berdasarkan kedekatannya dengan centroid (titik pusat cluster).
Cara Kerja K-Means: Cara Kerja K-Means:
@ -57,3 +57,11 @@ Tujuan K-Means
1. Meminimalkan jarak antar data dalam satu cluster. 1. Meminimalkan jarak antar data dalam satu cluster.
2. Memaksimalkan perbedaan antar cluster. 2. Memaksimalkan perbedaan antar cluster.
3. Menghasilkan pengelompokan wilayah yang mencerminkan kesamaan jumlah pendidik. 3. Menghasilkan pengelompokan wilayah yang mencerminkan kesamaan jumlah pendidik.
# Hasil Penelitian: k-Means Clustering
File CSV tersebut adalah output akhir dari analisis K-Means Clustering yang berfungsi untuk:
1. Mengelompokkan provinsi berdasarkan jumlah pendidik
2. Menentukan kategori kepadatan pendidik (rendah/sedang/tinggi)
3. Menjadi bahan grafik, tabel, dan laporan penelitian
4. Digunakan untuk pembahasan pemerataan pendidik