Update README.md
This commit is contained in:
parent
4e54fd3e72
commit
97351cf841
34
README.md
34
README.md
@ -21,7 +21,7 @@ Pemerintah menetapkan sektor pertanian sebagai prioritas nasional, termasuk di d
|
||||
|
||||
Data produksi beras per provinsi pada tahun 2020–2022 memberikan gambaran mengenai kondisi pertanian Indonesia secara regional. Data ini mencerminkan perbedaan produktivitas antar wilayah, faktor geografis, luas lahan, serta tingkat keberhasilan program pemerintah di masing-masing provinsi. Analisis data produksi beras dapat membantu mengidentifikasi daerah dengan produksi tinggi, produksi rendah, atau yang mengalami fluktuasi dari tahun ke tahun.
|
||||
|
||||
Dengan menganalisis dataset ini menggunakan metode machine learning, kita dapat memahami pola produksi, memprediksi hasil produksi di masa mendatang, serta memberikan wawasan bagi pemerintah dan pemangku kepentingan dalam merumuskan kebijakan yang lebih tepat untuk menjaga ketahanan pangan nasional.
|
||||
Dengan menganalisis dataset ini menggunakan metode machine learning, kita dapat memahami pola produksi, memprediksi hasil produksi di masa mendatang, serta memberikan wawasan bagi pemerintah dan pemangku kepentingan dalam merumuskan kebijakan yang lebih tepat untuk menjaga ketahanan pangan nasional. Dataset ini memuat informasi produksi per provinsi yang merefleksikan variasi agronomis, kondisi lahan, serta keberhasilan program peningkatan produktivitas di berbagai wilayah. Sebagai komoditas strategis, perubahan produksi beras memiliki implikasi langsung terhadap stabilitas pangan nasional, sehingga analisis kuantitatif berbasis data diperlukan untuk mendukung perumusan kebijakan yang lebih presisi.
|
||||
|
||||
# Analisis Dataset: Regression
|
||||
|
||||
@ -31,6 +31,15 @@ Algoritma yang digunakan:
|
||||
1. Linear Regression
|
||||
2. Random Forest Regression
|
||||
|
||||
Pada proyek ini dilakukan analisis menggunakan model **Linear Regression** dan **Random Forest Regression**.
|
||||
Linear Regression berfungsi sebagai model dasar yang memberikan pemahaman mengenai kontribusi masing-masing variabel terhadap target secara langsung. Model ini mengasumsikan bahwa perubahan pada satu variabel fitur akan menyebabkan perubahan proporsional pada variabel output, sehingga cocok digunakan untuk mengidentifikasi hubungan struktural yang bersifat sederhana serta memberikan interpretasi koefisien yang jelas.
|
||||
|
||||
Random Forest Regression digunakan untuk meningkatkan akurasi prediktif dengan memanfaatkan kemampuan ensemble learning. Algoritma ini menggabungkan banyak pohon keputusan yang dibangun dari subset data dan fitur yang berbeda, sehingga menghasilkan prediksi yang lebih stabil dan tahan terhadap outlier. Pendekatan ini sangat bermanfaat ketika data memiliki pola interaksi antarvariabel yang datanya memiliki pola Non linear.
|
||||
|
||||
Dengan mengombinasikan kedua pendekatan tersebut, penelitian ini tidak hanya memperoleh model yang akurat, tetapi juga dapat memahami struktur dasar data secara lebih mendalam. Hasil analisis dari kedua algoritma memungkinkan peneliti untuk mengevaluasi mana model yang paling representatif terhadap kondisi nyata, serta memberikan dasar yang kuat untuk melakukan prediksi produksi beras di masa mendatang. Pendekatan ini juga memperkuat proses pengambilan keputusan berbasis data dalam perencanaan kebijakan pertanian dan pengelolaan ketahanan pangan nasional.
|
||||
|
||||
Regresi merupakan bagian dari supervised learning, di mana model mempelajari hubungan antara fitur dan output numerik dari data sebelumnya. Model regresi menghasilkan prediksi yang dapat digunakan untuk pengambilan keputusan dan perencanaan masa depan, terutama dalam konteks ketahanan pangan nasional.
|
||||
|
||||
## Alasan:
|
||||
1. Target berupa nilai kontinu sehingga cocok untuk regresi.
|
||||
2. Dapat memprediksi jumlah produksi beras di masa depan.
|
||||
@ -38,21 +47,26 @@ Algoritma yang digunakan:
|
||||
4. Model regresi dapat dievaluasi dengan metrik kuantitatif (R², MSE, RMSE).
|
||||
5. Mendukung cross validation untuk mengukur konsistensi model.
|
||||
|
||||
Pada proyek ini dilakukan analisis menggunakan model **Linear Regression** dan **Random Forest Regression**.
|
||||
Linear Regression digunakan untuk melihat hubungan secara linear, sedangkan Random Forest digunakan untuk menangkap pola yang lebih kompleks dan non-linear.
|
||||
|
||||
Regresi merupakan bagian dari supervised learning, di mana model mempelajari hubungan antara fitur dan output numerik dari data sebelumnya. Model regresi menghasilkan prediksi yang dapat digunakan untuk pengambilan keputusan dan perencanaan masa depan, terutama dalam konteks ketahanan pangan nasional.
|
||||
|
||||
Random Forest Regression bekerja dengan membangun banyak decision tree kemudian menggabungkannya untuk menghasilkan prediksi yang lebih stabil dan akurat. Model ini juga tahan terhadap outlier dan cocok ketika data memiliki pola tidak linear.
|
||||
|
||||
# Evaluasi Model
|
||||
Evaluasi model dilakukan untuk memastikan bahwa algoritma yang digunakan mampu memberikan prediksi yang akurat dan sesuai dengan pola data produksi beras yang sebenarnya. Dalam penelitian ini digunakan tiga metrik utama, yaitu R² Score, MSE, dan RMSE, yang masing-masing memiliki fungsi berbeda dalam menilai kualitas prediksi dengan membandingkan Linear Regression dan Random Forest Regression sehingga dapat ditentukan model mana yang memberikan performa terbaik.
|
||||
|
||||
Model dievaluasi menggunakan:
|
||||
1. R² Score
|
||||
2. Mean Squared Error (MSE)
|
||||
3. Root Mean Squared Error (RMSE)
|
||||
|
||||
Evaluasi dilakukan untuk membandingkan Linear Regression dan Random Forest Regression sehingga dapat ditentukan model mana yang memberikan performa terbaik.
|
||||
R² Score digunakan untuk mengukur sejauh mana model dapat menjelaskan variasi data. Nilai R² yang semakin mendekati 1 menunjukkan bahwa model mampu menjelaskan sebagian besar pola pada data, sehingga baik digunakan untuk menilai kesesuaian model secara keseluruhan.
|
||||
|
||||
Mean Squared Error (MSE) dan Root Mean Squared Error (RMSE) digunakan untuk mengukur besarnya kesalahan prediksi. MSE memberikan gambaran rata-rata kesalahan kuadrat, sedangkan RMSE merupakan akar dari MSE dan lebih mudah diinterpretasikan karena berada pada satuan yang sama dengan data asli. Nilai MSE dan RMSE yang lebih kecil menandakan bahwa model memiliki tingkat error prediksi yang rendah.
|
||||
|
||||
# Cross Validation
|
||||
Cross validation digunakan untuk menguji konsistensi model pada beberapa pembagian data.
|
||||
Metode yang digunakan adalah **K-Fold Cross Validation**, sehingga performa model tidak hanya bergantung pada satu kali train-test split dan hasil evaluasi menjadi lebih akurat.
|
||||
Metode yang digunakan adalah **K-Fold Cross Validation**, sehingga performa model tidak hanya bergantung pada satu kali train-test split dan hasil evaluasi menjadi lebih akurat.Penerapan juga memberikan jaminan bahwa kinerja model tidak hanya berlaku pada satu subset data tertentu, melainkan konsisten pada berbagai skenario pembagian data. Metode ini penting untuk mengurangi risiko overfitting serta memastikan model memiliki kemampuan generalisasi yang baik.
|
||||
|
||||
# keuntungan menggunakan Cross Validation
|
||||
1. model dievaluasi pada banyak kombinasi data sehingga hasilnya lebih stabil dan tidak bergantung pada satu kali train-test split.
|
||||
2. metode ini membantu mengidentifikasi apakah model mengalami overfittingatau kondisi model bekerja sangat baik pada data pelatihan tetapi buruk pada data pengujian.
|
||||
3. Cross validation memastikan bahwa performa model dapat digeneralisasikan ke data baru yang belum pernah dilihat sebelumnya.
|
||||
|
||||
# Kesimpulan
|
||||
Secara keseluruhan, analisis ini menegaskan bahwa metode regresi, khususnya Random Forest Regression, memberikan hasil yang lebih stabil dalam menangkap variasi antarprovinsi. Model yang dibangun berpotensi menjadi alat pendukung keputusan dalam perencanaan distribusi sumber daya pertanian dan evaluasi kebijakan peningkatan produktivitas padi dalam menjaga ketahanan pangan nasional, terutama dalam menghadapi dinamika produksi pangan di masa mendatang.
|
||||
Loading…
x
Reference in New Issue
Block a user