Update README.md
This commit is contained in:
parent
8b010e8178
commit
a568ac56d3
11
README.md
11
README.md
@ -21,7 +21,7 @@ Pemerintah menetapkan sektor pertanian sebagai prioritas nasional, termasuk di d
|
|||||||
|
|
||||||
Data produksi beras per provinsi pada tahun 2020–2022 memberikan gambaran mengenai kondisi pertanian Indonesia secara regional. Data ini mencerminkan perbedaan produktivitas antar wilayah, faktor geografis, luas lahan, serta tingkat keberhasilan program pemerintah di masing-masing provinsi. Analisis data produksi beras dapat membantu mengidentifikasi daerah dengan produksi tinggi, produksi rendah, atau yang mengalami fluktuasi dari tahun ke tahun.
|
Data produksi beras per provinsi pada tahun 2020–2022 memberikan gambaran mengenai kondisi pertanian Indonesia secara regional. Data ini mencerminkan perbedaan produktivitas antar wilayah, faktor geografis, luas lahan, serta tingkat keberhasilan program pemerintah di masing-masing provinsi. Analisis data produksi beras dapat membantu mengidentifikasi daerah dengan produksi tinggi, produksi rendah, atau yang mengalami fluktuasi dari tahun ke tahun.
|
||||||
|
|
||||||
Dengan menganalisis dataset ini menggunakan metode machine learning, kita dapat memahami pola produksi, memprediksi hasil produksi di masa mendatang, serta memberikan wawasan bagi pemerintah dan pemangku kepentingan dalam merumuskan kebijakan yang lebih tepat untuk menjaga ketahanan pangan nasional.
|
Dengan menganalisis dataset ini menggunakan metode machine learning, kita dapat memahami pola produksi, memprediksi hasil produksi di masa mendatang, serta memberikan wawasan bagi pemerintah dan pemangku kepentingan dalam merumuskan kebijakan yang lebih tepat untuk menjaga ketahanan pangan nasional. Dataset ini memuat informasi produksi per provinsi yang merefleksikan variasi agronomis, kondisi lahan, serta keberhasilan program peningkatan produktivitas di berbagai wilayah. Sebagai komoditas strategis, perubahan produksi beras memiliki implikasi langsung terhadap stabilitas pangan nasional, sehingga analisis kuantitatif berbasis data diperlukan untuk mendukung perumusan kebijakan yang lebih presisi.
|
||||||
|
|
||||||
# Analisis Dataset: Regression
|
# Analisis Dataset: Regression
|
||||||
|
|
||||||
@ -31,6 +31,8 @@ Algoritma yang digunakan:
|
|||||||
1. Linear Regression
|
1. Linear Regression
|
||||||
2. Random Forest Regression
|
2. Random Forest Regression
|
||||||
|
|
||||||
|
Dua algoritma ini digunakan untuk memodelkan pola hubungan antara variabel fitur dan total produksi beras. Linear Regression memberikan gambaran keterkaitan linear antarvariabel, sedangkan Random Forest Regression mampu menangkap hubungan yang lebih kompleks melalui ensemble banyak decision tree. Kombinasi kedua model tersebut memungkinkan analisis yang komprehensif, baik dari sisi interpretabilitas maupun akurasi prediksi.
|
||||||
|
|
||||||
## Alasan:
|
## Alasan:
|
||||||
1. Target berupa nilai kontinu sehingga cocok untuk regresi.
|
1. Target berupa nilai kontinu sehingga cocok untuk regresi.
|
||||||
2. Dapat memprediksi jumlah produksi beras di masa depan.
|
2. Dapat memprediksi jumlah produksi beras di masa depan.
|
||||||
@ -46,6 +48,8 @@ Regresi merupakan bagian dari supervised learning, di mana model mempelajari hub
|
|||||||
Random Forest Regression bekerja dengan membangun banyak decision tree kemudian menggabungkannya untuk menghasilkan prediksi yang lebih stabil dan akurat. Model ini juga tahan terhadap outlier dan cocok ketika data memiliki pola tidak linear.
|
Random Forest Regression bekerja dengan membangun banyak decision tree kemudian menggabungkannya untuk menghasilkan prediksi yang lebih stabil dan akurat. Model ini juga tahan terhadap outlier dan cocok ketika data memiliki pola tidak linear.
|
||||||
|
|
||||||
# Evaluasi Model
|
# Evaluasi Model
|
||||||
|
Evaluasi model dilakukan secara sistematis menggunakan metrik R² Score, Mean Squared Error (MSE), dan Root Mean Squared Error (RMSE) guna mengukur kualitas prediksi secara kuantitatif. Hasil evaluasi tersebut memberikan dasar empiris untuk membandingkan kinerja kedua model dan menentukan pendekatan yang paling sesuai dengan karakteristik data.
|
||||||
|
|
||||||
Model dievaluasi menggunakan:
|
Model dievaluasi menggunakan:
|
||||||
1. R² Score
|
1. R² Score
|
||||||
2. Mean Squared Error (MSE)
|
2. Mean Squared Error (MSE)
|
||||||
@ -55,4 +59,7 @@ Evaluasi dilakukan untuk membandingkan Linear Regression dan Random Forest Regre
|
|||||||
|
|
||||||
# Cross Validation
|
# Cross Validation
|
||||||
Cross validation digunakan untuk menguji konsistensi model pada beberapa pembagian data.
|
Cross validation digunakan untuk menguji konsistensi model pada beberapa pembagian data.
|
||||||
Metode yang digunakan adalah **K-Fold Cross Validation**, sehingga performa model tidak hanya bergantung pada satu kali train-test split dan hasil evaluasi menjadi lebih akurat.
|
Metode yang digunakan adalah **K-Fold Cross Validation**, sehingga performa model tidak hanya bergantung pada satu kali train-test split dan hasil evaluasi menjadi lebih akurat.Penerapan juga memberikan jaminan bahwa kinerja model tidak hanya berlaku pada satu subset data tertentu, melainkan konsisten pada berbagai skenario pembagian data. Metode ini penting untuk mengurangi risiko overfitting serta memastikan model memiliki kemampuan generalisasi yang baik.
|
||||||
|
|
||||||
|
# Kesimpulan
|
||||||
|
Secara keseluruhan, analisis ini menegaskan bahwa metode regresi, khususnya Random Forest Regression, memberikan hasil yang lebih stabil dalam menangkap variasi antarprovinsi. Model yang dibangun berpotensi menjadi alat pendukung keputusan dalam perencanaan distribusi sumber daya pertanian dan evaluasi kebijakan peningkatan produktivitas padi dalam menjaga ketahanan pangan nasional, terutama dalam menghadapi dinamika produksi pangan di masa mendatang.
|
||||||
Loading…
x
Reference in New Issue
Block a user