Proyek Machine Learning Rice Production

This commit is contained in:
Apis 2025-11-20 20:03:04 +07:00
commit 4e54fd3e72
3 changed files with 368 additions and 0 deletions

207
Proyek_Mesin_Learning.ipynb Normal file

File diff suppressed because one or more lines are too long

58
README.md Normal file
View File

@ -0,0 +1,58 @@
# Proyek Machine Learning
Anggota Kelompok:
1. Muhammad Hafidz (202310715202)
2. Rizky Noor Fazila (202310715254)
3. Silviani Rizky (202310715239)
# Ketentuan Tugas
1. Mencari dataset yang terdapat pada website https://www.kaggle.com/
2. Tentukan algoritma (klasifikasi, regresi, atau klastering) yang paling cocok untuk data tersebut
3. Lakukan evaluasi model pada data yang sudah ada
4. Lakukan juga cross validation untuk memastikan bahwa hasil prediksi model tidak jauh berbeda dari pola asli dalam data
5. Lakukan push atau penyimpanan laporan pada website https://git.lab.ubharajaya.ac.id/
# Produksi Beras Indonesia Tahun 20202022
Sumber dataset: https://www.kaggle.com/
Beras merupakan komoditas pangan utama di Indonesia dan memiliki peran strategis dalam menjaga stabilitas ekonomi, sosial, dan ketahanan pangan nasional. Sebagai negara agraris, sebagian besar penduduk Indonesia menggantungkan hidup pada sektor pertanian, sehingga produksi beras tidak hanya menjadi indikator kesejahteraan petani, tetapi juga penentu kestabilan harga dan ketersediaan pangan bagi masyarakat luas.
Pemerintah menetapkan sektor pertanian sebagai prioritas nasional, termasuk di dalamnya program peningkatan produktivitas padi. Oleh karena itu, ketersediaan data produksi beras yang akurat dan mutakhir sangat penting untuk berbagai kebutuhan, seperti perencanaan distribusi pupuk, pengembangan teknologi pertanian, penyusunan kebijakan impor, hingga pembangunan infrastruktur irigasi.
Data produksi beras per provinsi pada tahun 20202022 memberikan gambaran mengenai kondisi pertanian Indonesia secara regional. Data ini mencerminkan perbedaan produktivitas antar wilayah, faktor geografis, luas lahan, serta tingkat keberhasilan program pemerintah di masing-masing provinsi. Analisis data produksi beras dapat membantu mengidentifikasi daerah dengan produksi tinggi, produksi rendah, atau yang mengalami fluktuasi dari tahun ke tahun.
Dengan menganalisis dataset ini menggunakan metode machine learning, kita dapat memahami pola produksi, memprediksi hasil produksi di masa mendatang, serta memberikan wawasan bagi pemerintah dan pemangku kepentingan dalam merumuskan kebijakan yang lebih tepat untuk menjaga ketahanan pangan nasional.
# Analisis Dataset: Regression
Algoritma yang paling cocok untuk mengolah dataset ini adalah **Regresi**, karena variabel target berupa angka (jumlah produksi beras dalam ton).
Algoritma yang digunakan:
1. Linear Regression
2. Random Forest Regression
## Alasan:
1. Target berupa nilai kontinu sehingga cocok untuk regresi.
2. Dapat memprediksi jumlah produksi beras di masa depan.
3. Dapat menganalisis hubungan antara provinsi, luas panen, produktivitas, dan hasil produksi.
4. Model regresi dapat dievaluasi dengan metrik kuantitatif (R², MSE, RMSE).
5. Mendukung cross validation untuk mengukur konsistensi model.
Pada proyek ini dilakukan analisis menggunakan model **Linear Regression** dan **Random Forest Regression**.
Linear Regression digunakan untuk melihat hubungan secara linear, sedangkan Random Forest digunakan untuk menangkap pola yang lebih kompleks dan non-linear.
Regresi merupakan bagian dari supervised learning, di mana model mempelajari hubungan antara fitur dan output numerik dari data sebelumnya. Model regresi menghasilkan prediksi yang dapat digunakan untuk pengambilan keputusan dan perencanaan masa depan, terutama dalam konteks ketahanan pangan nasional.
Random Forest Regression bekerja dengan membangun banyak decision tree kemudian menggabungkannya untuk menghasilkan prediksi yang lebih stabil dan akurat. Model ini juga tahan terhadap outlier dan cocok ketika data memiliki pola tidak linear.
# Evaluasi Model
Model dievaluasi menggunakan:
1. R² Score
2. Mean Squared Error (MSE)
3. Root Mean Squared Error (RMSE)
Evaluasi dilakukan untuk membandingkan Linear Regression dan Random Forest Regression sehingga dapat ditentukan model mana yang memberikan performa terbaik.
# Cross Validation
Cross validation digunakan untuk menguji konsistensi model pada beberapa pembagian data.
Metode yang digunakan adalah **K-Fold Cross Validation**, sehingga performa model tidak hanya bergantung pada satu kali train-test split dan hasil evaluasi menjadi lebih akurat.

View File

@ -0,0 +1,103 @@
Provinsi,Year,Yield.Areal(ha),Productivity(kw/ha),Production.(ton)
ACEH,2020,317869.41,55.28,1757313.07
SUMATERA UTARA,2020,388591.22,52.51,2040500.19
SUMATERA BARAT,2020,295664.47,46.92,1387269.29
RIAU,2020,64733.13,37.64,243685.04
JAMBI,2020,84772.93,45.58,386413.49
SUMATERA SELATAN,2020,551320.76,49.75,2743059.68
BENGKULU,2020,64137.28,45.66,292834.04
LAMPUNG,2020,545149.05,48.62,2650289.64
KEP. BANGKA BELITUNG,2020,17840.55,32.13,57324.32
KEP. RIAU,2020,298.52,28.56,852.54
DKI JAKARTA,2020,914.51,49.69,4543.93
JAWA BARAT,2020,1586888.63,56.82,9016772.58
JAWA TENGAH,2020,1666931.49,56.93,9489164.62
DI YOGYAKARTA,2020,110548.12,47.35,523395.95
JAWA TIMUR,2020,1754380.30,56.68,9944538.26
BANTEN,2020,325333.24,50.88,1655170.09
BALI,2020,90980.69,58.49,532168.45
NUSA TENGGARA BARAT,2020,273460.82,48.17,1317189.81
NUSA TENGGARA TIMUR,2020,181690.63,39.90,725024.30
KALIMANTAN BARAT,2020,256575.43,30.33,778170.36
KALIMANTAN TENGAH,2020,143275.05,31.96,457952.00
KALIMANTAN SELATAN,2020,289836.35,39.69,1150306.66
KALIMANTAN TIMUR,2020,73568.44,35.67,262434.52
KALIMANTAN UTARA,2020,9883.05,33.97,33574.28
SULAWESI UTARA,2020,61827.86,40.25,248879.48
SULAWESI TENGAH,2020,178066.94,44.49,792248.84
SULAWESI SELATAN,2020,976258.14,48.23,4708464.97
SULAWESI TENGGARA,2020,133697.15,39.85,532773.49
GORONTALO,2020,48686.34,46.75,227627.20
SULAWESI BARAT,2020,64826.18,53.23,345050.37
MALUKU,2020,28668.22,38.53,110447.30
MALUKU UTARA,2020,10301.91,42.11,43382.85
PAPUA BARAT,2020,7570.63,32.20,24378.33
PAPUA,2020,52727.52,31.48,166002.30
ACEH,2021,297058.38,55.03,1634639.60
SUMATERA UTARA,2021,385405.00,52.00,2004142.51
SUMATERA BARAT,2021,272391.95,48.36,1317209.38
RIAU,2021,53062.35,40.98,217458.87
JAMBI,2021,64412.26,46.29,298149.25
SUMATERA SELATAN,2021,496241.65,51.44,2552443.19
BENGKULU,2021,55704.69,48.67,271117.19
LAMPUNG,2021,489573.23,50.77,2485452.78
KEP. BANGKA BELITUNG,2021,18278.27,38.57,70496.25
KEP. RIAU,2021,270.16,31.65,855.01
DKI JAKARTA,2021,559.97,58.03,3249.47
JAWA BARAT,2021,1604109.31,56.81,9113573.08
JAWA TENGAH,2021,1696712.36,56.69,9618656.81
DI YOGYAKARTA,2021,107506.16,51.77,556531.03
JAWA TIMUR,2021,1747481.20,56.02,9789587.67
BANTEN,2021,318248.46,50.38,1603247.00
BALI,2021,105201.31,58.83,618910.81
NUSA TENGGARA BARAT,2021,276211.88,51.39,1419559.84
NUSA TENGGARA TIMUR,2021,174900.07,41.85,731877.74
KALIMANTAN BARAT,2021,223165.74,31.90,711898.01
KALIMANTAN TENGAH,2021,125870.05,30.28,381189.55
KALIMANTAN SELATAN,2021,254263.59,39.97,1016313.55
KALIMANTAN TIMUR,2021,66269.46,36.92,244677.96
KALIMANTAN UTARA,2021,8880.83,33.74,29967.31
SULAWESI UTARA,2021,59182.52,39.35,232884.76
SULAWESI TENGAH,2021,182186.62,47.59,867012.77
SULAWESI SELATAN,2021,985158.23,51.67,5090637.23
SULAWESI TENGGARA,2021,127517.29,41.57,530029.08
GORONTALO,2021,48713.50,48.12,234392.86
SULAWESI BARAT,2021,59763.18,52.05,311072.46
MALUKU,2021,28319.75,41.24,116803.67
MALUKU UTARA,2021,7781.96,36.05,28050.80
PAPUA BARAT,2021,6414.94,41.98,26926.93
PAPUA,2021,64984.90,44.05,286279.80
ACEH,2022,271750.20,55.55,1509456.00
SUMATERA UTARA,2022,411462.10,50.76,2088584.00
SUMATERA BARAT,2022,271883.10,50.52,1373532.00
RIAU,2022,51054.04,41.83,213557.20
JAMBI,2022,60539.59,45.88,277743.80
SUMATERA SELATAN,2022,513378.20,54.06,2775069.00
BENGKULU,2022,57151.84,49.27,281610.10
LAMPUNG,2022,518256.10,51.87,2688160.00
KEP. BANGKA BELITUNG,2022,15107.80,40.66,61425.07
KEP. RIAU,2022,179.48,28.24,506.91
DKI JAKARTA,2022,477.25,48.98,2337.77
JAWA BARAT,2022,1662404.00,56.75,9433723.00
JAWA TENGAH,2022,1688670.00,55.41,9356445.00
DI YOGYAKARTA,2022,110927.20,50.64,561699.50
JAWA TIMUR,2022,1693211.00,56.26,9526516.00
BANTEN,2022,337240.70,53.04,1788583.00
BALI,2022,112320.60,60.59,680601.60
NUSA TENGGARA BARAT,2022,270092.90,53.79,1452945.00
NUSA TENGGARA TIMUR,2022,183092.00,41.29,756049.90
KALIMANTAN BARAT,2022,241478.60,30.28,731225.80
KALIMANTAN TENGAH,2022,108226.80,31.78,343918.80
KALIMANTAN SELATAN,2022,214908.90,38.13,819419.20
KALIMANTAN TIMUR,2022,64970.01,36.85,239425.30
KALIMANTAN UTARA,2022,8604.19,35.49,30533.59
SULAWESI UTARA,2022,58195.56,41.88,243730.30
SULAWESI TENGAH,2022,168993.20,44.05,744408.70
SULAWESI SELATAN,2022,1038084.00,51.64,5360169.00
SULAWESI TENGGARA,2022,118258.80,40.50,478958.00
GORONTALO,2022,46823.47,51.29,240134.50
SULAWESI BARAT,2022,69323.95,50.99,353513.30
MALUKU,2022,23987.82,38.60,92601.06
MALUKU UTARA,2022,6416.45,38.16,24486.03
PAPUA BARAT,2022,5460.59,43.89,23963.92
PAPUA,2022,49741.91,38.99,193943.50
1 Provinsi Year Yield.Areal(ha) Productivity(kw/ha) Production.(ton)
2 ACEH 2020 317869.41 55.28 1757313.07
3 SUMATERA UTARA 2020 388591.22 52.51 2040500.19
4 SUMATERA BARAT 2020 295664.47 46.92 1387269.29
5 RIAU 2020 64733.13 37.64 243685.04
6 JAMBI 2020 84772.93 45.58 386413.49
7 SUMATERA SELATAN 2020 551320.76 49.75 2743059.68
8 BENGKULU 2020 64137.28 45.66 292834.04
9 LAMPUNG 2020 545149.05 48.62 2650289.64
10 KEP. BANGKA BELITUNG 2020 17840.55 32.13 57324.32
11 KEP. RIAU 2020 298.52 28.56 852.54
12 DKI JAKARTA 2020 914.51 49.69 4543.93
13 JAWA BARAT 2020 1586888.63 56.82 9016772.58
14 JAWA TENGAH 2020 1666931.49 56.93 9489164.62
15 DI YOGYAKARTA 2020 110548.12 47.35 523395.95
16 JAWA TIMUR 2020 1754380.30 56.68 9944538.26
17 BANTEN 2020 325333.24 50.88 1655170.09
18 BALI 2020 90980.69 58.49 532168.45
19 NUSA TENGGARA BARAT 2020 273460.82 48.17 1317189.81
20 NUSA TENGGARA TIMUR 2020 181690.63 39.90 725024.30
21 KALIMANTAN BARAT 2020 256575.43 30.33 778170.36
22 KALIMANTAN TENGAH 2020 143275.05 31.96 457952.00
23 KALIMANTAN SELATAN 2020 289836.35 39.69 1150306.66
24 KALIMANTAN TIMUR 2020 73568.44 35.67 262434.52
25 KALIMANTAN UTARA 2020 9883.05 33.97 33574.28
26 SULAWESI UTARA 2020 61827.86 40.25 248879.48
27 SULAWESI TENGAH 2020 178066.94 44.49 792248.84
28 SULAWESI SELATAN 2020 976258.14 48.23 4708464.97
29 SULAWESI TENGGARA 2020 133697.15 39.85 532773.49
30 GORONTALO 2020 48686.34 46.75 227627.20
31 SULAWESI BARAT 2020 64826.18 53.23 345050.37
32 MALUKU 2020 28668.22 38.53 110447.30
33 MALUKU UTARA 2020 10301.91 42.11 43382.85
34 PAPUA BARAT 2020 7570.63 32.20 24378.33
35 PAPUA 2020 52727.52 31.48 166002.30
36 ACEH 2021 297058.38 55.03 1634639.60
37 SUMATERA UTARA 2021 385405.00 52.00 2004142.51
38 SUMATERA BARAT 2021 272391.95 48.36 1317209.38
39 RIAU 2021 53062.35 40.98 217458.87
40 JAMBI 2021 64412.26 46.29 298149.25
41 SUMATERA SELATAN 2021 496241.65 51.44 2552443.19
42 BENGKULU 2021 55704.69 48.67 271117.19
43 LAMPUNG 2021 489573.23 50.77 2485452.78
44 KEP. BANGKA BELITUNG 2021 18278.27 38.57 70496.25
45 KEP. RIAU 2021 270.16 31.65 855.01
46 DKI JAKARTA 2021 559.97 58.03 3249.47
47 JAWA BARAT 2021 1604109.31 56.81 9113573.08
48 JAWA TENGAH 2021 1696712.36 56.69 9618656.81
49 DI YOGYAKARTA 2021 107506.16 51.77 556531.03
50 JAWA TIMUR 2021 1747481.20 56.02 9789587.67
51 BANTEN 2021 318248.46 50.38 1603247.00
52 BALI 2021 105201.31 58.83 618910.81
53 NUSA TENGGARA BARAT 2021 276211.88 51.39 1419559.84
54 NUSA TENGGARA TIMUR 2021 174900.07 41.85 731877.74
55 KALIMANTAN BARAT 2021 223165.74 31.90 711898.01
56 KALIMANTAN TENGAH 2021 125870.05 30.28 381189.55
57 KALIMANTAN SELATAN 2021 254263.59 39.97 1016313.55
58 KALIMANTAN TIMUR 2021 66269.46 36.92 244677.96
59 KALIMANTAN UTARA 2021 8880.83 33.74 29967.31
60 SULAWESI UTARA 2021 59182.52 39.35 232884.76
61 SULAWESI TENGAH 2021 182186.62 47.59 867012.77
62 SULAWESI SELATAN 2021 985158.23 51.67 5090637.23
63 SULAWESI TENGGARA 2021 127517.29 41.57 530029.08
64 GORONTALO 2021 48713.50 48.12 234392.86
65 SULAWESI BARAT 2021 59763.18 52.05 311072.46
66 MALUKU 2021 28319.75 41.24 116803.67
67 MALUKU UTARA 2021 7781.96 36.05 28050.80
68 PAPUA BARAT 2021 6414.94 41.98 26926.93
69 PAPUA 2021 64984.90 44.05 286279.80
70 ACEH 2022 271750.20 55.55 1509456.00
71 SUMATERA UTARA 2022 411462.10 50.76 2088584.00
72 SUMATERA BARAT 2022 271883.10 50.52 1373532.00
73 RIAU 2022 51054.04 41.83 213557.20
74 JAMBI 2022 60539.59 45.88 277743.80
75 SUMATERA SELATAN 2022 513378.20 54.06 2775069.00
76 BENGKULU 2022 57151.84 49.27 281610.10
77 LAMPUNG 2022 518256.10 51.87 2688160.00
78 KEP. BANGKA BELITUNG 2022 15107.80 40.66 61425.07
79 KEP. RIAU 2022 179.48 28.24 506.91
80 DKI JAKARTA 2022 477.25 48.98 2337.77
81 JAWA BARAT 2022 1662404.00 56.75 9433723.00
82 JAWA TENGAH 2022 1688670.00 55.41 9356445.00
83 DI YOGYAKARTA 2022 110927.20 50.64 561699.50
84 JAWA TIMUR 2022 1693211.00 56.26 9526516.00
85 BANTEN 2022 337240.70 53.04 1788583.00
86 BALI 2022 112320.60 60.59 680601.60
87 NUSA TENGGARA BARAT 2022 270092.90 53.79 1452945.00
88 NUSA TENGGARA TIMUR 2022 183092.00 41.29 756049.90
89 KALIMANTAN BARAT 2022 241478.60 30.28 731225.80
90 KALIMANTAN TENGAH 2022 108226.80 31.78 343918.80
91 KALIMANTAN SELATAN 2022 214908.90 38.13 819419.20
92 KALIMANTAN TIMUR 2022 64970.01 36.85 239425.30
93 KALIMANTAN UTARA 2022 8604.19 35.49 30533.59
94 SULAWESI UTARA 2022 58195.56 41.88 243730.30
95 SULAWESI TENGAH 2022 168993.20 44.05 744408.70
96 SULAWESI SELATAN 2022 1038084.00 51.64 5360169.00
97 SULAWESI TENGGARA 2022 118258.80 40.50 478958.00
98 GORONTALO 2022 46823.47 51.29 240134.50
99 SULAWESI BARAT 2022 69323.95 50.99 353513.30
100 MALUKU 2022 23987.82 38.60 92601.06
101 MALUKU UTARA 2022 6416.45 38.16 24486.03
102 PAPUA BARAT 2022 5460.59 43.89 23963.92
103 PAPUA 2022 49741.91 38.99 193943.50