# Klasifikasi Teks menggunakan ANN (TF-IDF + FNN)

**Nama:** Fatah Sabila Rosyad  
**NIM:** 202210715288  
**Kelas:** F7B2  
**MK:** NLP  

**Tujuan praktikum:**
Menerapkan klasifikasi teks sentimen sederhana menggunakan TF-IDF dan Feedforward Neural Network (MLPClassifier), dengan:
- Mengubah contoh teks (menggunakan kalimat yang dibuat sendiri)
- Mengubah parameter TF-IDF (`max_features`, `ngram_range`)
- Mengubah arsitektur dan parameter model ANN (`hidden_layer_sizes`, `max_iter`, `learning_rate_init`)


In [2]:
# ---------------------------------------------------------
# Klasifikasi Teks dengan TF-IDF + Feedforward Neural Network
# ---------------------------------------------------------

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report, confusion_matrix

In [3]:
# -----------------------------------------
# 1. Contoh Dataset (teks buatan Fatah)
# -----------------------------------------

data = {
    "text": [
        "Saya Fatah Sabila Rosyad merasa sangat puas dengan kualitas produk ini.",
        "Sebagai pelanggan, Fatah kecewa karena pelayanan toko sangat lambat.",
        "Pengalaman belanja Fatah kali ini menyenangkan, proses cepat dan barang sesuai.",
        "Fatah benci produk ini karena mudah rusak dan tidak sesuai deskripsi.",
        "Menurut Fatah kualitas produk ini sangat bagus dan layak direkomendasikan.",
        "Fatah tidak akan membeli lagi di sini karena pelayanan buruk dan respon yang lambat."
    ],
    "label": ["positive", "negative", "positive", "negative", "positive", "negative"]
}

df = pd.DataFrame(data)
df


Unnamed: 0,text,label
0,Saya Fatah Sabila Rosyad merasa sangat puas de...,positive
1,"Sebagai pelanggan, Fatah kecewa karena pelayan...",negative
2,Pengalaman belanja Fatah kali ini menyenangkan...,positive
3,Fatah benci produk ini karena mudah rusak dan ...,negative
4,Menurut Fatah kualitas produk ini sangat bagus...,positive
5,Fatah tidak akan membeli lagi di sini karena p...,negative


In [4]:
# -----------------------------------------
# 2. Split Train & Test (PERUBAHAN: test_size & random_state)
# -----------------------------------------
X_train, X_test, y_train, y_test = train_test_split(
    df["text"],
    df["label"],
    test_size=0.34,      # semula 0.3
    random_state=7       # semula 42
)

print("Jumlah data latih :", len(X_train))
print("Jumlah data uji   :", len(X_test))


Jumlah data latih : 3
Jumlah data uji   : 3


In [5]:
# -----------------------------------------
# 3. TF-IDF Vectorization (PERUBAHAN PARAMETER)
# -----------------------------------------

tfidf = TfidfVectorizer(
    max_features=1000,      # semula 5000
    ngram_range=(1, 2)      # tambahan: gunakan unigram + bigram
)

X_train_tfidf = tfidf.fit_transform(X_train)
X_test_tfidf = tfidf.transform(X_test)

print("Shape X_train_tfidf:", X_train_tfidf.shape)
print("Shape X_test_tfidf :", X_test_tfidf.shape)


Shape X_train_tfidf: (3, 52)
Shape X_test_tfidf : (3, 52)


In [6]:
# -----------------------------------------
# 4. Feedforward ANN (MLPClassifier) (PERUBAHAN PARAMETER)
# -----------------------------------------

model = MLPClassifier(
    hidden_layer_sizes=(128, 32),    # semula (256, 64)
    activation='relu',
    solver='adam',
    learning_rate_init=0.001,        # tambahan
    max_iter=300,                    # semula 500
    random_state=7
)

model.fit(X_train_tfidf, y_train)
print("Model selesai dilatih.")


Model selesai dilatih.


In [7]:
# -----------------------------------------
# 5. Evaluasi Model
# -----------------------------------------

y_pred = model.predict(X_test_tfidf)

print("=== Classification Report ===")
print(classification_report(y_test, y_pred))

print("=== Confusion Matrix ===")
print(confusion_matrix(y_test, y_pred))


=== Classification Report ===
              precision    recall  f1-score   support

    negative       1.00      0.50      0.67         2
    positive       0.50      1.00      0.67         1

    accuracy                           0.67         3
   macro avg       0.75      0.75      0.67         3
weighted avg       0.83      0.67      0.67         3

=== Confusion Matrix ===
[[1 1]
 [0 1]]


In [8]:
# -----------------------------------------
# 6. Prediksi Teks Baru (contoh 1 - positif)
# -----------------------------------------
sample_text = ["Menurut Fatah, pengalaman belanja kali ini sangat memuaskan."]
sample_vec = tfidf.transform(sample_text)
prediction = model.predict(sample_vec)

print("Prediksi untuk:", sample_text[0])
print("Hasil:", prediction[0])


Prediksi untuk: Menurut Fatah, pengalaman belanja kali ini sangat memuaskan.
Hasil: positive


In [9]:
# -----------------------------------------
# 6. Prediksi Teks Baru (contoh 2 - negatif)
# -----------------------------------------
sample_text = ["Saya Fatah merasa kecewa karena layanan toko sangat buruk."]
sample_vec = tfidf.transform(sample_text)
prediction = model.predict(sample_vec)

print("Prediksi untuk:", sample_text[0])
print("Hasil:", prediction[0])


Prediksi untuk: Saya Fatah merasa kecewa karena layanan toko sangat buruk.
Hasil: negative
