Kecerdasan Buatan & Bahasa

Memahami bagaimana mesin mengerti dan memproses bahasa manusia.

  • Tokenisasi: Proses memecah teks menjadi potongan kecil (kata atau karakter).
  • Stopwords: Kata-kata umum yang diabaikan karena kurang memiliki makna unik (seperti "dan", "di").
  • Sentiment Analysis: Teknik menentukan emosi (positif/negatif) dalam sebuah teks.
  • Stemming: Proses mengubah kata berimbuhan menjadi kata dasarnya.
  • Corpus: Kumpulan data teks besar yang digunakan untuk melatih model bahasa.