Topic Modelling Latent Dirichlet Allocation untuk Klasifikasi Komentar Kuliah Pada Twitter X

Bambang Subeno (1)
(1) Telkom University

Abstract

In recent years, social media data analysis has become crucial to understand public opinion, feedback, and engagement in various domains, including education. This study uses the Latent Dirichlet Allocation (LDA) method to perform topic modeling on college-related comments uploaded on Twitter X. The goal is to classify these comments into meaningful topics to make it easier for educators and institutions to identify areas of interest, concern, and overall sentiment. From the dataset of Twitter comments X, as many as 1200 comments related to college, four topics have been produced, labeled topic-0: "Tuition Fees", topic-1: "College Scholarships", topic-2: "Universities in Bandung", and topic-3: "Student Activities". The highest probability of the word from the four topics is the word "college" at 0.046. Based on these results, the most searched and discussed in social media are related to financing, scholarships, universities and student activities. For this reason, with these results, it is hoped that Educational Institutions need to pay attention to promotional content media related to the four topics properly.
Keywords: clasification, LDA, topic modeling
 
Abstrak
Dalam beberapa tahun terakhir, analisis data media sosial menjadi krusial untuk memahami opini publik, umpan balik, dan keterlibatan dalam berbagai domain, termasuk pendidikan. Penelitian ini menggunakan metode Latent Dirichlet Allocation (LDA) untuk melakukan pemodelan topik pada komentar terkait kuliah yang diunggah di twitter X. Tujuannya adalah untuk mengklasifikasikan komentar-komentar ini ke dalam topik-topik yang bermakna untuk memudahkan pendidik dan lembaga dalam mengidentifikasi bidang minat, perhatian, dan sentimen secara keseluruhan. Dari dataset kumpulan komentar twitter X sebanyak 1200 komentar yang berkaitan tentang kuliah telah menghasilkan empat topic yang diberi label topic-0: “Biaya Kuliah”, topic-1: “Beasiswa Kuliah”, topic-2: “Universitas di Bandung”, dan topic-3: “Kegiatan Mahasiswa”. Probabilitas kata yang paling tinggi dari ke-empat topic adalah kata “kuliah” sebesar 0.046. Berdasarkan hasil tersebut bahwa dalam media social yang paling banyak dicari dan diperbicangkan adalah terkait pembiayaan, beasiswa, universitas dan kegiatan mahasiswanya. Untuk itu dengan hasil ini diharapkan para Lembaga Pendidikan perlu memperhatikan media konten promosi terkait empat topic tersebut dengan baik.
Kata kunci: klasifikasi, LDA, topic modeling

Authors

Bambang Subeno

How to Cite

Topic Modelling Latent Dirichlet Allocation untuk Klasifikasi Komentar Kuliah Pada Twitter X. (2024). Jurnal Wahana Informatika, 3(1), 1-7. https://journal2.unfari.ac.id/index.php/jwi/article/view/1000056

##plugins.themes.bootstrap3.article.details##

References

Most read articles by the same author(s)