Klasifikasi Data Saran Pemustaka di Perpustakaan STIKOM Bali Menggunakan TF-IDF dan Multinomial Naive Bayes
Main Article Content
Abstract
Perpustakaan STIKOM Bali berperan penting dalam mendukung pembelajaran dan riset dengan koleksi yang luas dan up-to-date. Untuk meningkatkan layanan, perpustakaan mengadopsi pendekatan proaktif dengan menyebarkan kuesioner kepada pengguna melalui website. Hasil kuesioner digunakan untuk memahami kebutuhan pengguna dan merancang perbaikan yang sesuai. Namun, mengelompokkan jawaban kuesioner seringkali menimbulkan tantangan. Untuk mengatasi hal ini, penelitian klasifikasi menggunakan metode TF-IDF dan algoritma Multinomial Naive Bayes untuk mengelompokkan jawaban secara efisien dilakukan. Data awal berisi 5264 kata, di mana 53% merupakan stop word. Eksperimen dilakukan dengan menggunakan berbagai teknik pra pemrosesan dan class balancing. Hasilnya menunjukkan bahwa lowercase conversion tidak berpengaruh pada klasifikasi, namun penghapusan stop word menurunkan performa. Spelling correction meningkatkan performa, tetapi dengan class balancing ROS, precision dan F1-score sedikit menurun. Secara keseluruhan, class balancing ROS meningkatkan performa klasifikasi. Pra pemrosesan tidak selalu meningkatkan performa klasifikasi, sehingga diperlukan eksperimen lebih lanjut dengan berbagai teknik pra pemrosesan untuk mendapatkan model optimal.
Article Details
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jurnal Sistem dan Informatika (JSI) bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di JSI setuju dengan ketentuan berikut:- JSI menggunakan perjanjian lisensi ekslusif, yaitu penulis memegang hak cipta atas artikel dan memberikan hak publikasi kepada Jurnal Sistem dan Informatika (JSI).
- JSI mempunyai hak ekslusif untuk mempublikasi dan mendistribusikan artikel secara sebagian atau keseluruhan, dan memberikan hak kepada orang lain sesuai dengan lisensi yang digunakan.
- JSI berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
- JSI berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.
- Artikel harus dirujuk, link terhadap lisensi harus disediakan, dan jika terdapat bagian artikel yang diubah harus ditandai.
- Jika artikel disadur sehingga terdapat perubahan, hasil saduran harus didistribusikan menggunakan lisensi yang sama.
- Tidak diperkenankan untuk membatasi orang lain terhadap apa yang diperbolehkan oleh lisensi.
References
A. Alessa and M. Faezipour, “Tweet classification using sentiment analysis features and TF-IDF weighting for improved flu trend detection,” in Machine Learning and Data Mining in Pattern Recognition: 14th International Conference, MLDM 2018, New York, NY, USA, July 15-19, 2018, Proceedings, Part I 14, 2018, pp. 174–186.
G. Singh, B. Kumar, L. Gaur, and A. Tyagi, “Comparison between multinomial and Bernoulli naive Bayes for text classification,” in 2019 International conference on automation, computational and technology management (ICACTM), 2019, pp. 593–596.
N. L. P. M. Putu, A. Z. Amrullah, and others, “Analisis Sentimen dan Pemodelan Topik Pariwisata Lombok Menggunakan Algoritma Naive Bayes dan Latent Dirichlet Allocation,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 123–131, 2021.
Y. HaCohen-Kerner, D. Miller, and Y. Yigal, “The influence of preprocessing on text classification using a bag-of-words representation,” PLoS One, vol. 15, no. 5, May 2020, doi: 10.1371/journal.pone.0232525.
D. S. Sisodia, N. K. Reddy, and S. Bhandari, “Performance evaluation of class balancing techniques for credit card fraud detection,” in 2017 IEEE International Conference on power, control, signals and instrumentation engineering (ICPCSI), 2017, pp. 2747–2752.
B. Drury and A. de Andrade Lopes, “A comparison of the effect of feature selection and balancing strategies upon the sentiment classification of Portuguese news stories,” Proceedings of ENIAC, 2014.
M. A. Al-Asadi and S. Tasdemir, “Empirical comparisons for combining balancing and feature selection strategies for characterizing football players using FIFA video game system,” IEEE Access, vol. 9, pp. 149266–149286, 2021.
A. Kelly and M. A. Johnson, “Investigating the statistical assumptions of Naive Bayes classifiers,” in 2021 55th annual conference on information sciences and systems (CISS), 2021, pp. 1–6.
A. K. Uysal and S. Gunal, “The impact of preprocessing on text classification,” Inf Process Manag, vol. 50, no. 1, pp. 104–112, 2014.