Main Article Content

I Made Bhaskara Gautama

Abstract

Perpustakaan STIKOM Bali berperan penting dalam mendukung pembelajaran dan riset dengan koleksi yang luas dan up-to-date. Untuk meningkatkan layanan, perpustakaan mengadopsi pendekatan proaktif dengan menyebarkan kuesioner kepada pengguna melalui website. Hasil kuesioner digunakan untuk memahami kebutuhan pengguna dan merancang perbaikan yang sesuai. Namun, mengelompokkan jawaban kuesioner seringkali menimbulkan tantangan. Untuk mengatasi hal ini, penelitian klasifikasi menggunakan metode TF-IDF dan algoritma Multinomial Naive Bayes untuk mengelompokkan jawaban secara efisien dilakukan. Data awal berisi 5264 kata, di mana 53% merupakan stop word. Eksperimen dilakukan dengan menggunakan berbagai teknik pra pemrosesan dan class balancing. Hasilnya menunjukkan bahwa lowercase conversion tidak berpengaruh pada klasifikasi, namun penghapusan stop word menurunkan performa. Spelling correction meningkatkan performa, tetapi dengan class balancing ROS, precision dan F1-score sedikit menurun. Secara keseluruhan, class balancing ROS meningkatkan performa klasifikasi. Pra pemrosesan tidak selalu meningkatkan performa klasifikasi, sehingga diperlukan eksperimen lebih lanjut dengan berbagai teknik pra pemrosesan untuk mendapatkan model optimal.

Article Details

How to Cite
Gautama, I. M. B. (2023). Klasifikasi Data Saran Pemustaka di Perpustakaan STIKOM Bali Menggunakan TF-IDF dan Multinomial Naive Bayes. Jurnal Sistem Dan Informatika (JSI), 17(2), 62 - 72. https://doi.org/10.30864/jsi.v17i2.490
Section
Articles

References

M. Djaenudin and C. Trianggoro, “Inovasi Layanan Perpustakaan Khusus Dalam Ekosistem E-Research Dalam Mendukung Open Science: Studi Kasus Perpustakaan PDDI LIPI,” Al Maktabah, vol. 19, no. 1, 2020.
A. Alessa and M. Faezipour, “Tweet classification using sentiment analysis features and TF-IDF weighting for improved flu trend detection,” in Machine Learning and Data Mining in Pattern Recognition: 14th International Conference, MLDM 2018, New York, NY, USA, July 15-19, 2018, Proceedings, Part I 14, 2018, pp. 174–186.
G. Singh, B. Kumar, L. Gaur, and A. Tyagi, “Comparison between multinomial and Bernoulli naive Bayes for text classification,” in 2019 International conference on automation, computational and technology management (ICACTM), 2019, pp. 593–596.
N. L. P. M. Putu, A. Z. Amrullah, and others, “Analisis Sentimen dan Pemodelan Topik Pariwisata Lombok Menggunakan Algoritma Naive Bayes dan Latent Dirichlet Allocation,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 123–131, 2021.
Y. HaCohen-Kerner, D. Miller, and Y. Yigal, “The influence of preprocessing on text classification using a bag-of-words representation,” PLoS One, vol. 15, no. 5, May 2020, doi: 10.1371/journal.pone.0232525.
D. S. Sisodia, N. K. Reddy, and S. Bhandari, “Performance evaluation of class balancing techniques for credit card fraud detection,” in 2017 IEEE International Conference on power, control, signals and instrumentation engineering (ICPCSI), 2017, pp. 2747–2752.
B. Drury and A. de Andrade Lopes, “A comparison of the effect of feature selection and balancing strategies upon the sentiment classification of Portuguese news stories,” Proceedings of ENIAC, 2014.
M. A. Al-Asadi and S. Tasdemir, “Empirical comparisons for combining balancing and feature selection strategies for characterizing football players using FIFA video game system,” IEEE Access, vol. 9, pp. 149266–149286, 2021.
A. Kelly and M. A. Johnson, “Investigating the statistical assumptions of Naive Bayes classifiers,” in 2021 55th annual conference on information sciences and systems (CISS), 2021, pp. 1–6.
A. K. Uysal and S. Gunal, “The impact of preprocessing on text classification,” Inf Process Manag, vol. 50, no. 1, pp. 104–112, 2014.
Indexed and Journal List Title by: