Klasifikasi Data Saran Pemustaka di Perpustakaan STIKOM Bali Menggunakan TF-IDF dan Multinomial Naive Bayes

I Made Bhaskara Gautama

doi:10.30864/jsi.v17i2.490

PDF

Published: May 15, 2023

DOI: https://doi.org/10.30864/jsi.v17i2.490

Keywords:

klasifikasi, tf-idf, multinomial naive bayes, machine learning

I Made Bhaskara Gautama

Institut Teknologi dan Bisnis STIKOM Bali

Abstract

Perpustakaan STIKOM Bali berperan penting dalam mendukung pembelajaran dan riset dengan koleksi yang luas dan up-to-date. Untuk meningkatkan layanan, perpustakaan mengadopsi pendekatan proaktif dengan menyebarkan kuesioner kepada pengguna melalui website. Hasil kuesioner digunakan untuk memahami kebutuhan pengguna dan merancang perbaikan yang sesuai. Namun, mengelompokkan jawaban kuesioner seringkali menimbulkan tantangan. Untuk mengatasi hal ini, penelitian klasifikasi menggunakan metode TF-IDF dan algoritma Multinomial Naive Bayes untuk mengelompokkan jawaban secara efisien dilakukan. Data awal berisi 5264 kata, di mana 53% merupakan stop word. Eksperimen dilakukan dengan menggunakan berbagai teknik pra pemrosesan dan class balancing. Hasilnya menunjukkan bahwa lowercase conversion tidak berpengaruh pada klasifikasi, namun penghapusan stop word menurunkan performa. Spelling correction meningkatkan performa, tetapi dengan class balancing ROS, precision dan F1-score sedikit menurun. Secara keseluruhan, class balancing ROS meningkatkan performa klasifikasi. Pra pemrosesan tidak selalu meningkatkan performa klasifikasi, sehingga diperlukan eksperimen lebih lanjut dengan berbagai teknik pra pemrosesan untuk mendapatkan model optimal.

How to Cite

Gautama, I. M. B. (2023). Klasifikasi Data Saran Pemustaka di Perpustakaan STIKOM Bali Menggunakan TF-IDF dan Multinomial Naive Bayes. Jurnal Sistem Dan Informatika (JSI), 17(2), 62 - 72. https://doi.org/10.30864/jsi.v17i2.490

Issue

Vol 17 No 2 (2023): Jurnal Sistem dan Informatika (JSI)

Section

Articles

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Jurnal Sistem dan Informatika (JSI) bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di JSI setuju dengan ketentuan berikut:

JSI menggunakan perjanjian lisensi ekslusif, yaitu penulis memegang hak cipta atas artikel dan memberikan hak publikasi kepada Jurnal Sistem dan Informatika (JSI).
JSI mempunyai hak ekslusif untuk mempublikasi dan mendistribusikan artikel secara sebagian atau keseluruhan, dan memberikan hak kepada orang lain sesuai dengan lisensi yang digunakan.
JSI berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
JSI berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.

Artikel yang diterbitkan oleh JSI menggunakan lisensi Creative Commons Attribution-ShareAlike 4.0 yang memberikan hak terhadap orang lain dengan secara bebas untuk menyalin, mendistribusikan artikel menggunakan media apapun dan dalam format apapun, menyadur artikel untuk kepentingan apapun bahkan untuk kepentingan komersial dengan ketentuan sebagai berikut:

Artikel harus dirujuk, link terhadap lisensi harus disediakan, dan jika terdapat bagian artikel yang diubah harus ditandai.
Jika artikel disadur sehingga terdapat perubahan, hasil saduran harus didistribusikan menggunakan lisensi yang sama.
Tidak diperkenankan untuk membatasi orang lain terhadap apa yang diperbolehkan oleh lisensi.

References

M. Djaenudin and C. Trianggoro, “Inovasi Layanan Perpustakaan Khusus Dalam Ekosistem E-Research Dalam Mendukung Open Science: Studi Kasus Perpustakaan PDDI LIPI,” Al Maktabah, vol. 19, no. 1, 2020.
A. Alessa and M. Faezipour, “Tweet classification using sentiment analysis features and TF-IDF weighting for improved flu trend detection,” in Machine Learning and Data Mining in Pattern Recognition: 14th International Conference, MLDM 2018, New York, NY, USA, July 15-19, 2018, Proceedings, Part I 14, 2018, pp. 174–186.
G. Singh, B. Kumar, L. Gaur, and A. Tyagi, “Comparison between multinomial and Bernoulli naive Bayes for text classification,” in 2019 International conference on automation, computational and technology management (ICACTM), 2019, pp. 593–596.
N. L. P. M. Putu, A. Z. Amrullah, and others, “Analisis Sentimen dan Pemodelan Topik Pariwisata Lombok Menggunakan Algoritma Naive Bayes dan Latent Dirichlet Allocation,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 5, no. 1, pp. 123–131, 2021.
Y. HaCohen-Kerner, D. Miller, and Y. Yigal, “The influence of preprocessing on text classification using a bag-of-words representation,” PLoS One, vol. 15, no. 5, May 2020, doi: 10.1371/journal.pone.0232525.
D. S. Sisodia, N. K. Reddy, and S. Bhandari, “Performance evaluation of class balancing techniques for credit card fraud detection,” in 2017 IEEE International Conference on power, control, signals and instrumentation engineering (ICPCSI), 2017, pp. 2747–2752.
B. Drury and A. de Andrade Lopes, “A comparison of the effect of feature selection and balancing strategies upon the sentiment classification of Portuguese news stories,” Proceedings of ENIAC, 2014.
M. A. Al-Asadi and S. Tasdemir, “Empirical comparisons for combining balancing and feature selection strategies for characterizing football players using FIFA video game system,” IEEE Access, vol. 9, pp. 149266–149286, 2021.
A. Kelly and M. A. Johnson, “Investigating the statistical assumptions of Naive Bayes classifiers,” in 2021 55th annual conference on information sciences and systems (CISS), 2021, pp. 1–6.
A. K. Uysal and S. Gunal, “The impact of preprocessing on text classification,” Inf Process Manag, vol. 50, no. 1, pp. 104–112, 2014.

Article Sidebar

Main Article Content

Abstract

Article Details

References