Kombinasi Inisial Filtering Oversampling dengan Metode Ensemble Classifier pada Klasifikasi Data Imbalanced

Gede Angga Pradipta; Putu Desiana Wulaning Ayu

doi:10.30864/jsi.v17i2.591

PDF

Published: May 15, 2023

DOI: https://doi.org/10.30864/jsi.v17i2.591

Keywords:

imbalanced data, oversampling, SMOTE-IPF, SMOTE Borderline, ensemble learning

Gede Angga Pradipta

Institut Teknologi dan Bisnis STIKOM Bali

Putu Desiana Wulaning Ayu

Institut Teknologi dan Bisnis STIKOM Bali

Abstract

Permasalahan dataset tidak seimbang (imbalanced dataset) terjadi ketika distribusi kelas dalam dataset tidak seimbang. Ini bisa menjadi masalah dalam machine learning karena model memiliki kecenderungan untuk memprediksi kelas mayoritas, yang mengakibatkan kinerja bias terhadap kelas mayoritas dan akurasi yang rendah terhadap kelas minoritas. Penelitian ini bertujuan untuk melakukan analisis pengaruh proses oversampling data untuk penanganan klasifikasi data imbalanced. Pada penelitian ini melakukan komparasi pengaruh proses oversampling pada algoritma machine learning. Algoritma machine learning yang digunakan adalah metode ensemble dengan observasi pada dua base classifier yaitu support vector machine (SVM) dan naive bayes (NB). Metode oversampling yang digunakan adalah Synthetic Minority Oversampling Teechnique (SMOTE-IPF) dan SMOTE Borderline. Eksperimen dilakukan terhadap 9 dataset yang bertipe imbalanced. Dari hasil eksperimen dapat diketahui bahwa metode ensemble baik dengan base SVM dan Naive Bayes mengalami peningkatan saat adanya proses oversampling tersebut. Dari 9 dataset yang digunakan pada eksperimen, seluruhnya mengalami peningkatan performa yang diukur menggunakan parameter akurasi, presisi, recall dan F Measure. Pada base classifier SVM peningkatan performa tertinggi pada dataset Abalone 19 dengan penambahan oversampling SMOTE Borderline. Peningkatan akurasi terjadi dari 64.5% menjadi 84.5%. Kemudian pada base classifer Naive Bayes peningkatan peforma teringgi pada dataset Abalone 19 dengan penambahan Borderline SMOTE. Peningkatan akurasi terjadi dari 62.3% menjadi 82.3%.

How to Cite

Pradipta, G. A., & Putu Desiana Wulaning Ayu. (2023). Kombinasi Inisial Filtering Oversampling dengan Metode Ensemble Classifier pada Klasifikasi Data Imbalanced. Jurnal Sistem Dan Informatika (JSI), 17(2), 137 - 145. https://doi.org/10.30864/jsi.v17i2.591

Issue

Vol 17 No 2 (2023): Jurnal Sistem dan Informatika (JSI)

Section

Articles

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Jurnal Sistem dan Informatika (JSI) bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di JSI setuju dengan ketentuan berikut:

JSI menggunakan perjanjian lisensi ekslusif, yaitu penulis memegang hak cipta atas artikel dan memberikan hak publikasi kepada Jurnal Sistem dan Informatika (JSI).
JSI mempunyai hak ekslusif untuk mempublikasi dan mendistribusikan artikel secara sebagian atau keseluruhan, dan memberikan hak kepada orang lain sesuai dengan lisensi yang digunakan.
JSI berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
JSI berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.

Artikel yang diterbitkan oleh JSI menggunakan lisensi Creative Commons Attribution-ShareAlike 4.0 yang memberikan hak terhadap orang lain dengan secara bebas untuk menyalin, mendistribusikan artikel menggunakan media apapun dan dalam format apapun, menyadur artikel untuk kepentingan apapun bahkan untuk kepentingan komersial dengan ketentuan sebagai berikut:

Artikel harus dirujuk, link terhadap lisensi harus disediakan, dan jika terdapat bagian artikel yang diubah harus ditandai.
Jika artikel disadur sehingga terdapat perubahan, hasil saduran harus didistribusikan menggunakan lisensi yang sama.
Tidak diperkenankan untuk membatasi orang lain terhadap apa yang diperbolehkan oleh lisensi.

References

L. I. Kuncheva, Combining pattern classifiers: methods and algorithms, 2nd ed. Wiley Blackwell, 2014.
M. Woźniak, M. Graña, and E. Corchado, “A survey of multiple classifier systems as hybrid systems,” Information Fusion, vol. 16, no. 1, pp. 3–17, 2014, doi: 10.1016/j.inffus.2013.04.006.
J. Kittler, I. C. Society, M. Hatef, R. P. W. Duin, and J. Matas, “On Combining Classifiers,” IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 20, no. 3, pp. 226–239, 1998.
A. Fernández, S. García, M. Galar, and R. C. Prati, “Learning from Imbalanced Data Sets,” Springer Nature Switzerland AG 2018, 2018.
L. Rokach, “Ensemble-based classifiers,” Artificial Intelligence Review, no. November 2009, pp. 1–39, 2010, doi: 10.1007/s10462-009-9124-7.
Aytung Onan, S. Korukoglu, and H. Bulut, “A Multiobjective Weighted Voting Ensemble Classifier Based on Differential Evolution Algorithm for Text Sentiment Classification,” Expert Systems With Applications, 2016, doi: 10.1016/j.eswa.2016.06.005.
F. Moreno-seco, “Comparison of Classifier Fusion Methods for Classification in Pattern Recognition Tasks,” pp. 705–713, 2006.
Mehmet Akif Yaman, “SS symmetry Comparison of Random Subspace and Voting Ensemble Machine Learning Methods for,” Symmetry 2018, vol. 10, 2018, doi: 10.3390/sym10110651.
O. O. Petinrin, F. Saeed, and T. Al-hadhrami, “Voting-Based Ensemble Method for Prediction of Bioactive Molecules,” 2nd International Conference on Knowledge Engineering and Applications Voting-Based, pp. 118–122, 2017.
M. R. Smith and T. Martinez, “The robustness of majority voting compared to filtering misclassified instances in supervised classification tasks,” Artificial Intelligence Review, 2016, doi: 10.1007/s10462-016-9518-2.
S. Bashir, U. Qamar, and F. Hassan, “BagMOOV : A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting,” Australas Phys Eng Sci Med, 2015, doi: 10.1007/s13246-015-0337-6.
W. Chen et al., “Rail crack recognition based on Adaptive Weighting Multi-classifier Fusion Decision,” Measurement: Journal of the International Measurement Confederation, vol. 123, no. December 2017, pp. 102–114, 2018, doi: 10.1016/j.measurement.2018.03.059.
K. Wang, C. Huang, and W. Zhou, “Pathological automatic classification of hepatocellular carcinoma based on adaptive weighted multi-classifier fusion,” Proceedings of 2017 IEEE 2nd Advanced Information Technology, Electronic and Automation Control Conference, IAEAC 2017, pp. 1489–1493, 2017, doi: 10.1109/IAEAC.2017.8054261.

Article Sidebar

Main Article Content

Abstract

Article Details

References