Main Article Content

Gede Angga Pradipta
Putu Desiana Wulaning Ayu

Abstract

Permasalahan dataset tidak seimbang (imbalanced dataset) terjadi ketika distribusi kelas dalam dataset tidak seimbang. Ini bisa menjadi masalah dalam machine learning karena model memiliki kecenderungan untuk memprediksi kelas mayoritas, yang mengakibatkan kinerja bias terhadap kelas mayoritas dan akurasi yang rendah terhadap kelas minoritas. Penelitian ini bertujuan untuk melakukan analisis pengaruh proses oversampling data untuk penanganan klasifikasi data imbalanced. Pada penelitian ini melakukan komparasi pengaruh proses oversampling pada algoritma machine learning. Algoritma machine learning yang digunakan adalah metode ensemble dengan observasi pada dua base classifier yaitu support vector machine (SVM) dan naive bayes (NB). Metode oversampling yang digunakan adalah Synthetic Minority Oversampling Teechnique (SMOTE-IPF) dan SMOTE Borderline. Eksperimen dilakukan terhadap 9 dataset yang bertipe imbalanced. Dari hasil eksperimen dapat diketahui bahwa metode ensemble baik dengan base SVM dan Naive Bayes mengalami peningkatan saat adanya proses oversampling tersebut. Dari 9 dataset yang digunakan pada eksperimen, seluruhnya mengalami peningkatan performa yang diukur menggunakan parameter akurasi, presisi, recall dan F Measure. Pada base classifier SVM peningkatan performa tertinggi pada dataset Abalone 19 dengan penambahan oversampling SMOTE Borderline. Peningkatan akurasi terjadi dari 64.5% menjadi 84.5%. Kemudian pada base classifer Naive Bayes peningkatan peforma teringgi pada dataset Abalone 19 dengan penambahan Borderline SMOTE. Peningkatan akurasi terjadi dari 62.3% menjadi 82.3%.

Article Details

How to Cite
Pradipta, G. A., & Putu Desiana Wulaning Ayu. (2023). Kombinasi Inisial Filtering Oversampling dengan Metode Ensemble Classifier pada Klasifikasi Data Imbalanced. Jurnal Sistem Dan Informatika (JSI), 17(2), 137 - 145. https://doi.org/10.30864/jsi.v17i2.591
Section
Articles

References

L. I. Kuncheva, Combining pattern classifiers: methods and algorithms, 2nd ed. Wiley Blackwell, 2014.
M. Woźniak, M. Graña, and E. Corchado, “A survey of multiple classifier systems as hybrid systems,” Information Fusion, vol. 16, no. 1, pp. 3–17, 2014, doi: 10.1016/j.inffus.2013.04.006.
J. Kittler, I. C. Society, M. Hatef, R. P. W. Duin, and J. Matas, “On Combining Classifiers,” IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, vol. 20, no. 3, pp. 226–239, 1998.
A. Fernández, S. García, M. Galar, and R. C. Prati, “Learning from Imbalanced Data Sets,” Springer Nature Switzerland AG 2018, 2018.
L. Rokach, “Ensemble-based classifiers,” Artificial Intelligence Review, no. November 2009, pp. 1–39, 2010, doi: 10.1007/s10462-009-9124-7.
Aytung Onan, S. Korukoglu, and H. Bulut, “A Multiobjective Weighted Voting Ensemble Classifier Based on Differential Evolution Algorithm for Text Sentiment Classification,” Expert Systems With Applications, 2016, doi: 10.1016/j.eswa.2016.06.005.
F. Moreno-seco, “Comparison of Classifier Fusion Methods for Classification in Pattern Recognition Tasks,” pp. 705–713, 2006.
Mehmet Akif Yaman, “SS symmetry Comparison of Random Subspace and Voting Ensemble Machine Learning Methods for,” Symmetry 2018, vol. 10, 2018, doi: 10.3390/sym10110651.
O. O. Petinrin, F. Saeed, and T. Al-hadhrami, “Voting-Based Ensemble Method for Prediction of Bioactive Molecules,” 2nd International Conference on Knowledge Engineering and Applications Voting-Based, pp. 118–122, 2017.
M. R. Smith and T. Martinez, “The robustness of majority voting compared to filtering misclassified instances in supervised classification tasks,” Artificial Intelligence Review, 2016, doi: 10.1007/s10462-016-9518-2.
S. Bashir, U. Qamar, and F. Hassan, “BagMOOV : A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting,” Australas Phys Eng Sci Med, 2015, doi: 10.1007/s13246-015-0337-6.
W. Chen et al., “Rail crack recognition based on Adaptive Weighting Multi-classifier Fusion Decision,” Measurement: Journal of the International Measurement Confederation, vol. 123, no. December 2017, pp. 102–114, 2018, doi: 10.1016/j.measurement.2018.03.059.
K. Wang, C. Huang, and W. Zhou, “Pathological automatic classification of hepatocellular carcinoma based on adaptive weighted multi-classifier fusion,” Proceedings of 2017 IEEE 2nd Advanced Information Technology, Electronic and Automation Control Conference, IAEAC 2017, pp. 1489–1493, 2017, doi: 10.1109/IAEAC.2017.8054261.
Indexed and Journal List Title by: