Peningkatan Akurasi Klasifikasi Kualitas Udara melalui Oversampling dengan Metode Support Vector Machine dan Random Forest
Main Article Content
Abstract
Kualitas udara merupakan faktor penting yang memengaruhi kesehatan manusia dan semua makhluk hidup. Penelitian ini bertujuan untuk mengembangkan model klasifikasi kualitas udara menggunakan teknik oversampling SMOTE, serta metode Random Forest dan Support Vector Machine. Data yang digunakan adalah Indeks Standar Pencemaran Udara (ISPU) DKI Jakarta selama tahun 2022. Hasil pengujian menunjukkan bahwa menggunakan Random Forest, akurasi model mencapai 98%, sedangkan dengan penerapan SMOTE, akurasi meningkat menjadi 99%. Pada pemodelan dengan Support Vector Machine, akurasi mencapai 91%, namun dengan SMOTE, akurasi meningkat menjadi 95%. Hal ini menunjukkan bahwa penggunaan teknik oversampling SMOTE dapat meningkatkan akurasi model. Diharapkan penelitian ini dapat memberikan kontribusi penting bagi pemantauan dan pengelolaan lingkungan, serta memberikan pemahaman yang lebih baik tentang kualitas udara.
Article Details
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Jurnal Sistem dan Informatika (JSI) bersifat open access, yaitu dapat diakses secara umum tanpa dikenakan biaya. Penulis yang menerbitkan artikelnya di JSI setuju dengan ketentuan berikut:- JSI menggunakan perjanjian lisensi ekslusif, yaitu penulis memegang hak cipta atas artikel dan memberikan hak publikasi kepada Jurnal Sistem dan Informatika (JSI).
- JSI mempunyai hak ekslusif untuk mempublikasi dan mendistribusikan artikel secara sebagian atau keseluruhan, dan memberikan hak kepada orang lain sesuai dengan lisensi yang digunakan.
- JSI berhak untuk menyediakan artikel dalam berbagai bentuk dan media, sehingga artikel dapat digunakan untuk teknologi terbaru bahkan setelah dipublikasikan.
- JSI berhak untuk menegakkan hak-hak atas nama penulis pada artikel terhadap pihak ketiga. Misalnya dalam kasus plagiarisme atau pelanggaran hak cipta.
- Artikel harus dirujuk, link terhadap lisensi harus disediakan, dan jika terdapat bagian artikel yang diubah harus ditandai.
- Jika artikel disadur sehingga terdapat perubahan, hasil saduran harus didistribusikan menggunakan lisensi yang sama.
- Tidak diperkenankan untuk membatasi orang lain terhadap apa yang diperbolehkan oleh lisensi.
References
A. Indrawati, “Penerapan Teknik Kombinasi Oversampling Dan Undersampling Untuk Mengatasi Permasalahan Imbalanced Dataset,” Jurnal Informatika dan Komputer) Akreditasi KEMENRISTEKDIKTI, vol. 4, no. 1, 2021, doi: 10.33387/jiko.
F. Hamami and I. A. Dahlan, “Klasifikasi Cuaca Provinsi Dki Jakarta Menggunakan Algoritma Random Forest Dengan Teknik Oversampling,” Jurnal Teknoinfo, vol. 16, no. 1, p. 87, 2022, doi: 10.33365/jti.v16i1.1533.
D. L. Hidup, “Data Indeks Standar Pencemar Udara (ISPU) di Provinsi DKI Jakarta,” 2022. Accessed: Jan. 01, 2022. [Online]. Available: https://satudata.jakarta.go.id
G. A. Pradipta, R. Wardoyo, A. Musdholifah, I. N. H. Sanjaya, and M. Ismail, “SMOTE for Handling Imbalanced Data Problem : A Review,” in 2021 Sixth International Conference on Informatics and Computing (ICIC), 2021, pp. 1–8. doi: 10.1109/ICIC54025.2021.9632912.
R. Das, S. Kr. Biswas, D. Devi, and B. Sarma, “An Oversampling Technique by Integrating Reverse Nearest Neighbor in SMOTE: Reverse-SMOTE,” in 2020 International Conference on Smart Electronics and Communication (ICOSEC), 2020, pp. 1239–1244. doi: 10.1109/ICOSEC49089.2020.9215387.
G. Putro Dirgantoro, M. A. Soeleman, and C. Supriyanto, “Smoothing Weight Distance to Solve Euclidean Distance Measurement Problems in K-Nearest Neighbor Algorithm,” in 2021 IEEE 5th International Conference on Information Technology, Information Systems and Electrical Engineering (ICITISEE), 2021, pp. 294–298. doi: 10.1109/ICITISEE53823.2021.9655820.
R. Wardoyo, I. M. A. Wirawan, and I. G. A. Pradipta, “Oversampling Approach Using Radius-SMOTE for Imbalance Electroencephalography Datasets,” Emerging Science Journal, vol. 6, no. 2, pp. 382–398, 2022, doi: 10.28991/ESJ-2022-06-02-013.
A. L. Latifah, A. Shabrina, I. N. Wahyuni, and R. Sadikin, “Evaluation of Random Forest model for forest fire prediction based on climatology over Borneo,” in 2019 International Conference on Computer, Control, Informatics and its Applications (IC3INA), 2019, pp. 4–8. doi: 10.1109/IC3INA48034.2019.8949588.
Y. Dong, H. Wang, L. Zhang, and K. Zhang, “An improved model for PM2.5 inference based on support vector machine,” in 2016 17th IEEE/ACIS International Conference on Software Engineering, Artificial Intelligence, Networking and Parallel/Distributed Computing (SNPD), 2016, pp. 27–31. doi: 10.1109/SNPD.2016.7515873.
D. Normawati and S. A. Prayogi, “Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter,” Jurnal Sains Komputer & Informatika (J-SAKTI, vol. 5, no. 2, pp. 697–711, 2021.