Perbandingan Metode Klasifikasi Multiclass untuk Pemetaan Zona Risiko COVID-19 di Pulau Jawa

  • Jesica Nauli Br. Siringo Ringo(1*)
    Politeknik Statistik STIS
  • Wahyu Joko Mursalin(2)
    5Politeknik Statistik STIS
  • Nisrina Citra Nurfadilah(3)
    Politeknik Statistik STIS
  • Dwiky Rachmat Ramadhan(4)
    Politeknik Statistik STIS
  • Wa Ode Zuhayeni Madjida(5)
    Politeknik Statistik STIS
  • (*) Corresponding Author
Kata Kunci: zona risiko, klasifikasi, data mining, ukuran evaluasi

Abstrak

Penambahan kasus COVID-19 yang besar di Indonesia, khususnya Pulau Jawa, membutuhkan berbagai upaya untuk mengendalikannya. Salah satu upaya efektif yang dapat dilakukan adalah tindakan preventif dengan memberi informasi mengenai kondisi suatu wilayah. Sebagai peringatan kepada masyarakat dan sebagai upaya pengambilan kebijakan daerah, Indonesia mengeluarkan zona risiko sampai pada tingkat kabupaten/kota melalui Satgas Penanganan COVID-19. Pembentukan level zona risiko tersebut menggunakan teknik konvensional yaitu pembobotan skor menggunakan informasi dari tiga jenis indikator. Dengan mempertimbangkan bahwa zona risiko merupakan hal yang penting dalam penentuan kebijakan terkait COVID-19, penelitian ini bertujuan untuk membangun model klasifikasi zona risiko kabupaten/kota di Pulau Jawa menggunakan beberapa teknik klasifikasi data mining dan menentukan model klasifikasi terbaik berdasarkan hasil evaluasi. Teknik klasifikasi yang digunakan sebagai perbandingan dalam penelitian ini adalah naive Bayes, decision tree, k-nearest-neighbor, dan neural network. Sebelum dilakukan pemodelan, data disesuaikan terlebih dahulu pada tahap preprocessing di mana pada tahap tersebut teridentifikasi terdapat permasalahan missing value dan imbalanced data. Permasalahan tersebut diatasi dengan imputasi data dan teknik oversampling. Hasil penelitian menunjukkan bahwa model k-nearest-neighbor merupakan model terbaik dibandingkan tiga model lainnya. Hasil tersebut didasarkan pada ukuran evaluasi keempat model di mana model k-NN memiliki nilai acccuracy, nilai rata-rata makro untuk sensitivitas, spesifisitas, dan ukuran F1 paling tinggi dibandingkan model lainnya.

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Referensi

World Health Organisation, ‘WHO Coronavirus Disease (COVID-19) Dashboard’. https://covid19.who.int/table (accessed Nov. 20, 2020).

Satuan Tugas Penanganan COVID 19, ‘Peta Sebaran | Covid19.go.id’. https://covid19.go.id/peta-sebaran (accessed Nov. 20, 2020).

W. Wiguna and D. Riana, ‘Diagnosis of Coronavirus disease 2019 (Covid-19) surveillance using C4. 5 algorithm’, Jurnal PILAR Nusa Mandiri, vol. 16, no. 1, pp. 71–80, 2020.

A. P. Windarto, U. Indriani, M. R. Raharjo, and L. S. Dewi, ‘Bagian 1: Kombinasi Metode Klastering dan Klasifikasi (Kasus Pandemi Covid-19 di Indonesia)’, Jurnal Media Informatika Budidarma, vol. 4, no. 3, pp. 855–862, 2020.

A. P. Windarto, J. Naam, Y. Yuhandri, A. Wanto, and M. Mesran, ‘Bagian 2: Model Arsitektur Neural Network Dengan Kombinasi K-Medoids dan Backpropagation pada kasus Pandemi Covid-19 di Indonesia’, Jurnal Media Informatika Budidarma, vol. 4, no. 4, pp. 1175–1180, 2020.

Kemenkes Indonesia, ‘Kemenkes Siap Sosialisasikan Perubahan Istilah ODP, PDP dan OTG ke Seluruh Dinas Kesehatan - Sehat Negeriku’. https://sehatnegeriku.kemkes.go.id/baca/umum/20200714/3334463/kemenkes-siap-sosialisasikan-perubahan-istilah-odp-pdp-dan-otg-seluruh-dinas-kesehatan/ (accessed Nov. 20, 2020).

M. Kamber and J. Pei, Data Mining. Morgan kaufmann, 2006.

C. M. Rahman, M. Kabir, A. Hossain, and K. Dahal, ‘Enhanced classification accuracy on naive bayes data mining models’, 2011.

T. Hendrawati, ‘Kajian Metode Imputasi dalam Menangani Missing Data’, 2015.

M. J. Azur, E. A. Stuart, C. Frangakis, and P. J. Leaf, ‘Multiple imputation by chained equations: what is it and how does it work?’, International journal of methods in psychiatric research, vol. 20, no. 1, pp. 40–49, 2011.

T. E. Bodner, ‘What improves with increased missing data imputations?’, Structural Equation Modeling: A Multidisciplinary Journal, vol. 15, no. 4, pp. 651–675, 2008.

C. Jian, J. Gao, and Y. Ao, ‘A new sampling method for classifying imbalanced data based on support vector machine ensemble’, Neurocomputing, vol. 193, pp. 115–122, 2016.

B. Jeong et al., ‘Comparison between statistical models and machine learning methods on classification for highly imbalanced multiclass kidney data’, Diagnostics, vol. 10, no. 6, p. 415, 2020.

PlumX Metrics

Diterbitkan
2021-04-03
Bagian
Articles

##plugins.generic.recommendByAuthor.heading##

##plugins.generic.recommendByAuthor.noMetric##