PENERAPAN ALGORITMA K-MEANS UNTUK PENGELOMPOKAN DIAGNOSA PENYAKIT MATA BERDASARKAN RENTANG USIA

  • Fitra Kurnia UIN Sultan Syarif Kasim Fakultas Sains & Teknologi Riau,Indonesia
  • Ichsan Fahmi Pendidikan Teknik Elektro, FKIP, Universitas Nusa Cendana
  • Erwin Wahyudi UIN Sultan Syarif Kasim Fakultas Sains & Teknologi Riau,Indonesia
  • Godlief Erwin S. Mige Pendidikan Teknik Elektro, FKIP, Universitas Nusa Cendana
Keywords: Algoritma K Means, Centroid, Clustering, Data Mining, Preprocessing, Rapidminer

Abstract

Penelitian ini menggunakan teknik Data Mining yang bertujuan untuk menemukan informasi baru dari suatu dataset rekam medis penyakit mata.Algoritma K Means dijadikan pilihan untuk tujuan tersebut. Algoritma ini mengelompokan jenis penyakit mata berdasarkan rentang usiadengan parameter jenis kelamin, umur, gejala dan penyakit.Setelah melalui tahapan seleksi, preprocessing/cleaning dan transformasi maka data yang digunakan menjadi hanya 6689 record. Data ini dikelompokkan dalam 3 cluster yaitu penyakit banyak (C1), sedang (C2) dan sedikit (C3). Berdasarkan Algoritma K Means diperoleh informasi diagnosa penyakit terbanyak terjadi pada kelompok Usia Tua yang rentan terhadap penyakit Cataract, kemudian pada kelompok usia balita dan anak-anak, remaja dan dewasa rentan terhadap penyakit Conjunctivitis. Tahap pertama, pengujian dilakukan dengan cara membandingkan perhitungan manual dengan aplikasi yang telah dirancang. Hasil perbandingannya menunjukan nilai yang sama. Metode pengujian pertama adalah menggunakan perbandingan Between-Class Variation (BCV) dan Within-Class Variation (WCV).Rasio perbandingan BCV dan WCV  adalah0,002yang bermakna tingkat penggunaan nilai centroid memiliki kualitas yang sangat baik.Metode pengujian kedua dilakukan untuk melihat akurasi hasil clusteringyang dihitung menggunakan Metode Receiver Operating Characteristic (ROC).Hasil perhitungan dengan metode ROC adalah0,645.Nilai akurasi ini menunjukan bahwaaplikasi berada dalam kategori baik.Pada tahap kedua, pengujian dilakukan untuk membandingkan hasil aplikasi dengan Rapidminer. Perbandingan pengujian menunjukan bahwa hasil cluster tidak memiliki selisih lebih dari 3% untuk tiap clusternya, dimana cluster 1 memiliki selisih 0 data (0%), cluster 2 memiliki selisih 108 data(2,2%), dan cluster 3 memiliki selisih 108 data(2,2%).

Downloads

Download data is not yet available.
Published
2019-08-03