Model Feature Selection dalam Penentuan Parameter Pengelompokan Kompetensi SDM IG

Budi Susetyo, Puspa Eosina, Immas Nurhayati, Indupurnahayu Indupurnahayu

Sari


Industri geospasial memiliki prospek bisnis yang berkembang pesat di Indonesia, khususnya di sektor swasta.  Untuk mengetahui seberapa besar potensi sumberdaya manusia sesuai dengan kompetensi bidang informasi geospasial tersebut dibutuhkan survey dan analisis terkait parameter beberapa parameter kompetensi. Tujuan penelitian ini adalah mencari pengukuran parameter yang paling mempengaruhi pengelompokan kompetensi sumberdaya manusia bidang informasi geospasial.  Penelitian ini menggunakan data profil yang telah diolah menjadi 5 kategori index yaitu WEI, EFI, ENI, CFI, dan CPI.  dengan jumlah sampel 46 data. Metode yang digunakan adalah k-means clustering untuk pembentukan cluster kompetensi yang selanjutnya dibandingkan di antara 4 ,5 dan 6 cluster. Evaluasi cluster yang dipilih adalah menggunakan Mean intercluster dissimilarity dengan rumus jarak Euclidean. Dihasilkan bahwa pengelompokan paling optimal adalah 4 cluster dengan nilai intercluster terbesar, yaitu 0.45699. Fature subset selection dilakukan terhadap data yang sudah membentuk 4 cluster untuk melihat parameter yang paling berpengaruh. Untuk hal ini, digunakan metode Decision Tree Induction dengan skema Binary Tree. Diperoleh nilai Impurity terkecil pada atribut EFI, yaitu sebesar 0.6857 yang menunjukkan bahwa atribut EFI adalah parameter yang paling berpengaruh dalam menentukan label sebuah data.

Kata Kunci


Decision tree induction; Euclidean distance; Feature subset selection; K-means; Mean intercluster dissimilarity

Teks Lengkap:

PDF

Referensi


Chandrashekar, G., & Sahin, F. (2014). A survey on feature selection methods. Computers and Electrical Engineering, 40(1), 16–28. https://doi.org/10.1016/j.compeleceng.2013.11.024

Leela Sandhya Rani, Y., Sucharita, V., Bhattacharyya, D., & Kim, H. J. (2016). Performance evaluation of feature selection methods on large dimensional databases. International Journal of Database Theory and Application, 9(9), 75–82. https://doi.org/10.14257/ijdta.2016.9.9.07

Beniwal, S., & Arora, J. (2012). Classification and Feature Selection Techniques in Data Mining, 1(6), 1–6.

Shang, R., Zhang, Z., Jiao, L., Liu, C., & Li, Y. (2016). Self-representation based dual-graph regularized feature selection clustering. Neurocomputing, 171, 1242–1253. https://doi.org/10.1016/j.neucom.2015.07.068

Bennasar, M., Hicks, Y., & Setchi, R. (2015). Feature selection using Joint Mutual Information Maximisation. Expert Systems with Applications, 42(22), 8520–8532. https://doi.org/10.1016/j.eswa.2015.07.007

Kumbhar, P. (2016). A Survey on Feature Selection Techniques and Classification Algorithms for Efficient Text Classification, 5(5), 1267–1275.

Zhao, Z., Wang, L., Liu, H., & Ye, J. (2013). On similarity preserving feature selection. IEEE Transactions on Knowledge and Data Engineering, 25(3), 619–632. https://doi.org/10.1109/TKDE.2011.222

Casella, G., Fienberg, S., & Olkin, I. (2013). An Introduction to Statistical Learning. Springer Texts in Statistics. https://doi.org/10.1016/j.peva.2007.06.006

Kittler, J. “Feature Selection & Extraction”, in Handbook of Pattern Recognition and Image Processing, Tzay Y. Young, King Sun Fu Ed. Academic Press, 1986.

MAPIN. Profil SDM-IG, Masyarakat Penginderaan Jauh Indonesia. 2019.

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Data mining concepts and techniques (Third). Morgan Kaufmann. https://doi.org/10.1109/ICMIRA.2013.45

Sullivan, R. (2012). Introduction to Data Mining for the Life Sciences. Journal of Chemical Information and Modeling (Vol. 53). Springer. https://doi.org/10.1017/CBO9781107415324.004

Susetyo, B., I. Nurhayati, I. Purnahayu, P. Eosina, (2017), "Model Evaluasi Kinerja SDM Geospasial Menggunakan Metode CPI dan CPD Berbasis WebGIS". Prosiding Seminar Nasional XII “Rekayasa Teknologi Industri dan Informasi 2017 Sekolah Tinggi Teknologi Nasional Yogyakarta




DOI: http://dx.doi.org/10.32832/kreatif.v7i2.2696

Article Metrics

Sari view : 62 times
PDF - 29 times

Refbacks

  • Saat ini tidak ada refbacks.


View My Stats