Implementasi Algoritma Klasifikasi C4.5 Untuk Memprediksi Resiko Terkena Penyakit Paru-Paru
DOI:
https://doi.org/10.55826/wdj5vf79Keywords:
implementasi, algoritma, klasifikasi c4.5, prediksi, penyakit paru-paruAbstract
Penyakit paru-paru merupakan salah satu masalah kesehatan utama di Indonesia dengan prevalensi yang terus meningkat akibat faktor gaya hidup seperti merokok, paparan polusi, dan pola hidup tidak sehat. Penelitian ini bertujuan mengembangkan model prediksi risiko penyakit paru-paru berbasis algoritma C4.5 dengan menganalisis atribut pola hidup masyarakat, meliputi kebiasaan merokok, paparan polusi, jenis pekerjaan, pola makan, olahraga, dan lingkungan tempat tinggal. Algoritma C4.5 dipilih karena kemampuannya menangani data kategorikal dan nilai hilang (missing values) serta menghasilkan model yang mudah dipahami. Dataset yang digunakan berjumlah 30.000 baris data sekunder yang diperoleh dari platform Kaggle. Hasil pengujian menunjukkan bahwa model C4.5 yang dibangun memiliki akurasi sebesar 94%, precision 95%, recall 94%, dan F1-score 94%. Temuan ini diharapkan dapat membantu tenaga medis dan masyarakat dalam melakukan deteksi dini serta upaya preventif terhadap penyakit paru-paru, sekaligus mengidentifikasi faktor gaya hidup yang paling berkontribusi terhadap risiko penyakit ini, yaitu kebiasaan merokok.
References
[1] L.Sari, A.Romadloni, Andr.Listyaningrum, “Penerapan Data Mining Dalam Analisis Prediksi Kanker Paru Menggunakan Algoritma Random Forest,” Infotekmesin, Vol. 14, No. 1, Pp. 155–162, 2023, Doi: 10.35970/Infotekmesin.V14i1.1751.
[2] W. H.Organization, “Smoking Is The Leading Cause Of Chronic Obstructive Pulmonary Disease,” 2023.
[3] “Riset Kesehatan Dasar (Riskesdas), ‘Laporan Riskesdas 2018 Nasional.Pdf,’ 2018.”.
[4] R.Rofiani, L.Oktaviani, D.Vernanda, Andt.Hendriawan, “Penerapan Metode Klasifikasi Decision Tree Dalam Prediksi Kanker Paru-Paru Menggunakan Algoritma C4.5,” J. Tekno Kompak, Vol. 18, No. 1, P. 126, 2024, Doi: 10.33365/Jtk.V18i1.3525.
[5] “S. Machfud And Y. Cahyono, ‘Klasifikasi Penyakit Kanker Paru-Paru Menggunakan Metode C4 . 5,’ Vol. 5, No. 2, Pp. 109–117, 2024, Doi: 10.31284/J.Kernel.2024.V5i2.7315.”.
[6] F.Meila Azzahra Sofyan, A.Voutama, Andy.Umaidah, “Penerapan Algoritma C4.5 Untuk Prediksi Penyakit Paru-Paru Menggunakan Rapidminer,” Jati (Jurnal Mhs. Tek. Inform., Vol. 7, No. 2, Pp. 1409–1415, 2023, Doi: 10.36040/Jati.V7i2.6810.
[7] M. K.Amril Mutoi Siregar, S.Kom., M.Kom. Dan Adam Puspabhuana, S.Kom., Data Mining: Pengolahan Data Menjadi Informasi Dengan Rapidminer, Amril Muto. Cv Kekata Group.
[8] A.Naseh Khudori Andm.Syauqi Haris, “Implementasi Decision Tree Untuk Prediksi Kanker Paru-Paru,” J. Ris. Sist. Inf. Dan Tek. Inform. (Jurasik, Vol. 9, No. 1, Pp. 94–106, 2024.
[9] Y.Son, “Development Of Methodology For Classification Of User Experience (Ux) In Online Customer Review,” J. Retail. Consum. Serv., Vol. 71, 2023, Doi: 10.1016/J.Jretconser.2022.103210.
[10] H. K.Dreiner, “The Abc Of Rpv: Classification Of R-Parity Violating Signatures At The Lhc For Small Couplings,” J. High Energy Phys., Vol. 2023, No. 7, 2023, Doi: 10.1007/Jhep07(2023)215.
[11] R.Krittayaphong, “Clinical Phenotype Classification To Predict Risk And Optimize The Management Of Patients With Atrial Fibrillation Using The Atrial Fibrillation Better Care (Abc) Pathway: A Report From The Cool-Af Registry,” Qjm An Int. J. Med., Vol. 117, No. 1, Pp. 16–23, 2024, Doi: 10.1093/Qjmed/Hcad219.
[12] G.Houge, “Stepwise Abc System For Classification Of Any Type Of Genetic Variant,” Eur. J. Hum. Genet., Vol. 30, No. 2, Pp. 150–159, 2022, Doi: 10.1038/S41431-021-00903-Z.
[13] D.Anugrah Pratama, I.Rizal Mutaqin, Andk.Rafael Manuela, “Analisis Terjadinya Kanker Paru-Paru Pada Pasien Menggunakan Decision Tree: Penerapan Algoritma C4.5 Dan Rapidminer Untuk Menentukan Risiko Kanker Pada Gejala Pasien,” Jtmei, Vol. 2, No. 4, Pp. 156–170, 2023.
[14] D. T.Dinh Andv. N.Huynh, “K-Pbc: An Improved Cluster Center Initialization For Categorical Data Clustering,” Appl. Intell., Vol. 50, No. 8, Pp. 2610–2632, 2020, Doi: 10.1007/S10489-020-01677-5.
[15] S.Bensalem, S.Naouali, Andz.Chtourou, “Rough Mode: A Generalized Centroid Proposal For Clustering Categorical Data Using The Rough Set Theory,” In Big Data And Smart Digital Environment, Y.Farhaoui Andl.Moussaid, Eds., Polytech Sch Tunisia, Bp 743,Rue El Khawarizmi, Tunis 2078, Tunisia Mil Acad Fondouk Jedid, Virtual Real & Informat Technol, Tunis, Tunisia Digital Res Ctr Sfax, Bp 275, Sfax 3021, Tunisia, 2019, Pp. 225–236. Doi: 10.1007/978-3-030-12048-1_24 10.1007/978-3-030-12048-1.
[16] I.Saha, J. P.Sarkar, Andu.Maulik, “Integrated Rough Fuzzy Clustering For Categorical Data Analysis,” Fuzzy Sets Syst., Vol. 361, Pp. 1–32, 2019, Doi: 10.1016/J.Fss.2018.02.007.
[17] M. T.Muhammad Arhami, S.Si., M.Kom., Muhammad Nasir, S.T., Data Mining - Algoritma Dan Implementasi. Andi Offset, 2020.
[18] “W. Yusnaeni And Widiarina, ‘Penerapan Algoritma C4.5 Dalam Prediksi Resiko Diabetes Tahap Awal (Early Stage Diabetes),’ J. Tek. Komput. Amik Bsi, Vol. 8, No. 2, Pp. 56–60, 2022, Doi: 10.31294/Jtk.V4i2.”.
[19] “Mulaab, Data Mining : Konsep Dan Aplikasi. Media Nusa Creative (Mnc Publishing), 2021. [Online]. Available: Https://Books.Google.Co.Id/Books?Id=X1fkeaaaqbaj”.
[20] “M. S. Ariantini Et Al., Sistem Pendukung Keputusan : Konsep,Metode, Dan Implementasi. Pt. Sonpedia Publishing Indonesia, 2023. [Online]. Available: Https://Books.Google.Co.Id/Books?Id=2e_Jeaaaqbaj”.
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Muhamad Ilhan mansiz, Ahmad Homaidi, Jarot Dwi Prasetyo

This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.