Page 118 - The-5th-MCAIT2021-eProceeding
P. 118
(EuroSCORE) (Nashef et al., 1999). Namun begitu Garcia-Valentin et al. (2015), Gummert et al. (2009) dan
Yap et al. (2005) yang telah menentusahkan model stratifikasi risiko EuroSCORE adalah terlebih jangkaan dan
membuat kesimpulan model EuroSCORE tidak lagi sesuai digunakan dalam menentukan kadar risiko bagi
pembedahan jantung pada masa kini. Beberapa penyelidik membuktikan model pembelajaran mesin adalah
lebih tepat dalam menjangkakan kematian selepas pembedahan jantung terbuka dan mempunyai kelebihan yang
terbaik berbanding EuroSCORE dan EuroSCORE II (Benedetto et al., 2020; Mejia et al., 2018; Kartal &
Balaban, 2018; Allyn et al., 2017; Nouei et al., 2016). Benedetto, Dimagli, et al. (2020) melaporkan dalam
kajian meta-analisis dan penilaian sistematik terhadap 15 penyelidikan (1997 – 2018), 10 (67%) melaporkan
Artifial Neural Network (ANN) adalah model terbaik dengan kuasa diskriminasi yang terbaik, 2 (13.3%)
melaporkan kaedah ensemble, 2 (13.3%) melaporkan Decision Tree (DT) atau Random Forest (RF) dan 1
(6.7%) melaporkan Support Vector Machine (SVM) sebagai model terbaik. Menurut Garcia-Valentin et al.
(2015), Gummert et al. (2009) dan Yap et al. (2005) yang telah menjalankan kajian bagi menentusahkan model
stratifikasi risiko EuroSCORE, model ini adalah terlebih jangkaan dan membuat kesimpulan model
EuroSCORE tidak lagi sesuai digunakan dalam menentukan kadar risiko bagi pembedahan jantung pada masa
kini. Salah seorang penyelidik tempatan telah menjalankan kajian bagi menentusahkan model EuroSCORE II
terhadap pesakit yang menjalani pembedahan pintasan jantung koronari di IJN, mendapati nilai AUC bagi
EuroSCORE II adalah 0.700 (95% SK 0.640 – 0.759) (Musa et al. 2018), di mana hanya menunjukkan kadar
diskriminasi model ini di tahap baik sahaja. Menurut salah seorang penyelidik yang menjalankan kajian
penilaian sistematik, terdapat hanya 8 kumpulan penyelidik atau institusi daripada 53 projek pembangunan
model yang telah membangunkan model jangkaan kematian menggunakan teknik pembelajaran mesin iaitu
bootstrap bagging (5) dan Neural Network (3) sehingga tahun 2017 (Karim et al. 2017). Ini menunjukkan masih
tidak banyak kajian yang menggunakan kaedah pembelajaran mesin dalam menjangka hasil akhir kematian
selepas menjalani pempedahan jantung terbuka. Permasalahan data atau kaedah pemprosesan awal data juga
tidak banyak diterangkan di dalam penyelidikan-penyelidikan terdahulu. Permasalahan data hilang sering
diabaikan oleh penyelidik dan hanya mengekalkan atribut yang tidak mempunyai data hilang di dalam analisis
selanjutnya. Dengan pembuangan data hilang ini boleh menyebabkan peningkatan ketidaktepatan dalam
menjangka hasil akhir dan juga boleh mengakibatkan kepada keputusan berat sebelah (bias).
1.1. Kaedah pemprosesan awal data
Kaedah pemprosesan awal data merupakan salah satu langkah kritikal sebelum proses menganalisis yang
akan menghasilkan jangkaan yang lebih tepat, di mana kaedah ini di anggarkan melibatkan hampir 60%
daripada keseluruhan proses (Taleb et al., 2015). Salah satu permasalahan data di dalam sektor kesihatan adalah
data kelas tidak seimbang adalah keadaan dimana kelas yang ingin dijangkakan itu adalah jarang-jarang berlaku
dan keadaannya adalah hanya minoriti berbanding kelas sebaliknya (Han et al., 2012). Chawla et al. (2002)
telah memperkenalkan satu teknik bagi mengatasi masalah terkurang persampelan, iaitu dengan melakukan
kaedah penambahan sampel sintetik dengan meniru data yang terdekat (replicate) yang menggunakan algoritma
yang disebut sebagai SMOTE (Synthetic Minority Over-sampling Technique) dan menunjukkan prestasi yang
superior dan signifikan terhadap data mamografi atau data klinikal yang mempunyai kelas tidak seimbang. Zhao
et al. (2018) telah menggunakan teknik SMOTE yang digabungkan dengan regresi logistik bagi membangunkan
kerangka pembelajaran terhadap data kesihatan yang mempunyai permasalah data tidak seimbang dan
mendapati teknik ini menghasilkan keputusan jangkaan yang terbaik dengan peningkatan yang signifikan
terhadap dapatan semula (recall) sebanyak 45.4%.
E- Proceedings of The 5th International Multi-Conference on Artificial Intelligence Technology (MCAIT 2021) [105]
Artificial Intelligence in the 4th Industrial Revolution