Page 118 - The-5th-MCAIT2021-eProceeding
P. 118

(EuroSCORE) (Nashef et al., 1999). Namun begitu Garcia-Valentin et al. (2015), Gummert et al. (2009) dan
        Yap et al. (2005) yang telah menentusahkan model stratifikasi risiko EuroSCORE adalah terlebih jangkaan dan
        membuat kesimpulan model EuroSCORE tidak lagi sesuai digunakan dalam menentukan kadar risiko bagi
        pembedahan jantung pada masa kini. Beberapa penyelidik membuktikan model pembelajaran mesin adalah
        lebih tepat dalam menjangkakan kematian selepas pembedahan jantung terbuka dan mempunyai kelebihan yang
        terbaik  berbanding  EuroSCORE  dan  EuroSCORE  II  (Benedetto  et  al., 2020;  Mejia  et al.,  2018;  Kartal  &
        Balaban, 2018; Allyn et al., 2017; Nouei et al., 2016). Benedetto, Dimagli, et al. (2020) melaporkan dalam
        kajian meta-analisis dan penilaian sistematik terhadap 15 penyelidikan (1997 – 2018), 10 (67%) melaporkan
        Artifial  Neural  Network  (ANN)  adalah  model  terbaik  dengan  kuasa  diskriminasi  yang  terbaik,  2  (13.3%)
        melaporkan  kaedah  ensemble, 2 (13.3%) melaporkan  Decision Tree (DT) atau Random Forest (RF) dan 1
        (6.7%) melaporkan  Support Vector Machine (SVM) sebagai  model terbaik. Menurut Garcia-Valentin et al.
        (2015), Gummert et al. (2009) dan Yap et al. (2005) yang telah menjalankan kajian bagi menentusahkan model
        stratifikasi  risiko  EuroSCORE,  model  ini  adalah  terlebih  jangkaan  dan  membuat  kesimpulan  model
        EuroSCORE tidak lagi sesuai digunakan dalam menentukan kadar risiko bagi pembedahan jantung pada masa
        kini. Salah seorang penyelidik tempatan telah menjalankan kajian bagi menentusahkan model EuroSCORE II
        terhadap pesakit yang menjalani pembedahan pintasan jantung koronari di IJN, mendapati nilai AUC bagi
        EuroSCORE II adalah 0.700 (95% SK 0.640 – 0.759) (Musa et al. 2018), di mana hanya menunjukkan kadar
        diskriminasi  model  ini  di  tahap  baik  sahaja.  Menurut  salah  seorang  penyelidik  yang  menjalankan  kajian
        penilaian sistematik, terdapat hanya 8 kumpulan penyelidik atau institusi daripada 53 projek pembangunan
        model yang telah membangunkan model jangkaan kematian menggunakan teknik pembelajaran mesin iaitu
        bootstrap bagging (5) dan Neural Network (3) sehingga tahun 2017 (Karim et al. 2017). Ini menunjukkan masih
        tidak banyak kajian yang menggunakan kaedah pembelajaran mesin dalam menjangka hasil akhir kematian
        selepas menjalani pempedahan jantung terbuka. Permasalahan data atau kaedah pemprosesan awal data juga
        tidak  banyak  diterangkan  di  dalam  penyelidikan-penyelidikan  terdahulu.  Permasalahan  data  hilang  sering
        diabaikan oleh penyelidik dan hanya mengekalkan atribut yang tidak mempunyai data hilang di dalam analisis
        selanjutnya.  Dengan  pembuangan  data  hilang  ini  boleh  menyebabkan  peningkatan  ketidaktepatan  dalam
        menjangka hasil akhir dan juga boleh mengakibatkan kepada keputusan berat sebelah (bias).
        1.1. Kaedah pemprosesan awal data


           Kaedah pemprosesan awal data merupakan salah satu langkah kritikal sebelum proses menganalisis yang
        akan  menghasilkan  jangkaan  yang  lebih  tepat,  di  mana  kaedah  ini  di  anggarkan  melibatkan  hampir  60%
        daripada keseluruhan proses (Taleb et al., 2015). Salah satu permasalahan data di dalam sektor kesihatan adalah
        data kelas tidak seimbang adalah keadaan dimana kelas yang ingin dijangkakan itu adalah jarang-jarang berlaku
        dan keadaannya adalah hanya minoriti berbanding kelas sebaliknya (Han et al., 2012). Chawla et al. (2002)
        telah memperkenalkan satu teknik bagi mengatasi masalah terkurang persampelan, iaitu dengan melakukan
        kaedah penambahan sampel sintetik dengan meniru data yang terdekat (replicate) yang menggunakan algoritma
        yang disebut sebagai SMOTE (Synthetic Minority Over-sampling Technique) dan menunjukkan prestasi yang
        superior dan signifikan terhadap data mamografi atau data klinikal yang mempunyai kelas tidak seimbang. Zhao
        et al. (2018) telah menggunakan teknik SMOTE yang digabungkan dengan regresi logistik bagi membangunkan
        kerangka  pembelajaran  terhadap  data  kesihatan  yang  mempunyai  permasalah  data  tidak  seimbang  dan
        mendapati  teknik  ini  menghasilkan  keputusan  jangkaan  yang  terbaik  dengan  peningkatan  yang  signifikan
        terhadap dapatan semula (recall) sebanyak 45.4%.











        E- Proceedings of The 5th International Multi-Conference on Artificial Intelligence Technology (MCAIT 2021)   [105]
        Artificial Intelligence in the 4th Industrial Revolution
   113   114   115   116   117   118   119   120   121   122   123