智慧型醫療決策輔助系統自編碼器之研究
本研究於健保資料庫中進行回顧性的研究,納入了18-90歲患者的資料,並將數據庫分配到訓練數據集和測試數據集中。我們從數據庫中提取了總共2562個臨床變量(包括疾病診斷和種藥物使用信息)來訓練自編碼器。我們總共建構了12個不同架構的自編碼器,在使用非監督式學習訓練完這些自編碼器後,我們將這些自編碼器用於預測三種常見疾病(腦中風,心肌梗塞,消化道出血),用以檢測這些自編碼器之效力。
用於預測三種常見疾病,自編碼器的使用都能帶來比基礎值更好的預測效力。使用藥物特徵值自編碼器的效能大致等同於使用整體特徵值自編碼器,並優於使用疾病特徵值自編碼器。降維至32維或64維的自編碼器可以達到最好的效能,優於16維或128維(效能較差)。使用深度學習做為分析模組會優於使用邏輯式回歸模組,而深度學習使用模組使用三層結構可獲得最佳效能。因此,針對常見疾病的預測可使用藥物特徵值自編碼器連接深度學習模組即可獲得最好的效能,需要進一步的研究來確定這種自編碼器是否能推廣到更多疾病的預測上。