運用機器學習建構心血管疾病預測模型之研究
本研究於健保資料庫中進行回顧性的研究,納入了2003年未患有心血管疾病的45-90歲患者。將數據庫分配到訓練數據集(204,896名患者)和測試數據集(51,210名患者)中。從數據庫中提取了總共6,717個臨床變量(包括年齡,性別,疾病診斷和藥物使用以及時間信息)。使用兩種常用的機器學習方法(梯度提升決策樹 [GBDT] 和邏輯回歸 [LR])來開發急性冠狀動脈症候群預測模型。
在訓練數據集中,人口的平均年齡為59.2歲,722例患者有急性冠狀動脈症候群住院病史。GBDT達到0.821的AUC值(95%信賴區間,0.817-0.824),而LR可達到AUC值0.800(95%信賴區間,0.796-0.803)。GBDT模型顯示出比LR模型顯著更高的預測性能(DeLong test:p = 0.0017)。年齡是這些預測模型中最重要的因素。需要進一步的研究來確定這類機器學習技術是否可以改善臨床實踐。