醫療革新的現在式:AI演算法應用於急性白血病快篩


:
: 李政霖Jeng-Lin Li 林子晴Tzu-Ching Lin 
: 科普論文醫療

最近常常看到商業、科技媒體都搶著報導醫學與科技結合,智慧醫療這個詞似乎紅紅火火,但是「醫療與科技整合」到底有什麼實際案例?原理是什麼?如何應用?

以本實驗室 BIIC Lab 為例,我們以人工智慧的技術與臺大醫院血液腫瘤科、骨髓移殖團隊合作組成AHEAD團隊,開發出AI急性白血病快篩工具,大幅提升血液判讀效率。
 

在醫院為什麼要等那麼久?

 
在醫院為什麼要等那麼久?我到底要看哪一科?看病的人好像越來越多,怎麼辦?台灣的醫療品質一直在進步,但是越多人看病,就會發現越多問題。這些問題都是全世界即將,或已經面臨的,而其中一些問題的解方,或許就是遇到發展瓶頸的醫療產業極為渴求的科技「人工智慧」。 

這篇文章將舉出一個前瞻的醫療與人工智慧結合案例,不但大幅節省醫生和病患的時間,並讓診斷更客觀,同時節省醫院的醫療成本。希望科技與醫療持續的創新,可以讓醫生免於面對龐雜的事務,專注於醫生的專業,也讓更多人獲得更良好、完善的就醫經驗。

急性骨髓性白血病(AML)簡介

 
急性骨髓性白血病是白血病的一種,病程發展快速,具有高死亡及復發風險。近十年,在標準診斷急性骨髓性白血病的流程中採用「流式細胞儀」檢測骨髓液,每一試管中的骨髓液約有十萬顆細胞,通常超過10支試管以便醫師正確判斷。由流式細胞儀產生出大量複雜數據後,醫生以人工的方式圈選檢測資料中含有白血病特徵的數據。因此,每份檢驗資料的判斷時間至少花費20分鐘以上,並且相當依賴醫生的專業經驗。每年全球醫師共花費670萬小時在判斷此數據,約等於760個醫生花費一整年不眠不休的判讀病人到底有沒有得白血病。

 
稀缺的醫療人力資源及龐大複雜的臨床資料,成為白血病患獲得完善治療的阻礙,而正因為資料量龐大,更適合導入人工智慧,由電腦來輔助醫生分析檢測結果。

2017年起,台大醫院血液腫瘤科、骨髓移殖團隊及BIIC實驗室成員組成AHEAD團隊,由博士生李政霖以人工智慧演算法開發「流式細胞儀輔助診斷系統」,不僅將判斷時間由20分鐘縮短至7秒鐘,判斷準確率更達94%,團隊也將輔助系統的使用者介面設計的易於使用,讓醫師能更容易上手。另外在更進一步的實驗中發現,這個系統只需要一半的試管數就可以達到一樣有效的判讀結果,因此大幅降低時間、人力及物力成本。

 Interface

(圖:介面使用照片,資料來源:科技新報 

流式細胞儀的原理及數據特性

 
什麼樣的數據特性適合導入AI?讓我們先談談流式細胞儀的原理:

使用流式細胞儀首先需要將骨髓液中的細胞加上生物標記(抗體),再讓細胞一顆、一顆通過流式細胞儀中的通道,在經過通道時,打上特定的雷射光,而結合生物標記的細胞就會被激發出螢光並造成雷射光散射,藉由接收散射及螢光數據,可以以此數據分析出大量關於該細胞的資料,再藉由此資料判斷病患是否有白血病,或是測量體內微量殘存疾病(MRD),以此判斷病情及治療的成效。
 How to analyze leukemia by flow cytometry

(圖:如何使用流式細胞儀分析白血病)


每一筆數據都是單一顆細胞,每顆細胞又需要用多種生物標記和雷射光種類搭配來描述,可想見超過十管骨髓液細胞的數據量有多龐大!這麼多用來描述細胞的生物標記和雷射光組合,在工程學中被稱為「高維度」特徵,高維度數據由人類處理除了速度緩慢以外,也有一定難度,更容易有人為的偏誤。所謂「大數據」,普遍被認為有
3 V,即數據蒐集與處理的速度(Velocity)、數據格式的多樣性(Variety)與數據資料量的規模(Volume)。用以判斷血癌的流式細胞儀數據,符合「大數據」特性,非常適合使用演算法分析。

本次的研究由台大醫院方提供近十年的血液資料,採用其中一台流式細胞儀為樣本來源就有2424組數據供研究使用,每筆樣本都內含了11管的檢測資料。並且,所有的樣本都已經被訓練有素的醫師分別出急性骨髓性白血病(AML)、骨髓異常增生綜合症(MDS)、正常(無殘餘白血病細胞)三種判讀結果。
 

···


所以實際上
AI是怎麼處理這些資料的?大家都知道電腦很厲害、算術比人類快一百倍不止,但是機器真的會自己學習嗎?

這次研究中,李政霖將2424組樣本分為80%給機器進行訓練,剩下的20%再學習完畢後給機器測驗。首先,李政霖命令電腦以細胞為單位,使用其數據建立深度學習模型Autoencoder(或可翻譯為「自動編碼」),打個比方,就是命令電腦把大量資料填進表格,再從表格總結出另一種較容易判斷閱讀的資料。

 autoencoder

(圖:資料被變小變小再變小)

 接著再利用數學方法Latent Fisher-scoring Vectorization,將數以萬計的細胞資料整合為一個病人的代表向量,就像是將一個人所有的經歷、技能通通整理成一份履歷,讓可以用來判讀的特徵更容易辨認,最後以logistic regression LR,邏輯回歸公式)帶入變小的數據進行二分法:大於0的站一邊、小於0的站一邊,因此可以得到正常 vs. 不正常的分類結果。最終,機器的判斷準確率高達94%


 
另一項本研究的實驗,是嘗試降低所需試管數量,測試電腦以較少的數據是否能夠達成一樣的判斷結果。最終,李政霖發現,以流式細胞儀資料訓練出的系統,只需要6管骨髓液的資料,就可以幾乎達到與11管血液資料相同的正確率,這樣未來就能夠大幅降低醫院的物力成本(以及病人的血!)。

而在這個案例中,機器學會的是如何分辨特徵,以及比較該資料特徵與資料庫中其他資料的特徵。但說到最後,機器到底是不是會自己學習?如上面的例子,研究人員下達指令要求程式一步一步整理資料、辨識特定的特徵,目前為止機器都還是聽從人類的命令,以某種人類發明的專業方法來學習。要讓機器像電影裡擁有如人類般的智慧,對工程師們依然是既接近又遙遠夢想。
 

AI實際應用前的一哩路

 
「自動化流式細胞儀診斷系統」由博士生李政霖利用人工智慧的方法開發,達到白血病判定準確率94%、判斷時間由20分鐘縮短至7秒鐘,並且減少50%所需資料量,大幅提升血癌判斷的效率,領先全球研究。最重要的是,為了驗證機器學習的結果,李政霖進行了多重的測試。首先,他進行四種主題的二分法任務:不正常 AML+MDS vs. 正常、AML vs. 正常、MDS vs. 正常、AML vs. MDS,再以前述的20%數據,交互驗證分類結果是否都有良好的正確率,接著將管數減少進行相同的實驗。最後,數據顯示兩個實驗都有效:交叉驗證分類診斷結果有效、管數減少後診斷結果也有效。甚至,近期AHEAD團隊引進美國匹茲堡醫學中心(UPMC)的資料進行驗證,最終也依然顯示實驗有效!

此外,本次計畫的特別之處也在於,「自動化流式細胞儀診斷系統」相當易於產品化,且由於該系統目的並非取代醫師,AHEAD團隊也提供方便醫師使用的人性化操作介面,非常容易快速應用於工作現場。只可惜因為現行法規須保護病人隱私,無法立刻用於輔助醫生。AI與醫療跨域合作,除了需要兩方專業外,更需要政府的法規能夠跟上創新的腳步。


 
綜合上述,在AI與其他產業的跨界合作中,擁有強大的技術背景,配合其他產業的專業知識以及適當充分的數據,再加上嚴謹的驗證、易於應用於現場的產品特性,很可能就能做出一個改變世界的研究!現今世界上引進AI至醫院現場已有不少案例,如斷層掃描輔助判斷系統、超音波AI輔助診斷系統等等,對於未來應用AI於醫療,產學界普遍期待AI能夠輔助醫生診斷(而非取代)、進行健康及疾病的監控、以及協助就醫管理,以減少醫療資源浪費為目標。BIIC實驗室本次與臺大團隊攜手推出的「自動化流式細胞儀診斷系統」就是能夠大幅節省醫療資源的AI應用,目前也已向美國推進中,讓我們期待BIICers本次的研究能夠儘快問世,幫助到更多的醫師與病患,更期待BIIC下一個創新研究!


註:本文改寫自博士生李政霖 2019 年於 EMBC 發表的論文:

Jeng-Lin Li, Yu-Fen Wang, Bor-Sheng Ko, Chi-Cheng Li, Jih-Luh Tang, Chi-Chun Lee, "Learning a Cytometric Deep Phenotype Embedding for Automatic Hematological Malignancies Classification", in Proceedings of Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), 2019


 

(圖:本論文作者,BIIC Lab 博士生李政霖,於 InnoVex 國際新創展覽會,作為 AHEAD 團隊成員講解相關研究。)




Back