醫療革新的現在式：AI演算法應用於急性白血病快篩｜BIIC Lab - NTHU

BLOG・Health 醫療

Healthcare 醫療 Algorithm 演算法

醫療革新現在式：AI演算法應用於急性白血病快篩

SEP

2019

2272

最近常常看到商業、科技媒體都搶著報導醫學與科技結合，智慧醫療這個詞似乎紅紅火火，但是「醫療與科技整合」到底有什麼實際案例？原理是什麼？如何應用？

以本實驗室 BIIC Lab 為例，我們以人工智慧的技術與臺大醫院血液腫瘤科、骨髓移殖團隊合作組成AHEAD團隊，開發出AI急性白血病快篩工具，大幅提升血液判讀效率。

在醫院為什麼要等那麼久？

在醫院為什麼要等那麼久？我到底要看哪一科？看病的人好像越來越多，怎麼辦？台灣的醫療品質一直在進步，但是越多人看病，就會發現越多問題。這些問題都是全世界即將，或已經面臨的，而其中一些問題的解方，或許就是遇到發展瓶頸的醫療產業極為渴求的科技「人工智慧」。

本文改寫自博士生李政霖 2019 年於 EMBC 發表的論文，將舉出一個前瞻的醫療與人工智慧結合案例，不但大幅節省醫生和病患的時間，並讓診斷更客觀，同時節省醫院的醫療成本。希望科技與醫療持續的創新，可以讓醫生免於面對龐雜的事務，專注於醫生的專業，也讓更多人獲得更良好、完善的就醫經驗。

急性骨髓性白血病（AML）簡介

急性骨髓性白血病是白血病的一種，病程發展快速，具有高死亡及復發風險。近十年，在標準診斷急性骨髓性白血病的流程中採用「流式細胞儀」檢測骨髓液，每一試管中的骨髓液約有十萬顆細胞，通常超過10支試管以便醫師正確判斷。由流式細胞儀產生出大量複雜數據後，醫生以人工的方式圈選檢測資料中含有白血病特徵的數據。因此，每份檢驗資料的判斷時間至少花費20分鐘以上，並且相當依賴醫生的專業經驗。每年全球醫師共花費670萬小時在判斷此數據，約等於760個醫生花費一整年不眠不休的判讀病人到底有沒有得白血病。

稀缺的醫療人力資源及龐大複雜的臨床資料，成為白血病患獲得完善治療的阻礙，而正因為資料量龐大，更適合導入人工智慧，由電腦來輔助醫生分析檢測結果。

自2017年起，台大醫院血液腫瘤科、骨髓移殖團隊及BIIC實驗室成員組成AHEAD團隊，由博士生李政霖以人工智慧演算法開發「流式細胞儀輔助診斷系統」，不僅將判斷時間由20分鐘縮短至7秒鐘，判斷準確率更達94%，團隊也將輔助系統的使用者介面設計的易於使用，讓醫師能更容易上手。另外在更進一步的實驗中發現，這個系統只需要一半的試管數就可以達到一樣有效的判讀結果，因此大幅降低時間、人力及物力成本。

（圖：介面使用照片，資料來源：科技新報）

流式細胞儀的原理及數據特性

什麼樣的數據特性適合導入AI？讓我們先談談流式細胞儀的原理：

使用流式細胞儀首先需要將骨髓液中的細胞加上生物標記（抗體），再讓細胞一顆、一顆通過流式細胞儀中的通道，在經過通道時，打上特定的雷射光，而結合生物標記的細胞就會被激發出螢光並造成雷射光散射，藉由接收散射及螢光數據，可以以此數據分析出大量關於該細胞的資料，再藉由此資料判斷病患是否有白血病，或是測量體內微量殘存疾病（MRD），以此判斷病情及治療的成效。

（圖：如何使用流式細胞儀分析白血病）

每一筆數據都是單一顆細胞，每顆細胞又需要用多種生物標記和雷射光種類搭配來描述，可想見超過十管骨髓液細胞的數據量有多龐大！這麼多用來描述細胞的生物標記和雷射光組合，在工程學中被稱為「高維度」特徵，高維度數據由人類處理除了速度緩慢以外，也有一定難度，更容易有人為的偏誤。所謂「大數據」，普遍被認為有3 V，即數據蒐集與處理的速度（Velocity）、數據格式的多樣性（Variety）與數據資料量的規模（Volume）。用以判斷血癌的流式細胞儀數據，符合「大數據」特性，非常適合使用演算法分析。

本次的研究由台大醫院方提供近十年的血液資料，採用其中一台流式細胞儀為樣本來源就有2424組數據供研究使用，每筆樣本都內含了11管的檢測資料。並且，所有的樣本都已經被訓練有素的醫師分別出急性骨髓性白血病（AML）、骨髓異常增生綜合症（MDS）、正常(無殘餘白血病細胞)三種判讀結果。

機·器·時·間

所以實際上AI是怎麼處理這些資料的？大家都知道電腦很厲害、算術比人類快一百倍不止，但是機器真的會自己學習嗎？

這次研究中，李政霖博士生將2424組樣本分為80%給機器進行訓練，剩下的20%再學習完畢後給機器測驗。首先，李政霖命令電腦以細胞為單位，使用其數據建立深度學習模型Autoencoder（或可翻譯為「自動編碼」），打個比方，就是命令電腦把大量資料填進表格，再從表格總結出另一種較容易判斷閱讀的資料。

（圖：資料被變小變小再變小）

接著再利用數學方法Latent Fisher-scoring Vectorization，將數以萬計的細胞資料整合為一個病人的代表向量，就像是將一個人所有的經歷、技能通通整理成一份履歷，讓可以用來判讀的特徵更容易辨認，最後以logistic regression （LR，邏輯回歸公式）帶入變小的數據進行二分法：大於０的站一邊、小於０的站一邊，因此可以得到正常 vs. 不正常的分類結果。最終，機器的判斷準確率高達94%！

另一項本研究的實驗，是嘗試降低所需試管數量，測試電腦以較少的數據是否能夠達成一樣的判斷結果。最終，李政霖發現，以流式細胞儀資料訓練出的系統，只需要6管骨髓液的資料，就可以幾乎達到與11管血液資料相同的正確率，這樣未來就能夠大幅降低醫院的物力成本（以及病人的血本！）。

而在這個案例中，機器學會的是如何分辨特徵，以及比較該資料特徵與資料庫中其他資料的特徵。但說到最後，機器到底是不是會自己學習？如上面的例子，研究人員下達指令要求程式一步一步整理資料、辨識特定的特徵，目前為止機器都還是聽從人類的命令，以某種人類發明的專業方法來學習。要讓機器像電影裡擁有如人類般的智慧，對工程師們依然是既接近又遙遠夢想。

AI實際應用前的一哩路

「自動化流式細胞儀診斷系統」由博士生李政霖利用人工智慧的方法開發，達到白血病判定準確率94%、判斷時間由20分鐘縮短至7秒鐘，並且減少50%所需資料量，大幅提升血癌判斷的效率，領先全球研究。最重要的是，為了驗證機器學習的結果，李政霖進行了多重的測試。首先，他進行四種主題的二分法任務：不正常（AML+MDS） vs. 正常、AML vs. 正常、MDS vs. 正常、AML vs. MDS，再以前述的20%數據，交互驗證分類結果是否都有良好的正確率，接著將管數減少進行相同的實驗。最後，數據顯示兩個實驗都有效：交叉驗證分類診斷結果有效、管數減少後診斷結果也有效。甚至，近期AHEAD團隊引進美國匹茲堡醫學中心（UPMC）的資料進行驗證，最終也依然顯示實驗有效！

此外，本次計畫的特別之處也在於，「自動化流式細胞儀診斷系統」相當易於產品化，且由於該系統目的並非取代醫師，AHEAD團隊也提供方便醫師使用的人性化操作介面，非常容易快速應用於工作現場。只可惜因為現行法規須保護病人隱私，無法立刻用於輔助醫生。AI與醫療跨域合作，除了需要兩方專業外，更需要政府的法規能夠跟上創新的腳步。

綜合上述，在AI與其他產業的跨界合作中，擁有強大的技術背景，配合其他產業的專業知識以及適當充分的數據，再加上嚴謹的驗證、易於應用於現場的產品特性，很可能就能做出一個改變世界的研究！現今世界上引進AI至醫院現場已有不少案例，如斷層掃描輔助判斷系統、超音波AI輔助診斷系統等等，對於未來應用AI於醫療，產學界普遍期待AI能夠輔助醫生診斷（而非取代）、進行健康及疾病的監控、以及協助就醫管理，以減少醫療資源浪費為目標。BIIC實驗室本次與臺大團隊攜手推出的「自動化流式細胞儀診斷系統」就是能夠大幅節省醫療資源的AI應用，目前也已向美國推進中，讓我們期待BIICers本次的研究能夠儘快問世，幫助到更多的醫師與病患，更期待BIIC下一個創新研究！

註：本文改寫自博士生李政霖 2019 年於 EMBC 發表的論文：

Jeng-Lin Li, Yu-Fen Wang, Bor-Sheng Ko, Chi-Cheng Li, Jih-Luh Tang, Chi-Chun Lee, "Learning a Cytometric Deep Phenotype Embedding for Automatic Hematological Malignancies Classification", in Proceedings of Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC), 2019

（圖：本論文作者，BIIC Lab 博士生李政霖，於 InnoVex 國際新創展覽會，作為 AHEAD 團隊成員講解相關研究。）

BLOG + NEWS

在醫院為什麼要等那麼久？

急性骨髓性白血病（AML）簡介

流式細胞儀的原理及數據特性

機·器·時·間

AI實際應用前的一哩路