人工智慧與醫療

（本文改寫自本人於 AIM人工智慧醫療組織邀請之《醫學專業如何強化人工智慧》線上演講內容）

人工智慧的定義

人工智慧（Artificial intelligence）是當今最熱門的科技關鍵字。在探討人工智慧醫療的應用之前，我們要先了解「人工智慧」及相關名詞的定義。

人工智慧

人工智慧（artificial intelligence, AI），指的是「能夠展現人類智能的機器」。這裡的機器不只是機器硬體，也包含電腦程式等軟體。目前大家對於人類智能（human-like cognition）的定義則相對模糊，標準也不太不一致。大略來說，人類智能包含人類所能展現的認知思考及學習功能。對於俗稱「強人工智慧」的「人工通用智能」（artificial general intelligence, AGI）來說，除了要能同時展現人工認知的不同功能，甚至要能展現類似人類情緒的處理能力。現今最常被討論的人工智慧應用，大多都還只是侷限於特定「任務」（task）的執行能力，還沒有辦法達到完全像是人類般的智能展現，因此充其量只能稱為是「弱人工智慧」。

機器學習

機器學習（machine learning）是機器透過訓練資料不斷改進表現，進而逼近人工智慧的過程。在人工智慧發展之前，電腦要執行特定功能，必須要由人類很明確地下達指令，遇到特定情況時需要做出什麼反應，假如是事先沒有預先設定的狀況，機器便不知道如何執行。然而，機器學習不需要人為設定判斷規則，只要有足夠量的訓練資料，電腦程式便會從資料當中學習資料的特徵和反應模式，而達到一定的表現水準。

深度學習

深度學習（deep learning）則是利用特定多層神經網路的結構來進行機器學習的一種技術，也是近代機器學習突飛猛進的關鍵技術之一。多層次的神經網路可以擷取訓練資料當中複雜的特徵，以便進行預測和判讀。

機器學習於醫療領域的應用

機器學習在醫療領域的應用架構是透過大量的已標註醫學資料（labeled training data），送入演算法模型當中進行分析，並且針對醫學場域需要回答的問題進行預測與建議。常見的標註醫學資料包含各種醫學影像、電子病歷、生命徵象、實驗室生化數據、生理訊號、音訊影像等。而需要回答的醫療問題則包含診斷、治療選擇，以及疾病預後的評估。這些大量的資料常常不是單一醫師便能夠收集完成，需要整個醫院、甚至是大型醫院聯合進行資料搜集。另外，醫療資料的私密性更增加了這些資料取得的複雜性，以及醫療資訊相關的隱私權問題，都是機器學習在醫療領域應用特別需要解決的課題。

雖然訓練模型時需要大量的訓練資料，但是單單只依靠大量的訓練資料，卻很難保有競爭優勢。特別在臺灣，很多的資料量遠遠不及其他大國，即便靠著現成的臨床資料「炒短線」進行研究，也容易因為資料範圍的限制，被其他國家後來居上。另外，如果只是將獨有的臨床資料放進大家都有的通用模型進行訓練，快速地得到研究結果，在類似的訓練資料被其他研究者取得後，目前的研究也很容易透過公開的模型工具立刻複製，而失去競爭力。反之，針對臺灣在人工智慧醫療的發展，我認為至少有兩方面要特別注意：

首先，醫學資料除了數量要多以外，資料的品質也相當重要，有高品質的訓練質量，才可以增加模型訓練的效率。許多臨床資料在收集的時候，為了要衝資料量，把各種不同情境下收集的資料全部集合在一起，這時有太多的變因使得資料品質參差不齊，這時確保資料品質就變得相對重要。例如，心電圖的貼片位置，每位醫師貼的位置可能會有誤差，甚至會有不小心貼錯的狀況，造成訊號來源錯誤。如果要利用心電圖來進行遠距醫療判讀，就要先標準化心電圖的訊號紀錄，才能有高品質的訊號來進行分析和預測。

此外，擁有獨特的演算法技術，可以讓其他人即便擁有相同的訓練資料，也無法立刻進行同樣的分析，確保自己在領域當中的獨特地位。接下來的內容，我將會著重在介紹常見的演算法模型，以及腦科學對於大腦神經迴路的認識，如何幫忙設計並且改進人工智慧的演算法。

演算法模型

演算法模型，泛指能夠透過輸入的訓練資料進行分析，並且針對有興趣的問題輸出預測與分析的方法。因此，最簡單的演算法模型，其實就是我們熟悉的各種統計方法。近代的機器學習，則採用了更複雜的人工神經網路，來達到相同的目的。生物的大腦，本身也是一個透過實體神經細胞連結而成的神經網路，能夠讓針對我們的感覺輸入進行資訊處理，並且產生對應的運動反應輸出。

從傳統的統計方法、神經網路、一直到大腦迴路，模型的構造越來越複雜，然而複雜的模型並不一定代表是最好的模型。現在許多人為了趕上機器學習的熱潮，硬是將各種問題全部丟進機器學習裡頭來分析，然而，其中可能有許多研究問題，使用傳統的統計方法更快更準確，這時候使用機器學習並沒有帶來更多的好處，只是讓計算的時間拉長。此外，因為目前的神經網路普遍缺乏可解釋性（explanability），當分析出問題的時候，也無從得知模型的問題在哪裡，讓自己陷入進退兩難的局面。因此在選擇模型時一定要切記，如果一個問題同時可以利用簡單的模型和複雜的模型進行處理，我們必定會優先選擇簡單的模型，在運算上及後續的討論上會更方便並且更有效率。反過來說，想要使用機器學習，便要努力找到一般統計模型難以解決，或是存在特定瓶頸的研究問題，才能夠凸顯機器學習的價值。

利用大腦迴路設計神經網路

早期機器學習剛發展的時候，許多人工智慧工程師普遍認為，因為電腦可以有極快的運算能力和幾乎無限的記憶力，展現的運算功能必定會超越人腦，因此，他們並不需要了解人腦的原理，更不需要向人腦學習，只需要將模型當作「黑盒子」將資料餵進去，得到足夠準確的預測結果即可。這樣的想法和1920年代行為主義（behaviorism）的興起不謀而合，當時的心理學家認為，因為動物的行為都可以使用簡單的制約訓練（conditioning）來改變，因此我們並不需要研究大腦內部的機制，只要能操控動物行為就好了。然而，就如同後來行為學派的式微以及認知神經科學（cognitive neuroscience）的興起，人們開始研究並解釋大腦內的複雜認知機制一樣，近年來人工智慧工程師開始慢慢認識到，要能夠了解神經網路的運作機制，以及加入新的功能模組，擴增神經網路的功能，他們必須要跟腦科學家一起攜手合作，利用大腦迴路的架構來設計或解釋神經網路。

大腦裡面有許多神經細胞，作為資訊處理的單元，稱為神經元（neuron）。神經元之間會互相連接形成複雜的網路，當神經元受到活化時，細胞內外離子的濃度會改變，產生非常微小的電位，因而產生對應的電流。這個電流沿著有如電線般長長的神經元纖維，往下一個神經元的方向傳遞。到了神經元相接的地方（突觸），因為電流無法直接跨越細胞，電訊號會活化神經末端釋放特定的化學分子，稱為神經傳導物質（neurotransmitter），利用轉換後的化學訊號活化下一顆神經元，繼續進行神經電訊號的傳遞。

因此，想要記錄並研究神經訊號的意義，我們可以透過單細胞神經紀錄（single unit recording）的方式，將微電擊（microelectrode）透過立體定位手術（stereotaxic surgery）的方式，放在特定神經元的旁邊，當神經細胞電位的時候，同時記錄到這樣的訊號，進而了解神經細胞之間溝通所傳遞的訊息。我們了解了大腦神經系統之間溝通所使用的語言後，可以進一步讀取神經傳遞的資訊。反過來，在了解神經訊號的編碼規則之後，我們也可以將我們想要傳達的資訊編碼成為神經訊號寫入大腦當中。當我們認識了正常的神經迴路如何運作後，我們更可以在神經迴路異常，造成神經精神症狀時，找出迴路當中異常的關鍵所在，並且將其矯正，已達到治療疾病的效果。

人工神經網路的架構

目前常用的人工神經網路，都和大腦的結構與功能息息相關。以下介紹三種常見的神經網路架構。

多層感知器（Multi-layered Perceptron）

多層感知器架構中，神經網路中的虛擬神經元排列成為多層結構，且神經網路內的每一顆神經元都和前後層的所有神經元互相連接。多層感知器利用調節神經之間的連結強度，來進行不同的運算並且儲存資訊。值得注意的是，訊息在多層感知器裡傳遞時的方向是單向進行，從輸入訊號一路傳到輸出神經元，進行資料的判斷和預測。

遞迴神經網路（Recurrent Neural Network, RNN）

然而，大腦皮質裡，許多神經元之間會形成互相連結的迴圈（loop），因此神經訊號可以雙向的傳遞。根據這個概念發展出來的遞迴神經網路中，同一顆神經元的訊號會透過其他神經元的迴饋，隨著時間不斷改變。這樣的模型因為模擬了大腦皮質的結構，在許多模擬大腦皮質的認知功能上，比多層感知器的訓練表現來得更好。

卷積神經網路（Convolutional Neural Network, CNN）

在視覺辨識上，卷積神經網路結合了擷取特徵的濾鏡（filter），掃視圖片的不同區域，試圖先擷取出特定的視覺特徵，再將這些特徵傳入類似多層感知器的神經網路進行分類，以告訴我們輸入的圖片究竟是什麼物體。卷積神經網路在透過大量的標註資料訓練之後，其每一層神經網路的訊號，會跟大腦的視覺訊息傳遞路徑上各個結構的神經訊號，有非常高的對應關係。這樣人工神經網路和大腦迴路驚之間人的相似性，再次支持了利用大腦的結構，作為人工神經網路的基本架構，是非常有潛力的發展模式。

神經網路演算法的生物基礎：深度強化學習

除了單純的判斷感覺訊息之外，人工神經網路也可以針對輸入訊息，決定應該要做出什麼動作反應。近年來，最為人熟知為機器學習帶來突破性發展關鍵演算法，「強化學習」（reinforcement learning），利用的是每次選擇之後的結果，回饋給學習系統，如果選擇之後結果很滿意，下次就重複相同的選擇；反之，如果結果不如預期，下次就應該要避免這個選擇。這樣簡單的試誤學習機制，配合上多層結構的深度學習神經網路，成功地讓DeepMind發展出打敗世界棋王的AlphaGo。其基本的原理就是透過強大的運算能力，不斷地反覆學習每個下棋的步驟應該要如何最大化贏棋的機率。這個例子也再次凸顯開發新演算法的重要影響：只要將一個簡單的新概念，整合進機器學習演算法中，不只是能將80%的準確度提升到90%，而是能夠發展出原本的神經網路完全無法做到的新功能，更有機會帶給人類文明劃世代的新發明。

強化學習中的回饋機制，不只是想像中可行的演算方法，而是大腦中神經細胞實際可以進行的學習方式。我的指導老師Prof. Wolfram Schultz在70-80年代，首次在獼猴的大腦中，證實強化學習所需要的「學習信號」（learning signal），在大腦中是透過神經傳導物質多巴胺（dopamine）來進行回饋。因此，透過研究以多巴胺神經元為核心的獎賞系統的神經迴路，我們可以發展出更多元的學習演算法。當代機器學習中，常用的三種學習模式分類：「監督式學習」（supervised learning）、「強化學習」（reinforcement learning）、「非監督式學習」（unsupervised learning），在大腦裡面也都能找到對應使用的區域和迴路。這表示大腦複雜的認知功能，至少有多種複合性的學習系統共同執行完成。現在，人工智慧工程師也越來越常使用不同的神經網路互相結合，期待能解決更複雜的問題，然而，他們卻時常面臨到，不同的神經網路應該要如何結合的問題。循此思路，其實在大腦裡這些不同的學習系統都試過特定的結構緊密連結，我們或許可以根據需要，從大腦裡學習系統的結合方式，同樣的道理將人工神經網路互相組合。

醫學背景在人工智慧研究的優勢

回到實際的醫療應用，除了手上的訓練資料外，找到適切的題目非常重要。好的應用題目除了要有創意，真實反映實際臨床上的問題之外，現在，隨著各種人工智慧技術漸趨成熟，各式各樣的產品紛紛搶著「落地」應用，這時候除了訓練模型的技術外，決定研究應用能不能實際落實在臨床情境的關鍵，往往取決於醫學情境中的許多人文議題。

首先，在臨床情境中，任何代替醫師回答診斷、選擇治療、預測預後的程式，都需要面臨醫學倫理的挑戰。即便預測準確度再怎麼高，究竟在社會中，誰有資格可以代替醫師來決定病人需不需要開刀？特別是在面臨生命臨終的選擇時，治療的選擇不只是考量存活率，還需要納入病人本身的價值觀，醫療決策者需要具有同理心，站在病人的立場和他一同安排生命中的最後一段旅程，這部分則需要生命哲學訓練的專業人士加入共同討論。

其次，在國家層面，要推展人工智慧在醫療的應用，仍需要先解決許多醫療法律上的限制。新的人工智慧軟體既不符合衛生福利部的藥品定義，也和傳統的手術醫材性質不同，既然如此，這樣的產品要使用在臨床上需要如何申請，進行怎樣的審核，需不需要進行臨床試驗等等，都是臺灣的法律沒有規範的部分，即便有這樣的產品，也會卡在法規無法通過而無法實際使用。相較於臺灣偏重科技的短視政策，造成科技法規上的落後，英國則是在新科技還尚未成熟之前，就已經由法界人士帶領民間積極討論，新科技在醫學倫理上的爭議和醫療責任歸屬的劃分。這些討論都需要很多的時間凝聚共識，因此特別需要提前好幾年開始進行，如此一來，才能在科技成熟時，相關的法規審查，以及民眾的教育認知都已經成熟能夠直接將新技術拿來使用。類似的討論，在人工生殖技術也可見一斑。英國的超前部署，使得英國是現今全世界人工生殖技術、法規、和民眾認知接受最完整的國家。此外，健全的法規制度也能讓大膽的研究能夠符合倫理規範，不會受限於陳舊的法規所限制，卻又能兼顧一定的合理管制。另外，在醫療資源的分配上，如果今天有了可以大幅提升醫療水準的人工智慧技術，究竟誰有資格來使用這項技術？醫療在許多國家都具有一定的公共性，特別是在臺灣的健保體制下，國家希望能保障所有民眾一定的健康水準。所以如果有一項科技是醫療診斷或治療所必須，政府需要決定應該要讓哪些族群優先使用？誰又有資格來決定什麼族群能夠使用最新的科技？使用者需不需要負擔費用？這些都是醫療經濟學需要進行資源分配與分析評估的重要問題。經過這些考量之後，政府也需要將科技納入國家的醫療與公共衛生政策當中，並且向民眾進行適當的風險溝通，了解這些科技的優缺點和影響，才能真正嘉惠整個國家的人民，提升生活的福祉。而這部分也亟需公共行政和政治方面的長才。

最後，更宏觀地從社會的層面來看待醫療科技的發展，需要特別注意「健康不平等」的議題。因為尖端科技常常是特定族群才能有比較高的可近性，特別是居住在都會區、年紀較輕、社經地位較好的人們。然而，最受惠於醫療科技的人們卻往往是那些被科技邊緣化的相對弱勢，例如小嬰兒、中低收入戶、老年人、偏鄉的居民等。如果醫療技術逐漸轉為依賴特定高科技技術，勢必會造成無法使用這些科技的人，被醫療服務邊緣化，無法得到目前最好的醫療服務，加深健康上的貧富差距。因此，科技發展者引入技術時，也需要思考，同樣的技術要選擇透過什麼樣的媒介來提供服務？什麼樣的媒介，可以反過來讓這些被醫療資源邊緣化的民眾更容易使用，才能平衡本來就已存在的城鄉醫療差距，達到全民健康的普世價值。

看見「醫師」以外的醫療服務

人工智慧想要應用在醫療領域會面臨如此複雜的人文難題，其中一個原因在於，大部分的應用題目都是從醫師的角度出發，試圖取代或協助醫師的工作。然而，醫師的存在，本來就是社會將充滿爭議的決定，特許給一群互相監督的專業團體來執行。因此這些決策本質上都是充滿倫理爭議的決策，需要長時間的討論和凝聚共識。然而，如果在短期之內就想要有醫療應用的成果，可以試著看見醫療領域中，醫師之外的臨床工作。在臨床場域中，護理師、藥師以及其他治療師，都扮演健康照護中不可或缺的重要角色，他們的工作中有一些部分是重複性高，亟需自動化的部分。這些重複性的工作，如果由人工智慧程式來代替，面對的倫理爭議相對比較少，也可以快速提高臨床工作的效率，也是現今人們較少著墨的藍海領域。

總結

醫療背景的專業人士如果想要投入人工智慧在醫療的應用，與其興沖沖地跟著做別人已經做得很好的事情，不如深耕自己的專業，並且與之連結。舉例來說，專門開發軟體的工程師已經將演算法寫好，許多機器學習程式也進入自動化的階段，甚至不需要寫程式就能夠自己建立模型，在這種時候，為了要進入人工智慧領域，重新學習寫程式，若非為了興趣，其實效益相對很低。反之，我們應該要在機器學習技術成熟的現在，發揮自己的臨床知識、溝通能力，以及醫療相關的人文素養，協助將這些技術橋接帶到臨床的場域，讓科技真正落地。這些後續的工作，是專門寫程式的工程師無法完成，又是醫學背景的人最擅長的，才是我們應該努力的方向。

2 thoughts on “人工智慧與醫療”

忠實讀者

January 3, 2021 at 12:56 am

有一個一直很想問但也一直在想如何闡述較清楚的問題：
想問飛揚覺得「AI有可能輔助我們做出更高品質（或事後更少後悔）的決策嗎？」
例如：某高階主管在不同的時間點、不同的狀態（飯後、運動後、睡前… …）或情緒下做決策時，是否有可偵測且具區別性的生理訊號（至少情緒應該有？），以資回溯出他在何時能做出最佳決策？
這個問題可能有點奇怪，因為後來會不會後悔的影響因子太多（不一定是決策時腦運作功能的問題），或者可能結論只會得出：別在情緒高漲或疲勞時衝動時衝動下決定。
之所以問是覺得，也許可以開發一種穿戴裝置，能提醒自己某些時候做決定時緩一下，而減少衝動購物或買賣股票等等。
因為常常碰到自己也不確定「是否該在那個當下做決定」的狀況🤔

LikeLike

- Huang, Fei-Yang M.D. （黃飛揚）
  
  January 3, 2021 at 1:03 am
  
  這個問題我的看法是「既可以」也「無法」。要討論AI能不能引導做出最佳決策的前提，是最佳決策必須存在。然而要確認最佳決策是否存在必須要定義何謂「最佳」。從你的論述裡，似乎認為最佳的選擇是「不會後悔的選擇」，如果是這樣，決策本身不是造成後悔最主要的原因，而是如何「解釋自己的選擇」才是。對相信AI的人來說，光是使用AI這個動作或許就能充分讓他解釋自己正在正確的決策上，並且減少後悔。如果是要「減少衝動」的話這點倒是很多人在做，像是很多交易都會有反覆的確認訊息，就是要減少衝動決策的發生。然而，衝動的決策並不一定是不好的，深思熟慮的也不一定是正確的，類似的經驗在考試的時候每個人或多或少都有經歷過，有時候你的直覺才是正確的，反而在思考之後更改的答案反而是錯誤的。
  
  LikeLike

神經經濟學與決策神經生理研究室 – 黃飛揚