十一月:人工智慧與醫療

(本文改寫自本人於 AIM人工智慧醫療組織 邀請之《醫學專業如何強化人工智慧》線上演講內容)

人工智慧的定義

人工智慧(Artificial intelligence)是當今最熱門的科技關鍵字。在探討人工智慧醫療的應用之前,我們要先了解「人工智慧」及相關名詞的定義。

人工智慧

人工智慧(artificial intelligence, AI),指的是「能夠展現人類智能的機器」。這裡的機器不只是機器硬體,也包含電腦程式等軟體。目前大家對於人類智能(human-like cognition)的定義則相對模糊,標準也不太不一致。大略來說,人類智能包含人類所能展現的認知思考及學習功能。對於俗稱「強人工智慧」的「人工通用智能」(artificial general intelligence, AGI)來說,除了要能同時展現人工認知的不同功能,甚至要能展現類似人類情緒的處理能力。現今最常被討論的人工智慧應用,大多都還只是侷限於特定「任務」(task)的執行能力,還沒有辦法達到完全像是人類般的智能展現,因此充其量只能稱為是「弱人工智慧」。

機器學習

機器學習(machine learning)是機器透過訓練資料不斷改進表現,進而逼近人工智慧的過程。在人工智慧發展之前,電腦要執行特定功能,必須要由人類很明確地下達指令,遇到特定情況時需要做出什麼反應,假如是事先沒有預先設定的狀況,機器便不知道如何執行。然而,機器學習不需要人為設定判斷規則,只要有足夠量的訓練資料,電腦程式便會從資料當中學習資料的特徵和反應模式,而達到一定的表現水準。

深度學習

深度學習(deep learning)則是利用特定多層神經網路的結構來進行機器學習的一種技術,也是近代機器學習突飛猛進的關鍵技術之一。多層次的神經網路可以擷取訓練資料當中複雜的特徵,以便進行預測和判讀。

機器學習於醫療領域的應用

機器學習在醫療領域的應用架構是透過大量的已標註醫學資料(labeled training data),送入演算法模型當中進行分析,並且針對醫學場域需要回答的問題進行預測與建議。常見的標註醫學資料包含各種醫學影像、電子病歷、生命徵象、實驗室生化數據、生理訊號、音訊影像等。而需要回答的醫療問題則包含診斷、治療選擇,以及疾病預後的評估。這些大量的資料常常不是單一醫師便能夠收集完成,需要整個醫院、甚至是大型醫院聯合進行資料搜集。另外,醫療資料的私密性更增加了這些資料取得的複雜性,以及醫療資訊相關的隱私權問題,都是機器學習在醫療領域應用特別需要解決的課題。

雖然訓練模型時需要大量的訓練資料,但是單單只依靠大量的訓練資料,卻很難保有競爭優勢。特別在臺灣,很多的資料量遠遠不及其他大國,即便靠著現成的臨床資料「炒短線」進行研究,也容易因為資料範圍的限制,被其他國家後來居上。另外,如果只是將獨有的臨床資料放進大家都有的通用模型進行訓練,快速地得到研究結果,在類似的訓練資料被其他研究者取得後,目前的研究也很容易透過公開的模型工具立刻複製,而失去競爭力。反之,針對臺灣在人工智慧醫療的發展,我認為至少有兩方面要特別注意:

首先,醫學資料除了數量要多以外,資料的品質也相當重要,有高品質的訓練質量,才可以增加模型訓練的效率。許多臨床資料在收集的時候,為了要衝資料量,把各種不同情境下收集的資料全部集合在一起,這時有太多的變因使得資料品質參差不齊,這時確保資料品質就變得相對重要。例如,心電圖的貼片位置,每位醫師貼的位置可能會有誤差,甚至會有不小心貼錯的狀況,造成訊號來源錯誤。如果要利用心電圖來進行遠距醫療判讀,就要先標準化心電圖的訊號紀錄,才能有高品質的訊號來進行分析和預測。

此外,擁有獨特的演算法技術,可以讓其他人即便擁有相同的訓練資料,也無法立刻進行同樣的分析,確保自己在領域當中的獨特地位。接下來的內容,我將會著重在介紹常見的演算法模型,以及腦科學對於大腦神經迴路的認識,如何幫忙設計並且改進人工智慧的演算法。

演算法模型

演算法模型,泛指能夠透過輸入的訓練資料進行分析,並且針對有興趣的問題輸出預測與分析的方法。因此,最簡單的演算法模型,其實就是我們熟悉的各種統計方法。近代的機器學習,則採用了更複雜的人工神經網路,來達到相同的目的。生物的大腦,本身也是一個透過實體神經細胞連結而成的神經網路,能夠讓針對我們的感覺輸入進行資訊處理,並且產生對應的運動反應輸出。

從傳統的統計方法、神經網路、一直到大腦迴路,模型的構造越來越複雜,然而複雜的模型並不一定代表是最好的模型。現在許多人為了趕上機器學習的熱潮,硬是將各種問題全部丟進機器學習裡頭來分析,然而,其中可能有許多研究問題,使用傳統的統計方法更快更準確,這時候使用機器學習並沒有帶來更多的好處,只是讓計算的時間拉長。此外,因為目前的神經網路普遍缺乏可解釋性(explanability),當分析出問題的時候,也無從得知模型的問題在哪裡,讓自己陷入進退兩難的局面。因此在選擇模型時一定要切記,如果一個問題同時可以利用簡單的模型和複雜的模型進行處理,我們必定會優先選擇簡單的模型,在運算上及後續的討論上會更方便並且更有效率。反過來說,想要使用機器學習,便要努力找到一般統計模型難以解決,或是存在特定瓶頸的研究問題,才能夠凸顯機器學習的價值。

利用大腦迴路設計神經網路

早期機器學習剛發展的時候,許多人工智慧工程師普遍認為,因為電腦可以有極快的運算能力和幾乎無限的記憶力,展現的運算功能必定會超越人腦,因此,他們並不需要了解人腦的原理,更不需要向人腦學習,只需要將模型當作「黑盒子」將資料餵進去,得到足夠準確的預測結果即可。這樣的想法和1920年代行為主義(behaviorism)的興起不謀而合,當時的心理學家認為,因為動物的行為都可以使用簡單的制約訓練(conditioning)來改變,因此我們並不需要研究大腦內部的機制,只要能操控動物行為就好了。然而,就如同後來行為學派的式微以及認知神經科學(cognitive neuroscience)的興起,人們開始研究並解釋大腦內的複雜認知機制一樣,近年來人工智慧工程師開始慢慢認識到,要能夠了解神經網路的運作機制,以及加入新的功能模組,擴增神經網路的功能,他們必須要跟腦科學家一起攜手合作,利用大腦迴路的架構來設計或解釋神經網路。

大腦裡面有許多神經細胞,作為資訊處理的單元,稱為神經元(neuron)。神經元之間會互相連接形成複雜的網路,當神經元受到活化時,細胞內外離子的濃度會改變,產生非常微小的電位,因而產生對應的電流。這個電流沿著有如電線般長長的神經元纖維,往下一個神經元的方向傳遞。到了神經元相接的地方(突觸),因為電流無法直接跨越細胞,電訊號會活化神經末端釋放特定的化學分子,稱為神經傳導物質(neurotransmitter),利用轉換後的化學訊號活化下一顆神經元,繼續進行神經電訊號的傳遞。

因此,想要記錄並研究神經訊號的意義,我們可以透過單細胞神經紀錄(single unit recording)的方式,將微電擊(microelectrode)透過立體定位手術(stereotaxic surgery)的方式,放在特定神經元的旁邊,當神經細胞電位的時候,同時記錄到這樣的訊號,進而了解神經細胞之間溝通所傳遞的訊息。我們了解了大腦神經系統之間溝通所使用的語言後,可以進一步讀取神經傳遞的資訊。反過來,在了解神經訊號的編碼規則之後,我們也可以將我們想要傳達的資訊編碼成為神經訊號寫入大腦當中。當我們認識了正常的神經迴路如何運作後,我們更可以在神經迴路異常,造成神經精神症狀時,找出迴路當中異常的關鍵所在,並且將其矯正,已達到治療疾病的效果。

人工神經網路的架構

目前常用的人工神經網路,都和大腦的結構與功能息息相關。以下介紹三種常見的神經網路架構。

多層感知器(Multi-layered Perceptron)

多層感知器架構中,神經網路中的虛擬神經元排列成為多層結構,且神經網路內的每一顆神經元都和前後層的所有神經元互相連接。多層感知器利用調節神經之間的連結強度,來進行不同的運算並且儲存資訊。值得注意的是,訊息在多層感知器裡傳遞時的方向是單向進行,從輸入訊號一路傳到輸出神經元,進行資料的判斷和預測。

遞迴神經網路(Recurrent Neural Network, RNN)

然而,大腦皮質裡,許多神經元之間會形成互相連結的迴圈(loop),因此神經訊號可以雙向的傳遞。根據這個概念發展出來的遞迴神經網路中,同一顆神經元的訊號會透過其他神經元的迴饋,隨著時間不斷改變。這樣的模型因為模擬了大腦皮質的結構,在許多模擬大腦皮質的認知功能上,比多層感知器的訓練表現來得更好。

卷積神經網路(Convolutional Neural Network, CNN)

在視覺辨識上,卷積神經網路結合了擷取特徵的濾鏡(filter),掃視圖片的不同區域,試圖先擷取出特定的視覺特徵,再將這些特徵傳入類似多層感知器的神經網路進行分類,以告訴我們輸入的圖片究竟是什麼物體。卷積神經網路在透過大量的標註資料訓練之後,其每一層神經網路的訊號,會跟大腦的視覺訊息傳遞路徑上各個結構的神經訊號,有非常高的對應關係。這樣人工神經網路和大腦迴路驚之間人的相似性,再次支持了利用大腦的結構,作為人工神經網路的基本架構,是非常有潛力的發展模式。

神經網路演算法的生物基礎:深度強化學習

除了單純的判斷感覺訊息之外,人工神經網路也可以針對輸入訊息,決定應該要做出什麼動作反應。近年來,最為人熟知為機器學習帶來突破性發展關鍵演算法,「強化學習」(reinforcement learning),利用的是每次選擇之後的結果,回饋給學習系統,如果選擇之後結果很滿意,下次就重複相同的選擇;反之,如果結果不如預期,下次就應該要避免這個選擇。這樣簡單的試誤學習機制,配合上多層結構的深度學習神經網路,成功地讓DeepMind發展出打敗世界棋王的AlphaGo。其基本的原理就是透過強大的運算能力,不斷地反覆學習每個下棋的步驟應該要如何最大化贏棋的機率。這個例子也再次凸顯開發新演算法的重要影響:只要將一個簡單的新概念,整合進機器學習演算法中,不只是能將80%的準確度提升到90%,而是能夠發展出原本的神經網路完全無法做到的新功能,更有機會帶給人類文明劃世代的新發明。

強化學習中的回饋機制,不只是想像中可行的演算方法,而是大腦中神經細胞實際可以進行的學習方式。我的指導老師Prof. Wolfram Schultz在70-80年代,首次在獼猴的大腦中,證實強化學習所需要的「學習信號」(learning signal),在大腦中是透過神經傳導物質多巴胺(dopamine)來進行回饋。因此,透過研究以多巴胺神經元為核心的獎賞系統的神經迴路,我們可以發展出更多元的學習演算法。當代機器學習中,常用的三種學習模式分類:「監督式學習」(supervised learning)、「強化學習」(reinforcement learning)、「非監督式學習」(unsupervised learning),在大腦裡面也都能找到對應使用的區域和迴路。這表示大腦複雜的認知功能,至少有多種複合性的學習系統共同執行完成。現在,人工智慧工程師也越來越常使用不同的神經網路互相結合,期待能解決更複雜的問題,然而,他們卻時常面臨到,不同的神經網路應該要如何結合的問題。循此思路,其實在大腦裡這些不同的學習系統都試過特定的結構緊密連結,我們或許可以根據需要,從大腦裡學習系統的結合方式,同樣的道理將人工神經網路互相組合。

醫學背景在人工智慧研究的優勢

回到實際的醫療應用,除了手上的訓練資料外,找到適切的題目非常重要。好的應用題目除了要有創意,真實反映實際臨床上的問題之外,現在,隨著各種人工智慧技術漸趨成熟,各式各樣的產品紛紛搶著「落地」應用,這時候除了訓練模型的技術外,決定研究應用能不能實際落實在臨床情境的關鍵,往往取決於醫學情境中的許多人文議題。

首先,在臨床情境中,任何代替醫師回答診斷、選擇治療、預測預後的程式,都需要面臨醫學倫理的挑戰。即便預測準確度再怎麼高,究竟在社會中,誰有資格可以代替醫師來決定病人需不需要開刀?特別是在面臨生命臨終的選擇時,治療的選擇不只是考量存活率,還需要納入病人本身的價值觀,醫療決策者需要具有同理心,站在病人的立場和他一同安排生命中的最後一段旅程,這部分則需要生命哲學訓練的專業人士加入共同討論。

其次,在國家層面,要推展人工智慧在醫療的應用,仍需要先解決許多醫療法律上的限制。新的人工智慧軟體既不符合衛生福利部的藥品定義,也和傳統的手術醫材性質不同,既然如此,這樣的產品要使用在臨床上需要如何申請,進行怎樣的審核,需不需要進行臨床試驗等等,都是臺灣的法律沒有規範的部分,即便有這樣的產品,也會卡在法規無法通過而無法實際使用。相較於臺灣偏重科技的短視政策,造成科技法規上的落後,英國則是在新科技還尚未成熟之前,就已經由法界人士帶領民間積極討論,新科技在醫學倫理上的爭議和醫療責任歸屬的劃分。這些討論都需要很多的時間凝聚共識,因此特別需要提前好幾年開始進行,如此一來,才能在科技成熟時,相關的法規審查,以及民眾的教育認知都已經成熟能夠直接將新技術拿來使用。類似的討論,在人工生殖技術也可見一斑。英國的超前部署,使得英國是現今全世界人工生殖技術、法規、和民眾認知接受最完整的國家。此外,健全的法規制度也能讓大膽的研究能夠符合倫理規範,不會受限於陳舊的法規所限制,卻又能兼顧一定的合理管制。另外,在醫療資源的分配上,如果今天有了可以大幅提升醫療水準的人工智慧技術,究竟誰有資格來使用這項技術?醫療在許多國家都具有一定的公共性,特別是在臺灣的健保體制下,國家希望能保障所有民眾一定的健康水準。所以如果有一項科技是醫療診斷或治療所必須,政府需要決定應該要讓哪些族群優先使用?誰又有資格來決定什麼族群能夠使用最新的科技?使用者需不需要負擔費用?這些都是醫療經濟學需要進行資源分配與分析評估的重要問題。經過這些考量之後,政府也需要將科技納入國家的醫療與公共衛生政策當中,並且向民眾進行適當的風險溝通,了解這些科技的優缺點和影響,才能真正嘉惠整個國家的人民,提升生活的福祉。而這部分也亟需公共行政和政治方面的長才。

最後,更宏觀地從社會的層面來看待醫療科技的發展,需要特別注意「健康不平等」的議題。因為尖端科技常常是特定族群才能有比較高的可近性,特別是居住在都會區、年紀較輕、社經地位較好的人們。然而,最受惠於醫療科技的人們卻往往是那些被科技邊緣化的相對弱勢,例如小嬰兒、中低收入戶、老年人、偏鄉的居民等。如果醫療技術逐漸轉為依賴特定高科技技術,勢必會造成無法使用這些科技的人,被醫療服務邊緣化,無法得到目前最好的醫療服務,加深健康上的貧富差距。因此,科技發展者引入技術時,也需要思考,同樣的技術要選擇透過什麼樣的媒介來提供服務?什麼樣的媒介,可以反過來讓這些被醫療資源邊緣化的民眾更容易使用,才能平衡本來就已存在的城鄉醫療差距,達到全民健康的普世價值。

看見「醫師」以外的醫療服務

人工智慧想要應用在醫療領域會面臨如此複雜的人文難題,其中一個原因在於,大部分的應用題目都是從醫師的角度出發,試圖取代或協助醫師的工作。然而,醫師的存在,本來就是社會將充滿爭議的決定,特許給一群互相監督的專業團體來執行。因此這些決策本質上都是充滿倫理爭議的決策,需要長時間的討論和凝聚共識。然而,如果在短期之內就想要有醫療應用的成果,可以試著看見醫療領域中,醫師之外的臨床工作。在臨床場域中,護理師、藥師以及其他治療師,都扮演健康照護中不可或缺的重要角色,他們的工作中有一些部分是重複性高,亟需自動化的部分。這些重複性的工作,如果由人工智慧程式來代替,面對的倫理爭議相對比較少,也可以快速提高臨床工作的效率,也是現今人們較少著墨的藍海領域。

總結

醫療背景的專業人士如果想要投入人工智慧在醫療的應用,與其興沖沖地跟著做別人已經做得很好的事情,不如深耕自己的專業,並且與之連結。舉例來說,專門開發軟體的工程師已經將演算法寫好,許多機器學習程式也進入自動化的階段,甚至不需要寫程式就能夠自己建立模型,在這種時候,為了要進入人工智慧領域,重新學習寫程式,若非為了興趣,其實效益相對很低。反之,我們應該要在機器學習技術成熟的現在,發揮自己的臨床知識、溝通能力,以及醫療相關的人文素養,協助將這些技術橋接帶到臨床的場域,讓科技真正落地。這些後續的工作,是專門寫程式的工程師無法完成,又是醫學背景的人最擅長的,才是我們應該努力的方向。







2 thoughts on “十一月:人工智慧與醫療

  1. 有一個一直很想問但也一直在想如何闡述較清楚的問題:
    想問飛揚覺得「AI有可能輔助我們做出更高品質(或事後更少後悔)的決策嗎?」
    例如:某高階主管在不同的時間點、不同的狀態(飯後、運動後、睡前… …)或情緒下做決策時,是否有可偵測且具區別性的生理訊號(至少情緒應該有?),以資回溯出他在何時能做出最佳決策?
    這個問題可能有點奇怪,因為後來會不會後悔的影響因子太多(不一定是決策時腦運作功能的問題),或者可能結論只會得出:別在情緒高漲或疲勞時衝動時衝動下決定。
    之所以問是覺得,也許可以開發一種穿戴裝置,能提醒自己某些時候做決定時緩一下,而減少衝動購物或買賣股票等等。
    因為常常碰到自己也不確定「是否該在那個當下做決定」的狀況🤔

    Like

    • 這個問題我的看法是「既可以」也「無法」。要討論AI能不能引導做出最佳決策的前提,是最佳決策必須存在。然而要確認最佳決策是否存在必須要定義何謂「最佳」。從你的論述裡,似乎認為最佳的選擇是「不會後悔的選擇」,如果是這樣,決策本身不是造成後悔最主要的原因,而是如何「解釋自己的選擇」才是。對相信AI的人來說,光是使用AI這個動作或許就能充分讓他解釋自己正在正確的決策上,並且減少後悔。如果是要「減少衝動」的話這點倒是很多人在做,像是很多交易都會有反覆的確認訊息,就是要減少衝動決策的發生。然而,衝動的決策並不一定是不好的,深思熟慮的也不一定是正確的,類似的經驗在考試的時候每個人或多或少都有經歷過,有時候你的直覺才是正確的,反而在思考之後更改的答案反而是錯誤的。

      Like

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s