九月:人工智慧的核心哲學

計算神經科學之父:大衛 · 馬爾(David Marr)

計算神經科學之父:大衛 · 馬爾(David Marr, 1945-1980)利用數學模型,對大腦的資訊處理和功能,提出開創性的預測。他的理論引領了五十年來腦科學重要的研究方向,也成為想要深入了解近代人工智慧發展的人,不可不仔細研究的啟蒙導師之一。他透過仔細觀察西班牙籍1906年諾貝爾獎生理醫學獎得主,拉蒙 · 卡哈爾(Santiago Ramón y Cajal, 1852-1934)精湛手繪的神經解剖圖譜(非業配但經典著作有中文翻譯真的捨得不點一下嗎),與我的師公 1963年諾貝爾生理醫學獎得主,約翰 · 埃克爾斯(Sir John Carew Eccles, 1903-1997)著作中對於神經系統功能的探索,一邊揣摩腦神經細胞的連接方式,想像這一張電路圖中可能的電路傳訊,完成了他在劍橋大學生理學博士班時期的重要論文。

這個月,劍橋大學舉辦了紀念大衛提交博士論文五十週年的紀念研討會,會中邀請到來自世界各地,大腦和人工智慧的專家前來,分享他們對大衛理論的了解,以及他的思想如何深遠的影響他們的研究。另外,許多大衛過去的好朋友和老師也一同出席,談談他不為人知的個性和趣聞軼事,讓我們得以從不同方面,去了解和認識這一位早逝的思想巨人。

劍橋大學於2019年9月11日舉辦大衛・馬爾博士論文提交五十週年紀念研討會,作為一年一度的劍橋大學神經科學研討會(Cambridge Neuroscience Symposium)的延伸活動。

簡介與生平

出生於倫敦東北方的郊區,大衛於1963年進入劍橋大學三一學院(Trinity College)主修數學。在學風自由的劍橋大學,他曾在有「諾貝爾獎搖籃」之稱的分子生物實驗室(MRC Labratory of Molecular Biology, MRC LMB)短暫接觸過生物實驗,也開始對生物複雜的行為和作用深深著迷。他的大學同學透露,他曾發下狂語「要用數學破解大腦的功能」。於是,他在畢業之後進入了我現在所就讀的劍橋大學生理學研究所,就讀神經生理學博士班。他的指導老師Professor Giles Brindley(1926 -)當時還是個純粹的實驗神經生理學家,對計算模型一竅不通,面對跨領域的博士生大衛,他嚴格要求他必須參與系上針對醫學系教授的神經解剖學課程,以對大腦的結構有基本的認識。

高齡93歲,大衛・馬爾在劍橋生理學研究所的博士班指導老師 Professor Giles Brindley 在大衛提交博士論文五十週年的紀念研討會後酒會,侃侃而談大衛不為人知的趣聞軼事。

影響深遠的博士論文

1969年,大衛從我現在就讀的劍橋大學生理所畢業,並且將他的博士論文分成三篇論文發表,分別針對三個腦區提出其獨具見解的功能預測和理論:(文章連結

  • 小腦:A Theory of Cerebellar Cortex (1969)
  • 大腦古皮質:Simple Memory: a Theory of Archicortex (1970)
  • 大腦新皮質:A Theory for Cerebral Neocortex (1971)

相較於純粹解釋後設現象的數學模擬研究,大衛在他的著作當中聲明他的理念:「一個科學模型要能給出明確並且能被否證(falsify)的預測,才是真正的科學模型」,例如他在論文當中,大膽預測小腦中只有攀爬纖維(climbing fibre)具有「學習」的能力,能根據外在刺激改變神經之間的連結強度,其他小腦的神經突觸「都不具有可塑性」。雖然後來已經證明小腦其他區域的神經突觸,也能透過學習改變神經連結的強度,大衛的預測也因此被推翻,但這不但不影響他在腦科學的地位,反而凸顯他在如此早期,就能對大腦功能進行清晰的分析,並大膽透過給出明確的預測的貢獻,指引了數十年來實驗神經科學家的積極研究,讓腦科學研究得以推進。

左:1960年,12歲的學生大衛。右:1974年,大衛(前)與其博士後研究指導教授Tomaso Poggio(中)在加州拜訪諾貝爾獎得主Francis Crick(後)

人工視覺的劃時代發展

大衛在畢業後隨即前往大西洋對岸的另外一個劍橋,在麻省理工學院(Massachusetts Institute of Technology, MIT)跟著Professor Tomaso Poggio進行視覺相關研究。他在1977年獲得麻省理工學院心理系的教職,旋即在1980年便榮升該系的專任教授。他主要的思想都濃縮在他1982年出版的著作:Vision: A computational investigation into the human representation and processing of visual information。在書中的第一章簡介當中,他提出了影響後世深遠的「三層次分析」,提出了對大腦探索的系統性思考哲學,將不同領域對於大腦不同層次的討論進行區分。這樣的架構成為了後來計算神經科學發展的基石,也間接促成近年來人工智慧的蓬勃進展。

  • 運算目標層次(Computation)
  • 演算和表示法層次(Algorithm & Representation)
  • 硬體執行層次(Implementation)
大衛於1982年出版的經典著作:視覺(Vision)
大衛提出的「三層次分析」(three-level analysis)

三層次分析「Three-Level Analysis」

三層次意涵
第一層
運算目標
Computation

Why
大腦為何需要這樣的功能,要解決的問題為何?
第二層
表徵和演算
Representation &
Algorithm

What
要達到這樣的功能,所需要的運算規則為何?
第三層
硬體執行
Implementation

How
根據生物的構造和機制,此運算規則如何實際達成?

要探索大腦與人工智能的奧秘,在「運算目標層次(copmutation)」首先要先定義問題,我們想要研究大腦的什麼功能?這個功能可以協助個體解決什麼問題?這個問題對個體為什麼重要?其次,在「表徵與演算層次(representation & algorithm)」嘗試提出能夠達成運算目標的步驟,及其需要的資訊,這樣的步驟可能不只一種,所需要的資訊表徵也各不相同。最後,要能比較並且選擇出最合適的演算法,則需要在「硬體執行層次(implementation)」考慮大腦內如何使用既有的細胞分子機制,達到上述的演算資訊處理過程。

舉例來說,我們想了解個體在決策時,「如何根據既有資訊,做出對自己最有利的選擇」。這個能力能讓個體趨善避惡,保證個體的存活並且保證族群的延續。要達到此種能力,個體的大腦必須根據過去經驗,幫眼前的選項評分,並且將過去選擇後的結果回饋給大腦,為能帶來好結果的選項加分,為帶來不好的結果扣分(強化學習演算法 reinforcement learning algorithm)。如果大腦真的能幫選項打分數,那我們便很容易達到運算目標(演算法),但大腦裡的神經細胞真的有辦法做到這件事嗎?這樣的資訊在細胞層次又要如何表現(表徵)?

我的指導教授Wolfram Schultz 在1970年代首先在獼猴中腦神經元記錄到中腦多巴胺神經元,在獼猴得到獎賞時,會傳遞「預期誤差」(prediction error signal)。記錄到這樣的神經元訊號,便是為理論上的強化學習演算法(演算層次)提供了生物體內在「硬體執行層次」的驗證。

「wolfram schultz reward prediction error」的圖片搜尋結果
獼猴中腦多巴胺神經元會在後子得到獎賞時活化(上),如果給予圖片提示(conditioned stimulus, CS)後再給予獎賞,其神經活性會現前移動到看到圖片時,代表正向的預期效果(中)。而在看到圖片,對獎賞有所期待,卻沒有得到獎賞時,多巴胺神經元活性反而會被抑制(下)。(Schultz et al, 1997)

結語

從遠古時代開始,我們對人類的行為與智能便充滿了好奇心。不同領域的學者使用不同的工具和語言,共同在了解人生而為人的獨特之處。近代,透過了解大腦,我們得以更近一步整合個領域過去的討論,透過電腦演算的方式,去認識大腦在資訊處理的過程和特性。在人工智慧爆炸的時代,除了使用機器學習進行資料處理以外,世界頂尖的人工智慧研究者都在深入研究大腦,畢竟想要模擬複雜的人工智能,唯一的方式,就是向複雜智能存在的唯一證明-人類大腦來學習。這樣的進展需要具有完整格局的思考和討論,而大衛・馬爾的「三階段分析」理論架構,便是人工智慧核心哲學思考,無可取代的重要基石。

參考資料

  1. Marr D. 1969 A theory of cerebellar cortex. J. Physiol. 202, 437–470.
  2. Marr D. 1970 A theory for cerebral neocortex. Proc. R. Soc. Lond. B 176, 161–234.
  3. Marr D. 1971 Simple memory: a theory for archicortex. Phil. Trans. R. Soc. Lond. B 262, 23–81.
  4. Marr, D. Vision: A Computational Investigation Into the Human Representation and Processing of Visual Information. (MIT Press, 2010).
  5. Willshaw DJ, Dayan P, Morris RGM. 2015 Memory, modelling and Marr: a commentary on Marr (1971) ‘Simple memory: a theory of archicortex’. Phil. Trans. R. Soc. B 370: 20140383.
  6. Schultz W., Dayan P., Montague RR.(1997) A neural substrate of prediction and reward. Science. 275:1593–1599.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s