四月:如何從別人的經驗中學習

「讓我猜測妳的心思,妳的行動,
讓我知道猶豫是否在妳心中;
聽著妳的呼吸,我的思緒,
在那一個深深的夜裡,猜不透的妳。」

無印良品。猜測

不再重蹈覆徹:從經驗中學習的能力

試誤學習:從失敗中成長

我們從嬰兒時期就開始不斷探索周遭的環境,透過不斷嘗試、不斷犯錯,慢慢去認識世界運作的法則,並且逐漸了解自己的喜好。就像是美食達人總是積極去嘗試新的餐廳、新的餐點,好吃的下次就會再來光顧,難吃則會記得不要再次踩雷。然而,為了生存,人類不能只依賴這樣的「試誤學習」(trial-and-error learning),否則很有可能在野外第一次看到火的時候,覺得很溫暖便靠近而被燒傷,或是看見新奇的食物立刻放進嘴巴而被毒死。

幸好,人類是社會的動物,生活在群體裡。因此我們不需要凡事都親自嘗試,可以透過觀察別人的行為和結果,學習成為自己的經驗。我們如果看到前面的人,經過一段溼滑的路段跌倒了,隨後跟上的我們就知道要立刻避開這個區域,不需要自己再摔一次跤才能學會教訓,不會像飛蛾撲火一樣,一隻隻接連葬送火窟。(點播:燕尾蝶

觀察學習:吸收別人經驗的智慧

「觀察學習」(observational learning),又稱為「社會學習」 social learning或是「替代學習」 vicarious learning),指的便是透過他人的經驗,形塑自己的行為的過程。為此,大腦中必須要有一套機制監測其他個體的行為和結果,並且利用這樣的結果修正自己過去的經驗,作為下次行動時的參考。然而,觀察學習是相對進階的社會認知能力,在出生之後,大腦在這方面的成熟需要很多年的時間,因此小孩子在國小以前,主要還是依賴試誤學習,總是「不見棺材不掉淚」,什麼東西都想玩都想碰,明明看過別人摔倒受傷,卻還是無法從中學習到教訓。

除此之外,要能善用觀察學習的經驗,了解對方的動機和目的是很重要的前提。如果在路上開車,看到別人紛紛右轉,自己也盲目地跟著右轉,忽略了自己的目的地跟其他人並不相同,這樣只複製「行為結果」,不在乎「背後動機」的學習,並不會讓達成自己的目標。從前在學校時,許多同學看著班上第一名補哪家補習班就跟著補;用哪本參考書就跑去買;甚至他唸書唸到幾點睡,就跟著學:這些都只是把「手段」和「目標」混淆,也並不會讓自己的成績進步。進到醫院工作後,看到許多病患和家屬常常會引用街頭巷尾大叔大嬸的經驗,當作決定自己性命的重要參考:「醫師,開刀真的好嗎?我記得我小時候隔壁鄰居去開刀,後來就在醫院往生了,我打死都不要開刀!」或是「我好姐妹之前胎位不正也都是自然產,我胎位不正為什麼醫生就叫我剖腹產?是不是想多賺我錢?」。這樣的學習過度依賴他人的經驗,而忽略了決策情境的差異,對個體反而有害無益。

同理心:站在別人立場的換位思考能力

「同理心」(empathy),指的不僅是能站在對方的立場,了解對方的感受,更是能了解對方的動機和行為策略,甚至能預測對方在特定情境下的行為。這樣的能力並非與生俱來,需要好幾年的時間等到大腦發育成熟才會慢慢發展出來。即便到了成年,也不是每個人都能具備足夠的同理心,常常會投射自己的偏好到別人身上,覺得別人的喜好應該都跟自己相同,無法接受與自己不相同的其他喜好。假如你今天自己在逛街購物時,看到各種不同的名牌服飾,你的大腦會根據你過去的經驗形成的獨特偏好,為每樣物品打分數,作為是否要購買的參考。然而,假如你是要買情人節禮物給自己的男女朋友,面對完全相同的物品,有「同理心」的大腦,會知道不應該用你自己喜不喜歡的標準來評價物品,而要想的是「對方」會不會喜歡,用你腦中對對方偏好的預測來進行評價。有過買禮物給別人經驗的人,都能體會到這種預想對方偏好(特別是在跟自己偏好差異很大)的能力並不容易。在特定社交能力障礙的患者(例如:有些自閉症患者),這樣的社會能力特別缺乏。即便社會行為的障礙如此普遍,我們對大腦在社會互動上如何監測、並且了解對方行為動機的大腦機制仍然知道的很少。

大腦的社會監測系統

透過獼猴互動的同時,同時紀錄大腦神經細胞活動的實驗方法,是目前了解大腦如何處理與其他個體有關的社會訊息,最尖端的實驗方法之一。大腦要能夠進行觀察學習,至少需要有兩個要件:

  • 大腦必須察覺對方的「行為」
  • 大腦同時需要關心對方行為的「結果」:好的結果應該學習,不好的則要避免

近五年來,獼猴神經生理學家發現,在兩隻獼猴互動時,大腦的神經細胞的確會特別針對對方的行為與行為的結果有所反應,暗示著大腦的確可能透過觀察對方的行為和結果來進行觀察學習。

心智模擬:想像自己如果是對方會如何行動

兩隻獼猴面對面進行觀察學習,分別透過自己選擇的結果、和對方的選擇行為去推論每個圖片被預先設定的獎賞機率。其中一隻接受神經紀錄的猴子,透過不斷在兩個圖片中進行選擇,去學習特定圖片有多少機率可以得到獎賞,同時另外一隻觀察的猴子,也對另外一組圖片進行相同的學習。對於自己的圖片組,猴子可以透過實際的獎賞結果學習圖片的獎賞機率,但對於對方使用的圖片組,只能透過觀察對方的行為和對方是否得到獎賞來進行觀察學習。為了測試觀察學習的結果,試驗中間讓兩隻猴子的圖片對調,猴子因此需要使用之前觀察對方猴子學到的經驗來進行選擇。(Grabenhorst et al., 2019)

就在這個月,我們實驗室發表了突破性的研究,發現傳統上被認為跟恐懼與負面情緒相關的杏仁核(amygdala)在社會決策上扮演重要角色。當猴子互相觀察對方選擇不同圖片是否得到獎賞時,在杏仁核內記錄到有兩種特別功能的神經元:一種是專門分辨現在是自己行動還是對方行動的「自我-他人神經元」(self-other neuron);另外一種是分別幫每種可能的選擇打分數的「價值神經元」(value neuron)

不論價值高低,只對自我(左)和他人(右)有反應的「自我-他人神經元」(self-other neuron)Grabenhorst et al., 2019)
不論行動對象,只反映選項的價值高低的「價值神經元」,左側是觀察者負責預測對他人選擇價值的價值神經元,右側則是自己的價值神經元。Grabenhorst et al., 2019)

只要把這兩種神經元放在一起,透過神經網路的不斷訓練,我們發現神經細胞會自動組成三層的神經網路:第一層是「價值層」(value layer),決定決策當下的選項的價值高低;第二層是「社會層」(social layer),用來區辨當下的情境是與自我相關還是與他人相關;結合這兩層的資訊後,傳送到第三層「決策層」(choice layer)來進行最後的預測和選擇。

透過神經網路模擬,只要將價值神經元和社會神經元放在一起,經過神經網路訓練後,自動會形成三層的神經網路系統。第一層「價值層」(value layer),決定決策當下選項的價值高低;第二層「社會層」(social layer),用來區辨當下的情境與自我相關還是與他人相關;結合這兩層的資訊後,傳送到第三層「決策層」(choice layer)來進行最後的預測和選擇。(Grabenhorst et al., 2019)

這樣的社會決策系統,讓你在買聖誕禮物給女朋友的時候,可以使用她的價值觀,來選擇對方喜歡的東西;面對相同的物品,如果是買給自己時,又可以切換成為自己的價值觀來做判斷。這樣的結果支持在決策的大腦迴路當中,自我和他人的訊息處理應該要有所區分(social brain hypothesis)。

社會決策神經迴路的應用:人工智慧與精神疾患

這篇研究是第一次在動物神經系統中,證實靈長類等高等智能的動物,能透過觀察他人行為、並學習對方的價值系統,在大腦中預測對方的行為,更進一步利用預測和實際結果的差距來進行學習。這個結果對於現今迅速發展的人工智慧以及精神疾患中的社會行為相關疾患,例如:自閉症、社交恐懼症等,提供可能的致病機轉以及可供神經調節治療的候選大腦迴路。

失衡的社會決策系統:社會行為相關疾患

在這樣的架構下,自閉症其中重要的社會缺陷:無法站在對方立場的「換位思考」(theory of mind),有可能是杏仁核內「社會層」的神經細胞並沒有分化完全,導致在社會互動時,無法特別去學習對方的偏好和價值,了解不同人在不同情境下,會有怎樣的情緒反應,所以會有不適切的言行舉止,而導致社會關係的惡化。假如真是如此,目前現有能選擇性調節部分神經迴路的治療方法(例如:深腦刺激術、聚焦式超音波等)或許有機會透過調節杏仁核內社會決策相關的迴路,治療這些社會行為的症狀。

具社交能力的人工智慧系統

人工智慧(artificial intelligence)致力在建構具有人類多工智能的系統。其中,社會能力是目前很難突破的障礙。當今最先進的人工智慧系統,即便已經或多或少能預測人類的偏好(例如:網頁上的廣告推薦系統),但仍很難透過和人互動去了解對方的行為動機。目前的深度學習模型當中,有許多納入我們對於海馬迴機制的了解,卻鮮少有將杏仁核特性建立在其中的模型。然而,現今我們對於杏仁核的認識,已經突破以往被認為純粹是主管情緒的腦區,反而進一步在決策和社會行為扮演重要的角色。因此,想要改進現有的人工智慧演算法,其中一個方向必須積極納入情緒處理相關的神經迴路,並且了解情緒如何影響決策與學習,讓「理性」和「感性」不再是各自獨立或是互相競爭的機制,而是在不同情境下互相合作,共同進行個體決策的重要部分,這或許是讓機器能更接近人工智能的重要關鍵。

結語

能夠從他人身上獲取經驗,是現在社會必備的能力,也是人必須接受教育的重要原因之一。人們熱衷於讀書、學習、聽演講,為的就是吸取他人經驗之後,不要重蹈別人的覆轍。然而,這樣高階的大腦認知功能,並非時時都運作順暢,很多時候我們難免會陷入「不見棺材不掉淚」的情境中,別人的例子見了再多都很難改變自己的成見。隨著人生歷練,懂得在經驗學習當中保持彈性,了解別人的行為模式,但不一味模仿,而是從中摸索出自己理想的生活模式,才能擺脫活在別人價值觀裡的人生,追求自己心之所向的目標。

參考資料

  1. Thorndike EL. A Proof of the Law of the Effect. Science. (1933). 77(1989):173-5.
  2. Yoshida, K., Saito, N., Iriki, A., and Isoda, M. (2012). Social error monitoring in macaque frontal cortex. Nat. Neurosci. 15, 1307–1312.
  3. Ba ́ ez-Mendoza, R., Harris, C.J., and Schultz, W. (2013). Activity of striatal neurons reflects social action and own reward. Proc. Natl. Acad. Sci. USA 110, 16634–16639.
  4. Chang, S.W., Garie ́py, J.F., and Platt, M.L. (2013). Neuronal reference frames for social decisions in primate frontal cortex. Nat. Neurosci. 16, 243–250.
  5. Grabenhorst F, Báez-Mendoza R, Genest W, Deco G, Schultz W. (2019). Primate Amygdala Neurons Simulate Decision Processes of Social Partners. Cell. pii: S0092-8674(19)30225-9.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s