人類對心智和大腦的發(fā)掘與人類對自然的理解與征服同樣悠久。哺乳動物的神經(jīng)系統(tǒng),也許是自然界最強大的器官。它具有約1011個神經(jīng)元和1015個突觸,耗能卻僅約20W。某種程度上,人類對于科學和機器的狂熱,就是在復制自身的心智。當科學研究進入21世紀,科學家們則試圖借助“理性的自負”真正破解大腦與心智之謎:大腦的信息編碼與儲存,神經(jīng)元的傳導和對于情緒認知的控制,是否可以與計算機科學相聯(lián)系?古典哲學家認為,人生下來就是一張白紙。那么,人類能否向控制機器一樣在這張白紙上肆意涂鴉?科學與倫理從來都是一對雙生子,每當科學向前一步,人類對于道德和自我的困惑也向更深層次突破了一層。
英國曼徹斯特大學動物學教授、神經(jīng)科學家馬修·科布的新書《大腦傳》就是這樣一部作品,它既展示了人類不斷破解大腦與神經(jīng)背后的歷程,也展示了科學與人文之間永恒的沖突。當知識的自負使人類不斷征服了腦科學的未知領域時,困惑也隨之而來——我們是否有資格改造并控制人性?假使我們真正地澄清了自身的心智與知識的迷霧,我們又該期待怎樣的未來?
下文經(jīng)出版社授權,摘編自《大腦傳》第十二章。作者在本章中梳理了20世紀60年代以來科學家如何將腦科學運用到計算機科學與人工智能領域。以及科學家對人類心智之謎的困惑所在:假如人腦就是一臺計算機,那么人為什么會有這樣或那樣的價值觀,這些價值觀又是為何會引領我們塑造了今天的世界?
《大腦傳》,[英]馬科·修布 著,張今 譯,新思文化·中信出版社 2022年3月版。
在計算機時代初期,科學家們對這些新機器與腦之間的相似之處感到無比震撼。受到這種啟發(fā),不同的科學家采用了三種不同的方式來使用計算機。有些科學家忽略了生物學,專注于讓計算機盡可能更智能,這個領域后來被稱為“ 人工智能”(這個概念是約翰·麥卡錫 在1956 年提出的),以各種方式為現(xiàn)代生活做出了積極的貢獻(至少目前是這樣)。對于理解腦是如何工作的,最富有成效的方法并非來自創(chuàng)造超級智能機器的嘗試,而是那些構建腦功能模型的努力,這些研究探索的是模型中神經(jīng)元之間交互連接的規(guī)則。如果你喜歡,可以把這個領域稱為“ 神經(jīng)元代數(shù)”(neuronal algebra)。
模擬神經(jīng)系統(tǒng)的早期嘗試出現(xiàn)在 1956 年,當時 IBM(國際商業(yè)機器公司)的研究人員檢驗了赫布的猜想(神經(jīng)元的組合是腦的基本功能單元)。他們使用的是 IBM 的第一款商用計算機—IBM 701。這是一種真空管計算機,由 11 個大型部件組成,幾乎占據(jù)了一個房間(總共只售出了 19 臺)。這個團隊模擬了一個由 512 個神經(jīng)元組成的網(wǎng)絡。盡管這些組件最初并沒有連接到一起,但就像赫布提出的那樣,它們很快就形成了一些組合,并且自發(fā)地以波的形式同步它們的活動。雖然這個非常粗糙的模型存在局限性,但這表明神經(jīng)系統(tǒng)環(huán)路的某些特征源自一些非?;镜囊?guī)則。
計算機是另一種人腦嗎?
最早使用計算機模型來闡釋腦運作機制的人之一是數(shù)學家奧利弗·塞爾弗里奇(Oliver Selfridge)。他是維納的學生,與皮茨、麥卡洛克和萊特文也關系密切。1958 年,塞爾弗里奇展示了一個被他稱為“ 群魔”(Pandemonium)的分級處理系統(tǒng),這個系統(tǒng)是在他有關機器模式識別的研究工作的基礎上開發(fā)出來的。塞爾弗里奇以創(chuàng)建一種簡單的單元—“ 數(shù)據(jù)惡魔”(datademon)為出發(fā)點,這些單元可以通過將某一特征(比如一條線)與預先設定的內(nèi)部模板進行比較來識別環(huán)境中的元素。這些“ 數(shù)據(jù)惡魔”會把它們檢測到了什么報告給更高一級的“ 惡魔”—“ 計算惡魔”(computational demon)。對于接下來發(fā)生了什么,塞爾弗里奇是這樣解釋的:
在下一個層級上,“ 計算惡魔” 或者 叫“ 亞惡魔”(sub-demon)會對數(shù)據(jù)進行某種或多或少的復雜計算,并將計算結果傳遞到再下一個層級—“ 認知惡魔(cognitive demon)那里,由“ 認知惡魔”對證據(jù)加以權衡。每一個“ 認知惡魔”都會計算出一聲尖叫,而最高層級的惡魔—“決策惡魔”(decision demon)會從所有的尖叫中選擇出最大聲的那一個。
這個過程的最終結果是,一個復雜的特征(比如一個字母)會被“ 決策惡魔”識別出來。乍一看,這似乎只是感覺處理層級觀的一個電子版本,最早可以追溯到阿爾弗雷德·斯密。但“ 群魔”有自己的獨特之處—它可以在整個過程中不斷學習。這個程序會持續(xù)關注自己對物體的分類準確與否(在最初階段,這些信息是由人提供的)。通過不斷重復運行這個程序,以及這個過程中塞爾弗里奇所謂的對惡魔的“ 自然選擇”(如果分類正確,它們就會被保留下來),隨著時間的推移,系統(tǒng)會變得越來越準確。它甚至能識別那些并不是設計出來供它識別的東西。根據(jù)認知科學家瑪格麗特·博登的說法,“ 群魔”的影響是不可估量的—它表明計算機程序可以模擬相當復雜的感覺過程,而且如果它的成功獲得適當?shù)姆答?,程序的功能還可以隨著時間而改變。
與此同時, 另一位美國科學家弗蘭克· 羅森布拉特(Frank Rosenblatt)提出了一個稍有不同的模型 — 感知機(Perceptron)。感知機關注的也是模式識別,也使用了靈活層級連接的思想—一種后來被稱為“ 連接主義”(connectionism)的方法。羅森布拉特認為,腦和計算機都具備兩項功能—決策和控制,無論是在腦還是計算機中,這兩項功能都是基于邏輯規(guī)則運行的。但腦同時還在執(zhí)行兩項更深層,交互性也更強的功能:對環(huán)境的解讀和預測。所有這些功能都在羅森布拉特的感知模型中得到了體現(xiàn),因此他把感知機稱為“ 第一臺能夠產(chǎn)生原創(chuàng)性想法的機器”。
美國科學家弗蘭克· 羅森布拉特與感知機(圖片來自康奈爾大學官方網(wǎng)站)。
事實上,和之前的“ 群魔”一樣,感知機只是學會了識別字母。而且就感知機而言,字母必須要大約半米高才能被識別出來。但感知機與“ 群魔”的關鍵區(qū)別是,感知機無須預設的模板,通過使用并行處理(同時執(zhí)行不同的計算,就像腦一樣)就能做到這一點。這種差別絕非偶然,因為羅森布拉特不僅對開發(fā)一項在當時看來令人瞠目結舌的技術感興趣,對提出理論來解釋腦的運作方式同樣感興趣。
媒體很喜歡追捧這樣的事。當羅森布拉特的資助方美國海軍在 1958 年宣布他的研究成果時,《紐約時報》歡呼道:“ 今天,美國海軍披露了電子計算機的雛形,在未來,它有望能夠走路、說話、看見、書寫、復制自己,并意識到自身的存在。” 這些話并非出自某位過度興奮的記者之口,而是羅森布拉特本人的原話。關于羅森布拉特,一位科學家后來回憶說:“ 他是那種新聞工作者夢想報道的人,就像有魔力一樣。按照他的說法,感知機能做出各種各樣了不得的事情。也許確實如此,但他的工作證明不了這一點?!?/p>
盡管羅森布拉特在媒體上進行了精心的宣傳,但他對感知機的真正意義卻保持了相對冷靜的態(tài)度。在他 1961 年出版的著作《神經(jīng)動力學原理》(Principles of Neurodynamics)中,羅森布拉特寫道:
感知機不是任何實際神經(jīng)系統(tǒng)的近似仿品。它們是簡化的網(wǎng)絡,能幫助我們研究神經(jīng)網(wǎng)絡及其所在環(huán)境的組織方式與這些網(wǎng)絡的“ 心理”表現(xiàn)之間的關系法則。感知機實際上可能對應于生物系統(tǒng)外延網(wǎng)絡的某些部分……更有可能的是,它們是對中樞神經(jīng)系統(tǒng)的極端簡化,其中一些特征被放大了,而另一些則被縮小了。
到了20 世紀60 年代中期,專家們開始承認,即使是感知機,也并不像人們吹捧的那樣好。1969 年,人工智能先驅馬文·明斯基(Marvin Minsky)和同事西摩·佩珀特(Seymour Papert)出版了一本書,對感知機模型給予了非常負面的評價。明斯基和佩珀特對感知機的能力進行了數(shù)學分析,認為無論對于人工智能還是對于理解腦來說,這種方法都是死胡同,因為感知機的構造方式使它不可能在內(nèi)部表征它正在學習的東西。一方面由于這類批評的出現(xiàn),一方面由于這些模型進展放緩,美國對連接主義方法的資助逐漸枯竭,這個領域也隨之萎縮。羅森布拉特隨后開始研究學習轉移現(xiàn)象,這個領域的研究將在恐暗肽理論出現(xiàn)時達到高潮。1971 年 7 月 11 日,在他 43 歲生日那一天,羅森布拉特在一次船只事故中喪生。
盡管“ 群魔”和感知機未能提供可以應用到生物模式識別系統(tǒng)上的見解,但這兩個程序改變了研究者對腦的看法—它們表明,任何對感知(無論是人的感知還是機器的感知)的有效描述,都必須引入關鍵的可塑性要素。因此,它們與基于機械或者壓強隱喻的舊模型完全不同。此外,在這些連接主義程序的結構與休伯爾和維澤爾發(fā)現(xiàn)的簡單特征探測器的層級結構之間,存在著一種誘人的相似性,巴洛 1972 年提出的關于“ 紅衣主教細胞” 的想法顯然受到了這種相似性的影響。對一些人來說,這意味著這些新模型并不僅僅是用隱喻來解釋腦是如何工作的。它們實際上揭示了真正的機制。
基因、理性與人腦的機制
隨著學界對“ 群魔”和感知機的興趣逐漸消退,大衛(wèi)·馬爾開發(fā)了一種不同的腦功能計算模型。馬爾此時已經(jīng)在劍橋大學闖出了名聲。在那里,他發(fā)表了一系列論文,宣稱已經(jīng)發(fā)現(xiàn)了腦是如何工作的。但他很快就否定了這些數(shù)學模型,認為它們只是“ 一種簡單的組合技巧”,因為他意識到研究人員們需要一種完全不同的方法。1973 年,馬爾搬到了波士頓的麻省理工學院,與明斯基一起工作。他的目標是創(chuàng)造一臺能看見東西的機器,進而理解人的視覺是如何工作的。4 年后,馬爾患上了白血病,因此迅速開始撰寫一本名為《視覺》(Vision)的書,總結他的見解。他在書的前言中寫道:“ 因為某些事情,我不得不比原計劃提前幾年開始寫這本書?!?馬爾于 1980 年去世,年僅 35 歲。1982 年,《視覺》出版上市。
也許正是意識到了死亡將近,馬爾的這部著作展現(xiàn)出了更為宏大的視角,而沒有限于一個視覺模型的細節(jié)。他把他有關腦運作機制的觀點放到了一個更廣泛的倫理背景下,講述了我們是如何進化的,以及我們對自然選擇的影響抱有的深刻態(tài)度源自何處:
說腦是一臺計算機,這沒錯,但又容易引起誤解。它確實是一臺高度專業(yè)化的信息處理設備—或者更確切地說, 是許多信息處理設備的集合。將我們的腦視為信息處理設備,這并不是在貶低或者否定人的價值觀。這么看待人腦反而更能體現(xiàn)人的價值觀,并可能最終幫助我們從信息處理的視角理解人的價值觀究竟是什么,人為什么有這樣或那樣的價值觀,以及這些價值觀是如何整合進基因賦予我們的社會習俗和社會組織的。
電影《攻殼機動隊》中的腦機接口。
馬爾的這部著作中使用了很多數(shù)學方法,因此有人說引用他這本書的人比理解他這本書的人更多。這句俏皮話說明,馬爾最大的貢獻不在于其視覺計算模型的精確細節(jié),而是他的思想方法。即使是馬爾最熱情的支持者也承認,在今天看來,他的這本書的主要價值是其歷史意義。
與巴洛不同,馬爾認為單個神經(jīng)元的活動不足以解釋環(huán)路是如何發(fā)揮其功能的,也無法解釋感知是如何運作的。他曾用一種略帶諷刺的口吻來為自己的新方法辯護:
試圖僅僅通過研究神經(jīng)元來理解感知,就像試圖僅僅通過研究羽毛來理解鳥類的飛行一樣:根本就不可能。要研究鳥類是如何飛行的,我們必須先了解空氣動力學,只有這樣,羽毛的結構和鳥類翅膀的不同形狀才變得有意義。
要理解某個特定的功能在腦(或計算機)中是如何執(zhí)行的, 馬爾的方法是分三步走。首先,待解決的問題必須以遵循邏輯的方式加以陳述,這樣的理論方法限定了如何通過實驗來探索問題或者對問題進行建模。其次,必須確定系統(tǒng)輸入和輸出的表征方式,還需要確定將系統(tǒng)從一種狀態(tài)轉換到另一種狀態(tài)的算法的描述。最后,必須解釋第二層在物理上(在腦活動這個問題上,就是在神經(jīng)系統(tǒng)中)是如何實現(xiàn)的。馬爾的觀點是,在創(chuàng)造一個可以看見東西的網(wǎng)絡(無論是一臺機器還是一個腦)這個問題上, 面臨的約束條件在所有情況下基本上都是一樣的,因此應該可以使用類似的算法,即使這些算法在生物體中與在計算機中的運行方式可能大為不同。他認為,通過解決機器的視覺問題,我們可以更好地理解我們腦中的視覺。
在腦如何識別簡單物體(比如一條邊)這個問題上,馬爾的想法是以休伯爾和維澤爾的發(fā)現(xiàn)為基礎的。但與“ 群魔”和感知機不同,他的方法引入了更豐富的計算方案,而不只是一個把線段的各個點疊加在一起,然后與模板對比的層級結構。正如馬爾 1976 年在冷泉港的一次會議上所說的那樣,“ 這個輪廓不是被探測到的,而是被構建出來的”。這種觀點可以追溯到赫爾姆霍茲,它強調(diào)了腦并非只是一個接收感官信息的被動觀察者。感知還涉及對這些刺激的組合和解釋。這種方法對于任何視覺模型來說都是不可或缺的,因為如果機器(或者視網(wǎng)膜)只是在圖像的每一個點上識別光度值,那么什么也不會發(fā)生。這些是照相機做的事情,而照相機是無法看見東西的。
雖然有這些深刻的見解,但馬爾的機器方法并沒有改變我們對機器視覺的理解,也沒有改變我們對腦如何看東西的理解。就我們目前對視覺皮層中具體過程的理解而言,同樣的算法還沒有在生物體和計算機中被發(fā)現(xiàn)。同樣麻煩的是,馬爾用來理解視覺的方法無法被擴展到腦功能的其他領域去使用。
視覺與感知
盡管我們在計算機面部識別和其他人工場景分析方法上已經(jīng)取得了巨大的進步,但機器視覺仍然遠遠落后于我們腦中的視覺。同樣地,我們對“ 看見”東西時究竟發(fā)生了什么仍然知之甚少。每個人都同意,在我們的腦中一定有某種對場景的符號表征,但沒有人太清楚這究竟是如何發(fā)生的。在《視覺》出版 30 周年之際,馬爾的學生肯特·史蒂文斯回顧了馬爾的貢獻并得出結論說,雖然符號表征在視覺中的重要性毋庸置疑,但“ 我們?nèi)匀粺o法完全理解符號系統(tǒng)在生物視覺中的地位”。
在這個問題上,對猴子腦中面部識別細胞的研究或許已經(jīng)能為我們提供一些見解。2017 年,加州理工學院的兩名研究者常樂和曹穎向獼猴展示了一系列面孔,并研究了猴子腦中一系列細胞的單細胞反應。這些細胞總共能識別面部 50 個維度的信息(眼間距和發(fā)際線等),但每個面部識別細胞只對其中一個維度感興趣。為了說明這些信息是如何結合起來并準確地表征整個面部的,常樂和曹穎記錄了 200 個這類細胞對一系列照片的反應, 然后用計算機根據(jù)這些神經(jīng)元的電活動就精確地重建出了原始的圖像。有趣的是,他們并沒有發(fā)現(xiàn)獼猴腦中存在“ 詹妮弗·安妮斯頓細胞”的證據(jù),或者用他們的話來說,“ 不存在負責識別特定個體身份的探測細胞”。但另一個研究小組的一項研究表明,猴子的顳葉中似乎有一個區(qū)域參與了識別“ 臉熟”的猴子的面孔的過程。
曹穎推特的個人簡介很簡短:“ 皮層幾何學家”。曹穎猜測,她所揭示的面孔檢測過程中的特征提取可能是一個發(fā)生在視覺皮層的通用過程—“ 我們認為,整個下顳葉皮層可能使用了相同的方式來把各個連接的區(qū)域組織成網(wǎng)絡,并且在所有類型的對象識別中使用了相同的編碼方式?!?她目前試圖解決的問題是理解視錯覺(比如著名的花瓶 / 人臉錯覺)的神經(jīng)基礎。正如她指出的那樣,在 10 年前,沒有人知道該從哪里下手研究這個問題。但現(xiàn)在我們知道了。
至于人類是如何識別面孔的—包括我們祖母的臉—我們似乎很可能像獼猴那樣,腦中存在某種分散式分布的面孔識別網(wǎng)絡。你腦中的這種算法不同于手機的人臉識別算法或者安保系統(tǒng)篩選犯罪嫌疑人照片的算法,后者完全是為了辨識某些特征定制的,依賴于眼間距、臉形等生物計量特征。生物視覺中的面孔識別要復雜和抽象得多,而且最終是以休伯爾和維澤爾發(fā)現(xiàn)的各種元素(線條、斑點等等),而不是以面部每個細節(jié)的解剖結構以及彼此之間的關系為基礎的。這些元素以某種方式被組織成了一個復雜的層級系統(tǒng)(就像馬爾想象的那樣),而且這個系統(tǒng)同樣適用于環(huán)境中的其他特征,而不僅僅是面孔。
在哈佛大學最近一項結果令人不安但又讓人驚嘆的研究中, 研究人員在猴子身上融合使用了計算和電生理的方法,研究結果揭示了這些層級細胞可能對什么刺激感興趣。這些科學家把圖像投射到屏幕上,并記錄清醒猴子的下顳葉皮層的單個細胞的活動。這倒沒什么稀奇的。但這些圖像并不是靜態(tài)的,而是合成的,在不斷變化和流動。圖像是由一種名為 XDREAM 的算法“ 進化”出來的,這種算法會不斷調(diào)整刺激,以獲得細胞最大程度的反應。這種方法并非原創(chuàng),神經(jīng)科學家查爾斯·康納(Charles Connor)和同事在 10 年前就曾使用過,但這項新研究得出了令人毛骨悚然的結果。在經(jīng)過一百多次迭代后,圖像從一片灰白色的平板“ 進化”成了夢境一般的超現(xiàn)實主義影像:猴子面部的各個部分被扭曲雜糅到了一起,這里可以辨認出來是眼睛,那里是無形且模糊的身體的某個部分,不同部位的朝向也各不相同。
神經(jīng)科學家查爾斯·康納(圖片來自約翰·霍普金斯大學官網(wǎng))。
這表明在猴腦中,這些細胞真正感興趣的是這類奇怪的圖像,而不是肖像。如果在有“ 詹妮弗·安妮斯頓細胞”的人的腦中也會出現(xiàn)類似的現(xiàn)象,那就意味著這些細胞其實并沒有被設定成對任何照片上的影像做出反應—細胞之所以會有反應,僅僅是因為照片跟細胞真正響應的影像非常相似。與此同時,麻省理工學院的研究人員也發(fā)表了類似的結果,不過結果不像哈佛大學科學家的結果那么離奇。他們在猴子視覺皮層中一個與面孔識別無關的區(qū)域的細胞上開展了相同的實驗。研究發(fā)現(xiàn),這些細胞似乎只會被某些帶有一定生物特征的奇怪的幾何圖像激活,這些圖像就像人在出現(xiàn)嚴重偏頭痛時產(chǎn)生的那類幻象。
上述發(fā)現(xiàn)很容易誘使我們想象,這些奇怪的混合形狀才是一只猴子看著另一只猴子時實際上看到的東西。但是請記住,有數(shù)百萬個細胞參與了對面孔的感知,而且最重要的是,腦中并沒有什么微型小猴在審視這些單個細胞的輸出。以某種方式產(chǎn)生感知的是整個系統(tǒng),不是某個細胞,甚至不是一小群細胞。
最近,在小鼠上開展的研究為理解視覺感知的神經(jīng)基礎提供了一條有力的途徑。2019 年夏天,利用一種復雜的光遺傳學技術,哥倫比亞大學拉斐爾·尤斯特的研究小組和斯坦福大學卡爾·戴瑟羅斯的研究小組在相隔幾周的時間里先后發(fā)表論文,證明可以重現(xiàn)小鼠在視覺感知過程中腦的活動模式。 在這兩項研究中,小鼠都事先經(jīng)過訓練,當它們看到一種條紋圖案時就會舔水。研究人員發(fā)現(xiàn),如果用光遺傳學方法激活這些模式,即使沒有視覺刺激,小鼠也會舔水。兩個小組使用了略微不同的技術:戴瑟羅斯的小組精確地刺激了十幾個神經(jīng)元,使其產(chǎn)生相應的活動模式;尤斯特的小組則專注于兩個連接緊密的神經(jīng)元,這兩個神經(jīng)元能夠激活腦視覺系統(tǒng)中的一組神經(jīng)元,從而產(chǎn)生相應的活動模式。盡管這些研究令人印象深刻,但我們?nèi)匀粺o法據(jù)此認定這些活動模式就是小鼠的視覺感知,或者就是視覺感知發(fā)生— 通過其他神經(jīng)元組合的活動—的必要先決條件。雖然計算科學家和神經(jīng)生物學家已經(jīng)付出了數(shù)十年的努力,對于當我們看見東西時究竟發(fā)生了什么這個問題,我們的理解仍然很模糊。
作者|馬修·科布
編輯|朱天元
校對|李銘