我們為何能輕易在人群中認出家人或朋友的面孔?
如此理所當然的行為,其運作機制卻是科學界的重大奧祕之一!
從視覺到人工智慧,揭開人腦與電腦的「看見」之謎
幾乎大腦所有的行為,都與視覺息息相關,當我們了解視覺形成的原理,不僅能夠明白「看見」代表的意義,更能一窺大腦運作的堂奧。哈佛大學神經科學教授理查.馬斯蘭藉由解析眼睛的內在組成與行為,解答了關於大腦處理資訊的關鍵問題:即人類如何感知、學習和記憶資訊。
視覺神經細胞是高度特化、細緻而多元的神經細胞,一條視神經中約包含百萬根神經纖維,也因此「視覺的形成機制」一直是科學界亟欲解開的謎題。《眼見為憑:從眼睛到大腦,從感知到思考,探索「看見」的奧祕》分為三部分,理查.馬斯蘭帶領讀者從第一部「視覺的開始」出發,解說光線進入視網膜時發生的各項細節、介紹視網膜與視神經上功能不同的細胞及其機制;第二部分進一步闡述這些神經細胞如何各司其職接收訊息,並將其轉化為知覺的複雜神經網絡,讓我們對日常生活中幾乎不會意識到的「看見」,有了全新的認識,更將內容擴及電腦,闡述其如何藉由機器學習發展人工智慧;第三部分則嘗試討論知覺與思想,當電腦學會「看」,是否表示它有了自己的思想?電腦真能取代人腦嗎?或者還需要發展更多技巧?都在本書中有獨到的解析。
理查.馬斯蘭以風趣生動的口吻講述看似枯燥的理論機制,並廣納各種觀點;行文之間更不時點綴以合作過的傑出學者,以及在漫長研究過程中發生的大小事。透過深入淺出的筆觸,讓那些在實驗室裡度過的晨昏躍然紙上,帶領讀者一同參與這趟偉大的解謎之旅。
【精彩書摘】
看看下面這三張臉的照片,雖然照片有點模糊,對比也不強,但是你能夠清楚地分辨出來。右邊的女性臉有點圓,左邊的男孩下巴尖。如果他們是你的兒子、女兒、朋友或母親,你可以在各種不同的場合認出來。就算他們穿著普通的服裝,沒有化妝也可以。你可以從正面或側一個角度認出他們,不論光線明亮或是黯淡,距離是遠是近,他們的表情是快樂、悲傷、歡笑或是沉默,都沒有問題。
在這種種不同的狀況下,你是怎麼認出他們的呢?在每種狀況中,落在視網膜上的真實影像,從物理的角度來說是完全不一樣的。但是你的腦部能夠調整視覺,不論是影像大小、光線明暗,或是喜怒哀樂。在視網膜上接收到,臉部變化物理性刺激的組合方式,近乎無限多種。但是你幾乎馬上就可以辨認出熟悉的臉孔,不費半分力氣。你不但能夠分辨出這三張照片中的臉孔,還能夠分出數百或是數千張臉。腦部也不過是遵循物理原則的機器,和其他機器沒有多少不同,卻能夠漂亮地執行這種任務!
來思索一個比較簡單的問題,可以讓你知道這個任務有多困難。想像你要設計一個能夠辨認字母A的電腦程式,一臺現代的電腦可能輕鬆辦到,對吧。但是相較於人腦,電腦簡直就是在作弊,馬上就可以完成。
解決方式似乎很明顯:在電腦(或是你的腦)中某處有一個字母A的模板,然後電腦(或是你的腦)可以用一個A和那個模板加以比對。但是如果這個A的大小和模板不同該怎麼辦?電腦(或是你的腦)可能會認為那兩個字母並不相同。
那麼讓電腦測試不同大小的A字母模板,就可以把這個問題解決了吧?這當然可以解決問題。不過現在如果測試的A字母有點傾斜就比對不上了,不論電腦認為兩個大小有多相近,都比對不上。
好吧,那麼讓電腦能夠比對所有的大小和角度。如果電腦的運算速度很快,這的確有可能辦得到。但是到頭來,字母可以有的變化實在太多了:線條粗細、顏色、字型等,然後這些變化彼此還會結合在一起,電腦要比對所有可能的大小、乘上所有可能的角度、乘上所有可能的字型、乘上所有的顏色等。這樣相乘出來的數字會大到造成實際運作上的困難,搞得那麼麻煩,就是為了一個字母而已。
臉的變化種類幾乎是沒有數量限制的。皺眉或微笑的臉、陰暗或明亮的臉、正面或側面的臉。腦中的組成單位(神經元和突觸)和電腦相比,運算速度非常慢。人類腦中的神經元要把基本訊息傳過突觸到其他的神經元,需要千分之一秒,在這樣的時間中,現代夠快的電腦可以完成百萬次運算,就是因為有這種超人的速度,我才會說電腦作弊,一般的生物器官不可能辦得到。假設電腦每次比對的時候要進行一百次運算,那麼在腦中一個神經衝動跨過突觸的時間中,電腦便進行了十萬次比對,這還沒有把訊息在連結神經元的神經纖維上傳輸的時間算進來。如果要同樣的方式與電腦比較,我們老舊的人腦要花好幾分鐘才能認出一張熟悉的臉。換句話說,進行大量猜想並不適合腦。
這些我們每天輕鬆完成的事情,其實是個深奧的謎團,這個謎團有個名稱:「物體辨認」(object recognition)。我們會認為這是和感覺經驗有關的問題,但其實和記憶的關聯更為密切:物體辨認是把目前受到的刺激和之前記憶中的某個物體加以比對。研究物體辨認的運作方式,是極度艱難的技術挑戰,是感覺神經生物學中的聖母峰。
(本文摘自《眼見為憑》/時報出版)
【作者簡介】
理查.馬斯蘭(Richard Masland, 1942-2019)
哈佛醫學院科甘傑出眼科學教授(David Glendenning Cogan Distinguished Professor of Ophthalmology)與神經科學教授。曾擔任世上最大視覺研究機構麻州眼耳醫院(Massachusetts Eye and Ear Infirmary)研究主任多年。二十多年來擔任哈佛醫學園神經科學課程的主要教師,並因此得到兩座教師獎。他是美國科學促進會(AAAS)成員、前霍華德.休斯醫學研究所(Howard Hughes Medical Institute)研究員,以及普洛克特獎章(Proctor Medal)與愛爾康研究獎(Alcon Research Award)等諸多獎項的得主。他為視網膜的神經網路與逆轉失明的研究帶來了開創性的貢獻。
發表意見
中時新聞網對留言系統使用者發布的文字、圖片或檔案保有片面修改或移除的權利。當使用者使用本網站留言服務時,表示已詳細閱讀並完全了解,且同意配合下述規定:
違反上述規定者,中時新聞網有權刪除留言,或者直接封鎖帳號!請使用者在發言前,務必先閱讀留言板規則,謝謝配合。