日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

千脑智能理论:开启创造机器智能的路线图 | 《千脑智能》

發布時間:2023/12/10 编程问答 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 千脑智能理论:开启创造机器智能的路线图 | 《千脑智能》 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

導語

當人們談論人工智能時,往往熱衷于算法優化、模型迭代、算力提升,海量參數的復雜網絡仿佛就是人工智能的發展方向。然而,這就是真正的智能嗎?計算機科學家與神經科學家杰夫·霍金斯在《千腦智能》中提出了一種關于大腦和智能的理論——千腦智能理論。霍金斯團隊發現,大腦使用類似地圖的結構來建立一個世界的模型——不僅僅是一個模型,而是成千上萬個我們所知道的一切的模型。這一發現為創造機器智能提供了清晰的路線圖,將改變我們對大腦和人工智能的未來的理解。

研究領域:人工智能,腦科學

來源:?集智俱樂部

作者:Jeff Hawkins

譯者:廖璐、熊宇軒、馬雷

編輯:鄧一雪

自成立之初,Numenta 公司就期望發展一種普適的理論,論述大腦新皮質是如何工作的。神經科學家每年都會發表數千篇論文描述有關大腦的各種細節,卻缺乏一條系統的理論將這些細節串起來。我們決定先關注單根皮質柱。皮質柱物理結構復雜,工作方式也很復雜。在不了解單根皮質柱工作方式的情況下?(我在第2章講過類似分層的模式),就探究它為何無序地連接在一起,就如同在對人類一無所知的情況下,研究社會的工作方式一樣,這種做法顯然毫無意義。

現在,我們對皮質柱的功能已有了很多了解。我們知道了,每根皮質柱都是一個感覺 -運動系統,每根皮質柱都會學習成百上千個物體模型,這些模型都是基于參考系的。一旦我們了解了皮質柱的運行機制,整個新皮質的工作方式就和我們之前所認為的截然不同了。這種新的觀點就叫作“千腦智能理論”。

在闡釋什么是千腦智能理論之前,我們得先知道它取代了什么。

現有的新皮質理論

在現有的大腦新皮質理論中,最普遍的看法是新皮質就像一個流程圖。感覺信息逐步經過處理從新皮質的一個區域傳遞到下一個區域。科學家稱之為特征檢測器的一層。人們通常是從視覺的角度來描述這個過程的:視網膜上的每個細胞從圖像的某一小部分檢測到光的存在,再將光的輸入映射到新皮質上。新皮質中最先接收到該輸入的區域叫作V1區。V1區的個神經元只從視網膜的某一小部分接收輸入,這就像透過一根吸管看整個世界。

事實表明,V1區的皮質柱并不能識別物體的全貌。這樣V1區的功能就具有局限性了,它只能檢測微小的視覺特征,如某張圖片局部的線條、邊界等。接著,V1 區的神經元將這些特征傳遞到新皮質的其他區域。下一個視覺區叫作V2,它把從 V1 區接收的簡單信息聚合成更復雜的特征,如角點或弧形。這個過程會在更多區域中重復更多次,直到神經元能夠理解整個物體。有種設想認為,從簡單特征到復雜特征再到整個物體的這個過程,在觸覺和聽覺中同樣適用。這種認為新皮質是特征檢測器的一層的理論已盛行了半個多世紀。

該理論最大的弊端在于認為視覺是個靜止的過程,就像拍一張照片一樣,但事實并非如此。眼睛每秒會快速轉動約三次?(掃視)。每次掃視時,眼睛傳遞到大腦的信息完全不同。我們每次向前走或左右搖頭時,視覺輸入也會改變。特征檢測器理論則忽略了這些變化,認為視覺輸入似乎就是一次拍一張照片,然后再給照片貼個標簽。哪怕是隨意的觀察也表明,視覺是個互動的過程,依賴移動。例如,要了解一個新的物體長什么樣,我們需要把它握在手里,不斷旋轉,從不同角度來觀察它的樣子。只有通過移動,新皮質才能學習一個物體的模型。

許多人之所以會忽略視覺動態的一面,原因之一是,我們有時不移動眼睛就能識別出圖像,如在顯示屏上短暫閃過的圖片,但這只是一個特例,并不普遍。正常情況下,視覺是主動的感覺 - 運動過程,不是靜態過程。

對于觸覺和聽覺,感覺 - 運動過程的重要作用體現得更為明顯。如果有人將一個物體放在你張開的手上,除非動一動手指,否則你將無法識別出它是什么。同理,聽覺也是一個動態過程。不僅聽覺內容?(如口語會話)?是由隨時間變化的聲音定義的,當我們聆聽時,我們也會移動頭部主動完善所聽到的內容。目前尚不清楚特征層次理論是如何應用于觸覺和聽覺的。對于視覺層面,你至少可以想象大腦正在處理類似圖片的圖像,但對于觸覺和聽覺,就沒什么可類比的了。

有很多其他研究表明,特征層次理論需要進一步完善。以下幾個缺點均與視覺相關:

? 第一和第二視覺區(V1 和 V2)是人類新皮質中最大的區域。它們在大腦中所占面積比其他可識別完整物體的視覺區要大得多。為什么檢測數量有限的小特征比識別數量多且完整的物體需要更多的大腦區域?在某些哺乳動物?(如老鼠)?中,這種失衡情況更為嚴重。老鼠的 V1 區占據了整個大腦新皮質的很大一部分。相比之下,老鼠大腦中的其他視覺區占比都很小,就好像老鼠幾乎所有的視覺行為都發生在 V1 區中。

? 當研究人員將圖像投射到被麻醉的動物眼前并同時記錄 V1 區神經元的活動時,發現了 V1 區的特征檢測神經元。他們發現,神經元在檢測到一些簡單的特征時,如檢測到圖片中一小部分的邊緣時,會變得異常活躍。由于神經元僅在很小的區域內對簡單的特征做出反應,研究人員認為完整的物體必然是在其他區域被識別出來的,從而引出了特征層次模型。但在這些實驗中,V1 區的大多數神經元并沒有對任何明顯的物體做出反應,它們可能會不時地發射脈沖,或者連續發射脈沖,一段時間后停止。大多數神經元無法用特征層次理論來解釋,因而它們大多被忽略了。但 V1 區所有無法解釋的神經元一定發揮著重要的作用,而不僅僅是特征檢測。

? 當眼睛從一個注視點掃視到另一個注視點時,V1 區和 V2 區的一些神經元的某些行為引起了研究人員的注意。在視線移到新的注視點之前,這些神經元似乎就知道它們將會看到什么。盡管視覺輸入還沒有進入視野,這些神經元就已經變得活躍起來,仿佛它們已經可以看到新的視覺輸入。發現該現象的科學家非常震驚。這一現象表明, V1 區和 V2 區的神經元不只了解物體某一小部分的知識,還能知道它們即將看見的整個物體的知識。

? 視網膜的中央比邊緣有更多的光感受器。我們可以將眼球想象成一個擁有魚眼鏡頭的照相機。實際上,視網膜的某些部分沒有光感受器,例如,眼球中視神經穿過的地方和視網膜中血管穿過的地方,會形成盲點。因此,我們并不能將新皮質的視覺輸入簡單類比為一張照片。真正的視覺輸入就好比由高度變形的、不完整的圖塊鋪成的毯子。然而,我們并沒有意識到這種變形和缺失的部分,因為我們所感知的世界是一致且完整的。特征層次理論并不能解釋上述現象,我們將該問題稱為“綁定問題”?(binding problem)?或“感官融合問題”?(sensor-fusion problem)?。更通俗點來說,綁定問題探究的是:來自不同感官的信息分散在新皮質的各處,且伴有各種各樣的變形,這些信息是怎樣融為我們所體驗到的單一且完整的知覺的?

? 正如我在第 1 章中所指出的,盡管新皮質各功能區之間的某些連接呈現流程圖式逐步分層的結構,但大多數連接并非如此。例如,低層次的視覺區和低層次的觸覺區之間也存在連接。但從特征層次理論的角度來看,這些連接并沒有什么意義。

? 盡管特征層次理論可能解釋了新皮質識別圖像的機制,卻無法解釋我們如何學習物體的三維結構、物體如何由其他物體組合而來,以及物體如何隨著時間的推移而發生變化等。此外,特征層次理論也無法解釋我們如何想象出某個物體旋轉或發生變形后的樣子。

既然特征層次理論存在上述矛盾和缺點,為什么這一理論仍得到了廣泛應用呢?我們總結出了以下 4 種原因:(1)該理論與大量的觀察數據相符,尤其是很久以前收集的數據;(2)該理論存在的問題隨著時間的推進慢慢積累,這導致人們很容易將一些新出現的問題當作小問題,從而忽略;(3)這是我們迄今為止所建立起來的最好的理論,既然沒有更好的理論可以替代它,那就只能使用它;(4)該理論并非完全錯誤,只不過我們需要進行大量修正,本章后續部分將對此展開討論。

參考系下的新皮質理論

我們關于皮質柱存在參考系的觀點,為探究新皮質的工作方式提供了一種全新的思路。我們認為,所有皮質柱,即使是低層次的感覺區的皮質柱,都能夠學習和識別完整的物體。一個只感知到物體一小部分的皮質柱可以通過長期整合其輸入來學習整個物體的模型,就像我們通過訪問一個又一個地點來了解一個新的城市一樣。因此嚴格來說,學習物體的模型并不需要皮質區的層次結構。我們的理論解釋了老鼠的視覺系統大多只有一層,它為何能看到并識別出世界上的物體。

新皮質中有許多針對具體某個物體的模型。這些模型位于不同的皮質柱中。它們并非完全相同,而是互為補充。例如,一個從指尖獲得觸覺輸入的皮質柱,可以學習一個手機的模型,包括手機的形狀、手機表面的紋理,以及手機按鈕在按下時如何移動;一個從視網膜獲得視覺輸入的皮質柱也可以學習一個手機的模型,包括手機的形狀。但是,與從指尖獲得輸入的皮質柱不同,從視網膜獲得輸入的皮質柱所學習的模型還包括手機不同部分的顏色以及屏幕上的圖標在使用過程中的變化。視覺皮質柱無法學習電源開關的凹陷,觸覺皮質柱無法學習圖標在顯示屏上的變化。

任何單獨的皮質柱都不可能學習世界上每個物體的模型。首先,單根皮質柱能夠學習多少物體是有限制的。我們還不知道這個范圍有多大,但我們的模擬研究表明,單根皮質柱可以學習數百個復雜的物體。這比你所知道的物體的數量要少得多。其次,一根皮質柱所學習的東西受到其輸入的限制。例如,一根觸覺皮質柱不能學習云朵的模型,一根視覺皮質柱也無法學習旋律的模型。

即使在一個單一的感覺模態中,如視覺,皮質柱也會得到不同類型的輸入,并學習不同類型的模型。例如,有些視覺皮質柱獲得色彩輸入,而有些皮質柱則獲得黑白輸入。又或者,V1 區和 V2 區的皮質柱都獲得了來自視網膜的輸入。V1 區的皮質柱從視網膜中一個非常小的區域獲得輸入,就像它是通過一根細細的吸管看世界一樣。V2 區的皮質柱從視網膜中一個更大的區域獲得輸入,就像它是通過一根更寬的吸管看世界一樣,但看到的圖像更模糊。現在想象一下,你正在閱讀你能看清的最小字號的文本。我們的理論表明,只有 V1 區的皮質柱能夠識別最小字號的字母和單詞,透過 V2 區看到的圖像太模糊了。當我們調大字號時,V2 區和 V1 區都能識別該文本。如果字號繼續變大,那么 V1 區就更難識別文本,但 V2 區仍能識別。因此,V1 區和 V2 區的皮質柱也許都能學習物體的模型,如字母和單詞,但模型因大小比例不同而不同。

大腦中的知識存儲在哪

大腦中的知識是分布式存儲的。所有知識都不會只存儲在一個地方,如存儲在一個細胞或皮質柱中,也沒有像全息圖那樣在任一地方存儲所有東西。關于一個物體的知識會分布在成千上萬根皮質柱中,但這只是所有皮質柱中的一小部分。

再來想想咖啡杯。大腦中關于咖啡杯的知識存儲在哪里呢?視覺區中有許多皮質柱,它們從視網膜接收信息。每根皮質柱都會觀察杯子的一部分,并學習杯子的模型,再嘗試識別它。同樣,如果你握住杯子,那么新皮質觸覺區中的數十種到數百種模型都會活躍起來。沒有單一模型的咖啡杯。你對咖啡杯的了解存儲在成千上萬個模型中,即存儲在成千上萬根皮質柱中,但這些仍然只占新皮質中所有皮質柱的一小部分。這就是我們稱其為“千腦智能理論”的原因:關于任何特定物體的知識都分布在成千上萬個互補的模型中。

打個比方,現在有一座住著 10 萬居民的城市。這座城市有一套由管道、泵、水箱和過濾器組成的輸水系統,可以為每家每戶輸送干凈的水。這套輸水系統需要通過維護來保持良好的工作狀態。關于如何維護輸水系統的知識存儲在哪里呢?如果只有一個居民知道這些知識,這種做法顯然并不明智,但讓每個居民都知道這些知識又不切實際。解決方案是,將這些知識“分散”傳授給很多人,但人數也不要過多。在這種情況下,我們假設水利部門有 50 名員工。借著這個比喻,我們假設輸水系統有 100 個小部分,即 100 個泵、閥門、水箱等,而水利部門50名員工中的每個人都知道如何維護和修理不同但相互之間存在重疊的20 個部分。

那么,關于輸水系統的知識存儲在哪里呢?這 100 個部分中的每一部分都會有大約 10 個不同的人知道。即使有一天有一半的員工請了病假,還是很可能會有大約 5 個員工來修理任一特定的部分。每個員工可以獨自維護和修理 20% 的輸水系統,無須監督。關于如何維護和修理輸水系統的知識分配給了一小部分居民,這些知識分配能夠防止員工的大量流失造成的損害。

請注意,水利部門可能會有一些監管制度,但阻止任何自主權的實施或將所有知識只分配給一兩個人都是不明智的。當知識和行動廣泛分布在許多但不是太多的元素中時,復雜系統的工作效果就能達到最好。

大腦系統就是這樣工作的。例如,神經元從不依賴單個突觸,相反,它可能需要30 個突觸來識別一個模式。這樣一來,即使其中 10 個突觸失效,神經元仍然能夠識別這種模式。神經元網絡的工作從不依賴單個細胞。在我們創建的模擬網絡中,即使損失 30% 的神經元,對網絡功能的影響通常也很小。與此類似,新皮質并不依賴單根皮質柱。即使腦卒中或創傷摧毀了大腦中的數千根皮質柱,大腦也能繼續工作。

因此,我們不應該對大腦不依賴任何物體的單一模型感到驚訝。我們對物體的知識分布在數千根皮質柱中。這些皮質柱不是多余的,也不是彼此的副本。最重要的是,每一根皮質柱都是一個完整的感覺 - 運動系統,就像水利部門的每個員工都能夠獨自修理供水基礎設施的某些部分一樣。

大腦中的“投票”機制

如果我們擁有上千種模型,為什么還能獲得某一種感知?當我們舉起一個咖啡杯,仔細端詳它,為什么我們會感覺它是一個物體,而不是上千個物體?如果我們將杯子放在桌子上,發出聲音,那么聲音如何與咖啡杯的外形和觸感結合在一起?換句話說,我們的感覺輸入如何被綁定到某種單一的知覺上?科學家一直假設,大腦新皮質的各種輸入一定會匯聚到大腦中的單個地方,人們會在這個地方感知到咖啡杯之類的東 西。這個假設也是特征層次理論的一部分。然而,大腦新皮質中的連接并非如此。這些連接會向四面八方延伸,不會匯聚到同一個位置。這也正是“綁定問題”懸而未決的原因之一。在這里,我們提出了一種可能的解釋:皮質柱會進行“投票”,即感知是皮質柱通過投票達成的共識。

讓我們回顧一下以紙質地圖做類比的例子。你有一組不同小鎮的地圖,這些地圖會被切割成一些小方格,然后混在一起。假設你在某個未知的地點下車,看到了一家咖啡店。如果你在多個地圖方格上找到了看上去相似的咖啡店,你就無法得知自己身處何方。如果 4 個不同的小鎮上都有相似的咖啡店,那么你肯定處于這 4 個小鎮中的一個,但你并不能確定自己究竟在哪一個小鎮中。

現在,假設有 4 個人也和你一樣。他們也擁有這些小鎮的地圖,并且與你在同一個小鎮下車,但是他們的下車地點是隨機且不同的。和你一樣,他們并不知道自己身處哪個小鎮。他們摘下眼罩四處張望。其中一個人看到了一個圖書館,在查閱地圖方格后,他發現有 6 個小鎮都有圖書館。另一個人看到了一個玫瑰花園,而他發現 3 個不同的小鎮都有玫瑰花園。另外兩個人也經歷了類似的境遇。沒有人知道自己身處哪個小鎮中,但是他們都為自己可能身處的小鎮做了一個列表。然后,所有人會進行投票。你們 5 個人的手機上都有一個應用程序,這個應用程序上列出了你們可能會在的小鎮和地點。每個人從應用程序中都可以看到其他人的列表。投票結果顯示,只有 9 號小鎮同時出現在了每個人的列表中,因此所有人都知道了自己身處 9 號小鎮。簡而言之,通過對比每個人可能身處的小鎮列表,找出同時出現在每個人列表上的小鎮,就會立刻知道自己究竟身處哪個小鎮。我們將這個過程稱為“投票”。

在這個例子中,這 5 個人就好比 5 個觸碰到某個物體不同位置的手指。它們無法獨自確定觸碰到的是什么物體,但如果將它們的感知合在一起就可以確定該物體了。如果你僅用一根手指觸碰某物,你就必須在物體上移動手指,才能識別該物體。但是,如果你用整只手抓住這個物體,你就可以立即識別出來。在大多數情況下,使用 5 根手指完成任務比僅使用一根手指需要的動作更少。與此類似,如果你透過一根吸管觀察某個物體,你就不得不通過移動這根吸管才能識別該物體。但是如果你觀察這個物體時視野開闊,通常你就可以在不需要移動的情況下識別該物體。

我們回到前面的例子中。想象一下,在鎮上下車的 5 個人中,有一個人只具有聽覺,這個人的地圖方格上標有在每個地點他會聽到的聲音。每當聽到噴泉聲、樹上的鳥鳴聲,或是從酒吧傳來的音樂聲,他就會在地圖上標出可能聽到這些聲音的地方。同樣,如果有兩個人只具有觸覺,他們的地圖上就標有在不同地點可能會有的觸感。最后的兩個人只具有視覺,他們的地圖方格上標有在每個地點可能會看到的東西。所以這 5 個人具有了三種不同的知覺:視覺、觸覺、聽覺。5 個人都可以感知到某些事物,但他們并不能確定自己身處哪個小鎮中。于是,他們決定通過投票解決這個問題。這里的投票機制與我在前文中的描述完全相同,他們只需找出同時出現在每個人列表上的小鎮,其他細節都無關緊要。可見,“投票”在感官模式的情況下也有效。

請注意,你并不需要十分了解其他人。你無須知道他們擁有哪種知覺,也不需要知道他們有多少張地圖。你不需要知道他們地圖上的方格比你多還是少,不需要知道他們的地圖方格代表更大的區域還是更小的區域,也不需要知道他們是怎樣移動的。也許,有些人可以跳過方格,而有些人只能沿對角線移動。這些細節都無關緊要,只需每個人將他們認為自己所處小鎮的列表分享出來就可以了。皮質柱中的投票機制解決 了“綁定問題”,該機制使大腦可以將各種感覺輸入結合起來,形成對所感知事物的單一表征。

當你手握某個物體時,表征手指的觸覺皮質柱還會共享另一種信息——手指之間的相對位置,這使我們更容易知道手指觸摸的是什么。假設這“5名探險者”在某個未知的小鎮下車。他們很有可能會看到在許多小鎮中都存在的地點,例如兩家咖啡店、一個圖書館、一個公園以及一個噴泉。通過投票,他們可以排除所有不具備這些特征的小鎮。由于具備所有上述 5個地點的小鎮有若干個,所以這些“探險者”仍然不知道自己究竟身處何方。如果這“5 個探險者”知道各自的相對位置,那么他們就可以排除所有相對位置信息中不具備這些特征的小鎮。我們猜想,某些皮質柱之間也會共享相對位置的信息。

投票是融合在大腦中完成的

回想一下,皮質柱中的大多數連接在各層之間上下移動,主要停留在皮質柱的邊界內。這條規則有一些眾所周知的例外。某些層中的細胞將軸突發送到新皮質內非常遠的地方。這些細胞可能會將軸突從大腦的一側發送到另一側,例如,在分別代表左右手的兩個腦區之間,或者,它們可能會將軸突從初級視覺區 V1 發送到初級聽覺區 A1 。我們認為,這些具有長距離連接的細胞在進行投票。

只有特定的某些細胞進行投票才有意義。皮質柱中的大多數細胞無法表征可以投票的那類信息。例如,一根皮質柱的感覺輸入不同于其他皮質柱的感覺輸入,因此接收這些感覺輸入的細胞不會投射到其他皮質柱。但是那些表征正在感知的物體的細胞可以投票,并且將被廣泛地投射到其皮質柱。

關于皮質柱是如何進行投票的這個基本想法其實并不復雜。使用遠程連接,皮質柱能廣泛傳遞它對正在觀察的東西所做出的猜測。皮質柱通常具有不確定性,在這種情況下,它的神經元會同時發送多種可能性。同時,該皮質柱接收來自其他皮質柱的映射,這些映射表示來自這些皮質柱的猜測。最常見的猜測會勝過最不常見的猜測,直到整個網絡確定一個答案。令人驚訝的是,皮質柱不需要將其投票發送給其他每一根皮質柱。即使遠程軸突連接到的是一個很小的、其他皮質柱隨機選擇的分支神經元,投票機制也能很好地工作。投票也需要一個學習階段。在已發表的論文中,我們描述了軟件模擬過程,從而顯示學習如何發生以及投票如何快速且可靠地進行。

穩定的感知

皮質柱投票解釋了有關大腦的另一個奧秘:為什么當大腦的輸入發生變化時,我們對世界的感知似乎依然是穩定的?當我們的眼睛掃視時,新皮質的輸入會隨著每次眼動而改變,因此活躍的神經元也一定會改變。然而我們的視覺感知卻是穩定的。當我們的眼睛轉動時,呈現在我們眼前的世界似乎并沒有跳動。大多數時候,我們完全不會意識到我們的眼睛在轉動。觸覺也會產生類似的感知穩定性。想象一下桌子上有一個咖啡杯,你正用手握住它,你在感知這個杯子。現在你漫不經心地在杯子上移動了手指。當你這樣做時,新皮質的輸入會發生變化,但你依然會感覺杯子是穩定的。你并不會認為杯子在變化或移動。

那么,為什么我們的感知是穩定的?為什么我們沒有意識到來自皮膚和眼睛的輸入的變化呢?識別物體意味著各根皮質柱會進行投票,然后就它們所感知到的物體達成一致。每根皮質柱中的投票神經元都會形成一個穩定的模式,表征物體和它與你的相對位置。投票神經元的活動并不會隨著你的眼睛和手指的移動而改變,只要它們感知的是同一個物體即可。每根皮質柱中的其他神經元會隨著感官移動而變化,但表示物體的投票神經元則不會。

如果你能俯視新皮質,你會在一層細胞中看到一種穩定的活動模式。這種穩定性擴展的面積非常大,會覆蓋數千根皮質柱,這些是投票神經元細胞。其他層中細胞的活動將在每根皮質柱中快速變化。我們所感知到的信息基于穩定的投票神經元。來自這些神經元的信息會廣泛傳遞到大腦的其他區域,在那里轉化為語言或存儲在短期記憶中。我們不會自發意識到每一根皮質柱中不斷變化的活動,因為它停留在皮質柱內并且無法傳遞到大腦的其他部分。

為了阻止癲癇發作,醫生有時會切斷患者新皮質左右兩側的連接。手術后,這些癲癇患者就像擁有了兩個大腦一樣。實驗表明,大腦的左右兩側具有不同的想法,會得出不同的結論。皮質柱投票機制可以解釋這種情況產生的原因。左右兩側的新皮質之間的連接用于投票,當它們被切斷時,雙方就失去了投票的通道,所以它們各自會得出不同的結論。

一直處于活躍狀態的投票神經元數量很少。如果你是一名科學家,觀察負責投票的神經元時,你可能會發現有 98% 的細胞處于靜止狀態,只有 2% 的細胞處于持續活躍狀態。皮質柱中其他細胞的活動會隨著輸入的變化而變化。你會很容易將注意力集中在不斷變化的神經元上,而忽略了投票神經元的重要性。

大腦想要達成共識。你以前可能見過圖 7-1 中的這張圖片,你從中既可以看到一個花瓶,也可以看到兩張人臉。在這樣的例子中,皮質柱無法確定哪個是正確的物體。就好像它們有兩個小鎮的兩張不同的地圖,但至少在某些地點,這兩張地圖是相同的。“花瓶小鎮”和“面孔小鎮”是相似的。投票層想要達成共識,它能使兩個可能的物體同時處于活動狀態,所以它會選擇其中一種。你可以感知到人臉或花瓶,但不能同時感知到兩者。

圖7-1:人臉 / 花瓶

大腦的注意力

人的感官部分受阻是很常見的,例如,當你看著站在車門后面的人時,雖然你只看到了半個人,但你知道一個完整的人站在門后。看到人的皮質柱會進行投票,然后確定這個物體是一個人。投票神經元投射到輸入被遮擋住的皮質柱,現在每根皮質柱都知道車門后有人。即使是被擋住的皮質柱也可以預測如果沒有車門它們會看到什么。

片刻之后,我們會將注意力轉移到車門上。就像“人臉 / 花瓶”這張圖片一樣,信息輸入也會有兩種。我們的注意力可以在“人”和“車門”之間來回轉移。每次轉移,投票神經元都會選擇不同的物體。我們會感知到兩種物體都在那里,即使一次只能關注其中一個。

大腦可以關注視覺場景中較小或較大的部分。例如,我們可以關注整個車門,我們也可以只關注車把手。大腦究竟是如何做到這一點的,我們目前還不清楚,但它涉及大腦中被稱為丘腦的部分,丘腦與新皮質的所有區域緊密相連。

注意力在大腦學習模型中起著至關重要的作用。在你度過每一天時,你的大腦會快速且不斷地關注不同的事情。例如,當你閱讀時,你的注意力會集中在一個個文字上。當你看著一座建筑物時,你的注意力從整個建筑物轉移到窗戶、門、門閂,再回到門等。我們認為,每當你注意一個不同的物體時,你的大腦會確定該物體相對于之前關注的物體的位置。這是一個自發的過程,是注意力集中過程的一部分。例如,我進入餐廳,我可能會先看到其中一把椅子,然后再看到桌子。我的大腦先識別出一把椅子,然后識別出一張桌子。但是,大腦也會計算椅子與桌子的相對位置。當我環顧餐廳時,大腦不僅在識別房間里的所有物體,而且在確定每個物體相對于其他物體和房間本身的位置。只需環顧四周,大腦就會創建一個房間模型,其中包括我注意到的所有物體。

你所學習的模型通常是臨時的。假設你在餐廳坐下來與家人共進晚餐。你環顧整個餐桌,看到各種各樣的菜肴。然后我請你閉上眼睛告訴我,土豆在哪里。你幾乎肯定能夠做到這一點,這證明你在環顧餐桌的短時間內學習了餐桌模型及其內容。幾分鐘后,在圓桌上的菜被轉了一圈之后,我請你閉上眼睛,再次指向土豆。這時你將指向一個新的位置,即你最后一次看到土豆的位置。這個例子要說明的一點是,我們會不斷地學習我們感知到的一切事物的模型。如果模型中的特征排列保持固定,比如咖啡杯上的標志,那么該模型可能會被大腦記住很長時間。如果特征的排列發生變化,比如餐桌上的菜肴,那么相應的模型就是臨時的。

新皮質永遠不會停止學習模型。每一次注意力的轉移,無論你是在環顧餐桌上的菜肴、走在街上,還是注意到咖啡杯上的標志,都在為學習某物的模型添加一項新的信息。無論模型是短暫的還是持久的,學習的過程都相同。

千腦智能理論中的層次結構

幾十年來,大多數神經科學家都堅持特征層次理論,這是有充分理由的。這個理論雖然存在許多問題,但是擬合了很多數據。我們的理論提出了一種思考新皮質的全新視角。千腦智能理論認為,新皮質區的層次結構并不是絕對必要的。老鼠的視覺系統證明,即使是單個皮質區也可以識別物體。那么,究竟哪種理論是正確的呢?新皮質是按層次組織還是由數千個模型投票以達成共識的呢?

新皮質的解剖結構表明,兩種類型的連接都存在。我們如何理解這一點呢?千腦智能理論提出了一種不同的方式,來思考與層次模型和單一皮質柱模型兼容的連接。我們指出,在層次之間傳遞的是完整的物體,而不是特征。新皮質并非使用層次結構將特征聚合成所識別的物體,而是使用層次結構將物體聚合成更復雜的物體。

我在前文中討論了層次結構。回想一下側面印有標志的咖啡杯的例子。我們通過關注杯子,然后關注標志來學習這樣一個新物體。標志也由物體組成,如圖形和文字,但我們不需要記住標志的特征相對于杯子的位置。我們只需要學習標志參考系與杯子參考系的相對位置。有關這個標志的所有細節特征就都包含在內了。

這就是大腦學習整個世界的方式:作為相對于其他物體定位的物體的復雜層次結構。新皮質究竟是如何做到這一點的,我們目前仍不清楚。例如,我們猜想一定數量的分層學習發生在每一根皮質柱內,但肯定不是全部,某些學習將由各腦區之間的分層連接處理。單根皮質柱中發生了多少分層學習,以及區域之間的連接中又發生了多少,我們還不了解,但我們正在嘗試攻克這個難題。想要找出答案,我們需要更好地理解注意力,這一點幾乎是肯定的,這也正是我們研究丘腦的原因。

在本章前面部分,我列出了普遍持有的觀點,即認為新皮質是特征檢測器的層次結構這一觀點中存在的問題。讓我們再看一遍那個列表,這次從移動的基本作用開始,討論千腦智能理論如何解決每個問題。

? 千腦智能理論本質上是一種感覺 - 運動理論。它解釋了我們如何通過移動來學習和識別物體。重要的是,它還解釋了為什么我們有時可以在不移動的情況下識別物體,例如當我們在屏幕上看到一個簡單的圖像或用所有手指抓住一個物體時。因此,千腦智能理論是層次模型的擴展。

? 靈長目動物的 V1 區和 V2 區相對較大,而小鼠的 V1 區特別大,這在千腦智能理論看來是有意義的,因為每一根皮質柱都可以識別完整的物體。與現今許多神經科學家的觀點相反,千腦智能理論認為,我們的大部分視覺行為都發生在 V1 區和 V2 區。主要和次要觸覺相關區域也比較大。

? 千腦智能理論可以解釋神經元如何在眼睛仍在移動時知道其下一個輸入將是什么。理論上,每一根皮質柱都擁有完整物體的模型,因此知道在物體的每個位置會感知到什么。如果皮質柱知道其輸入的當前位置以及眼睛如何移動,那么它就可以預測新位置以及它將在那里感知到什么。這與你查看小鎮地圖并預測如果你開始朝特定方向行走會看到什么是一樣的。

? 綁定問題基于這樣一個假設,即新皮質對世界上的每個物體都有一個單一的模型。而千腦智能理論認為,世界上的每個物體都有數千個模型。大腦的各種輸入不會被綁定或聚合成單個模型。皮質柱具有不同類型的輸入,一根皮質柱代表視網膜的一小部分,而另一根皮質柱代表更大的部分,這些因素都無關緊要。視網膜有沒有洞,就像你的手指之間有沒有縫隙一樣,都不重要。投射到 V1 區的模式可能會被扭曲和混淆,這也無關緊要,因為新皮質的任何一部分都不會試圖重新組合這種混亂的表征。千腦智能理論的投票機制解釋了為什么我們有一個一致而并不扭曲的感知。它還解釋了在一種感覺模態中識別物體是如何導致在其他感官模式中進行預測的。

? 千腦智能理論展示了新皮質如何使用參考系學習物體的三維模型。圖 7-2 是另一個小的證據。它是印在平面上的一組直線。沒有消失點,沒有匯聚線,也沒有逐步減弱的對比來暗示深度。然而,如果不將其視為一組三維樓梯,你就無法查看此圖。你所觀察到的圖片本身是二維的并不重要,重要的是你大腦新皮質中的模型是三維的,這就是你所感知到的內容。

圖 7-2 三維樓梯

大腦是很復雜的。有關位置細胞和網格細胞如何創建參考系、學習環境模型和規劃行為的細節比我描述的更為復雜,并且我們也只能了解其中的一部分。我們認為新皮質使用的是類似的機制,這些機制同樣復雜,而且人們對它的了解更少。對于像我們這樣的實驗型神經科學家和理論家來說,這是一個值得積極研究的領域。

要想進一步討論這些主題和其他主題,我就不得不介紹神經解剖學和神經生理學的其他細節,這些細節既難以描述,而且對于理解千腦智能理論來說沒那么重要。因此,我們已經到達了一個邊界,即本書探索的內容結束的邊界,以及科學論文的內容開始的邊界。

在介紹這本書時,我說過大腦就像一個拼圖游戲。我們有數以萬計關于大腦的事實信息,每一個都像一塊拼圖。但是沒有理論框架,我們就不知道該怎么拼這個拼圖。在沒有理論框架的情況下,我們能盡力做到的就是將幾個拼圖拼在一起。千腦智能理論便是一個框架,有了這個框架后,我們就像完成了拼圖的邊界并知道了整體的畫面是什么樣子。在我寫這本書的過程中,我們已經完成了拼圖內部的一些部分,而許多其他部分還沒有完成。盡管還有很多東西,但我們的任務現在更簡單了,因為有了正確的框架后,我們可以更清楚地知道哪些部分有待填充。

我不想給你留下錯誤的印象,即我們了解了新皮質所做的一切,相反,我們所掌握的信息還遠遠不夠。總而言之,關于大腦,尤其是新皮質,我們不了解的東西還很多。然而,我并不認為會有另一個系統性的理論框架,以一種不同的方式來填充拼圖的邊界部分。隨著時間的推移,理論框架會得到逐步修改和完善。我預計千腦智能理論也會如此,但我相信,我在本書中提出的核心思想將大體保持不變。

結束本章和本書的第一部分之前,我想和你說說我見到芒卡斯爾那個故事的剩余部分。回想一下,我在約翰斯·霍普金斯大學做了一次演講,結束時我見到了芒卡斯爾和他的系主任。不久,我要去趕飛機,因此我們說了再見,外面有一輛車正在等我。當我走出辦公室時,芒卡斯爾攔住了我,把手放在我的肩膀上,用一種“給你一些建議”的語氣說:“你應該停止談論層次理論,它實際上并不存在。”

我驚呆了。芒卡斯爾當時是世界上最著名的研究新皮質的專家,他告訴我,新皮質經過最多研究同時也是最大的一個特征并不存在。我很驚訝,就好像克里克本人對我說:“哦,那個 DNA 分子,它并沒有真正編碼你的基因。”我不知道該怎么回答,所以我什么都沒說。在去機場的路上,坐在車里時,我試圖理解臨別時他對我說的那句話。

如今,我對新皮質層次理論的理解發生了巨大的變化,這些層次比我曾經想象的要少得多。芒卡斯爾當時知道這一點嗎?他說層次理論真的不存在有理論依據嗎?他是在思考一些我不知道的實驗結果嗎?他于 2015 年離開這個世界,而我永遠也無法從他那里得到答案了。在他去世后,我重讀了他的許多書和論文。他的思想和寫作總是很有見地。他在1998年出版的《感知神經科學:大腦皮質》(Perceptual Neuroscience:The Cerebra Cortex)?是一本裝幀很精美的書,至今仍是我最喜歡的介紹大腦的圖書之一。當我回想起那天,我本可以選擇誤機,與他進一步交流。更重要的是,我多么希望我現在就能和他聊一聊。我相信,他會喜歡我向你們描述的理論的。

現在,我想把注意力轉向千腦智能理論將如何影響我們的未來上。

作者簡介

杰夫·霍金斯(Jeff Hawkins)

科技界一代傳奇,美國著名發明家、計算機科學家和神經科學家,于2003年當選美國國家工程院院士。Palm掌上電腦創始人,Numenta公司創始人。多年來深耕對大腦的探索,致力于解釋大腦是如何工作的。他認為只有把人類智能弄明白,才能制造出像人類大腦一樣工作的機器智能,著有《千腦智能》《新機器智能》。

未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)大腦研究計劃,構建互聯網(城市)大腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。每日推薦范圍未來科技發展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。

??如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”

總結

以上是生活随笔為你收集整理的千脑智能理论:开启创造机器智能的路线图 | 《千脑智能》的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。