潘楷文
大腦是人體最重要的器官之一,幾乎所有的高級神經活動都在腦部完成,也是人類與外界進行信息溝通與處理的中樞。而“腦機接口”技術由來已久,該技術是一種研究如何用神經信號與外部機械直接交互的技術,通過采集大腦皮層神經系統(tǒng)活動產生的腦電信號,經過放大、濾波等方法,通過計算機算法將其轉化為可以被計算機識別的信號,從中辨別人腦的真實想法,其中的“接口”就是用于信息交換的中介物。
目前的“腦機接口”主要分為植入式和非植入式兩大類植入式和非植入式兩種方式都各有優(yōu)劣,植入式更精確,可以編碼更復雜的命令,比如三維運動,但手術創(chuàng)傷是不可避免的;非植入式電極這種頭皮貼片雖然方便,無需開顱植入,但是能探測到的腦電信號范圍和精確度有限。
那么問題來了,“腦機接口”技術為什么會出現?推動這項技術發(fā)展前進的動力是什么?難道只是為了滿足窺探他人內心的好奇心嗎?腦機接口技術的出現與商業(yè)化,對于我們人類究竟意味著什么?要回答這些問題,我們首先要知道腦機接口本質上是一種全新的信息溝通與交互界面,而要理解信息溝通的本質,那就需要理解我們的語言。一起穿越回億萬年前,以語言演化為主線,去領略文明發(fā)展的史詩歷程,探尋“腦機接口”誕生的真正動力。
語言是人類大腦高級認知活動的產物,正如紐約大學的心理學和神經科學教授大衛(wèi)·珀佩爾在《科學》雜志子刊《科學進展》(Science Advances)上的論文中所說,“語言就是聲波如何把信息塞入你的腦子里”。當我們聽人講話的時候,耳朵將聲波轉化為神經信號,這些信號會被不同的腦區(qū)處理和翻譯,最先處理的腦區(qū)是聽覺皮層。多年的神經生理學研究結果顯示,聽覺皮層的腦電波會對應聲波的強弱變化的頻率,將聽覺信號分節(jié)并鎖定?;旧暇褪钦f,“腦電波像沖浪者般在聲波里起伏?!贝竽X很可能是通過聲波的強弱變化來區(qū)分音節(jié),辨識語義,從而將長串的語言信息“分節(jié)裝載”,轉化為便于處理的小塊信息。
然而,人類語言并不是一蹴而就,而是經歷了漫長的演化。從神經肽、神經元到神經網;從神經節(jié),到幾個神經節(jié)融合在一起形成“腦”,再到原始大腦的形成;從掌管身體器官并且精細分工的爬行腦出現,到能夠處理愛、憤怒和恐懼等復雜情感的邊緣系統(tǒng)的出現,再到能夠理性思考的新皮層的出現,可以說,神經系統(tǒng)經歷了從無到有,從簡單到復雜,從低級到高級的發(fā)展過程。正因為人類大腦新皮層擅長思考,尤其擅長抽象,并能對事物的本質屬性進行歸納和演繹,就在大約 10 萬年前,人類掌握了一項突破性的工具,就是能夠用一種特定的抽象聲音來指代某個具體事物。比如“石頭”這個詞的發(fā)音并不是石頭本身,而是通過發(fā)音來指代石頭這個物體的代表符號,就這樣,原始的語言誕生了。很快,世界上各種各樣的事物都有了相應名稱。到了公元前5萬年,人類已經能夠完整使用復雜的語言進行交流。從此,語言不僅能把人類大腦中各種奇妙的想法轉換成一系列的聲音符號,而且通過空氣振動將它們傳遞給其他人的大腦中,并能讓他人理解。
日本一名男子戴著腦機接口技術(BMI)設備頭罩操控機器人,該技術結合了腦電波儀(EEG)和近紅外線光譜儀(NIRS)。
人類語言的出現,不僅給世界上萬事萬物都打上了“符號標簽”,還產生了一個極其重要的功能,就是讓人們能夠學習自己沒有親身經歷過的事情,并以此形成間接經驗。由此,人類種族的生存能力大大提升。為什么呢?舉個例子,假如在原始人類的部落中,某人通過親身嘗試體會到某種植物的果實吃完后會腹瀉,他就可以用語言將這慘痛教訓分享給部落里的其他成員,而其他部落成員也會用語言將這個教訓傳給他們的孩子,他們的孩子又會把它傳給自己的孩子。就這樣,這條經驗教訓就隨著空間和時間不斷傳播,讓部落中的其他人都能避開。再假如,當部落中某位善于觀察的獵人,他通過長期觀察思考,掌握了星象變化與羚羊遷徙時間之間的規(guī)律,并總結出一套利用夜空來確定羊群遷徙路線的方法,那么他就創(chuàng)造了知識,他部落里的其他成員通過學習就能掌握,部落狩獵的效率也將大大提升。正因為通過語言的學習,使得經驗與智慧一代代傳承,不斷累積到部落的知識庫中,而后代則可以在祖先的智慧上繼續(xù)探索。
就這樣,語言賦予部落強大的集體智慧,同時每個人也能從集體智慧中獲益。隨著知識不斷積累,生產力不斷提升,勞動生產率逐步提高,人們開始吃飽穿暖,人口數量也逐漸提高,人口規(guī)模的變大則需要進一步提高勞動生產率并產出更多的糧食,就需要人們開發(fā)更先進的勞動工具,就需要掌握更多的技術與知識,以此來進一步提高勞動效率。事實上,提高勞動效率又需要通過精細化分工,而精細化分工就意味著人與人之間必須有相互協(xié)作,相互協(xié)作的前提是社會具有穩(wěn)定的社會結構與關系,穩(wěn)定的社會結構與關系則需要人們之間的信任,而信任則需要語言上的充分溝通才能實現。因此,有了語言的幫助,勞動效率開始提升,小型部落開始選擇永久定居在某個地方,并逐漸壯大;部落與部落之間在不斷融合,各部落之前積累下來的知識庫得到進一步分享,形成更大的知識庫。群體合作提高了每個人的生活質量,到了公元前 1 萬多年,城市的雛形開始形成,人類文明因語言而開花結果。
隨著城市的出現,使人類之間的聯系不斷突破親緣關系的束縛,大量陌生人通過共同的語言與共同的宗教想象開始了大規(guī)模協(xié)作,人與人之間產生的語言表達開始空前繁榮,而更多的溝通交流就意味著更多的思想碰撞,也意味著更多的新發(fā)現,從而迅速提升創(chuàng)新的步伐。很快,人類精通了農業(yè)技術,很多人因此從農業(yè)勞作中解放了出來,開始思考各種各樣的想法,并將想法通過“文字”記錄保存。在此之前,集體知識庫只能保存在人們的記憶中,而且只能通過口述傳播,這就大大限制了知識的傳播效率。文字與紙張的出現則打破了這種限制,人不再依靠記憶,許多知識也因此擺脫了失傳的厄運。如果說語言可以讓人類將想法從一個大腦傳遞到另一個大腦,那么寫作就打破了時間限制,讓思想與知識永遠保存下來。當人類開始在羊皮或紙上寫字時,那些需要口述數周才能傳達的龐大知識就可以被壓縮成一本書或一個卷軸。于是,人類集體知識庫開始以實體形式存在。
然而,書籍抄寫工作需要花費大量的精力,所以在古代,書籍往往會被視若珍寶,只有極少數精英人群才有機會接觸到。自從15 世紀的約翰內斯·古騰堡(Johannes Gutenberg)發(fā)明了效率高且成本低的印刷機后,批量印刷的書籍讓信息可以像野火般蔓延,當書籍的印刷成本變得越來越低,教育便不再是精英階層的特權。數以百萬計的人可以接觸到書籍,同時人們的識字率也得到了大大提升。大量涌現的書籍讓知識可以跨越國界,世界各地的知識庫終于融合成為全人類共享的最高知識庫,人類也因此具備了進入現代文明的條件。
大量的知識儲備為人類工業(yè)革命創(chuàng)造了條件,而機器的誕生則標志著人類將自己雙手的工作交給了流水線,將下肢的移動遷徙交給了發(fā)動機,自己徹底從重體力勞動中解放出來,并且可以將大部分的時間和精力集中在創(chuàng)新之上。而就在1940年代,世界上第一臺電子計算機誕生了,人類將自己大腦一部分的工作也外包給機器,這些工作主要包括記憶和運算。尤其是后者,隨著計算機硬件和軟件的迭代發(fā)展,越來越復雜的計算機軟件程序正在替代我們大腦一個又一個功能,并且開始成為政府、企業(yè)和學校正常運轉,甚至是我們個人正常生活的核心。緊接著,另一個飛躍在 1980 年代后期到來,這就是互聯網。隨著數以萬計臺計算機相互連接溝通,在全球范圍內形成了巨型計算機網絡,在這個網絡中,每一個節(jié)點之間都建立了互相的關聯,信息能夠以光速在這個系統(tǒng)中傳遞?;ヂ摼W為人類提供了即時、免費又易于搜索的學習方式,讓數十億人類能夠接觸到了完整的人類知識庫,這讓人類文明再一次達到空前的高度,人類社會真正迎來的知識大爆炸時代。
隨著信息技術的發(fā)展,特別是人工智能技術的誕生,人類發(fā)現自己在學習能力方面越來越不及人工智能,無法從海量的知識中快速獲取知識。而這種缺陷正是曾經為人類文明作出杰出貢獻的語言所造成的,這是因為人類的語言天生就有兩方面缺陷:一是精度低;二是效率低。
首先看語言的精度。可以說,無論人類的哪一種語言,其精度都是相當低的。想象一下,正在泰國游玩的你吃到一種熱帶水果,并將照片發(fā)在朋友圈上,這時然有位從來沒見過這種水果的朋友問你,這水果什么味道?你會發(fā)現,無論用語音還是文字,你都無法將這種熱帶水果的味道描述清楚。當然,你可以用很多詞來形容,比如酸、甜、水分很多;你還可以說口感跟桃子有點像,但是沒那么軟等。然而,你的朋友終究不清楚你所吃到的水果到底是什么味道,因為他無法感受到你的體驗,而你的體驗又無法用概念來描述清楚。像這樣的例子不甚枚舉,這就導致了人和人之間很多時候溝通準確性是很低的,人們因此會耗費大量的時間在溝通上,在人與人的溝通過程中,信息被大量損耗。更不幸的是,人類的溝通精度還與關系的親密程度與信任程度有關,如果兩個人之間彼此不信任,那么就算其中一個人將某件事描述得再清楚,在另外一個人看來,也是不值得相信的,甚至會因此而產生誤會與矛盾。
其次看人類語言的效率。語言還有另一種缺陷就是慢。相信所有人都有過學習考試的經歷,在復習時,會有很多同學幻想,希望把所有考試知識像U盤拷貝文件一樣將知識拷貝進自己的大腦。但由于語言和文字的低效率,我們只能花很多時間聽老師講課,看相關的參考書,甚至要背誦記憶某些知識點。想象一下,老師平時說話的速度每分鐘也就200-300字,也就是相當于每分鐘不到1K的速度,而現在的4G手機下載速度是每秒1.5至10兆,相差數萬倍。當然,人說話的時候還有語氣、表情、肢體動作等等信息,但毫無疑問,人類靠語言和文字所進行傳播的時候,確實非常慢。
從計算機誕生的那一刻起,到讓人人都有一臺計算機的個人電腦時代,再到后來的互聯網時代和智能手機時代,我們人類親手創(chuàng)造了一個在我們現實世界之外的新世界,也就是虛擬世界,或者數字世界。當然,更準確的形容是原子世界和比特世界。本來沒有比特世界的存在,我們的語言是唯一選項,也這些缺陷也不會暴露出來,畢竟人類這么多年都是這么過來的。但隨著比特世界的飛速發(fā)展,人類的弱點和局限性就開始被放大了。時代車輪滾滾向前,歷史發(fā)展的內在需求推動著技術的進步與發(fā)展,是該腦機接口登場的時候了。
目前Nicolelis團隊的目標是讓癱瘓病人再次踢足球,癱瘓的猴子在腦部植入電極之后可以使用外部的輔助支架再次行走。
全球范圍的“腦機接口”技術研究其實已開展多年,早在1963 年,英國就有科學家開始嘗試此類研究。20 世紀90 年代,美國率先提出“腦的十年計劃”;歐盟成立了“歐洲腦的十年”委員會;日本政府宣布投入200 億美元實施“腦科學時代”計劃,把“認識腦、保護腦、創(chuàng)造腦”作為腦研究三大目標。2013 年,美國、歐盟及中國分別正式啟動了“腦計劃”,大規(guī)模入腦研究在世界范圍內已經展開。其實早在2010年,華盛頓大學運動神經工程中心主任Rajesh Rao教授就已經提出利用腦機接口技術實現人腦與人腦之間通信的設想。該設想假設了如果老師在教授學生時,直接把數學證明傳入學生大腦,而不是口頭講授,學生的學習結果會怎樣?
目前,科學家已經在技術上設法通過大腦之間的直接交流來交換思想。2013年上半年,杜克大學的Miguel Nicolelis團隊率先發(fā)表了一項研究,成功地在兩只不同品種且從未有過交配老鼠之間,通過腦電信號直接傳遞了一些簡單信息。不久后,哈佛大學醫(yī)學院的Seung-SchikYoo和同事利用能穿透顱骨的高度聚焦超聲波技術,實現了人腦通過腦電直接控制老鼠腦的嘗試。當人類受試者決定移動老鼠尾巴時,他的腦電波信號會觸發(fā)超聲波裝置,向老鼠大腦運動皮層發(fā)射350Hz的超聲波脈沖,兩秒后,老鼠的尾巴會抬起后再放下。
可以說,腦機接口技術正在快速發(fā)展,如果腦機接口技術能夠在未來成熟并得到推廣,人造大腦的能耗和存儲密度將趕上甚至超過生物大腦,有望催生更智能的機器人、自動駕駛汽車、數據挖掘、醫(yī)療診斷等人工智能交互系統(tǒng)。也許當腦機接口技術普及之時,將是人類文明的飛躍之時,而且這次飛躍將會比語言、文字、印刷術、互聯網到來時飛躍得更高、更遠。