2024年度教育家
他是中國人工智能主要奠基者,40歲后跨界走進(jìn)這個(gè)“無人區(qū)”。他發(fā)表了中國第一篇人工智能領(lǐng)域論文,獲得了中國這一領(lǐng)域的第一個(gè)國際重要獎(jiǎng)項(xiàng),也是首位人工智能領(lǐng)域的中國科學(xué)院院士。他教書六十余載,培養(yǎng)的近90名博士四代同堂。他熬過了人工智能的冬天,培養(yǎng)的“清華代表隊(duì)”成為中國人工智能發(fā)展的中堅(jiān)。
2024年年終,一邊是AI巨頭們扎堆發(fā)布“顛覆性”進(jìn)展,比如“AI教母”李飛飛發(fā)布了一張圖就能生成3D場景的AI模型;一邊是國內(nèi)大模型市場在下半年遇冷。
在冷熱兩極化的“AI大戰(zhàn)”中,中國科學(xué)院院士、清華大學(xué)人工智能研究院名譽(yù)院長張鈸始終保有定力,既沒有對(duì)技術(shù)進(jìn)步過度樂觀,也不像一些人那樣唱衰大模型。
早在兩年前,人們還沉迷于大模型的“尺度定律”(ScalingLaw,即規(guī)模越大,大模型越強(qiáng))時(shí),張鈸就指出,ChatGPT只是向通用人工智能(AGI)邁出了第一步,下一步是與環(huán)境的交互。在他看來,AI的發(fā)展必須邁向?qū)ΜF(xiàn)實(shí)三維世界的深刻理解。
這是張鈸又一次做出技術(shù)預(yù)判。89歲的他說話邏輯清晰、思維敏捷,輸出觀點(diǎn)快而密。說不到兩句,就能感受到從他身上彌漫過來的強(qiáng)大自信。身為中國人工智能領(lǐng)域的奠基人之一,他的四代學(xué)生組成了中國最具代表性的一支AI隊(duì)伍——“清華代表隊(duì)”,其中一些人已成為國內(nèi)大模型江湖的重要力量。
經(jīng)歷人工智能40多年來的潮起潮落,張鈸總是逆潮而行,做出與別人不同但正確的選擇。他是天才嗎?他的技術(shù)洞察力來自哪兒?如何才能找到通往人工智能的真正方向?
張鈸的第一次選擇發(fā)生在1978年。
清華大學(xué)進(jìn)行部分院系調(diào)整,張鈸所在的電子系(原自動(dòng)控制系)改為計(jì)算機(jī)技術(shù)與應(yīng)用系,系中原來從事自動(dòng)控制研究的老師面臨兩個(gè)選擇:待在計(jì)算機(jī)系,或去新成立的自動(dòng)化系。他選擇了前者。
很多老師勸他:國家未來要大力發(fā)展工業(yè),自動(dòng)化是最有前景的方向之一。“自動(dòng)化領(lǐng)域,手里的工具主要就是PID(工業(yè)控制系統(tǒng)中最廣泛使用的控制器),花一兩年時(shí)間就能掌握它,放棄并不可惜?!睆堚摶貞?,“有人說,你把已有的知識(shí)都丟掉了,還剩什么?我說,還剩一個(gè)腦袋。”
帶著“唯一的腦袋”留在計(jì)算機(jī)系,張鈸遇到的第一個(gè)任務(wù)是尋找有潛力的新方向。他翻閱國外學(xué)術(shù)期刊,發(fā)現(xiàn)美國很多大學(xué)的計(jì)算機(jī)系里都有一個(gè)方向:人工智能。
“當(dāng)時(shí),對(duì)于人工智能是什么,我也不是特別清楚,但它對(duì)我有極強(qiáng)的吸引力,因?yàn)檫@個(gè)領(lǐng)域里充滿了大量的未知。AI在國際上剛發(fā)展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我干什么?”張鈸說。
由于歷史原因,張鈸這一代學(xué)者錯(cuò)過了從事研究的黃金時(shí)期。43歲的他決定從零開始。下定決心不僅要勇氣,還要有強(qiáng)大的自信。1935年出生于福建一個(gè)知識(shí)分子家庭的他,小學(xué)到中學(xué)的任何考試和競賽成績都是第一名。1953年,他以數(shù)理化三門滿分的成績考入清華大學(xué)電機(jī)系,后轉(zhuǎn)入自動(dòng)控制系。
數(shù)學(xué)是張鈸最拿手的學(xué)科。閱讀大量人工智能文獻(xiàn)后,他敏銳地發(fā)現(xiàn):多數(shù)AI研究中沒有使用任何數(shù)學(xué)工具,“這意味著,很多還未解決的問題有機(jī)會(huì)用數(shù)學(xué)辦法解決”。
1984年,張鈸和當(dāng)時(shí)在安徽大學(xué)任教的弟弟張鈴,共同發(fā)表了中國AI領(lǐng)域的第一篇論文,刊登在AI國際頂刊上。論文研究的是用數(shù)學(xué)理論解決機(jī)器人的運(yùn)動(dòng)規(guī)劃問題,即機(jī)械臂抓取物品時(shí),如何通過更好的線路規(guī)避周圍的障礙物。
那是20世紀(jì)80年代,以符號(hào)主義為代表的第一代人工智能正處于低潮。符號(hào)主義者認(rèn)為,人類認(rèn)知和思維的基本單元是符號(hào),計(jì)算機(jī)為了模擬人類的智能行為,需要先把知識(shí)表示成符號(hào),再通過推理等規(guī)則對(duì)符號(hào)進(jìn)行操作,最后形成答案。“這是以知識(shí)驅(qū)動(dòng)為核心?!睆堚撜f。
符號(hào)AI的開創(chuàng)者們最初希望研究出通用方法,很快遭遇了失敗,于是,退而求其次提出“專家系統(tǒng)”,即將知識(shí)范圍縮小到一個(gè)具體領(lǐng)域,但這很難推廣并上升到理論。
1980年,作為改革開放后的首批出國訪問學(xué)者之一,張鈸來到美國伊利諾伊大學(xué)香檳分校進(jìn)修,他發(fā)現(xiàn),很多AI專業(yè)的博士在論文的選題上遇到困難?!斑t遲找不到好的選題,或者找了一個(gè)題目多年做不出來,只好中途放棄?!?/p>
張鈸沒有受到影響。“我不在意低潮還是高潮,只要清楚這件事能做就行?!边@是典型的張鈸式回答。事實(shí)上,從1978年暑期起,他就開始研究機(jī)器人運(yùn)動(dòng)規(guī)劃,他出國第二年,就已投出中國AI領(lǐng)域的第一篇論文。他和張鈴提出,將機(jī)械臂所在的幾何空間簡化成拓?fù)淇臻g,“這就變成了一個(gè)純數(shù)學(xué)問題”。此時(shí),距離他決心轉(zhuǎn)戰(zhàn)AI還不到三年。
張鈸成為國際上第一批提出用數(shù)學(xué)模型解決AI問題的學(xué)者之一?!把芯抗ぷ飨喈?dāng)于做解剖,解剖必須用快刀,先進(jìn)的數(shù)學(xué)工具就是一把快刀?!睆堚撓嘈?,“只要數(shù)學(xué)工具能用上,(人工智能的)研究就可以往前推。”
2002年,袁進(jìn)輝還在西安電子科技大學(xué)計(jì)算機(jī)系讀大三,成績年級(jí)第一,想申請(qǐng)清華直博,“我咨詢師兄,他說你可以先從清華計(jì)算機(jī)系最有名的老師開始聯(lián)系”。當(dāng)時(shí),張鈸是清華計(jì)算機(jī)系唯一的中國科學(xué)院院士。
此前,袁進(jìn)輝已讀過張鈸和張鈴共同撰寫的一本關(guān)于人工神經(jīng)網(wǎng)絡(luò)的專著,第一反應(yīng)是“兩個(gè)作者的姓名好有特點(diǎn)”“書里有很多數(shù)學(xué)理論”。該書出版于20世紀(jì)90年代,那時(shí)人工神經(jīng)網(wǎng)絡(luò)是AI里很小眾的領(lǐng)域。“張鈸和張鈴老師研究的是小眾方向中更小眾的偏理論部分,在當(dāng)時(shí)是相當(dāng)少見且超前的。”袁進(jìn)輝說。
發(fā)現(xiàn)符號(hào)主義難以走通后,AI研究者逐漸轉(zhuǎn)換思路,發(fā)展出連接主義的新流派,即信息是通過在人腦神經(jīng)元之間建立起“刺激—響應(yīng)”的連接進(jìn)行傳遞。這一流派的代表成果就是人工神經(jīng)網(wǎng)絡(luò)。
但早期的人工神經(jīng)網(wǎng)絡(luò)只是淺層神經(jīng)網(wǎng)絡(luò),難以解決稍微復(fù)雜一點(diǎn)的現(xiàn)實(shí)問題。于是,連接主義起步不久就陷入低谷,只有少數(shù)人認(rèn)定這條路是正確的,包括2024年諾貝爾物理學(xué)獎(jiǎng)得主杰弗里·辛頓、“卷積神經(jīng)網(wǎng)絡(luò)之父”楊立昆,還有張鈸。20世紀(jì)90年代,張鈸和張鈴聯(lián)手,圍繞神經(jīng)網(wǎng)絡(luò)理論發(fā)表了多篇論文。
20世紀(jì)80年代末開始,國內(nèi)AI發(fā)展迎來低潮期。彼時(shí),張鈸選了一條更務(wù)實(shí)的道路:承擔(dān)國家重點(diǎn)攻關(guān)課題。但他沒有放棄當(dāng)時(shí)看起來不太有希望的理論研究?!扒迦A人工智能學(xué)科理論研究的隊(duì)伍中,基本一半人在做符號(hào)主義,一半人在做人工神經(jīng)網(wǎng)絡(luò),而人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)一脈相承。等到深度學(xué)習(xí)的時(shí)代真正到來,我們立刻將大部分兵力轉(zhuǎn)向深度學(xué)習(xí)?!睆堚撜f。
多數(shù)人理解ChatGPT就是“大數(shù)據(jù)+深度學(xué)習(xí)”,其實(shí)它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作為數(shù)據(jù)來處理,而是把文本當(dāng)成知識(shí)(內(nèi)容)來處理。
2012年,深度卷積神經(jīng)網(wǎng)絡(luò)AlexNet在ImageNet(世界上最大的圖像數(shù)據(jù)集)競賽上一戰(zhàn)成名。自此,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的深度學(xué)習(xí)徹底出圈?!斑@就是以數(shù)據(jù)驅(qū)動(dòng)為核心的第二代人工智能?!睆堚撜f。
他指出,與早期的神經(jīng)網(wǎng)絡(luò)相比,深度神經(jīng)網(wǎng)絡(luò)“把深度加深了”,即中間的網(wǎng)絡(luò)層數(shù)變多之后,性能發(fā)生了重大變化,只需輸入大量的原始數(shù)據(jù),就可以“自學(xué)成才”。他最初感到興奮,但隨后開始思考:深度學(xué)習(xí)的邊界在哪兒?
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授、人工智能研究院副院長朱軍是張鈸的學(xué)生?!?013年前后,正是深度學(xué)習(xí)最熱的時(shí)候,很多激進(jìn)的觀點(diǎn)認(rèn)為,AI三五年內(nèi)就可能在自動(dòng)駕駛等復(fù)雜場景量產(chǎn),但張鈸是國內(nèi)最早公開談?wù)撋疃壬窠?jīng)網(wǎng)絡(luò)存在缺陷的專家之一?!敝燔妼?duì)《中國新聞周刊》說,“這時(shí)候他已經(jīng)快80歲了?!?/p>
深度學(xué)習(xí)的一個(gè)關(guān)鍵弱點(diǎn)是容易被欺騙。張鈸團(tuán)隊(duì)發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別很脆弱。一張以雪山為背景的圖片,只要加入一點(diǎn)“噪聲”,“自學(xué)”之后的AI會(huì)將其識(shí)別成一條狗。這一問題絕非“雪山還是狗”這么簡單,而是指向一個(gè)困擾張鈸多年的更大難題:深度學(xué)習(xí)往何處去?
他很早就意識(shí)到,深度學(xué)習(xí)存在不可解釋性與魯棒性差(系統(tǒng)的抗干擾能力差)等根本性缺陷。2016年起,他陸續(xù)提出關(guān)于“新一代AI”的觀點(diǎn),2020年發(fā)表論文《邁向第三代人工智能》。他提出,第一、第二代人工智能都只是從一個(gè)側(cè)面模擬人類的智能行為,為了建立一個(gè)更全面反映人類智能行為的AI,需要把知識(shí)驅(qū)動(dòng)與數(shù)據(jù)驅(qū)動(dòng)結(jié)合起來。
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此巨大?!敖^大多數(shù)AI研究者感到非常震驚?!睆堚撜f。
袁進(jìn)輝指出,ChatGPT的誕生讓人工智能進(jìn)入截然不同的發(fā)展階段。模型變大后,人們突然發(fā)現(xiàn),過去多少年解決不了的問題可以用統(tǒng)一的方法搞定?!斑@是一次工業(yè)革命級(jí)的技術(shù)革命?!?/p>
像過去一樣,張鈸看問題的視角和別人不同。他說,多數(shù)人理解ChatGPT就是“大數(shù)據(jù)+深度學(xué)習(xí)”,其實(shí)它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作為數(shù)據(jù)來處理,而是把文本當(dāng)成知識(shí)(內(nèi)容)來處理?!爸挥挟?dāng)機(jī)器可以從大量的數(shù)據(jù)中獲取到知識(shí),真正的轉(zhuǎn)變才會(huì)發(fā)生。所以,ChatGPT能力的強(qiáng)大源自兩點(diǎn):一是大模型;二是大文本?!?/p>
可以說,ChatGPT是張鈸預(yù)測中的第三代人工智能的雛形,但還遠(yuǎn)遠(yuǎn)不夠。張鈸指出,ChatGPT突破了前兩代AI只能在限定領(lǐng)域完成限定任務(wù)的限制,這為建立起統(tǒng)一的人工智能理論提供了重大機(jī)遇,“這才是第三代人工智能實(shí)現(xiàn)的關(guān)鍵”。
迄今為止,人類一直通過模擬的方式讓機(jī)器的行為與人類相似,但大模型還是一個(gè)“黑匣子”,這正是張鈸認(rèn)為AI理論下一步可能突破的地方?!拔覀円汛竽P偷膬?nèi)部機(jī)理分析清楚,解剖復(fù)雜系統(tǒng)行為背后的內(nèi)在邏輯。誰能做到這一點(diǎn)?我說至少需要第二個(gè)愛因斯坦?!?/p>
在張鈸的倡議下,2018年,清華大學(xué)成立人工智能研究院基礎(chǔ)理論研究中心,朱軍為研究中心主任。被問到理論突破的難度有多大時(shí),他引用了一句話:“當(dāng)你提出問題時(shí),可能離解決問題已經(jīng)不遠(yuǎn)了?!?/p>
這是張鈸最常說的一句話。在他看來,中國學(xué)生解決問題的能力很強(qiáng),但提出問題的能力不足。因此,在培養(yǎng)學(xué)生時(shí),張鈸格外重視訓(xùn)練學(xué)生“提出問題的能力”。
袁進(jìn)輝2003年起跟隨張鈸讀博,不像有的導(dǎo)師會(huì)出于“更容易出成果”或“項(xiàng)目有需要”等原因給學(xué)生指定博士選題,張鈸總是讓學(xué)生自己找題,鼓勵(lì)大家自主探索無人區(qū)。
張鈸強(qiáng)調(diào),學(xué)生一定要有批判性精神,敢于質(zhì)疑現(xiàn)有成果。“中國培養(yǎng)的很多學(xué)生只知道標(biāo)準(zhǔn)答案。我常說,不怕餿主意,就怕沒主意?!?/p>
2016年,袁進(jìn)輝決定孤注一擲。
他從微軟亞洲研究院離職創(chuàng)業(yè),選擇的賽道是AI基礎(chǔ)設(shè)施(AIInfra),即AI模型的“操作系統(tǒng)”?!拔业睦砟钍悄P臀磥硪欢〞?huì)變得很大,變大之后,現(xiàn)有的深度學(xué)習(xí)框架將難以承載,谷歌、亞馬遜等大廠設(shè)計(jì)的底層架構(gòu)都不是為大模型準(zhǔn)備的,提前布局AIInfra,將來一定有商業(yè)機(jī)會(huì)。”他解釋。
袁進(jìn)輝的“超前”想法可以追溯到更早的博后時(shí)期。2008年,張鈸認(rèn)為計(jì)算機(jī)和腦科學(xué)的交叉很有潛力,提出了計(jì)算神經(jīng)科學(xué)的方向,并邀請(qǐng)海外相關(guān)專家加入清華擔(dān)任講席教授指導(dǎo)學(xué)生,袁進(jìn)輝就是受益者之一。若干年后,神經(jīng)網(wǎng)絡(luò)爆火,他下意識(shí)地從腦科學(xué)的角度去思考:“即使深度學(xué)習(xí)是萬億級(jí)的參數(shù),離人腦神經(jīng)元的規(guī)模也有好幾個(gè)數(shù)量級(jí)的差距。人工神經(jīng)網(wǎng)絡(luò)未來必須變得很大,才可能真的擁有接近人類的智能?!?/p>
一些頂尖科學(xué)家面對(duì)象牙塔外的商業(yè)世界會(huì)顯得無措,但張鈸是一個(gè)另類。多位受訪者提到,他在商業(yè)方面的眼光也很犀利。
2024年,國內(nèi)的AI玩家從“煉大模型”的狂熱中清醒過來,開始轉(zhuǎn)向應(yīng)用,而張鈸兩年前就預(yù)料到這一局面。“國內(nèi)企業(yè)燒錢根本燒不起,只有做應(yīng)用才能活下去,但這也是中國大模型企業(yè)當(dāng)下面臨的最大挑戰(zhàn),大模型尚未成熟時(shí)就去做應(yīng)用,70%—80%的企業(yè)可能都會(huì)倒下?!彼治?。
為何張鈸總能做出正確的選擇?“答案很簡單,必須先有正確的理解,才能做出正確的判斷?!彼f,“就是要深思熟慮,我很不容易說服自己去相信某個(gè)結(jié)論,會(huì)不停地對(duì)自己提出疑問,然后刨根究底,直到把這個(gè)問題徹底想明白?!?/p>
ChatGPT誕生后,有些人覺得AGI馬上就能實(shí)現(xiàn),張鈸卻非常保守。他認(rèn)為,需要去研究AI大模型的底層邏輯,嘗試不同的問題,測試機(jī)器的能力邊界。朱軍指出,大模型發(fā)展的各個(gè)階段,張鈸總能快速找到一些最適合又很巧妙的例子去測評(píng)模型的弱點(diǎn),根源在于他對(duì)AI系統(tǒng)本身有非常深刻的思考與見解。
張鈸設(shè)計(jì)了這樣一個(gè)問題:“我朝東面走,向右手方向轉(zhuǎn)90°,迎面走來一個(gè)人,我看到他左手方向的地上有一道很長的他的身影。此時(shí)是早晨、中午還是下午?”
GPT-4o(GPT-4的升級(jí)版)沒能答對(duì),OpenAI2024年9月發(fā)布的新一代推理模型o1則回答正確:是早晨。張鈸發(fā)現(xiàn),兩者的參數(shù)和數(shù)據(jù)沒有明顯區(qū)別,差距源于“思維鏈”技術(shù)?!皁1對(duì)這一問題分析的邏輯鏈非常細(xì)致,一步步推理出了結(jié)果。”
AI領(lǐng)域最激烈的變化就集中在短短十幾年內(nèi),這一切都發(fā)生在張鈸77歲之后。朱軍說,張鈸自我要求極高,有強(qiáng)烈的好奇心與求知欲,快90歲每天還在看國外最新的論文?!八俏乙娺^的學(xué)習(xí)能力最不可思議的人之一。最前沿的模型,玩得比我們還溜。”
很多學(xué)生認(rèn)為張鈸是天才。張鈸說,先天的智商決定了一個(gè)人能夠達(dá)到怎樣的高度,但最終實(shí)際達(dá)到的高度取決于努力的程度。大模型里有個(gè)神奇的現(xiàn)象叫“涌現(xiàn)”,指模型規(guī)模增加到某一臨界點(diǎn)時(shí),性能會(huì)突然顯著提升,甚至出現(xiàn)一些難以預(yù)測的能力,比如真正的智能。
“所以,你認(rèn)為自己是天才嗎?”
“我從6歲開始,每天都在學(xué)習(xí),再笨的人也學(xué)聰明了。”
這就是天才的“涌現(xiàn)”。
張鈸
中國科學(xué)院院士,清華大學(xué)人工智能研究院名譽(yù)院長、教授,中國人工智能領(lǐng)域的主要奠基者。