朱秋雨
“這一輪AI浪潮,到底怎么掙錢?”
10月17日,在深圳舉辦的世界人工智能大會上,一名國內(nèi)頭部AI公司的負責人以此為標題,開始了他的演講。
現(xiàn)場座無虛席。觀眾手機舉得很高,后排站了滿滿的兩排人。
毫無疑問,落地、掙錢是當下AI從業(yè)者最關注的話題。年初人們對AI大模型的歡呼聲量變低,越來越多人開始發(fā)問:這一輪的生成式AI,與往常有什么不同?它能帶來新的價值嗎?
智譜AI的CEO張鵬,也在長期思考著這些問題:AI,目前為止普通人摸不著的技術,如何才能正確判斷它的價值。他的公司由清華大學知識工程實驗室(KEG)孵化,在2023年一舉成為中國AI明星企業(yè)之一。
這一年,智譜AI獲得了25億人民幣的投資。投資方集合一眾大廠:美團、螞蟻、阿里、騰訊。
令互聯(lián)網(wǎng)大廠競相跟投的,不止是清華系的“背景”。
這家創(chuàng)業(yè)公司最特別的是,它擁有與國際頂級機構不一樣的技術路徑,GLM(General Language Model),一個獨屬于中國的自研路徑。
回到2022年3月。一篇7位中國作者合寫的論文發(fā)布,轟動學界。
他們在文中大膽指出,目前所有的預訓練模型框架中,都有各自的缺陷。比如,眾所周知的GPT,原理是根據(jù)前一個詞預測后面詞的出現(xiàn)概率,生成了答案。這是一個單向的過程,不利于機器理解語言。
而世界級大廠谷歌提出的Bert模型框架,是在一句話里挖空一個單詞,讓機器學會完形填空。它卻又不利于迅速生成答案。
“我們提出了一種通用語言模型(GLM)來應對這一挑戰(zhàn)?!痹谡撐睦铮粋€全新的大模型路徑被提出。緊接著,2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。
一切就像命運般“賭”對了。
三個月后,這個年輕的創(chuàng)業(yè)公司隨著ChatGPT的發(fā)布備受矚目。有人形容,這是最像OpenAI的中國公司,研究背景強,同樣追求更遠的事情—讓機器像人一樣思考。
面對火熱的關注,畢業(yè)于清華的張鵬卻很冷靜,習慣反思。他告訴南風窗,早在2022年中旬,團隊已經(jīng)預料到了這一輪技術帶來的爆發(fā)。但當下的AI大模型雖然迭代迅速,仍舊面臨如何創(chuàng)造新價值的問題。
他預想了很多種情況的發(fā)生。如果有一天,AI的進步真的讓技術持有者面臨奧本海默的抉擇,張鵬說,他會堅持一個原則:Don t do evil。
“基于已有認知情況,不要作惡?!?/p>
以下是南風窗與張鵬的對話:
南風窗:從2019年創(chuàng)業(yè)到現(xiàn)在,這幾年你自己有什么感受的變化?尤其是AI行業(yè)經(jīng)歷了幾年的“冷板凳”,今年大家的關注度突然間上升了那么多。
張鵬:我的感覺跟你的不太一樣?;厮菸覈?,人工智能產(chǎn)業(yè)更多在2012年隨著“AI四小龍”的興起開始進入市場。只有十幾年發(fā)展時間,速度卻非???。在我眼里,人工智能領域一直是快速上揚的進程。當然,以前在學校,我看得更多是全球最頂尖的研究成果,感知上和國內(nèi)的市場可能是兩碼事。
所以,我沒覺得AI是一個“冷板凳”。但ChatGPT出現(xiàn)后,確實改變了一些事情,讓人工智能行業(yè)從過去單在技術上推進,到如今整個產(chǎn)業(yè)對AI的關注。這是兩條線。兩條線交匯到一起,形成現(xiàn)在這個局面。
南風窗:上述我偏向投資的角度,今年對AI領域的投資確實更熱一點?;乜慈昵埃?020年6月11日,GPT-3發(fā)布,這是一個學術和產(chǎn)業(yè)界關注到的大事。這一天剛好是智譜AI成立一周年?!吧铡迸錾螱PT-3的發(fā)布,有改變智譜AI的命運軌跡嗎?
張鵬:我們2016、2017年開始研究AI產(chǎn)業(yè)時就一直在討論,到底應該做什么事。上一代的AI技術(即行業(yè)大模型)不是我們想要的,因為預見得到技術天花板。果然,2018、2019年前后,AI企業(yè)紛紛到達發(fā)展的天花板,陷入瓶頸。
2019年時智譜成立。我們很明確的想法是,做下一代的人工智能。這就是清華大學人工智能研究院名譽院長張鈸院士所說的,要發(fā)展第三代人工智能—“認知智能”。與張鈸院士聊時,我們想清楚一件事,AI未來的方向里一定要有兩條腿:一是數(shù)據(jù)驅(qū)動,另一個是知識驅(qū)動。從籌備創(chuàng)業(yè)一直到2020年,我們都在這個框架下用各種技術,如信息學習、數(shù)據(jù)挖掘、訓練模型,推動認知智能的落地。
2020年,智譜成立一周年,正好碰上GPT-3的發(fā)布。那一天,我們請了張鈸院士等人座談,討論的便是:GPT-3為代表的大模型,是不是我們所追尋的認知智能可能的解決方案。
我們接著做了一些小規(guī)模的實驗,取得了一點成果。但到2021年初,我們發(fā)現(xiàn),世界頂尖的水平領先我們挺多的。既然要去做下一代的技術,不上不下還是不行,應該瞄準最先進的技術去追趕;于是開始考慮,投入資源做一個世界頂級水平、類似GPT-3的千億級模型。
2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。
那時候,公司內(nèi)部討論最多的問題便是,要不要投這么多錢,做一個無法保證成功的大模型。經(jīng)過對我們實力的評估,我們最終決定還是冒一點風險。做出投入的最本質(zhì)原因,還是我們篤定AI大模型會是未來很重要的一件事。
當時國內(nèi)這樣認知的人非常少。別說創(chuàng)業(yè)公司了,大廠可能都很少。
南風窗:你剛剛說,想對標GPT-3。智譜AI最特別的一點就是GLM的路徑。當時就確定,想走的路徑是區(qū)別于谷歌和OpenAI,基于中國人自研的GLM路徑嗎?
張鵬:對。我們投入大成本做千億模型的時候,在算法的研究層面已經(jīng)完成了。GLM的路徑在百億模型上驗證成功了,區(qū)別是我們沒做千億參數(shù)模型的驗證,并不確定基于GLM能不能讓我們超越GPT-3的水平。
南風窗:如此看來,百億參數(shù)級的模型,對很多創(chuàng)業(yè)公司是可以接受的成本。但如果跨到千億級參數(shù),這就是一個飆升的難度,是決定一個公司的攸關時刻。
張鵬:對,一個是公司從經(jīng)營層面怎么來決策,是否要冒這個風險。
另一個更大的層面,從百億到千億參數(shù)的研發(fā),難度不是簡單的乘10倍。很多技術上的風險和問題,不是說有決心、有錢,敢冒風險就能解決,這是大家比較害怕的事,也是到現(xiàn)在為止能跑出千億模型的機構還非常少的原因之一。
南風窗:GLM還有一個特點,它比較節(jié)約算力,國產(chǎn)芯片也可以使用。這個特點怎么做到的?
張鵬:這就是所謂的“窮人的孩子早當家”。2020年底、2021年初做大模型研發(fā)時,算力不夠,我們只能到處去借。借到的算力要一點一點地摳出來,分給研究和工程。
所以我們天然地對資源的浪費挺關注。當時的模型除了訓練,還進行算法優(yōu)化,做了很多提速量化壓縮的輔助性工作。這些工作的目的是為了降成本,讓大家更好地使用它。
而且我們必須篤信能這么做,否則,我們資源厚度不如國外的企業(yè),起步比人家晚。在又不如人家的前提下,如果不做出一些創(chuàng)新,怎么可能追得上?
不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標。
南風窗:背靠清華,智譜在中國的發(fā)展有一種“天之驕子”的感覺,這三年,智譜在發(fā)展的過程中有遇到灰暗的時刻嗎?
張鵬:我們沒有認為自己是天才。剛創(chuàng)業(yè)出來跟投資人聊天,他們最大的一個質(zhì)疑就是:“你們一幫從學校出來的,整個創(chuàng)業(yè)院隊又不年輕,你們憑什么能成功?沒有一個人有市場和創(chuàng)業(yè)的經(jīng)驗,憑什么能成功?”一開始其實挺困難的,得面對這些問題。
南風窗:所以與外界想象的不同,清華系在投資者面前沒有太多的加成
張鵬:“清華系”能起到錦上添花的作用。它不能是一個創(chuàng)業(yè)公司的全部,甚至都不能是你的最重要的三件事情之一。對于我們想做的事情而言,一開始資源方面確實緊缺。
南風窗:上述來看,智譜AI的氣質(zhì)還是與OpenAI有些相似,創(chuàng)業(yè)公司,注重技術和研究,靠技術奪得頭籌。但你之前在受訪時強調(diào),智譜不是中國版OpenAI,你為什么會這樣說?
張鵬:這里我要糾正一下外界的解讀。從我的角度看,我們確實很多方向上的選擇和決策,都和OpenAI有點像。我之前說的是,不要盯著OpenAI實現(xiàn)階段性的目標。也就是說,不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標。
我們的終極目標和OpenAI很接近,那就是實現(xiàn)通用人工智能。OpenAI畢竟還是比我們領先,所以在很多選擇上,我們第一步就是虛心學習。他們做了很多創(chuàng)新,如果我們覺得有道理的,就想辦法去做。
南風窗:智譜與OpenAI有相似的目標,實現(xiàn)通用人工智能(AGI)。你的AGI定義是什么樣的?現(xiàn)在我們有了涌現(xiàn)很多智能的大語言模型,你覺得實現(xiàn)通用人工智能的下一個突破的點在哪里?
張鵬:通用人工智能,在不同的專家和學者眼里,有不同的解讀。很難說清楚AGI的具體定義是什么。但我相信一種更簡單的描繪:拿人做對比。像圖靈測試,通過行為學的定義,用對話的方式讓人分辨機器和人(如果人分辨不清哪個是機器哪個是人,說明機器通過了測試)。
目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。
目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。
今后我認為還有幾個重要的方向:
一是多模態(tài)。人類的智能包含了很多能力,視覺、聽覺等。我們在嘗試這些能力跟大模型融合。這是未來很重要的方向。
第二,如同紅杉資本在《Generative AI s Act Two》的文章中所說的,生成式AI的故事進入了第二幕。所謂的第二幕就是應用?,F(xiàn)在,大模型的智能能力已經(jīng)初步具備了,具備基本的人際溝通能力了。但怎么把它用到實際當中去,產(chǎn)生真正價值,怎么來做這個事情,還待解答。
第三,上述事情假如我們都能實現(xiàn)了,下一步我們該考慮,AI是否不僅達到人的水平,還能超過人。也就是Super Intelligence(超級人工智能)的出現(xiàn)。
南風窗:剛剛我們一直在聊說落地和技術,這是智譜的兩條腿。大模型在國內(nèi)掀起浪潮半年多了,想知道在未來,這兩條腿共同前進的目標是什么?
張鵬:有一個比較抽象的目標,那就是讓大模型的能力,真正創(chuàng)造出一些比較大價值的應用。面向消費者端,那便是創(chuàng)造一個Super App(超級應用)。
在面向企業(yè)端,即在應用場景給客戶帶來更大的價值。我們常提的叫“降本增效”,后面我還補了兩個詞,叫作“提質(zhì)”,提升質(zhì)量;還有,“創(chuàng)新”。
我最近和行業(yè)的人聊,有新的想法。大家都認為,大模型好比一個威力巨大的錘子。有人曾經(jīng)以為說錘子可以把所有原來的釘子全部砸一遍。原來所有事情都可以拿AI重做一遍,對吧?但我更強調(diào),不要把已有的釘子全部砸一遍,最終收獲還是原來那么多的價值。
錘子除了能用來把原來釘子砸一遍以外,其實還有一個可能性:用來砸墻,砸天花板。砸出來的窟窿,你會看到更多的空間,更多的釘子。
南風窗:要創(chuàng)造新的東西。
張鵬:對。要有新的東西,有新的空間產(chǎn)生。這才是我們看重這一波技術革新帶來的機會。
南風窗:“新的東西”,有具體的想法嗎?
張鵬:這個階段有一些苗頭出現(xiàn)。但更多的還是需要整個生態(tài),合作伙伴們包括客戶們一起摸索,尋找新的可能。這也涉及認知問題。大家的注意力不能在已知的這些釘子上,沒有人去想說有沒有可能有新的定位。或者我們有沒有可能把這堵墻拆了,讓現(xiàn)實世界變得更好,空間會變得更大。
南風窗:像硅谷今年下半年,聊得最多的除了AIGC(AI生成內(nèi)容)以外,便是AI agent(AI智能體,讓AI模擬人類行為和決策過程)。你怎么看AI agent?這會是一個“砸墻”比較重要的方向嗎?
張鵬:智能體從技術角度來看肯定是很重要的領域。但是它還是技術層面的新東西,并不是我剛才說的,創(chuàng)造了一個新的市場,或者創(chuàng)造了一個新需求。這個技術能創(chuàng)造出什么東西來,還得再去琢磨。
南風窗:智譜AI在2022年時已經(jīng)做好了千億大模型。2022年8月,智譜發(fā)布高精度雙語稠密千億大模型GLM-130B。緊接著,11月30日,ChatGPT發(fā)布,引起眾人對生成式AI的狂歡和追捧。ChatGPT發(fā)布后,有沒有意識到萬眾矚目的AI時刻就要發(fā)生了?
張鵬:2022年8月,智譜發(fā)布千億級大模型時,我們自己內(nèi)部就有一個預測,在半年最晚不超過一年的時間里,也就是在2022年底或者2023年初會爆發(fā)。
這就是一種技術的客觀規(guī)律。技術發(fā)展到了點上,所有的積累爆發(fā)出來的能量,會有持續(xù)爆發(fā)的過程。只要掌握到數(shù)據(jù)和這種客觀的因素,就可以預測未來一段時間的走勢。
南風窗:你說的預測的“爆發(fā)”,是指像ChatGPT帶來的這樣,AI已經(jīng)可以影響到公眾層面對新技術的一個認知上了嗎?
張鵬:對,不止停留在開發(fā)者手里,而是以實際的應用走入公眾的視野。ChatGPT出來后,我開玩笑說,這還幫了我們一個忙。去年8月,我們把 GLM-130B發(fā)布出來,大概10月份開始做新一輪的融資。當時跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。
南風窗:經(jīng)歷了這一年關注和教育,現(xiàn)在企業(yè)對大模型的認知和年初的時候會不會有區(qū)別?
張鵬:應該來說,我們越早接觸和達成合作的客戶,對于AI的認知反而越長遠。這一點,可能互聯(lián)網(wǎng)廠商會更敏感。因為他們本身價值計算的邏輯就是往未來看,可以燒錢可以虧,但是絕對不允許錯過。
因為一旦錯過,可能錯過的就是一個時代,想要再進去搶灘會很難。
南風窗:回看一路,智譜采用的是中國自研技術,一直對標的也是OpenAI。在中美的AI大模型競爭中,到現(xiàn)在為止你覺得差距還有多少?
跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。
張鵬:我們承認跟世界頂級的水平還是有差距的,但我們有信心去追趕這個差距。
南風窗:回到你個人層面上,這半年多,大家都會進入技術的過度興奮和冷靜兩者交替的狀態(tài),你如何平衡外界的興奮和對事情可能走向的謹慎?
張鵬:如果用一個詞來形容,那就是篤信。信當然就是相信這件事情,大模型一定是未來的大方向,能創(chuàng)造更大的價值?!昂V”是一種態(tài)度,踏實、審慎。我們的相信要基于對這件事情的理解和鉆研,并不是狂熱、沒有根基的。
南風窗:你是比較樂觀的人?
張鵬:在這個事上,我還是比較樂觀。
南風窗:在人工智能行業(yè)這么多年,會有一個方針或者目標,給予你相信的力量嗎?
張鵬:我一直在想一件事,人工智能到底把它搬到現(xiàn)實社會當中,會是一個什么樣的?最終的目的是什么?
答案也很簡單,讓社會或者里面的人更美好。比如大家的工作更輕松一些,有更多的閑余時間去享受生活,而不是一天天996。我想過很多的產(chǎn)品,像電影里體現(xiàn)的,人工智能的助手。這些能不能實現(xiàn)?我覺得應該快了。
我用一個詞描述過這個夢想,叫人機共生。比如在現(xiàn)實世界,可能有聰明的機器人,甚至是類人機器人,這些智能的設備可以讓你的生活更方便美好。老人不再擔心說沒有人陪伴,獨生子女不擔心沒有人跟他/她作伴了。以后在現(xiàn)實世界外,還有虛擬世界的疊加,要是這樣,世界是不是會更好一些?
南風窗:無意質(zhì)疑你。但技術本身還會帶來負面性。你會擔心自己能影響更多人的生活以后,就像奧本海默一樣,在一些關鍵的節(jié)點,面臨著是讓技術發(fā)展,還是按下暫停鍵的抉擇。如果是這樣,你會繼續(xù)希望這個技術是往前迭代的嗎?
張鵬:這時候要盡量審慎。有一句話叫dont do evil,在你的認知范圍之內(nèi),不要作惡。當然有時候就像奧本海默一樣,他最初的目的也不是為了作惡。所以產(chǎn)生惡果有時候不一定由你控制。但要盡全力確保這個事情在人的意愿里。在做事情過程當中,將一切后果考慮周全。