清華跑出的AI“第一梯隊”：錘子不該只砸釘子

2023-11-11 16:04:07朱秋雨

南風窗 2023年23期

關鍵詞：張鵬南風窗人工智能

朱秋雨

“這一輪AI浪潮，到底怎么掙錢？”

10月17日，在深圳舉辦的世界人工智能大會上，一名國內(nèi)頭部AI公司的負責人以此為標題，開始了他的演講。

現(xiàn)場座無虛席。觀眾手機舉得很高，后排站了滿滿的兩排人。

毫無疑問，落地、掙錢是當下AI從業(yè)者最關注的話題。年初人們對AI大模型的歡呼聲量變低，越來越多人開始發(fā)問：這一輪的生成式AI，與往常有什么不同？它能帶來新的價值嗎？

智譜AI的CEO張鵬，也在長期思考著這些問題：AI，目前為止普通人摸不著的技術，如何才能正確判斷它的價值。他的公司由清華大學知識工程實驗室（KEG）孵化，在2023年一舉成為中國AI明星企業(yè)之一。

這一年，智譜AI獲得了25億人民幣的投資。投資方集合一眾大廠：美團、螞蟻、阿里、騰訊。

令互聯(lián)網(wǎng)大廠競相跟投的，不止是清華系的“背景”。

這家創(chuàng)業(yè)公司最特別的是，它擁有與國際頂級機構不一樣的技術路徑，GLM（General Language Model），一個獨屬于中國的自研路徑。

回到2022年3月。一篇7位中國作者合寫的論文發(fā)布，轟動學界。

他們在文中大膽指出，目前所有的預訓練模型框架中，都有各自的缺陷。比如，眾所周知的GPT，原理是根據(jù)前一個詞預測后面詞的出現(xiàn)概率，生成了答案。這是一個單向的過程，不利于機器理解語言。

而世界級大廠谷歌提出的Bert模型框架，是在一句話里挖空一個單詞，讓機器學會完形填空。它卻又不利于迅速生成答案。

“我們提出了一種通用語言模型（GLM）來應對這一挑戰(zhàn)?！痹谡撐睦铮粋€全新的大模型路徑被提出。緊接著，2022年8月，智譜AI對外發(fā)布，基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。

一切就像命運般“賭”對了。

三個月后，這個年輕的創(chuàng)業(yè)公司隨著ChatGPT的發(fā)布備受矚目。有人形容，這是最像OpenAI的中國公司，研究背景強，同樣追求更遠的事情—讓機器像人一樣思考。

面對火熱的關注，畢業(yè)于清華的張鵬卻很冷靜，習慣反思。他告訴南風窗，早在2022年中旬，團隊已經(jīng)預料到了這一輪技術帶來的爆發(fā)。但當下的AI大模型雖然迭代迅速，仍舊面臨如何創(chuàng)造新價值的問題。

他預想了很多種情況的發(fā)生。如果有一天，AI的進步真的讓技術持有者面臨奧本海默的抉擇，張鵬說，他會堅持一個原則：Don t do evil。

“基于已有認知情況，不要作惡?！?/p>

以下是南風窗與張鵬的對話：

ALL in 大模型

南風窗：從2019年創(chuàng)業(yè)到現(xiàn)在，這幾年你自己有什么感受的變化？尤其是AI行業(yè)經(jīng)歷了幾年的“冷板凳”，今年大家的關注度突然間上升了那么多。

張鵬：我的感覺跟你的不太一樣?；厮菸覈?，人工智能產(chǎn)業(yè)更多在2012年隨著“AI四小龍”的興起開始進入市場。只有十幾年發(fā)展時間，速度卻非?？?。在我眼里，人工智能領域一直是快速上揚的進程。當然，以前在學校，我看得更多是全球最頂尖的研究成果，感知上和國內(nèi)的市場可能是兩碼事。

所以，我沒覺得AI是一個“冷板凳”。但ChatGPT出現(xiàn)后，確實改變了一些事情，讓人工智能行業(yè)從過去單在技術上推進，到如今整個產(chǎn)業(yè)對AI的關注。這是兩條線。兩條線交匯到一起，形成現(xiàn)在這個局面。

南風窗：上述我偏向投資的角度，今年對AI領域的投資確實更熱一點?；乜慈昵埃?020年6月11日，GPT-3發(fā)布，這是一個學術和產(chǎn)業(yè)界關注到的大事。這一天剛好是智譜AI成立一周年?！吧铡迸錾螱PT-3的發(fā)布，有改變智譜AI的命運軌跡嗎？

張鵬：我們2016、2017年開始研究AI產(chǎn)業(yè)時就一直在討論，到底應該做什么事。上一代的AI技術（即行業(yè)大模型）不是我們想要的，因為預見得到技術天花板。果然，2018、2019年前后，AI企業(yè)紛紛到達發(fā)展的天花板，陷入瓶頸。

2019年時智譜成立。我們很明確的想法是，做下一代的人工智能。這就是清華大學人工智能研究院名譽院長張鈸院士所說的，要發(fā)展第三代人工智能—“認知智能”。與張鈸院士聊時，我們想清楚一件事，AI未來的方向里一定要有兩條腿：一是數(shù)據(jù)驅(qū)動，另一個是知識驅(qū)動。從籌備創(chuàng)業(yè)一直到2020年，我們都在這個框架下用各種技術，如信息學習、數(shù)據(jù)挖掘、訓練模型，推動認知智能的落地。

2020年，智譜成立一周年，正好碰上GPT-3的發(fā)布。那一天，我們請了張鈸院士等人座談，討論的便是：GPT-3為代表的大模型，是不是我們所追尋的認知智能可能的解決方案。

我們接著做了一些小規(guī)模的實驗，取得了一點成果。但到2021年初，我們發(fā)現(xiàn)，世界頂尖的水平領先我們挺多的。既然要去做下一代的技術，不上不下還是不行，應該瞄準最先進的技術去追趕；于是開始考慮，投入資源做一個世界頂級水平、類似GPT-3的千億級模型。

2022年8月，智譜AI對外發(fā)布，基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。

那時候，公司內(nèi)部討論最多的問題便是，要不要投這么多錢，做一個無法保證成功的大模型。經(jīng)過對我們實力的評估，我們最終決定還是冒一點風險。做出投入的最本質(zhì)原因，還是我們篤定AI大模型會是未來很重要的一件事。

當時國內(nèi)這樣認知的人非常少。別說創(chuàng)業(yè)公司了，大廠可能都很少。

南風窗：你剛剛說，想對標GPT-3。智譜AI最特別的一點就是GLM的路徑。當時就確定，想走的路徑是區(qū)別于谷歌和OpenAI，基于中國人自研的GLM路徑嗎？

張鵬：對。我們投入大成本做千億模型的時候，在算法的研究層面已經(jīng)完成了。GLM的路徑在百億模型上驗證成功了，區(qū)別是我們沒做千億參數(shù)模型的驗證，并不確定基于GLM能不能讓我們超越GPT-3的水平。

南風窗：如此看來，百億參數(shù)級的模型，對很多創(chuàng)業(yè)公司是可以接受的成本。但如果跨到千億級參數(shù)，這就是一個飆升的難度，是決定一個公司的攸關時刻。

張鵬：對，一個是公司從經(jīng)營層面怎么來決策，是否要冒這個風險。

另一個更大的層面，從百億到千億參數(shù)的研發(fā)，難度不是簡單的乘10倍。很多技術上的風險和問題，不是說有決心、有錢，敢冒風險就能解決，這是大家比較害怕的事，也是到現(xiàn)在為止能跑出千億模型的機構還非常少的原因之一。

南風窗：GLM還有一個特點，它比較節(jié)約算力，國產(chǎn)芯片也可以使用。這個特點怎么做到的？

張鵬：這就是所謂的“窮人的孩子早當家”。2020年底、2021年初做大模型研發(fā)時，算力不夠，我們只能到處去借。借到的算力要一點一點地摳出來，分給研究和工程。

所以我們天然地對資源的浪費挺關注。當時的模型除了訓練，還進行算法優(yōu)化，做了很多提速量化壓縮的輔助性工作。這些工作的目的是為了降成本，讓大家更好地使用它。

而且我們必須篤信能這么做，否則，我們資源厚度不如國外的企業(yè)，起步比人家晚。在又不如人家的前提下，如果不做出一些創(chuàng)新，怎么可能追得上？

不要把我們做的事情定義成中國版ChatGPT。我們眼里，ChatGPT只是一個階段性的成果。它不是我們的終極目標。

南風窗：背靠清華，智譜在中國的發(fā)展有一種“天之驕子”的感覺，這三年，智譜在發(fā)展的過程中有遇到灰暗的時刻嗎？

張鵬：我們沒有認為自己是天才。剛創(chuàng)業(yè)出來跟投資人聊天，他們最大的一個質(zhì)疑就是：“你們一幫從學校出來的，整個創(chuàng)業(yè)院隊又不年輕，你們憑什么能成功？沒有一個人有市場和創(chuàng)業(yè)的經(jīng)驗，憑什么能成功？”一開始其實挺困難的，得面對這些問題。

南風窗：所以與外界想象的不同，清華系在投資者面前沒有太多的加成

張鵬：“清華系”能起到錦上添花的作用。它不能是一個創(chuàng)業(yè)公司的全部，甚至都不能是你的最重要的三件事情之一。對于我們想做的事情而言，一開始資源方面確實緊缺。

AI不是用來砸已有釘子

南風窗：上述來看，智譜AI的氣質(zhì)還是與OpenAI有些相似，創(chuàng)業(yè)公司，注重技術和研究，靠技術奪得頭籌。但你之前在受訪時強調(diào)，智譜不是中國版OpenAI，你為什么會這樣說？

張鵬：這里我要糾正一下外界的解讀。從我的角度看，我們確實很多方向上的選擇和決策，都和OpenAI有點像。我之前說的是，不要盯著OpenAI實現(xiàn)階段性的目標。也就是說，不要把我們做的事情定義成中國版ChatGPT。我們眼里，ChatGPT只是一個階段性的成果。它不是我們的終極目標。

我們的終極目標和OpenAI很接近，那就是實現(xiàn)通用人工智能。OpenAI畢竟還是比我們領先，所以在很多選擇上，我們第一步就是虛心學習。他們做了很多創(chuàng)新，如果我們覺得有道理的，就想辦法去做。

南風窗：智譜與OpenAI有相似的目標，實現(xiàn)通用人工智能（AGI）。你的AGI定義是什么樣的？現(xiàn)在我們有了涌現(xiàn)很多智能的大語言模型，你覺得實現(xiàn)通用人工智能的下一個突破的點在哪里？

張鵬：通用人工智能，在不同的專家和學者眼里，有不同的解讀。很難說清楚AGI的具體定義是什么。但我相信一種更簡單的描繪：拿人做對比。像圖靈測試，通過行為學的定義，用對話的方式讓人分辨機器和人（如果人分辨不清哪個是機器哪個是人，說明機器通過了測試）。

目前的AI早就通過了“圖靈測試”，但還有很多問題，比如容易出現(xiàn)幻覺和有毒性的詞匯，邏輯能力也不足。這些還有賴于工程問題的解決。

目前的AI早就通過了“圖靈測試”，但還有很多問題，比如容易出現(xiàn)幻覺和有毒性的詞匯，邏輯能力也不足。這些還有賴于工程問題的解決。

今后我認為還有幾個重要的方向：

一是多模態(tài)。人類的智能包含了很多能力，視覺、聽覺等。我們在嘗試這些能力跟大模型融合。這是未來很重要的方向。

第二，如同紅杉資本在《Generative AI s Act Two》的文章中所說的，生成式AI的故事進入了第二幕。所謂的第二幕就是應用?，F(xiàn)在，大模型的智能能力已經(jīng)初步具備了，具備基本的人際溝通能力了。但怎么把它用到實際當中去，產(chǎn)生真正價值，怎么來做這個事情，還待解答。

第三，上述事情假如我們都能實現(xiàn)了，下一步我們該考慮，AI是否不僅達到人的水平，還能超過人。也就是Super Intelligence（超級人工智能）的出現(xiàn)。

南風窗：剛剛我們一直在聊說落地和技術，這是智譜的兩條腿。大模型在國內(nèi)掀起浪潮半年多了，想知道在未來，這兩條腿共同前進的目標是什么？

張鵬：有一個比較抽象的目標，那就是讓大模型的能力，真正創(chuàng)造出一些比較大價值的應用。面向消費者端，那便是創(chuàng)造一個Super App（超級應用）。

在面向企業(yè)端，即在應用場景給客戶帶來更大的價值。我們常提的叫“降本增效”，后面我還補了兩個詞，叫作“提質(zhì)”，提升質(zhì)量；還有，“創(chuàng)新”。

我最近和行業(yè)的人聊，有新的想法。大家都認為，大模型好比一個威力巨大的錘子。有人曾經(jīng)以為說錘子可以把所有原來的釘子全部砸一遍。原來所有事情都可以拿AI重做一遍，對吧？但我更強調(diào)，不要把已有的釘子全部砸一遍，最終收獲還是原來那么多的價值。

錘子除了能用來把原來釘子砸一遍以外，其實還有一個可能性：用來砸墻，砸天花板。砸出來的窟窿，你會看到更多的空間，更多的釘子。

南風窗：要創(chuàng)造新的東西。

張鵬：對。要有新的東西，有新的空間產(chǎn)生。這才是我們看重這一波技術革新帶來的機會。

南風窗：“新的東西”，有具體的想法嗎？

張鵬：這個階段有一些苗頭出現(xiàn)。但更多的還是需要整個生態(tài)，合作伙伴們包括客戶們一起摸索，尋找新的可能。這也涉及認知問題。大家的注意力不能在已知的這些釘子上，沒有人去想說有沒有可能有新的定位。或者我們有沒有可能把這堵墻拆了，讓現(xiàn)實世界變得更好，空間會變得更大。

南風窗：像硅谷今年下半年，聊得最多的除了AIGC（AI生成內(nèi)容）以外，便是AI agent（AI智能體，讓AI模擬人類行為和決策過程）。你怎么看AI agent？這會是一個“砸墻”比較重要的方向嗎？

張鵬：智能體從技術角度來看肯定是很重要的領域。但是它還是技術層面的新東西，并不是我剛才說的，創(chuàng)造了一個新的市場，或者創(chuàng)造了一個新需求。這個技術能創(chuàng)造出什么東西來，還得再去琢磨。

“不要作惡”

南風窗：智譜AI在2022年時已經(jīng)做好了千億大模型。2022年8月，智譜發(fā)布高精度雙語稠密千億大模型GLM-130B。緊接著，11月30日，ChatGPT發(fā)布，引起眾人對生成式AI的狂歡和追捧。ChatGPT發(fā)布后，有沒有意識到萬眾矚目的AI時刻就要發(fā)生了？

張鵬：2022年8月，智譜發(fā)布千億級大模型時，我們自己內(nèi)部就有一個預測，在半年最晚不超過一年的時間里，也就是在2022年底或者2023年初會爆發(fā)。

這就是一種技術的客觀規(guī)律。技術發(fā)展到了點上，所有的積累爆發(fā)出來的能量，會有持續(xù)爆發(fā)的過程。只要掌握到數(shù)據(jù)和這種客觀的因素，就可以預測未來一段時間的走勢。

南風窗：你說的預測的“爆發(fā)”，是指像ChatGPT帶來的這樣，AI已經(jīng)可以影響到公眾層面對新技術的一個認知上了嗎？

張鵬：對，不止停留在開發(fā)者手里，而是以實際的應用走入公眾的視野。ChatGPT出來后，我開玩笑說，這還幫了我們一個忙。去年8月，我們把 GLM-130B發(fā)布出來，大概10月份開始做新一輪的融資。當時跟很多投資人在聊，別人都會問，你這個東西看起來好像還不錯，但能做什么、怎么能掙錢？接著OpenAI的ChatGPT上線，幫我們回答了這些問題。

南風窗：經(jīng)歷了這一年關注和教育，現(xiàn)在企業(yè)對大模型的認知和年初的時候會不會有區(qū)別？

張鵬：應該來說，我們越早接觸和達成合作的客戶，對于AI的認知反而越長遠。這一點，可能互聯(lián)網(wǎng)廠商會更敏感。因為他們本身價值計算的邏輯就是往未來看，可以燒錢可以虧，但是絕對不允許錯過。

因為一旦錯過，可能錯過的就是一個時代，想要再進去搶灘會很難。

南風窗：回看一路，智譜采用的是中國自研技術，一直對標的也是OpenAI。在中美的AI大模型競爭中，到現(xiàn)在為止你覺得差距還有多少？

跟很多投資人在聊，別人都會問，你這個東西看起來好像還不錯，但能做什么、怎么能掙錢？接著OpenAI的ChatGPT上線，幫我們回答了這些問題。

張鵬：我們承認跟世界頂級的水平還是有差距的，但我們有信心去追趕這個差距。

南風窗：回到你個人層面上，這半年多，大家都會進入技術的過度興奮和冷靜兩者交替的狀態(tài)，你如何平衡外界的興奮和對事情可能走向的謹慎？

張鵬：如果用一個詞來形容，那就是篤信。信當然就是相信這件事情，大模型一定是未來的大方向，能創(chuàng)造更大的價值?！昂V”是一種態(tài)度，踏實、審慎。我們的相信要基于對這件事情的理解和鉆研，并不是狂熱、沒有根基的。

南風窗：你是比較樂觀的人？

張鵬：在這個事上，我還是比較樂觀。

南風窗：在人工智能行業(yè)這么多年，會有一個方針或者目標，給予你相信的力量嗎？

張鵬：我一直在想一件事，人工智能到底把它搬到現(xiàn)實社會當中，會是一個什么樣的？最終的目的是什么？

答案也很簡單，讓社會或者里面的人更美好。比如大家的工作更輕松一些，有更多的閑余時間去享受生活，而不是一天天996。我想過很多的產(chǎn)品，像電影里體現(xiàn)的，人工智能的助手。這些能不能實現(xiàn)？我覺得應該快了。

我用一個詞描述過這個夢想，叫人機共生。比如在現(xiàn)實世界，可能有聰明的機器人，甚至是類人機器人，這些智能的設備可以讓你的生活更方便美好。老人不再擔心說沒有人陪伴，獨生子女不擔心沒有人跟他/她作伴了。以后在現(xiàn)實世界外，還有虛擬世界的疊加，要是這樣，世界是不是會更好一些？

南風窗：無意質(zhì)疑你。但技術本身還會帶來負面性。你會擔心自己能影響更多人的生活以后，就像奧本海默一樣，在一些關鍵的節(jié)點，面臨著是讓技術發(fā)展，還是按下暫停鍵的抉擇。如果是這樣，你會繼續(xù)希望這個技術是往前迭代的嗎？

張鵬：這時候要盡量審慎。有一句話叫dont do evil，在你的認知范圍之內(nèi)，不要作惡。當然有時候就像奧本海默一樣，他最初的目的也不是為了作惡。所以產(chǎn)生惡果有時候不一定由你控制。但要盡全力確保這個事情在人的意愿里。在做事情過程當中，將一切后果考慮周全。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

清華跑出的AI“第一梯隊”：錘子不該只砸釘子

ALL in 大模型

AI不是用來砸已有釘子

“不要作惡”