国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

清華跑出的AI“第一梯隊”:錘子不該只砸釘子

2023-11-11 16:04:07朱秋雨
南風窗 2023年23期
關鍵詞:張鵬南風窗人工智能

朱秋雨

“這一輪AI浪潮,到底怎么掙錢?”

10月17日,在深圳舉辦的世界人工智能大會上,一名國內(nèi)頭部AI公司的負責人以此為標題,開始了他的演講。

現(xiàn)場座無虛席。觀眾手機舉得很高,后排站了滿滿的兩排人。

毫無疑問,落地、掙錢是當下AI從業(yè)者最關注的話題。年初人們對AI大模型的歡呼聲量變低,越來越多人開始發(fā)問:這一輪的生成式AI,與往常有什么不同?它能帶來新的價值嗎?

智譜AI的CEO張鵬,也在長期思考著這些問題:AI,目前為止普通人摸不著的技術,如何才能正確判斷它的價值。他的公司由清華大學知識工程實驗室(KEG)孵化,在2023年一舉成為中國AI明星企業(yè)之一。

這一年,智譜AI獲得了25億人民幣的投資。投資方集合一眾大廠:美團、螞蟻、阿里、騰訊。

令互聯(lián)網(wǎng)大廠競相跟投的,不止是清華系的“背景”。

這家創(chuàng)業(yè)公司最特別的是,它擁有與國際頂級機構不一樣的技術路徑,GLM(General Language Model),一個獨屬于中國的自研路徑。

回到2022年3月。一篇7位中國作者合寫的論文發(fā)布,轟動學界。

他們在文中大膽指出,目前所有的預訓練模型框架中,都有各自的缺陷。比如,眾所周知的GPT,原理是根據(jù)前一個詞預測后面詞的出現(xiàn)概率,生成了答案。這是一個單向的過程,不利于機器理解語言。

而世界級大廠谷歌提出的Bert模型框架,是在一句話里挖空一個單詞,讓機器學會完形填空。它卻又不利于迅速生成答案。

“我們提出了一種通用語言模型(GLM)來應對這一挑戰(zhàn)?!痹谡撐睦铮粋€全新的大模型路徑被提出。緊接著,2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。

一切就像命運般“賭”對了。

三個月后,這個年輕的創(chuàng)業(yè)公司隨著ChatGPT的發(fā)布備受矚目。有人形容,這是最像OpenAI的中國公司,研究背景強,同樣追求更遠的事情—讓機器像人一樣思考。

面對火熱的關注,畢業(yè)于清華的張鵬卻很冷靜,習慣反思。他告訴南風窗,早在2022年中旬,團隊已經(jīng)預料到了這一輪技術帶來的爆發(fā)。但當下的AI大模型雖然迭代迅速,仍舊面臨如何創(chuàng)造新價值的問題。

他預想了很多種情況的發(fā)生。如果有一天,AI的進步真的讓技術持有者面臨奧本海默的抉擇,張鵬說,他會堅持一個原則:Don t do evil。

“基于已有認知情況,不要作惡?!?/p>

以下是南風窗與張鵬的對話:

ALL in 大模型

南風窗:從2019年創(chuàng)業(yè)到現(xiàn)在,這幾年你自己有什么感受的變化?尤其是AI行業(yè)經(jīng)歷了幾年的“冷板凳”,今年大家的關注度突然間上升了那么多。

張鵬:我的感覺跟你的不太一樣?;厮菸覈?,人工智能產(chǎn)業(yè)更多在2012年隨著“AI四小龍”的興起開始進入市場。只有十幾年發(fā)展時間,速度卻非???。在我眼里,人工智能領域一直是快速上揚的進程。當然,以前在學校,我看得更多是全球最頂尖的研究成果,感知上和國內(nèi)的市場可能是兩碼事。

所以,我沒覺得AI是一個“冷板凳”。但ChatGPT出現(xiàn)后,確實改變了一些事情,讓人工智能行業(yè)從過去單在技術上推進,到如今整個產(chǎn)業(yè)對AI的關注。這是兩條線。兩條線交匯到一起,形成現(xiàn)在這個局面。

南風窗:上述我偏向投資的角度,今年對AI領域的投資確實更熱一點?;乜慈昵埃?020年6月11日,GPT-3發(fā)布,這是一個學術和產(chǎn)業(yè)界關注到的大事。這一天剛好是智譜AI成立一周年?!吧铡迸錾螱PT-3的發(fā)布,有改變智譜AI的命運軌跡嗎?

張鵬:我們2016、2017年開始研究AI產(chǎn)業(yè)時就一直在討論,到底應該做什么事。上一代的AI技術(即行業(yè)大模型)不是我們想要的,因為預見得到技術天花板。果然,2018、2019年前后,AI企業(yè)紛紛到達發(fā)展的天花板,陷入瓶頸。

2019年時智譜成立。我們很明確的想法是,做下一代的人工智能。這就是清華大學人工智能研究院名譽院長張鈸院士所說的,要發(fā)展第三代人工智能—“認知智能”。與張鈸院士聊時,我們想清楚一件事,AI未來的方向里一定要有兩條腿:一是數(shù)據(jù)驅(qū)動,另一個是知識驅(qū)動。從籌備創(chuàng)業(yè)一直到2020年,我們都在這個框架下用各種技術,如信息學習、數(shù)據(jù)挖掘、訓練模型,推動認知智能的落地。

2020年,智譜成立一周年,正好碰上GPT-3的發(fā)布。那一天,我們請了張鈸院士等人座談,討論的便是:GPT-3為代表的大模型,是不是我們所追尋的認知智能可能的解決方案。

我們接著做了一些小規(guī)模的實驗,取得了一點成果。但到2021年初,我們發(fā)現(xiàn),世界頂尖的水平領先我們挺多的。既然要去做下一代的技術,不上不下還是不行,應該瞄準最先進的技術去追趕;于是開始考慮,投入資源做一個世界頂級水平、類似GPT-3的千億級模型。

2022年8月,智譜AI對外發(fā)布,基于GLM的1300億參數(shù)開源大模型GLM-130B。這是當年全亞洲唯一入選斯坦福評測的主流大模型。

那時候,公司內(nèi)部討論最多的問題便是,要不要投這么多錢,做一個無法保證成功的大模型。經(jīng)過對我們實力的評估,我們最終決定還是冒一點風險。做出投入的最本質(zhì)原因,還是我們篤定AI大模型會是未來很重要的一件事。

當時國內(nèi)這樣認知的人非常少。別說創(chuàng)業(yè)公司了,大廠可能都很少。

南風窗:你剛剛說,想對標GPT-3。智譜AI最特別的一點就是GLM的路徑。當時就確定,想走的路徑是區(qū)別于谷歌和OpenAI,基于中國人自研的GLM路徑嗎?

張鵬:對。我們投入大成本做千億模型的時候,在算法的研究層面已經(jīng)完成了。GLM的路徑在百億模型上驗證成功了,區(qū)別是我們沒做千億參數(shù)模型的驗證,并不確定基于GLM能不能讓我們超越GPT-3的水平。

南風窗:如此看來,百億參數(shù)級的模型,對很多創(chuàng)業(yè)公司是可以接受的成本。但如果跨到千億級參數(shù),這就是一個飆升的難度,是決定一個公司的攸關時刻。

張鵬:對,一個是公司從經(jīng)營層面怎么來決策,是否要冒這個風險。

另一個更大的層面,從百億到千億參數(shù)的研發(fā),難度不是簡單的乘10倍。很多技術上的風險和問題,不是說有決心、有錢,敢冒風險就能解決,這是大家比較害怕的事,也是到現(xiàn)在為止能跑出千億模型的機構還非常少的原因之一。

南風窗:GLM還有一個特點,它比較節(jié)約算力,國產(chǎn)芯片也可以使用。這個特點怎么做到的?

張鵬:這就是所謂的“窮人的孩子早當家”。2020年底、2021年初做大模型研發(fā)時,算力不夠,我們只能到處去借。借到的算力要一點一點地摳出來,分給研究和工程。

所以我們天然地對資源的浪費挺關注。當時的模型除了訓練,還進行算法優(yōu)化,做了很多提速量化壓縮的輔助性工作。這些工作的目的是為了降成本,讓大家更好地使用它。

而且我們必須篤信能這么做,否則,我們資源厚度不如國外的企業(yè),起步比人家晚。在又不如人家的前提下,如果不做出一些創(chuàng)新,怎么可能追得上?

不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標。

南風窗:背靠清華,智譜在中國的發(fā)展有一種“天之驕子”的感覺,這三年,智譜在發(fā)展的過程中有遇到灰暗的時刻嗎?

張鵬:我們沒有認為自己是天才。剛創(chuàng)業(yè)出來跟投資人聊天,他們最大的一個質(zhì)疑就是:“你們一幫從學校出來的,整個創(chuàng)業(yè)院隊又不年輕,你們憑什么能成功?沒有一個人有市場和創(chuàng)業(yè)的經(jīng)驗,憑什么能成功?”一開始其實挺困難的,得面對這些問題。

南風窗:所以與外界想象的不同,清華系在投資者面前沒有太多的加成

張鵬:“清華系”能起到錦上添花的作用。它不能是一個創(chuàng)業(yè)公司的全部,甚至都不能是你的最重要的三件事情之一。對于我們想做的事情而言,一開始資源方面確實緊缺。

AI不是用來砸已有釘子

南風窗:上述來看,智譜AI的氣質(zhì)還是與OpenAI有些相似,創(chuàng)業(yè)公司,注重技術和研究,靠技術奪得頭籌。但你之前在受訪時強調(diào),智譜不是中國版OpenAI,你為什么會這樣說?

張鵬:這里我要糾正一下外界的解讀。從我的角度看,我們確實很多方向上的選擇和決策,都和OpenAI有點像。我之前說的是,不要盯著OpenAI實現(xiàn)階段性的目標。也就是說,不要把我們做的事情定義成中國版ChatGPT。我們眼里,ChatGPT只是一個階段性的成果。它不是我們的終極目標。

我們的終極目標和OpenAI很接近,那就是實現(xiàn)通用人工智能。OpenAI畢竟還是比我們領先,所以在很多選擇上,我們第一步就是虛心學習。他們做了很多創(chuàng)新,如果我們覺得有道理的,就想辦法去做。

南風窗:智譜與OpenAI有相似的目標,實現(xiàn)通用人工智能(AGI)。你的AGI定義是什么樣的?現(xiàn)在我們有了涌現(xiàn)很多智能的大語言模型,你覺得實現(xiàn)通用人工智能的下一個突破的點在哪里?

張鵬:通用人工智能,在不同的專家和學者眼里,有不同的解讀。很難說清楚AGI的具體定義是什么。但我相信一種更簡單的描繪:拿人做對比。像圖靈測試,通過行為學的定義,用對話的方式讓人分辨機器和人(如果人分辨不清哪個是機器哪個是人,說明機器通過了測試)。

目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。

目前的AI早就通過了“圖靈測試”,但還有很多問題,比如容易出現(xiàn)幻覺和有毒性的詞匯,邏輯能力也不足。這些還有賴于工程問題的解決。

今后我認為還有幾個重要的方向:

一是多模態(tài)。人類的智能包含了很多能力,視覺、聽覺等。我們在嘗試這些能力跟大模型融合。這是未來很重要的方向。

第二,如同紅杉資本在《Generative AI s Act Two》的文章中所說的,生成式AI的故事進入了第二幕。所謂的第二幕就是應用?,F(xiàn)在,大模型的智能能力已經(jīng)初步具備了,具備基本的人際溝通能力了。但怎么把它用到實際當中去,產(chǎn)生真正價值,怎么來做這個事情,還待解答。

第三,上述事情假如我們都能實現(xiàn)了,下一步我們該考慮,AI是否不僅達到人的水平,還能超過人。也就是Super Intelligence(超級人工智能)的出現(xiàn)。

南風窗:剛剛我們一直在聊說落地和技術,這是智譜的兩條腿。大模型在國內(nèi)掀起浪潮半年多了,想知道在未來,這兩條腿共同前進的目標是什么?

張鵬:有一個比較抽象的目標,那就是讓大模型的能力,真正創(chuàng)造出一些比較大價值的應用。面向消費者端,那便是創(chuàng)造一個Super App(超級應用)。

在面向企業(yè)端,即在應用場景給客戶帶來更大的價值。我們常提的叫“降本增效”,后面我還補了兩個詞,叫作“提質(zhì)”,提升質(zhì)量;還有,“創(chuàng)新”。

我最近和行業(yè)的人聊,有新的想法。大家都認為,大模型好比一個威力巨大的錘子。有人曾經(jīng)以為說錘子可以把所有原來的釘子全部砸一遍。原來所有事情都可以拿AI重做一遍,對吧?但我更強調(diào),不要把已有的釘子全部砸一遍,最終收獲還是原來那么多的價值。

錘子除了能用來把原來釘子砸一遍以外,其實還有一個可能性:用來砸墻,砸天花板。砸出來的窟窿,你會看到更多的空間,更多的釘子。

南風窗:要創(chuàng)造新的東西。

張鵬:對。要有新的東西,有新的空間產(chǎn)生。這才是我們看重這一波技術革新帶來的機會。

南風窗:“新的東西”,有具體的想法嗎?

張鵬:這個階段有一些苗頭出現(xiàn)。但更多的還是需要整個生態(tài),合作伙伴們包括客戶們一起摸索,尋找新的可能。這也涉及認知問題。大家的注意力不能在已知的這些釘子上,沒有人去想說有沒有可能有新的定位。或者我們有沒有可能把這堵墻拆了,讓現(xiàn)實世界變得更好,空間會變得更大。

南風窗:像硅谷今年下半年,聊得最多的除了AIGC(AI生成內(nèi)容)以外,便是AI agent(AI智能體,讓AI模擬人類行為和決策過程)。你怎么看AI agent?這會是一個“砸墻”比較重要的方向嗎?

張鵬:智能體從技術角度來看肯定是很重要的領域。但是它還是技術層面的新東西,并不是我剛才說的,創(chuàng)造了一個新的市場,或者創(chuàng)造了一個新需求。這個技術能創(chuàng)造出什么東西來,還得再去琢磨。

“不要作惡”

南風窗:智譜AI在2022年時已經(jīng)做好了千億大模型。2022年8月,智譜發(fā)布高精度雙語稠密千億大模型GLM-130B。緊接著,11月30日,ChatGPT發(fā)布,引起眾人對生成式AI的狂歡和追捧。ChatGPT發(fā)布后,有沒有意識到萬眾矚目的AI時刻就要發(fā)生了?

張鵬:2022年8月,智譜發(fā)布千億級大模型時,我們自己內(nèi)部就有一個預測,在半年最晚不超過一年的時間里,也就是在2022年底或者2023年初會爆發(fā)。

這就是一種技術的客觀規(guī)律。技術發(fā)展到了點上,所有的積累爆發(fā)出來的能量,會有持續(xù)爆發(fā)的過程。只要掌握到數(shù)據(jù)和這種客觀的因素,就可以預測未來一段時間的走勢。

南風窗:你說的預測的“爆發(fā)”,是指像ChatGPT帶來的這樣,AI已經(jīng)可以影響到公眾層面對新技術的一個認知上了嗎?

張鵬:對,不止停留在開發(fā)者手里,而是以實際的應用走入公眾的視野。ChatGPT出來后,我開玩笑說,這還幫了我們一個忙。去年8月,我們把 GLM-130B發(fā)布出來,大概10月份開始做新一輪的融資。當時跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。

南風窗:經(jīng)歷了這一年關注和教育,現(xiàn)在企業(yè)對大模型的認知和年初的時候會不會有區(qū)別?

張鵬:應該來說,我們越早接觸和達成合作的客戶,對于AI的認知反而越長遠。這一點,可能互聯(lián)網(wǎng)廠商會更敏感。因為他們本身價值計算的邏輯就是往未來看,可以燒錢可以虧,但是絕對不允許錯過。

因為一旦錯過,可能錯過的就是一個時代,想要再進去搶灘會很難。

南風窗:回看一路,智譜采用的是中國自研技術,一直對標的也是OpenAI。在中美的AI大模型競爭中,到現(xiàn)在為止你覺得差距還有多少?

跟很多投資人在聊,別人都會問,你這個東西看起來好像還不錯,但能做什么、怎么能掙錢?接著OpenAI的ChatGPT上線,幫我們回答了這些問題。

張鵬:我們承認跟世界頂級的水平還是有差距的,但我們有信心去追趕這個差距。

南風窗:回到你個人層面上,這半年多,大家都會進入技術的過度興奮和冷靜兩者交替的狀態(tài),你如何平衡外界的興奮和對事情可能走向的謹慎?

張鵬:如果用一個詞來形容,那就是篤信。信當然就是相信這件事情,大模型一定是未來的大方向,能創(chuàng)造更大的價值?!昂V”是一種態(tài)度,踏實、審慎。我們的相信要基于對這件事情的理解和鉆研,并不是狂熱、沒有根基的。

南風窗:你是比較樂觀的人?

張鵬:在這個事上,我還是比較樂觀。

南風窗:在人工智能行業(yè)這么多年,會有一個方針或者目標,給予你相信的力量嗎?

張鵬:我一直在想一件事,人工智能到底把它搬到現(xiàn)實社會當中,會是一個什么樣的?最終的目的是什么?

答案也很簡單,讓社會或者里面的人更美好。比如大家的工作更輕松一些,有更多的閑余時間去享受生活,而不是一天天996。我想過很多的產(chǎn)品,像電影里體現(xiàn)的,人工智能的助手。這些能不能實現(xiàn)?我覺得應該快了。

我用一個詞描述過這個夢想,叫人機共生。比如在現(xiàn)實世界,可能有聰明的機器人,甚至是類人機器人,這些智能的設備可以讓你的生活更方便美好。老人不再擔心說沒有人陪伴,獨生子女不擔心沒有人跟他/她作伴了。以后在現(xiàn)實世界外,還有虛擬世界的疊加,要是這樣,世界是不是會更好一些?

南風窗:無意質(zhì)疑你。但技術本身還會帶來負面性。你會擔心自己能影響更多人的生活以后,就像奧本海默一樣,在一些關鍵的節(jié)點,面臨著是讓技術發(fā)展,還是按下暫停鍵的抉擇。如果是這樣,你會繼續(xù)希望這個技術是往前迭代的嗎?

張鵬:這時候要盡量審慎。有一句話叫dont do evil,在你的認知范圍之內(nèi),不要作惡。當然有時候就像奧本海默一樣,他最初的目的也不是為了作惡。所以產(chǎn)生惡果有時候不一定由你控制。但要盡全力確保這個事情在人的意愿里。在做事情過程當中,將一切后果考慮周全。

猜你喜歡
張鵬南風窗人工智能
《南風窗》新媒體營收激增原因分析
傳媒(2023年8期)2023-05-20 02:06:12
Quantitative analysis of the main components in ceramic raw materials based on the desktop LIBS analyzer
Competitive effect between roughness and mask pattern on charging phenomena during plasma etching
基于PLC控制的平移式自動門設計
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
理發(fā)風波
故事會(2018年13期)2018-07-03 03:00:12
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
《南風窗》 強化教育公平
大安市| 石嘴山市| 松溪县| 行唐县| 乌苏市| 许昌县| 昔阳县| 清丰县| 红河县| 朔州市| 镇赉县| 奉新县| 江北区| 玛沁县| 礼泉县| 子长县| 会东县| 靖远县| 丹巴县| 宁明县| 长垣县| 漳州市| 佛教| 饶平县| 朝阳市| 门头沟区| 务川| 乐昌市| 隆化县| 高州市| 泽州县| 扶绥县| 崇礼县| 开江县| 台东市| 襄樊市| 达日县| 水城县| 许昌市| 泰兴市| 西城区|