中國公司的追趕之旅

2023-04-14 00:54:10王姍姍

第一財經(jīng) 2023年4期

王姍姍

ChatGPT發(fā)布4個多月后，中國有了第一個國產(chǎn)的“類ChatGPT”產(chǎn)品。

3月16日，百度創(chuàng)始人、董事長兼CEO李彥宏親自站到臺前，演示了他的團隊“趕工”出來的知識增強大語言模型—“文心一言”。產(chǎn)品體驗談不上驚艷—它會的文學(xué)創(chuàng)作、商業(yè)文案寫作、解數(shù)學(xué)題，ChatGPT都會，而且會得更多。

此前一天，OpenAI正式發(fā)布了GPT-4，增加了多模態(tài)，會畫畫，也會寫代碼，能將一張手繪草圖一鍵變成真正的網(wǎng)頁。

不過，公眾對于百度這場發(fā)布會最失望的部分，是李彥宏發(fā)布這個自由對話產(chǎn)品的方式—錄播。李彥宏人在現(xiàn)場，但是他所演示的文心一言對問題的回答都是事先錄制好的。這么做的目的，像是要確保百度的大模型給出的案例，不會像幾周前Google發(fā)布聊天機器人Bard時那樣翻車。

3月16日，百度創(chuàng)始人、董事長兼CEO李彥宏出席百度大語言模型“文心一言”產(chǎn)品發(fā)布會。

這場謹慎的發(fā)布會，其實籌備得十分匆忙。最早的消息來自彭博社，其1月30日的報道中第一次透露“中國搜索巨頭百度正計劃推出一款類似于ChatGPT的人工智能聊天機器人服務(wù)”。當(dāng)時距離OpenAI推出ChatGPT只過去了兩個月，Google和Facebook都未承諾何時做出一個同類的產(chǎn)品。

百度文心一言發(fā)布會的背后，還存在兩種說法。一種說法是，ChatGPT發(fā)布之后，政府高層主動詢問過百度：這樣的技術(shù)做不做得出來？“AI有風(fēng)險，百度知道這一點，政府也知道。”一位百度內(nèi)部人士對《第一財經(jīng)》雜志說。

另一種說法則是，百度不會直接發(fā)布產(chǎn)品，只會發(fā)布一個demo。原因是，所有類ChatGPT產(chǎn)品在發(fā)布前都要經(jīng)過來自省網(wǎng)信辦和中央網(wǎng)信辦的“雙信評審”。提供這則消息的人士告訴《第一財經(jīng)》雜志，這是ChatGPT發(fā)布之后出現(xiàn)的新政策，國內(nèi)迄今沒有一家公司拿到許可，ChatGPT也沒有拿到。

百度不是唯一對發(fā)布一款自由對話的AI產(chǎn)品持謹慎態(tài)度的公司。百度發(fā)布會的前兩天，騰訊在其北京總部舉辦了媒體溝通會，邀請來自騰訊AI Lab和云計算的7位技術(shù)負責(zé)人，為上百家媒體講解騰訊在AI領(lǐng)域的工作成果。溝通會為“閉門”形式，參會媒體須經(jīng)騰訊官方確認，才能對外發(fā)布溝通會中的信息。同期，阿里巴巴則以“正在開發(fā)的人機對話產(chǎn)品是商業(yè)機密”為由，婉拒了《第一財經(jīng)》雜志的采訪。

公平一點說，在公眾對ChatGPT的狂熱認同面前，硅谷大公司的姿態(tài)也沒好到哪兒去。Google被迫應(yīng)戰(zhàn)發(fā)布的Bard表現(xiàn)并不比ChatGPT差，只因為給出的答案里出現(xiàn)了一個事實性錯誤，就被投資者用拋售股票投了唱衰票。Facebook發(fā)布的開源語言大模型LLaMA在市場上也并沒有激起多少水花。

“市場很殘酷，3月14日Google放出自家大語言模型PaLM的API接口后，我在相關(guān)開發(fā)者社群搜索了下，結(jié)果討論度是0。”即刻Hack Engine聯(lián)合發(fā)起人夏俊晨對《第一財經(jīng)》雜志說，他感覺ChatGPT發(fā)布之后席卷了整個行業(yè)，并成為一種事實標準，開發(fā)者對其他與之競爭的模型的態(tài)度恨不得是“要求它們開放給開發(fā)者的接口的定義、參數(shù)都要跟ChatGPT一樣”。

一瞬間，全球技術(shù)大廠都被一個叫OpenAI的小公司教訓(xùn)了—除了微軟，后者運氣不錯地在2019年就投資了OpenAI。如同當(dāng)年蘋果用iPod教訓(xùn)索尼，再用智能手機改寫IBM、微軟和諾基亞的命運一樣，OpenAI的故事看起來似乎是顛覆式創(chuàng)新的典型范式，但它在中國留下的故事版本和在硅谷書寫的并不那么相同：在硅谷，技術(shù)巨頭們都是參賽者；在中國，大廠們只是追趕者。

與外界在今年年初才感受到來自AI技術(shù)變革的沖擊不同，夏俊晨最早感受到?jīng)_擊是在2021年，GitHub推出代碼補全工具Copilot的時候。GitHub是全球最大的源代碼服務(wù)平臺，開發(fā)者可以在其中討論問題，也可以使用其提供的工具撰寫代碼。2018年，微軟收購了這家公司，2021年作為代碼補全工具的Copilot被推出。

“當(dāng)時GP T-3出來不久，它（指Copilot）的準確性讓我第一次覺得一個工具真的有一點人工智能的味道了。”夏俊晨說，作為產(chǎn)品開發(fā)者，他對自然語言類AI沒有那么敏感，但Copilot這樣的A I助手一面世，他就感受到它的不一樣。

人工智能領(lǐng)域的科學(xué)家們感受到的沖擊則要來得更早—2018年—而且，至今已出現(xiàn)了3次。

第一次沖擊是BERT預(yù)訓(xùn)練語言模型的出現(xiàn)。

“ 原本在自然語言處理（ NaturalLanguageProcessing， NLP）領(lǐng)域的狀況是，大家要為了不同任務(wù)設(shè)計不同的模型，領(lǐng)域之間是相互割裂的，各有各的算法專家。但是BERT一出來就告訴大家，不管你是什么任務(wù)，用BERT一個結(jié)構(gòu)就可以了。你叫它范式變化也不為過?！被浉郯拇鬄硡^(qū)數(shù)字經(jīng)濟研究院認知計算與自然語言研究中心負責(zé)人張家興對《第一財經(jīng)》雜志說。

在每個以AI能力著稱的公司中，處理語言數(shù)據(jù)的N L P 和處理視覺數(shù)據(jù)的CV（ComputerVision）是最基本的工程師配備。正是基于他們在底層對語言和視覺數(shù)據(jù)的處理，運用在公司前臺的各種推薦算法才能跑得起來。在BERT出現(xiàn)之前，N L P是個名類繁多的領(lǐng)域，從文本分類到機器翻譯，從閱讀理解到文章分級，或者垃圾郵件探測，工程師們會為每個“任務(wù)”開發(fā)專用的AI模型。以AI能力標榜自身的互聯(lián)網(wǎng)公司們最喜歡宣揚的，就是他們工具庫里的模型數(shù)量有多少。

BERT扭轉(zhuǎn)了這股舊習(xí)氣。作為Google在2018年推出的自然語言處理模型，它“以一敵百”，光參數(shù)就達到3個億，比稍早推出的GPT-1還要多。

第一次沖擊剛發(fā)生沒多久，第二次沖擊就來了。BERT發(fā)布一年半后，2020年5月，OpenAI發(fā)布了GPT-3，訓(xùn)練參數(shù)一下子從第二代的幾百億躍升至1750億。

兩次沖擊后，國內(nèi)學(xué)術(shù)界和工業(yè)界都出現(xiàn)過仿制潮。BERT發(fā)布的時候，張家興還在螞蟻金服工作。沒過多久他就發(fā)現(xiàn)，學(xué)界還在NL P領(lǐng)域做研究的人要發(fā)表論文時，都會思考要不要跟BERT對比一下效果，但是“比了又大概率比不過”。幾乎半年之內(nèi)，幾乎所有做研究的以及在工業(yè)界做落地的，都采用了BERT結(jié)構(gòu)。

類似的情形在GPT-3發(fā)布后再次出現(xiàn)，但使用者和跟隨仿制者都少了很多—只剩大公司還能勉強跟上。

“GPT-3效果比BERT好很多很多。它讓大家看到了一個模型可以大到何種程度，而且大家終于認識到把模型做大這件事情很重要，模型大了就會涌現(xiàn)出各種能力。”張家興說，但“因為模型太大了，很少有人能在本地跑起來”。另一個阻礙了大規(guī)模仿制性研究的原因，是GPT-3沒有開源。

但阿里巴巴還是想辦法仿制了它。根據(jù)阿里巴巴一位內(nèi)部人士的說法，阿里巴巴達摩院2021年4月發(fā)布的中文語言模型PLUG的確參照了GP T-3，它有270億參數(shù)，外界也稱之為“中文版GP T-3”。同年年初，達摩院還發(fā)布了一個叫M6的多模態(tài)大模型，參數(shù)超過百億，能處理文與圖之間的相互轉(zhuǎn)換，曾于當(dāng)年的雙11在犀牛工廠里為顧客設(shè)計衣服，后來也被加載到了小鵬汽車的自動駕駛系統(tǒng)中。

緊接著，華為云同樣在2021年4月發(fā)布了“盤古”大模型，包括基于Transformer的視覺預(yù)訓(xùn)練和中文語言預(yù)訓(xùn)練模型，參數(shù)據(jù)稱分別達到了30億和“千億級”。同年7月，百度的大模型升級至ERNIE 3.0（文心3.0），第一次達到百億參數(shù)。

暫且不看模型大?。℅PT-3這時候的參數(shù)規(guī)模為1750億），僅論有無，與Open AI相比，阿里巴巴、華為和百度在“大模型”上的進度大約晚了一年。騰訊還要再晚一年，直到2022年4月，才首次披露其第一個基于Transfor mer的模型“混元”的進展。

不久之后，ChatGPT就出世了。AI科學(xué)家們感受到了來自大模型的“第三次沖擊”。

“GPT-3很強大，但當(dāng)時擺在大家面前的問題是，這樣的大模型該怎么落地呢？怎么讓它有商業(yè)價值？這是擺在所有人面前的困難。”張家興說，GPT-3沒有解決這個問題，它的模仿者們沒有解決，最后OpenAI自己解決了。

事實上，從BERT到GPT-3（還有GPT-1、GPT-2、InstructGPT等一系列模型）都只是基礎(chǔ)模型，它們具備處理語言的能力，但除了被工程師拿去做做測試題，其他什么也做不了。ChatGP T第一次把這些能力變?yōu)榱恕伴_箱即用”的C端產(chǎn)品：寫文章、問答、做摘要、翻譯，甚至猜燈謎、寫代碼等等，在每個任務(wù)上OpenAI都對它做了專門訓(xùn) 練。

“它（指OpenAI）找到了一種極簡的產(chǎn)品形態(tài)—對話，這個是最大的創(chuàng)新?！币晃灰竽涿倪_摩院內(nèi)部人士對《第一財經(jīng)》雜志稱，跟隨GPT-3仿制出PLUG后，阿里巴巴也推出了相應(yīng)的生成式產(chǎn)品，并開放公眾測試，但那個產(chǎn)品并非一問一答的對話形態(tài)，而是續(xù)寫，敲出前幾個字，它會自動續(xù)寫一個故事或一篇商業(yè)文稿。

2020年，騰訊啟動過一個叫文涌（Effidit）的寫作助手項目，主要功能也是續(xù)寫—從各個維度補全創(chuàng)作者寫出的句子或文章?！皬谋O(jiān)管層面講，國內(nèi)大廠不會優(yōu)先考慮做一個C端的、大家可以任意提問的AI?！鄙鲜鲞_摩院人士說。產(chǎn)品形態(tài)既能決定一款產(chǎn)品是否能引爆大眾，也能影響開發(fā)者的技術(shù)路徑。

ChatGPT引爆市場后，幾乎所有人都進入了興奮與焦慮兼?zhèn)涞臓顟B(tài)。

3月6日，即刻創(chuàng)始人葉錫東在其社交賬號上發(fā)帖，宣布啟動Hack Engine項目，孵化AI應(yīng)用創(chuàng)業(yè)項目，每個在Demo Day錄取的團隊將獲得30萬美元啟動資金以及新的孵化器提供的全方面的創(chuàng)業(yè)資源幫助。

“現(xiàn)在可能還很難看出哪個才是10億美元的機會，一個團隊現(xiàn)在做的東西也不一定是最終做的那個東西，但可以肯定的是，那個最終跑出來的團隊，現(xiàn)在肯定已經(jīng)進場了?！毕目〕空f。在硅谷，創(chuàng)業(yè)孵化器YCombirator上一批投的項目中8個與AIGC相關(guān)，最新一季中，這個數(shù)字增長到了53個。

今年更早時候，真格基金也在通過官方賬號發(fā)出了“A I英雄帖”，尋覓與AIGC相關(guān)的項目和人才，其中一筆資金投給了美團前聯(lián)合創(chuàng)始人王慧文。3月19日，創(chuàng)新工場CEO李開復(fù)也入局了。他在朋友圈稱，正在籌組一個全球化公司Project AI 2.0，不僅要做中文版ChatGPT，也會關(guān)注基于大模型的應(yīng)用。

“如果說GPT-3發(fā)現(xiàn)了新大陸，ChatGPT的出現(xiàn)就是在新大陸上發(fā)現(xiàn)了黃金?！闭娓窕鸸芾砗匣锶舜饔晟f。夏俊晨的感知是：開發(fā)者非常積極地在嘗試各種新的應(yīng)用場景，大家的想象都被激發(fā)出來了，每天都有非常多新的應(yīng)用上線，你的idea晚上線幾天，其他三四個團隊已經(jīng)做出來了。

一些人的機會常常是另一些人的危險。戴雨森多年來是一款在線筆記軟件的忠誠用戶，但嘗試過加載了GPT-3的Notion后，他迅速拋棄了筆記軟件?！熬拖衲懔?xí)慣了有拍照功能的手機之后，很難再去適應(yīng)一個手機沒有攝像頭?！彼f。

當(dāng)微軟把GP T-4像核武器一樣裝進全產(chǎn)品線，從云計算到搜索引擎，從Word到PPT，打開每個微軟的應(yīng)用，都有一個內(nèi)核為GPT-4的AI助手站在那里，時刻等著被召喚。一時間，連蘋果都顯得不夠智能了。

沒有哪家公司會覺得自己在這樣的技術(shù)變革時代是安全的?！按竽Ｐ妥鳛锳I的一個新階段，肯定會帶來很多方面的變革，普通用戶未必看得見，但業(yè)務(wù)決策者看得到?！鄙鲜鲞_摩院內(nèi)部人士說，不論百度還是阿里巴巴，華為還是騰訊，都一定會努力去抓住由ChatGPT掀起的新浪潮。

但如何抓住潮流而不被潮流打翻，路徑并沒有那么明確。

3月16日的發(fā)布會上，李彥宏雖然把百度云計算的機遇放到了第一位，認為基于算力的游戲規(guī)則即將失效，基于模型的MaaS（model as a se rvice）能力將登場，但他也認為，“最大的機會既不在基礎(chǔ)服務(wù)，也不在行業(yè)服務(wù)，而在應(yīng)用。就像移動互聯(lián)網(wǎng)，最大機會不在iOS或安卓，而在微信、頭條等”。“殺手級應(yīng)用終將出現(xiàn)，人工智能會徹底改變今天的每一個行業(yè)?！崩顝┖暾f。

一個最容易想象的抓住機會的方式，就是把更強大的AI能力放到所有現(xiàn)有產(chǎn)品中去，就像微軟那樣。不出意外，百度很快就會在其搜索系統(tǒng)、云計算、小度智能音箱等產(chǎn)品中植入文心一言。阿里巴巴也把正在內(nèi)測的生成式AI放進了淘寶客服、天貓精靈、釘釘、夸克搜索。3月初，它才剛剛收購了一家文檔公司“我來”，看起來準備在微軟擅長的Office領(lǐng)域也找些翻身機會。至于騰訊，它說不定會直接在微信對話框里添加一個AI助手。

但在戴雨森看看，這些做法都只是新技術(shù)改變現(xiàn)有商業(yè)形態(tài)的第一個階段，“第一個階段都是新瓶裝舊酒，用新技術(shù)把已有場景再做一遍。到了第二階段，還會出現(xiàn)專屬于這個技術(shù)的商業(yè)模式。就像互聯(lián)網(wǎng)出現(xiàn)之初，人們只會使用它發(fā)郵件，后來有了信息黃頁，當(dāng)信息變多，搜索引擎就出現(xiàn)了；上網(wǎng)人數(shù)變多后，又出現(xiàn)了社交網(wǎng)絡(luò)；等到信息變得更多，推薦系統(tǒng)就出現(xiàn)了?！?/p>

一個可以想象的趨勢是，今后受歡迎的應(yīng)用、系統(tǒng)，其交互界面都將“以自然語言為中心”。1980年代，靠著用圖形界面取代代碼交互，Windows取代DOS，迅速占領(lǐng)并擴大了計算機市場。ChatGPT在3月24日推出的插件功能已部分顯示了這種野心：基于這種功能，用戶可以用自然語言指揮ChatGPT，讓它幫忙生成一個滿足用戶需求的插件。相當(dāng)于用戶對GPT這個智能管家說“幫我制造一把形狀像衣架的螺絲刀吧”，于是這位管家默默就端出了一把衣架形狀的螺絲刀給他。

“不僅交互是自然語言，以后的多模態(tài)也可能要以自然語言為中心，比如讓機器看到圖片后開始用自然語言思考，而不是在多種模態(tài)之間做信息的成對映射。”張家興說，甚至，未來人用自然語言去教會機器做各種事情也不無可能。

GPT-4也證明，當(dāng)模型有意“注意到”的token數(shù)量（你可以理解為字符數(shù)）變得更多，模型的確會更智能。而一旦像ChatGPT這樣的產(chǎn)品什么都能干，人們就越來越傾向于把它當(dāng)成唯一入口。

在這種平臺級的競爭游戲中，有一件事是明確的，那就是這些經(jīng)由互聯(lián)網(wǎng)時代拼殺留下來的大公司，都別無選擇地必須訓(xùn)練自己的人工智能大模型，并最好早日推出。不然誰也說不好自己會不會面臨Google當(dāng)下的尷尬。

好消息是，“大模型”這種東西，80分也能用。壞消息是，領(lǐng)先者的迭代速度已經(jīng)在加快。BERT發(fā)布到GPT-3誕生之間的周期是一年半，GPT-3到InstuctGPT（ChatGPT所基于的模型）的時間間隔差不多也是一年半，但GPT-4的發(fā)布時間與InstuctGPT之間只間隔了1年，距離ChatGPT的發(fā)布更是不到4個月。

根據(jù)北京智源人工智能研究院健康計算研究中心技術(shù)負責(zé)人黃文灝在一場AIGC相關(guān)論壇上談到的硅谷見聞，GPT-4在“去年8月”就訓(xùn)練完了，也就是ChatGPT發(fā)布之前。請注意，GPT-4并不是在GPT-3的基礎(chǔ)上優(yōu)化，而是重新搭建框架和算法并重新訓(xùn)練—它是另一套東西。意味著跟隨者如果想“彎道超車”，就要同時組建至少2個模型和團隊。

而且，從GPT-3開始，OpenAI就不再開源，對于GPT-4，OpenAI更是像保護商業(yè)機密一樣完全隱藏了其技術(shù)框架。這一做法已經(jīng)距離OpenAI最初創(chuàng)立的初衷—打破AI的技術(shù)壟斷—越來越遠，打破Google對AI的壟斷后，OpenAI成了新的壟斷者。

“技術(shù)細節(jié)才是壁壘?！盉ilibili一位算法工程師對《第一財經(jīng)》雜志說。他觀察到，相對于國內(nèi)大公司不得不跟進做大模型，很多中型互聯(lián)網(wǎng)公司多數(shù)處于觀望狀態(tài)。除了資金投入，人才更是稀缺。他聽說，中國公司從OpenAI的工程師團隊里挖人，給出的薪水已經(jīng)是其原有薪水的10倍。

根據(jù)戴雨森提供的消息，正在AIGC領(lǐng)域創(chuàng)業(yè)的王慧文會同時嘗試“大模型”和應(yīng)用生態(tài)兩個方向，因為“只做一個windows，沒有office其實也不行”，但同樣的困境是“頂級科學(xué)家是缺位的”。

下游的開發(fā)者們也已經(jīng)開始焦慮。3月17日，OpenAI把最新的ChatGPT plus以及API權(quán)限申請開放給了印度—依然沒有中國市場。這意味著，中國的開發(fā)者們即使想要在新大陸淘金，也沒有多少上游模型給他們部署應(yīng)用?！坝《饶沁叺膽?yīng)用生態(tài)一下子就可以被激活了。節(jié)奏和數(shù)量肯定不一樣了。”夏俊晨說。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

中國公司的追趕之旅