国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國公司的追趕之旅

2023-04-14 00:54:10王姍姍
第一財經(jīng) 2023年4期
關(guān)鍵詞:開發(fā)者百度產(chǎn)品

王姍姍

ChatGPT發(fā)布4個多月后,中國有了第一個國產(chǎn)的“類ChatGPT”產(chǎn)品。

3月16日,百度創(chuàng)始人、董事長兼CEO李彥宏親自站到臺前,演示了他的團隊“趕工”出來的知識增強大語言模型—“文心一言”。產(chǎn)品體驗談不上驚艷—它會的文學(xué)創(chuàng)作、商業(yè)文案寫作、解數(shù)學(xué)題,ChatGPT都會,而且會得更多。

此前一天,OpenAI正式發(fā)布了GPT-4,增加了多模態(tài),會畫畫,也會寫代碼,能將一張手繪草圖一鍵變成真正的網(wǎng)頁。

不過,公眾對于百度這場發(fā)布會最失望的部分,是李彥宏發(fā)布這個自由對話產(chǎn)品的方式—錄播。李彥宏人在現(xiàn)場,但是他所演示的文心一言對問題的回答都是事先錄制好的。這么做的目的,像是要確保百度的大模型給出的案例,不會像幾周前Google發(fā)布聊天機器人Bard時那樣翻車。

3月16日,百度創(chuàng)始人、董事長兼CEO李彥宏出席百度大語言模型“文心一言”產(chǎn)品發(fā)布會。

這場謹慎的發(fā)布會,其實籌備得十分匆忙。最早的消息來自彭博社,其1月30日的報道中第一次透露“中國搜索巨頭百度正計劃推出一款類似于ChatGPT的人工智能聊天機器人服務(wù)”。當(dāng)時距離OpenAI推出ChatGPT只過去了兩個月,Google和Facebook都未承諾何時做出一個同類的產(chǎn)品。

百度文心一言發(fā)布會的背后,還存在兩種說法。一種說法是,ChatGPT發(fā)布之后,政府高層主動詢問過百度:這樣的技術(shù)做不做得出來?“AI有風(fēng)險,百度知道這一點,政府也知道。”一位百度內(nèi)部人士對《第一財經(jīng)》雜志說。

另一種說法則是,百度不會直接發(fā)布產(chǎn)品,只會發(fā)布一個demo。原因是,所有類ChatGPT產(chǎn)品在發(fā)布前都要經(jīng)過來自省網(wǎng)信辦和中央網(wǎng)信辦的“雙信評審”。提供這則消息的人士告訴《第一財經(jīng)》雜志,這是ChatGPT發(fā)布之后出現(xiàn)的新政策,國內(nèi)迄今沒有一家公司拿到許可,ChatGPT也沒有拿到。

百度不是唯一對發(fā)布一款自由對話的AI產(chǎn)品持謹慎態(tài)度的公司。百度發(fā)布會的前兩天,騰訊在其北京總部舉辦了媒體溝通會,邀請來自騰訊AI Lab和云計算的7位技術(shù)負責(zé)人,為上百家媒體講解騰訊在AI領(lǐng)域的工作成果。溝通會為“閉門”形式,參會媒體須經(jīng)騰訊官方確認,才能對外發(fā)布溝通會中的信息。同期,阿里巴巴則以“正在開發(fā)的人機對話產(chǎn)品是商業(yè)機密”為由,婉拒了《第一財經(jīng)》雜志的采訪。

公平一點說,在公眾對ChatGPT的狂熱認同面前,硅谷大公司的姿態(tài)也沒好到哪兒去。Google被迫應(yīng)戰(zhàn)發(fā)布的Bard表現(xiàn)并不比ChatGPT差,只因為給出的答案里出現(xiàn)了一個事實性錯誤,就被投資者用拋售股票投了唱衰票。Facebook發(fā)布的開源語言大模型LLaMA在市場上也并沒有激起多少水花。

“市場很殘酷,3月14日Google放出自家大語言模型PaLM的API接口后,我在相關(guān)開發(fā)者社群搜索了下,結(jié)果討論度是0。”即刻Hack Engine聯(lián)合發(fā)起人夏俊晨對《第一財經(jīng)》雜志說,他感覺ChatGPT發(fā)布之后席卷了整個行業(yè),并成為一種事實標準,開發(fā)者對其他與之競爭的模型的態(tài)度恨不得是“要求它們開放給開發(fā)者的接口的定義、參數(shù)都要跟ChatGPT一樣”。

一瞬間,全球技術(shù)大廠都被一個叫OpenAI的小公司教訓(xùn)了—除了微軟,后者運氣不錯地在2019年就投資了OpenAI。如同當(dāng)年蘋果用iPod教訓(xùn)索尼,再用智能手機改寫IBM、微軟和諾基亞的命運一樣,OpenAI的故事看起來似乎是顛覆式創(chuàng)新的典型范式,但它在中國留下的故事版本和在硅谷書寫的并不那么相同:在硅谷,技術(shù)巨頭們都是參賽者;在中國,大廠們只是追趕者。

與外界在今年年初才感受到來自AI技術(shù)變革的沖擊不同,夏俊晨最早感受到?jīng)_擊是在2021年,GitHub推出代碼補全工具Copilot的時候。GitHub是全球最大的源代碼服務(wù)平臺,開發(fā)者可以在其中討論問題,也可以使用其提供的工具撰寫代碼。2018年,微軟收購了這家公司,2021年作為代碼補全工具的Copilot被推出。

“當(dāng)時GP T-3出來不久,它(指Copilot)的準確性讓我第一次覺得一個工具真的有一點人工智能的味道了。”夏俊晨說,作為產(chǎn)品開發(fā)者,他對自然語言類AI沒有那么敏感,但Copilot這樣的A I助手一面世,他就感受到它的不一樣。

人工智能領(lǐng)域的科學(xué)家們感受到的沖擊則要來得更早—2018年—而且,至今已出現(xiàn)了3次。

第一次沖擊是BERT預(yù)訓(xùn)練語言模型的出現(xiàn)。

“ 原本在自然語言處理( NaturalLanguageProcessing, NLP)領(lǐng)域的狀況是,大家要為了不同任務(wù)設(shè)計不同的模型,領(lǐng)域之間是相互割裂的,各有各的算法專家。但是BERT一出來就告訴大家,不管你是什么任務(wù),用BERT一個結(jié)構(gòu)就可以了。你叫它范式變化也不為過?!被浉郯拇鬄硡^(qū)數(shù)字經(jīng)濟研究院認知計算與自然語言研究中心負責(zé)人張家興對《第一財經(jīng)》雜志說。

在每個以AI能力著稱的公司中,處理語言數(shù)據(jù)的N L P 和處理視覺數(shù)據(jù)的CV(ComputerVision)是最基本的工程師配備。正是基于他們在底層對語言和視覺數(shù)據(jù)的處理,運用在公司前臺的各種推薦算法才能跑得起來。在BERT出現(xiàn)之前,N L P是個名類繁多的領(lǐng)域,從文本分類到機器翻譯,從閱讀理解到文章分級,或者垃圾郵件探測,工程師們會為每個“任務(wù)”開發(fā)專用的AI模型。以AI能力標榜自身的互聯(lián)網(wǎng)公司們最喜歡宣揚的,就是他們工具庫里的模型數(shù)量有多少。

BERT扭轉(zhuǎn)了這股舊習(xí)氣。作為Google在2018年推出的自然語言處理模型,它“以一敵百”,光參數(shù)就達到3個億,比稍早推出的GPT-1還要多。

第一次沖擊剛發(fā)生沒多久,第二次沖擊就來了。BERT發(fā)布一年半后,2020年5月,OpenAI發(fā)布了GPT-3,訓(xùn)練參數(shù)一下子從第二代的幾百億躍升至1750億。

兩次沖擊后,國內(nèi)學(xué)術(shù)界和工業(yè)界都出現(xiàn)過仿制潮。BERT發(fā)布的時候,張家興還在螞蟻金服工作。沒過多久他就發(fā)現(xiàn),學(xué)界還在NL P領(lǐng)域做研究的人要發(fā)表論文時,都會思考要不要跟BERT對比一下效果,但是“比了又大概率比不過”。幾乎半年之內(nèi),幾乎所有做研究的以及在工業(yè)界做落地的,都采用了BERT結(jié)構(gòu)。

類似的情形在GPT-3發(fā)布后再次出現(xiàn),但使用者和跟隨仿制者都少了很多—只剩大公司還能勉強跟上。

“GPT-3效果比BERT好很多很多。它讓大家看到了一個模型可以大到何種程度,而且大家終于認識到把模型做大這件事情很重要,模型大了就會涌現(xiàn)出各種能力。”張家興說,但“因為模型太大了,很少有人能在本地跑起來”。另一個阻礙了大規(guī)模仿制性研究的原因,是GPT-3沒有開源。

但阿里巴巴還是想辦法仿制了它。根據(jù)阿里巴巴一位內(nèi)部人士的說法,阿里巴巴達摩院2021年4月發(fā)布的中文語言模型PLUG的確參照了GP T-3,它有270億參數(shù),外界也稱之為“中文版GP T-3”。同年年初,達摩院還發(fā)布了一個叫M6的多模態(tài)大模型,參數(shù)超過百億,能處理文與圖之間的相互轉(zhuǎn)換,曾于當(dāng)年的雙11在犀牛工廠里為顧客設(shè)計衣服,后來也被加載到了小鵬汽車的自動駕駛系統(tǒng)中。

緊接著,華為云同樣在2021年4月發(fā)布了“盤古”大模型,包括基于Transformer的視覺預(yù)訓(xùn)練和中文語言預(yù)訓(xùn)練模型,參數(shù)據(jù)稱分別達到了30億和“千億級”。同年7月,百度的大模型升級至ERNIE 3.0(文心3.0),第一次達到百億參數(shù)。

暫且不看模型大?。℅PT-3這時候的參數(shù)規(guī)模為1750億),僅論有無,與Open AI相比,阿里巴巴、華為和百度在“大模型”上的進度大約晚了一年。騰訊還要再晚一年,直到2022年4月,才首次披露其第一個基于Transfor mer的模型“混元”的進展。

不久之后,ChatGPT就出世了。AI科學(xué)家們感受到了來自大模型的“第三次沖擊”。

“GPT-3很強大,但當(dāng)時擺在大家面前的問題是,這樣的大模型該怎么落地呢?怎么讓它有商業(yè)價值?這是擺在所有人面前的困難。”張家興說,GPT-3沒有解決這個問題,它的模仿者們沒有解決,最后OpenAI自己解決了。

事實上,從BERT到GPT-3(還有GPT-1、GPT-2、InstructGPT等一系列模型)都只是基礎(chǔ)模型,它們具備處理語言的能力,但除了被工程師拿去做做測試題,其他什么也做不了。ChatGP T第一次把這些能力變?yōu)榱恕伴_箱即用”的C端產(chǎn)品:寫文章、問答、做摘要、翻譯,甚至猜燈謎、寫代碼等等,在每個任務(wù)上OpenAI都對它做了專門訓(xùn) 練。

“它(指OpenAI)找到了一種極簡的產(chǎn)品形態(tài)—對話,這個是最大的創(chuàng)新?!币晃灰竽涿倪_摩院內(nèi)部人士對《第一財經(jīng)》雜志稱,跟隨GPT-3仿制出PLUG后,阿里巴巴也推出了相應(yīng)的生成式產(chǎn)品,并開放公眾測試,但那個產(chǎn)品并非一問一答的對話形態(tài),而是續(xù)寫,敲出前幾個字,它會自動續(xù)寫一個故事或一篇商業(yè)文稿。

2020年,騰訊啟動過一個叫文涌(Effidit)的寫作助手項目,主要功能也是續(xù)寫—從各個維度補全創(chuàng)作者寫出的句子或文章?!皬谋O(jiān)管層面講,國內(nèi)大廠不會優(yōu)先考慮做一個C端的、大家可以任意提問的AI?!鄙鲜鲞_摩院人士說。產(chǎn)品形態(tài)既能決定一款產(chǎn)品是否能引爆大眾,也能影響開發(fā)者的技術(shù)路徑。

ChatGPT引爆市場后,幾乎所有人都進入了興奮與焦慮兼?zhèn)涞臓顟B(tài)。

3月6日,即刻創(chuàng)始人葉錫東在其社交賬號上發(fā)帖,宣布啟動Hack Engine項目,孵化AI應(yīng)用創(chuàng)業(yè)項目,每個在Demo Day錄取的團隊將獲得30萬美元啟動資金以及新的孵化器提供的全方面的創(chuàng)業(yè)資源幫助。

“現(xiàn)在可能還很難看出哪個才是10億美元的機會,一個團隊現(xiàn)在做的東西也不一定是最終做的那個東西,但可以肯定的是,那個最終跑出來的團隊,現(xiàn)在肯定已經(jīng)進場了?!毕目〕空f。在硅谷,創(chuàng)業(yè)孵化器YCombirator上一批投的項目中8個與AIGC相關(guān),最新一季中,這個數(shù)字增長到了53個。

今年更早時候,真格基金也在通過官方賬號發(fā)出了“A I英雄帖”,尋覓與AIGC相關(guān)的項目和人才,其中一筆資金投給了美團前聯(lián)合創(chuàng)始人王慧文。3月19日,創(chuàng)新工場CEO李開復(fù)也入局了。他在朋友圈稱,正在籌組一個全球化公司Project AI 2.0,不僅要做中文版ChatGPT,也會關(guān)注基于大模型的應(yīng)用。

“如果說GPT-3發(fā)現(xiàn)了新大陸,ChatGPT的出現(xiàn)就是在新大陸上發(fā)現(xiàn)了黃金?!闭娓窕鸸芾砗匣锶舜饔晟f。夏俊晨的感知是:開發(fā)者非常積極地在嘗試各種新的應(yīng)用場景,大家的想象都被激發(fā)出來了,每天都有非常多新的應(yīng)用上線,你的idea晚上線幾天,其他三四個團隊已經(jīng)做出來了。

一些人的機會常常是另一些人的危險。戴雨森多年來是一款在線筆記軟件的忠誠用戶,但嘗試過加載了GPT-3的Notion后,他迅速拋棄了筆記軟件?!熬拖衲懔?xí)慣了有拍照功能的手機之后,很難再去適應(yīng)一個手機沒有攝像頭?!彼f。

當(dāng)微軟把GP T-4像核武器一樣裝進全產(chǎn)品線,從云計算到搜索引擎,從Word到PPT,打開每個微軟的應(yīng)用,都有一個內(nèi)核為GPT-4的AI助手站在那里,時刻等著被召喚。一時間,連蘋果都顯得不夠智能了。

沒有哪家公司會覺得自己在這樣的技術(shù)變革時代是安全的?!按竽P妥鳛锳I的一個新階段,肯定會帶來很多方面的變革,普通用戶未必看得見,但業(yè)務(wù)決策者看得到?!鄙鲜鲞_摩院內(nèi)部人士說,不論百度還是阿里巴巴,華為還是騰訊,都一定會努力去抓住由ChatGPT掀起的新浪潮。

但如何抓住潮流而不被潮流打翻,路徑并沒有那么明確。

3月16日的發(fā)布會上,李彥宏雖然把百度云計算的機遇放到了第一位,認為基于算力的游戲規(guī)則即將失效,基于模型的MaaS(model as a se rvice)能力將登場,但他也認為,“最大的機會既不在基礎(chǔ)服務(wù),也不在行業(yè)服務(wù),而在應(yīng)用。就像移動互聯(lián)網(wǎng),最大機會不在iOS或安卓,而在微信、頭條等”。“殺手級應(yīng)用終將出現(xiàn),人工智能會徹底改變今天的每一個行業(yè)?!崩顝┖暾f。

一個最容易想象的抓住機會的方式,就是把更強大的AI能力放到所有現(xiàn)有產(chǎn)品中去,就像微軟那樣。不出意外,百度很快就會在其搜索系統(tǒng)、云計算、小度智能音箱等產(chǎn)品中植入文心一言。阿里巴巴也把正在內(nèi)測的生成式AI放進了淘寶客服、天貓精靈、釘釘、夸克搜索。3月初,它才剛剛收購了一家文檔公司“我來”,看起來準備在微軟擅長的Office領(lǐng)域也找些翻身機會。至于騰訊,它說不定會直接在微信對話框里添加一個AI助手。

但在戴雨森看看,這些做法都只是新技術(shù)改變現(xiàn)有商業(yè)形態(tài)的第一個階段,“第一個階段都是新瓶裝舊酒,用新技術(shù)把已有場景再做一遍。到了第二階段,還會出現(xiàn)專屬于這個技術(shù)的商業(yè)模式。就像互聯(lián)網(wǎng)出現(xiàn)之初,人們只會使用它發(fā)郵件,后來有了信息黃頁,當(dāng)信息變多,搜索引擎就出現(xiàn)了;上網(wǎng)人數(shù)變多后,又出現(xiàn)了社交網(wǎng)絡(luò);等到信息變得更多,推薦系統(tǒng)就出現(xiàn)了?!?/p>

一個可以想象的趨勢是,今后受歡迎的應(yīng)用、系統(tǒng),其交互界面都將“以自然語言為中心”。1980年代,靠著用圖形界面取代代碼交互,Windows取代DOS,迅速占領(lǐng)并擴大了計算機市場。ChatGPT在3月24日推出的插件功能已部分顯示了這種野心:基于這種功能,用戶可以用自然語言指揮ChatGPT,讓它幫忙生成一個滿足用戶需求的插件。相當(dāng)于用戶對GPT這個智能管家說“幫我制造一把形狀像衣架的螺絲刀吧”,于是這位管家默默就端出了一把衣架形狀的螺絲刀給他。

“不僅交互是自然語言,以后的多模態(tài)也可能要以自然語言為中心,比如讓機器看到圖片后開始用自然語言思考,而不是在多種模態(tài)之間做信息的成對映射。”張家興說,甚至,未來人用自然語言去教會機器做各種事情也不無可能。

GPT-4也證明,當(dāng)模型有意“注意到”的token數(shù)量(你可以理解為字符數(shù))變得更多,模型的確會更智能。而一旦像ChatGPT這樣的產(chǎn)品什么都能干,人們就越來越傾向于把它當(dāng)成唯一入口。

在這種平臺級的競爭游戲中,有一件事是明確的,那就是這些經(jīng)由互聯(lián)網(wǎng)時代拼殺留下來的大公司,都別無選擇地必須訓(xùn)練自己的人工智能大模型,并最好早日推出。不然誰也說不好自己會不會面臨Google當(dāng)下的尷 尬。

好消息是,“大模型”這種東西,80分也能用。壞消息是,領(lǐng)先者的迭代速度已經(jīng)在加快。BERT發(fā)布到GPT-3誕生之間的周期是一年半,GPT-3到InstuctGPT(ChatGPT所基于的模型)的時間間隔差不多也是一年半,但GPT-4的發(fā)布時間與InstuctGPT之間只間隔了1年,距離ChatGPT的發(fā)布更是不到4個 月。

根據(jù)北京智源人工智能研究院健康計算研究中心技術(shù)負責(zé)人黃文灝在一場AIGC相關(guān)論壇上談到的硅谷見聞,GPT-4在“去年8月”就訓(xùn)練完了,也就是ChatGPT發(fā)布之前。請注意,GPT-4并不是在GPT-3的基礎(chǔ)上優(yōu)化,而是重新搭建框架和算法并重新訓(xùn)練—它是另一套東西。意味著跟隨者如果想“彎道超車”,就要同時組建至少2個模型和團隊。

而且,從GPT-3開始,OpenAI就不再開源,對于GPT-4,OpenAI更是像保護商業(yè)機密一樣完全隱藏了其技術(shù)框架。這一做法已經(jīng)距離OpenAI最初創(chuàng)立的初衷—打破AI的技術(shù)壟斷—越來越遠,打破Google對AI的壟斷后,OpenAI成了新的壟斷者。

“技術(shù)細節(jié)才是壁壘?!盉ilibili一位算法工程師對《第一財經(jīng)》雜志說。他觀察到,相對于國內(nèi)大公司不得不跟進做大模型,很多中型互聯(lián)網(wǎng)公司多數(shù)處于觀望狀態(tài)。除了資金投入,人才更是稀缺。他聽說,中國公司從OpenAI的工程師團隊里挖人,給出的薪水已經(jīng)是其原有薪水的10倍。

根據(jù)戴雨森提供的消息,正在AIGC領(lǐng)域創(chuàng)業(yè)的王慧文會同時嘗試“大模型”和應(yīng)用生態(tài)兩個方向,因為“只做一個windows,沒有office其實也不行”,但同樣的困境是“頂級科學(xué)家是缺位的”。

下游的開發(fā)者們也已經(jīng)開始焦慮。3月17日,OpenAI把最新的ChatGPT plus以及API權(quán)限申請開放給了印度—依然沒有中國市場。這意味著,中國的開發(fā)者們即使想要在新大陸淘金,也沒有多少上游模型給他們部署應(yīng)用?!坝《饶沁叺膽?yīng)用生態(tài)一下子就可以被激活了。節(jié)奏和數(shù)量肯定不一樣了。”夏俊晨說。

猜你喜歡
開發(fā)者百度產(chǎn)品
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
16%游戲開發(fā)者看好VR
CHIP新電腦(2016年3期)2016-03-10 13:06:42
百度遭投行下調(diào)評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
2015產(chǎn)品LOOKBOOK直擊
Coco薇(2015年1期)2015-08-13 02:23:50
iOS開發(fā)者調(diào)查
電腦迷(2015年8期)2015-05-30 12:27:10
iOS開發(fā)者調(diào)查
電腦迷(2015年4期)2015-05-30 05:24:09
百度“放衛(wèi)星”,有沒有可能?
太空探索(2014年4期)2014-07-19 10:08:58
安卓開發(fā)者之煩惱
新產(chǎn)品
玩具(2009年10期)2009-11-04 02:33:14
浑源县| 邵阳县| 勐海县| 永善县| 井研县| 临湘市| 巴林左旗| 泾源县| 东台市| 徐闻县| 泰来县| 饶河县| 株洲县| 镇康县| 五家渠市| 白城市| 金华市| 昌邑市| 蒲城县| 镇巴县| 剑川县| 滕州市| 泰安市| 饶河县| 定襄县| 兴业县| 云霄县| 霍城县| 岑溪市| 鸡西市| 日土县| 桦川县| 六枝特区| 宁武县| 枝江市| 临城县| 日照市| 吉安市| 河南省| 宁化县| 巴东县|