ChatGPT的崛起雖意外,卻也在情理之中。自GPT—3問世時(shí),我們就已預(yù)見到大模型的重要性,只是難以確定其突破時(shí)機(jī)。2023年,ChatGPT的出圈對(duì)整個(gè)產(chǎn)業(yè)產(chǎn)生了巨大的推動(dòng)作用。技術(shù)進(jìn)步可能是線性運(yùn)動(dòng),但信心則是跳躍式的。在技術(shù)未達(dá)到臨界點(diǎn)之前,公眾對(duì)其幾乎沒有信心。
因此,此輪風(fēng)暴主要源于信心的轉(zhuǎn)變,而非技術(shù)上的重大突破。以AI(人工智能)繪畫為例,該技術(shù)早已存在,但當(dāng)時(shí)人們對(duì)AI作畫興趣寥寥。2023年,即便我們不主動(dòng)提及,大家也會(huì)追問,渴望了解AI作畫。
第四范式擁有一個(gè)由100多名研究員組成的團(tuán)隊(duì),類似于公司的“達(dá)摩院”。對(duì)我們而言,大模型是一個(gè)不能錯(cuò)過的方向。
自2018年Google(谷歌)推出BERT模型起,我們便著手相關(guān)工作。盡管BERT當(dāng)時(shí)存在局限性,但GPT—3的出現(xiàn)為我們指明了技術(shù)發(fā)展的明確方向。我們?cè)诖诉^程中的投入與2023年有所不同,特別是在技術(shù)臨界點(diǎn)突破后,團(tuán)隊(duì)的士氣和信心大增。
信心問題一直困擾著我們。2022年若推出“式說”1.0和2.0版本,市場(chǎng)接受度恐怕不高。因此,盡管我們長(zhǎng)期儲(chǔ)備了大模型技術(shù),卻未給予足夠重視。技術(shù)臨界突破后,我們立即著手產(chǎn)品化,于是在2月和3月迅速推出了“式說”1.0、2.0版本。
在此過程中,我們面臨的主要挑戰(zhàn)是“可控性”問題。我們需要明確哪些事是可控的,哪些是不可控的,同時(shí)探索客戶對(duì)于可控與不可控范圍的接受度。以AI功能實(shí)現(xiàn)為例,即便準(zhǔn)確率高達(dá)99%,若無法滿足用戶的100%要求,便無法使用?;蛘咧辽賾?yīng)確保在指出錯(cuò)誤時(shí),AI能夠進(jìn)行自我迭代與修正。
對(duì)于大模型能力的涌現(xiàn),我們并不感到意外或激動(dòng),而是視為理所當(dāng)然。我們對(duì)自身大模型的評(píng)價(jià)是“理應(yīng)如此”。因此,在這波大模型投入上,我們未設(shè)明確上限,只要現(xiàn)金流允許,就會(huì)增加投入。目前,我們最高能產(chǎn)出千億(參數(shù))規(guī)模的模型或產(chǎn)品。
目前外界將AI分為1.0和2.0階段。過去的AI,是點(diǎn)上的AI,在參數(shù)規(guī)模達(dá)到1億或10億時(shí)便被廣泛接受。而現(xiàn)在熱議的AGI(人工通用智能),是面上的AI,其模型需達(dá)到一定參數(shù)量級(jí),方能展現(xiàn)可接受的能力。例如,參數(shù)規(guī)模低于100億的大語言模型,其能力難以被認(rèn)可。
過去我們尋求的AI應(yīng)用場(chǎng)景,如搜索引擎、資訊推薦、金融交易等,均需具備足夠大的價(jià)值,因?yàn)橐酝哪P蛢H適用于特定場(chǎng)景。如今,多模態(tài)大模型能力可成為底座,支撐多個(gè)場(chǎng)景。這就意味著,模型研發(fā)從以往注重投入產(chǎn)出比,轉(zhuǎn)變?yōu)楝F(xiàn)在全面升級(jí)換代。
過去點(diǎn)上的AI無法脫離軟件單獨(dú)存在,如抖音的推薦算法必須嵌入APP中才能為用戶服務(wù)。如今,AI技術(shù)帶來的巨大機(jī)遇在于,它有望推動(dòng)整個(gè)軟件產(chǎn)業(yè),包括to?C(面對(duì)企業(yè))和to?B(面對(duì)消費(fèi)者)領(lǐng)域再次升級(jí)換代。
在大模型的實(shí)際應(yīng)用上,我一直認(rèn)為其將首先變革to?B行業(yè)。由于B端企業(yè)軟件的起點(diǎn)相對(duì)較低,可改進(jìn)空間更大。這就像二維碼支付在中國(guó)迅速普及,但在信用卡業(yè)務(wù)高度發(fā)達(dá)的美國(guó)卻難以推廣一樣。
中國(guó)的to?C軟件在過去十余年里已發(fā)展至較高水平,而B端企業(yè)軟件更注重功能且交互門檻較高。AI大模型引入的新交互模式(如對(duì)話框式),有望創(chuàng)造出交互簡(jiǎn)潔、功能全面且能自我優(yōu)化的新型軟件工作流,提升B端軟件的用戶體驗(yàn)。此外,在開發(fā)層面,傳統(tǒng)的B端軟件采用菜單式開發(fā),功能更新周期長(zhǎng),而AI在改寫數(shù)據(jù)和API(應(yīng)用程序編程接口)方面的效率遠(yuǎn)超以往,從而將軟件迭代周期縮短至以天為單位,無論用戶體驗(yàn),還是開發(fā)者體驗(yàn),都得到了飛躍式提升。
ChatGPT的出現(xiàn)提升了客戶對(duì)AI的接受度和信心,也推動(dòng)市場(chǎng)的發(fā)展。我們正與各行業(yè)客戶,包括金融、能源、運(yùn)營(yíng)商、零售和醫(yī)療等,共同推動(dòng)技術(shù)產(chǎn)品的實(shí)際應(yīng)用。同時(shí),技術(shù)的迅速發(fā)展也提高了我們吸引新客戶的效率。
關(guān)于大模型的商業(yè)模式,我認(rèn)為最適合的盈利點(diǎn)是算力。AI算力的重要性不容忽視,例如,每次訪問ChatGPT都會(huì)消耗一定的算力資源,這種按使用量計(jì)費(fèi)的模式非常合理。關(guān)于to?C領(lǐng)域,我們雖無明確商業(yè)計(jì)劃,但會(huì)持續(xù)保持開放的態(tài)度。
近期,我們這家to?B科技公司的工作模式愈發(fā)趨向于互聯(lián)網(wǎng)企業(yè)的風(fēng)格。過去在互聯(lián)網(wǎng)公司,快速迭代是常態(tài),每天都會(huì)創(chuàng)新并實(shí)驗(yàn),依據(jù)結(jié)果持續(xù)優(yōu)化。盡管第四范式是一家高科技企業(yè),主要從事to?B業(yè)務(wù),但我們的迭代和反饋周期正逐漸加快。在to?B軟件企業(yè)中,我們每年更新兩個(gè)大版本已算迅速迭代。
過去,每個(gè)月甚至每天迭代對(duì)我們而言是難以想象的,然而,在ChatGPT的交互模式影響下,我們的產(chǎn)品和技術(shù)研發(fā)流程已經(jīng)發(fā)生了深刻變革。傳統(tǒng)上,研究部門開發(fā)的算法需經(jīng)歷工程化、產(chǎn)品化到解決方案的漫長(zhǎng)過程,至少耗時(shí)一年,甚至兩到三年才能推向市場(chǎng)。而現(xiàn)在,借助AI的力量,我們研究團(tuán)隊(duì)的成果能在一兩天內(nèi)迅速進(jìn)入產(chǎn)品階段。
團(tuán)隊(duì)如今的工作體驗(yàn)與以往截然不同。以前,我們百余人的研究團(tuán)隊(duì)在外界鮮為人知,因?yàn)檠芯砍晒辽傩枰荒瓴拍軐?shí)現(xiàn)商業(yè)價(jià)值,這期間,我們只能自我激勵(lì)。但現(xiàn)在,新成果一旦出現(xiàn),就能迅速被大眾看見并對(duì)產(chǎn)業(yè)產(chǎn)生影響。我們很享受這種類似互聯(lián)網(wǎng)公司的運(yùn)作模式——快速迭代、不斷試錯(cuò),并與客戶共同打磨產(chǎn)品。這不僅提升了產(chǎn)品能力,還讓我們與客戶更緊密地協(xié)作,共同進(jìn)步。
關(guān)于公司的發(fā)展愿景,早在創(chuàng)業(yè)初期,我便與其他創(chuàng)始人探討過這個(gè)話題。我們期望人們或許不熟悉戴文淵這個(gè)名字,但提起第四范式,卻人人皆知,至于創(chuàng)始人身份,或許需要查閱一番。許多海外企業(yè)的創(chuàng)始人已逐漸“隱身”,例如IBM和微軟,即便創(chuàng)始人不再活躍,公司依舊蓬勃發(fā)展。雖然創(chuàng)業(yè)公司鮮有能達(dá)到此境界者,但我們寄希望于第四范式有朝一日能實(shí)現(xiàn)這一目標(biāo)。