麥肯錫公司
2022年,全球GenAI市場整體收入為400億美元,預(yù)計2027年及2032年將分別達(dá)到3990億美元和1.3萬億美元,2022—2032年復(fù)合增長率高達(dá)42%。
我們預(yù)計,2022—2035年全球市場規(guī)模增量,主要來源于訓(xùn)練側(cè)硬件、廣告應(yīng)用和軟件。
其中,在訓(xùn)練側(cè)硬件方面的增量約4440億美元;在廣告應(yīng)用方面,相關(guān)年復(fù)合增長率將達(dá)到125%,增量達(dá)1924億美元;軟件方面,約2800億美元的增量中,GenAI助理軟件增量最為可觀,達(dá)890億美元。
2022年中國GenAI市場規(guī)模約人民幣660億元,預(yù)計2020—2025年復(fù)合增速將達(dá)84%,到2025年將占全球市場規(guī)模(2170億美元)的13%。
過去兩年,國內(nèi)GenAI融資市場熱度持續(xù)上升,前十大融資事件總規(guī)模達(dá)8.7億美元。其中,已有領(lǐng)先的端到端AI制藥公司、大模型初創(chuàng)公司等頭部企業(yè),獲得逾2億美元的單筆融資。
我們將結(jié)合GenAI價值鏈,探討中國GenAI技術(shù)棧和商業(yè)應(yīng)用的發(fā)展現(xiàn)狀。
由于無法獲得高端GPU(圖形處理器)芯片A100與H100,國內(nèi)大模型研發(fā)機構(gòu)在算力上遭遇瓶頸。為應(yīng)對上述困境,中國本土芯片研發(fā)廠商加強科研,在算力技術(shù)上實現(xiàn)重要突破。
目前,中國市場可以獲得的A800 GPU芯片,傳輸速度僅為頂尖產(chǎn)品 A100的70%。
由于AI技術(shù)發(fā)展高度依賴先進GPU,需借助芯片進行大量模型訓(xùn)練和擴展,部分國內(nèi)科研機構(gòu)和科技企業(yè)因此受到較大影響,尤其是在目前大模型參數(shù)量快速膨脹、算力需求顯著增加的情況下。
為了應(yīng)對算力瓶頸,國內(nèi)領(lǐng)先算力芯片公司力求在產(chǎn)品端實現(xiàn)突破。
例如,國內(nèi)某量產(chǎn)商業(yè)人工智能芯片廠商,在頭部大型云服務(wù)提供商旗下一款知識增強大語言模型產(chǎn)品中,實現(xiàn)了對部分業(yè)務(wù)場景的部署;某專注于通用GPU芯片及解決方案研發(fā)及銷售的高科技公司,和另一計算機圖形芯片設(shè)計公司則希望開發(fā)出性能接近高端芯片的產(chǎn)品。
全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商旗下的人工智能處理器,則被用于內(nèi)部大模型開發(fā)訓(xùn)練。
目前,國產(chǎn)GPU的算力規(guī)模大多在1000TOPS以內(nèi),上述計算機圖形芯片設(shè)計公司已能達(dá)到2000TOPS,距離國際領(lǐng)先的H100芯片仍有一定差距,其算力高達(dá)4000TOPS。
在云平臺領(lǐng)域,國內(nèi)和海外市場均呈現(xiàn)頭部廠商占據(jù)絕對主導(dǎo)地位的壟斷格局。2022年,國內(nèi)四家頭部廠商占據(jù)國內(nèi)79%的市場份額;在海外市場,截至2023年一季度,前三大廠商占據(jù)全球65%的市場份額。
由于國內(nèi)云計算行業(yè)發(fā)展尚未成熟,目前以定制化程度較高、毛利率低的IaaS為主,相關(guān)支出占比70%,PaaS和SaaS僅占30%;而全球云計算市場則恰好相反,IaaS支出占比28%,PaaS和SaaS占比72%。
展望未來,我們預(yù)計,海內(nèi)外頭部廠商的客戶群體將持續(xù)分化,國內(nèi)GenAI廠商將更多依賴國內(nèi)云平臺完成模型訓(xùn)練與調(diào)整。
在通用大模型方面,截至2023年5月,中國已發(fā)布79個10億參數(shù)級以上的大模型,在大模型發(fā)布數(shù)量上位居全球第二,僅次于美國。在全球模型發(fā)布數(shù)量前十的GenAI大模型廠商中,中國研發(fā)機構(gòu)及廠商占據(jù)4席。
通用大模型需要海量數(shù)據(jù)作訓(xùn)練用途,中文網(wǎng)站數(shù)量從全球來看,占比僅為1.4%(英文網(wǎng)站占比達(dá)54%),可用作訓(xùn)練的公開中文語料庫(含文本、圖片、視頻等素材)往往數(shù)量有限、質(zhì)量不均。
與此同時,國內(nèi)用戶在網(wǎng)站和移動端App產(chǎn)生的海量數(shù)據(jù),基于保護用戶隱私的原因,大部分也未能應(yīng)用在大模型訓(xùn)練上,對模型訓(xùn)練的效率和精度都造成不利影響。
資料來源:《中國AI 數(shù)字商業(yè)產(chǎn)業(yè)展望2021—2025》,前瞻產(chǎn)業(yè)研究院、中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟聯(lián)合發(fā)布
盡管在訓(xùn)練數(shù)據(jù)上受到諸多限制,中國通用大模型技術(shù)仍然不斷追趕國際領(lǐng)先水平,參數(shù)規(guī)模緊跟國際領(lǐng)先水準(zhǔn)并實現(xiàn)快速提升。
相較于適用于多領(lǐng)域、多任務(wù)的通用大模型,行業(yè)大模型更依賴于開發(fā)者對垂直場景的理解和海量行業(yè)數(shù)據(jù)支持,在算力受限的背景下,行業(yè)大模型更有可能成為中國GenAI廠商的制勝賽道。
就行業(yè)大模型而言,國內(nèi)市場正呈現(xiàn)差異化競爭格局:某頭部互聯(lián)網(wǎng)大廠的行業(yè)大模型根植于游戲、廣告、內(nèi)容創(chuàng)作等多媒體領(lǐng)域,成為提升廣告和游戲場景創(chuàng)作效率的生產(chǎn)力工具;
國內(nèi)前三的超大規(guī)模云服務(wù)商開發(fā)的產(chǎn)業(yè)級知識增強大模型則憑借其對中文語言的強大理解能力,賦能汽車行業(yè)售后服務(wù)與知識庫構(gòu)建、醫(yī)療行業(yè)單據(jù)識別、社科行業(yè)版權(quán)保護與詞條管理等;
某全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商旗下的包含NLP、CV、多模態(tài)和科學(xué)計算的中文大模型,則在工業(yè)物流、新藥研發(fā)、氣象預(yù)測等領(lǐng)域得到廣泛應(yīng)用。
資料來源: 漢能資本
海外市場圍繞可自由調(diào)整代碼的開源模型,已涌現(xiàn)出一批獨立廠商,可實現(xiàn)模型訓(xùn)練和微調(diào)、模型部署、模型應(yīng)用開發(fā)等細(xì)分技術(shù)功能。
隨著國內(nèi)GenAI市場的不斷發(fā)展,各種開發(fā)和維護工具等也將逐漸成熟。
中國GenAI領(lǐng)域的創(chuàng)業(yè)公司融資輪次靠前,集中在天使輪到Pre-A 輪之間,融資金額大多小于1億元人民幣,正處于方興未艾的發(fā)展初期,行業(yè)潛力巨大。
其中,某全球領(lǐng)先的跨國科技公司旗下的人工智能聊天機器人作為準(zhǔn)獨角獸企業(yè),于2022年11月完成10億元A+輪融資,投后估值約10億美元。
反觀海外GenAI行業(yè),科創(chuàng)企業(yè)規(guī)模體量相對較大,涌現(xiàn)出多家細(xì)分應(yīng)用領(lǐng)域獨角獸企業(yè),其中某總部位于倫敦的全球化AI研究型企業(yè)估值高達(dá)38億美元。
中國GenAI垂直應(yīng)用領(lǐng)域主要聚焦文本、圖像和音視頻生成,海外市場則在上述領(lǐng)域以外出現(xiàn)了大量基于GenAI的開發(fā)平臺、數(shù)據(jù)分析平臺及代碼編寫平臺,其原因在于海外以早期程序語言(如COBOL)編寫的系統(tǒng)較多,許多企業(yè)面臨較高編程人力成本,因此對編程輔助軟件有較高需求。
同時,目前中國GenAI企業(yè)目標(biāo)客群多為終端用戶,而海外市場在大規(guī)模企業(yè)客戶群體,隨著中國SaaS市場成熟以及企業(yè)付費意愿提升,預(yù)計國內(nèi)文本生成和圖像生成初創(chuàng)企業(yè)將快速拓展至企業(yè)客戶市場。
由于海內(nèi)外GenAI行業(yè)尚處于快速發(fā)展期,基于大模型產(chǎn)品的服務(wù)市場潛力還未被充分挖掘,服務(wù)市場有待進一步發(fā)展。
中國GenAI企業(yè)利用國內(nèi)垂直場景優(yōu)勢,將GenAI優(yōu)先應(yīng)用于商業(yè)化基礎(chǔ)設(shè)施較完善的新興行業(yè)中;而歐美同行則利用當(dāng)?shù)爻墒斓?SaaS市場,將GenAI應(yīng)用到高科技、通信及各種傳統(tǒng)行業(yè)(如醫(yī)療、 教育等),應(yīng)用范圍更加廣泛。
在國內(nèi),GenAI應(yīng)用發(fā)展最迅速的領(lǐng)域包括電商、傳媒、娛樂和游戲,尤其是數(shù)字虛擬人和電商視頻營銷,大部分傳統(tǒng)行業(yè)(如金融、能源、教育等)仍處于小規(guī)模試點階段。
GenAI應(yīng)用得以在互聯(lián)網(wǎng)電商平臺蓬勃發(fā)展,原因在于中國擁有優(yōu)質(zhì)的電商和供應(yīng)鏈生態(tài)以及龐大的消費者群體,為GenAI應(yīng)用落地提供了契機。
生成式AI的3D短視頻內(nèi)容廠商,已基于文本生成3D視頻內(nèi)容,并通過抖音、快手、B站等短視頻平臺進行推廣,極大提高了短視頻內(nèi)容生產(chǎn)者的創(chuàng)作效率;
GenAI視頻大模型研發(fā)企業(yè)則深耕電商行業(yè),以AI生成虛擬人主播,賦能各行業(yè)、各品牌電商;
游戲與AI研究和應(yīng)用機構(gòu)則利用人工智能打造AI陪玩、AI競技機器人,并通過自然語言技術(shù)賦予非玩家角色人設(shè),使其能夠在游戲中與玩家互動對話。
資料來源:Pitchbook(PE,VC 及并購項目數(shù)據(jù)平臺),Antler( 新加坡base 的VC 平臺),Crunchbase( 投融資信息平臺》,Gain.pro( 聚焦一級市場的數(shù)據(jù)平臺)
目前,大部分中國市場的GenAI創(chuàng)業(yè)公司,剛剛完成標(biāo)準(zhǔn)化產(chǎn)品輸出,開始進入初級商業(yè)化探索階段,市場上主流的商業(yè)模式包括云資源售賣、模型API調(diào)用、SaaS收費、素材收費等。
由于國內(nèi)企業(yè)對軟件的付費意愿不高、市場有待進一步培育,以及企業(yè)對SaaS部署方式存在數(shù)據(jù)安全方面的顧慮,大規(guī)模應(yīng)用GenAI的商業(yè)模式仍有待探索。
本文節(jié)選自麥肯錫公司《中國金融業(yè)CEO季刊——中國生成式AI行業(yè)發(fā)展現(xiàn)狀及未來趨勢》,作者為麥肯錫全球資深董事合伙人曲向軍、全球董事合伙人韓峰、全球副董事合伙人胡藝蓉、麥肯錫咨詢顧問王宸,編輯中略有改動,經(jīng)授權(quán)刊載。