韓菲子 尚洪坤
當(dāng)前,人工智能日益融入經(jīng)濟(jì)發(fā)展各個(gè)領(lǐng)域,成為推動(dòng)科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的重要驅(qū)動(dòng)力量。大模型技術(shù)的發(fā)展則推動(dòng)了人工智能由量變引發(fā)質(zhì)變。近一年來,大模型熱潮席卷全球并持續(xù)升溫。全球越來越多的科技巨頭、知名高校、科研院所和創(chuàng)新型企業(yè)加大研究力度,大模型技術(shù)不斷迭代升級,模型能力不斷加強(qiáng),逐漸形成從底層算力、模型開發(fā)到行業(yè)應(yīng)用的全新智能化產(chǎn)業(yè)。北京正在建設(shè)國際科技創(chuàng)新中心,在推動(dòng)大模型產(chǎn)業(yè)加速發(fā)展方面優(yōu)勢明顯,但同時(shí)面臨著一些挑戰(zhàn),大模型產(chǎn)業(yè)發(fā)展仍需綜合施策。
國內(nèi)加力推動(dòng)大模型技術(shù)研發(fā)與應(yīng)用
大模型,是指依托海量、優(yōu)質(zhì)數(shù)據(jù),通過強(qiáng)大算力進(jìn)行訓(xùn)練后,完成大量不同任務(wù)的模型。大模型具有超強(qiáng)計(jì)算能力,能夠處理海量數(shù)據(jù),完成各種云端的復(fù)雜任務(wù)。近年來,大模型技術(shù)迅速迭代,打破了原有人工智能技術(shù)發(fā)展的上限,認(rèn)知和應(yīng)用能力顛覆式提升。
大模型的崛起是算法、算力、數(shù)據(jù)三要素全面支撐的結(jié)果。首先是算力,算力是人工智能(AI)訓(xùn)練的基礎(chǔ)設(shè)施,強(qiáng)大的計(jì)算能力對于訓(xùn)練大型人工智能模型至關(guān)重要,包括高性能處理器、大量存儲(chǔ)空間和高速網(wǎng)絡(luò)連接、軟硬件適配完備的GPU算力生態(tài)體系;其次是算法,先進(jìn)算法是大模型訓(xùn)練的關(guān)鍵,包括深度學(xué)習(xí)、遷移學(xué)習(xí)等,這些算法有助于模型在大量數(shù)據(jù)中找到有效的特征和規(guī)律;再者是數(shù)據(jù),數(shù)據(jù)是大模型的“食物”,大型且優(yōu)質(zhì)的數(shù)據(jù)集可以源源不斷為大模型提供豐富的訓(xùn)練數(shù)據(jù),涵蓋文本、圖像、音頻和視頻等多種類型的信息。
中國大模型研發(fā)和應(yīng)用快速發(fā)展。目前,美國和中國發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%,成為大模型技術(shù)領(lǐng)域的引領(lǐng)者。谷歌、微軟、Meta、亞馬遜等全球科技巨頭將大模型視為重要發(fā)展機(jī)遇,積極投入并且大動(dòng)作頻發(fā)。我國眾多企業(yè)也投身大模型領(lǐng)域,不斷打通大模型研發(fā)與產(chǎn)業(yè)應(yīng)用場景的壁壘,推動(dòng)人工智能在傳統(tǒng)行業(yè)落地。工信部賽迪研究院數(shù)據(jù)顯示,2023年,我國生成式人工智能企業(yè)采用率已達(dá)15%,市場規(guī)模約為14.4萬億元。我國大模型企業(yè)主要包括:百度、阿里、騰訊等互聯(lián)網(wǎng)大廠,科大訊飛、商湯科技、曠視科技等垂直于AI領(lǐng)域的廠商,以及智譜華章、百川智能、MiniMax等大模型初創(chuàng)企業(yè)。
一線城市競相布局大模型。從全國范圍看,北京、上海、廣州、深圳等城市陸續(xù)出臺(tái)大模型產(chǎn)業(yè)發(fā)展措施,加速大模型應(yīng)用落地。根據(jù)2023年中國科學(xué)技術(shù)信息研究所發(fā)布的《中國人工智能大模型地圖研究報(bào)告》統(tǒng)計(jì)表明,人工智能和大模型學(xué)者指數(shù)排名國內(nèi)前四的分別是:北京、江蘇、廣東、上海。學(xué)校和機(jī)構(gòu)作為開源主力,清華大學(xué)的ChatGLM-6B、復(fù)旦大學(xué)的MOSS、百度的文心系列大模型在開源影響力上位居三甲。北京不論在人工智能學(xué)者數(shù)量方面還是大模型學(xué)者數(shù)量方面都遙遙領(lǐng)先于其他地區(qū),體現(xiàn)出明顯的人才儲(chǔ)備優(yōu)勢。
北京布局大模型優(yōu)勢和挑戰(zhàn)并存
北京對人工智能、大模型布局較早,人工智能一直是北京的“強(qiáng)項(xiàng)”:北京已摘得人工智能核心企業(yè)數(shù)量、產(chǎn)業(yè)集聚能力、專利授權(quán)量、工信部“揭榜掛帥”優(yōu)勝項(xiàng)目數(shù)量、國家級重點(diǎn)實(shí)驗(yàn)室數(shù)量、投融資活躍程度等多項(xiàng)“冠軍”。
北京正在不斷推進(jìn)國際科技創(chuàng)新中心建設(shè),加快建設(shè)全球數(shù)字經(jīng)濟(jì)標(biāo)桿城市,人工智能產(chǎn)業(yè)作為建設(shè)工作的重要抓手,持續(xù)受到高度關(guān)注與重點(diǎn)支持。2023年,北京人工智能相關(guān)產(chǎn)值規(guī)模初步統(tǒng)計(jì)突破2500億元,核心企業(yè)數(shù)量超過1800家,形成基本完整的產(chǎn)業(yè)鏈,涵蓋基礎(chǔ)層、技術(shù)層和應(yīng)用層等環(huán)節(jié)。
截至2023年10月,我國10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計(jì)254家,分布于20余省市或地區(qū),其中北京有122家,數(shù)量居全國首位,約占全國的一半。按模型類型分析,北京擁有通用大模型廠商及高校院所37家,占比30%,以百度、智譜華章、百川智能等為代表;行業(yè)大模型85家,以第四范式、云知聲、銜遠(yuǎn)科技等為代表。北京大模型廠商及高校院所主要集聚在海淀區(qū),其次為朝陽區(qū)。海淀區(qū)共87家(通用大模型33家,行業(yè)大型54家),占北京全市的71%。
2023年5月,北京市人民政府發(fā)布《北京市加快建設(shè)具有全球影響力的人工智能創(chuàng)新策源地實(shí)施方案(2023—2025年)》《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,強(qiáng)調(diào)開展大模型創(chuàng)新算法及關(guān)鍵技術(shù)研究,加強(qiáng)大模型訓(xùn)練數(shù)據(jù)采集及治理工具研發(fā),推動(dòng)大模型在政務(wù)、醫(yī)療、科學(xué)、金融等領(lǐng)域的示范應(yīng)用。同時(shí),北京市經(jīng)濟(jì)和信息化局聯(lián)合市科委、中關(guān)村管委會(huì)、市發(fā)展改革委共同啟動(dòng)“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計(jì)劃”,推進(jìn)人工智能大模型研發(fā)和應(yīng)用,賦能千行百業(yè)數(shù)智化轉(zhuǎn)型,加速大模型的行業(yè)應(yīng)用落地。
2023年10月,北京市經(jīng)濟(jì)和信息化局印發(fā)《人工智能算力券實(shí)施方案(2023—2025年)》支持在京注冊的軟件信息服務(wù)業(yè)企業(yè)和制造業(yè)企業(yè),租用非關(guān)聯(lián)方的智能算力資源,在工業(yè)、政務(wù)、醫(yī)療、金融、教育、法務(wù)、交通、文旅、科學(xué)研究、城市管理、便民服務(wù)等領(lǐng)域進(jìn)行行業(yè)人工智能大模型訓(xùn)練和應(yīng)用。企業(yè)申領(lǐng)算力券,可享受智能算力合同額一定比例的算力券補(bǔ)貼。
然而,北京發(fā)展人工智能大模型產(chǎn)業(yè)依舊面臨一些挑戰(zhàn):算力資源供不應(yīng)求,已成為大模型企業(yè)創(chuàng)新研發(fā)的重大挑戰(zhàn)。大模型熱潮興起之后,市場上算力需求劇增,英偉達(dá)芯片供不應(yīng)求,加之美國對中國實(shí)施芯片制裁,國內(nèi)云廠商提供的商業(yè)化算力供應(yīng)緊張,價(jià)格不斷上漲。據(jù)統(tǒng)計(jì),北京很多人工智能企業(yè)近兩年內(nèi)有租用英偉達(dá)A100/A800/H800算力需求,預(yù)計(jì)算力缺口約5000P。目前僅少部分龍頭企業(yè)和頭部初創(chuàng)企業(yè)能夠租到算力資源,但成本過高,大量中小型企業(yè)僅持有少量英偉達(dá)高性能算力,仍需要外部算力支撐。
大量高質(zhì)量數(shù)據(jù)缺乏。大模型的養(yǎng)成需要不斷“投喂”大量、高質(zhì)量的數(shù)據(jù)。目前市面上缺乏高質(zhì)量公開的數(shù)據(jù)集,大模型廠商和擁有數(shù)據(jù)集的用戶不互通,即大模型廠商無法迭代準(zhǔn)確面向行業(yè)落地場景訓(xùn)練大模型;而多數(shù)行業(yè)數(shù)據(jù)豐富的企業(yè)用戶又缺乏自研大模型的能力,嚴(yán)重掣肘行業(yè)模型研發(fā)和應(yīng)用落地。例如,政務(wù)、醫(yī)療、智慧城市等領(lǐng)域數(shù)據(jù)獲取難度大,隱私性要求高,阻礙了大模型應(yīng)用落地的進(jìn)程。
大模型應(yīng)用落地性有待提升?,F(xiàn)階段大模型應(yīng)用存在一定同質(zhì)化情況,多集中在面向內(nèi)部員工的知識(shí)檢索、文字生成等方面,其落地效果及實(shí)際業(yè)務(wù)收益有待進(jìn)一步提升。大模型廠商需與企業(yè)用戶深度對接需求,找到高價(jià)值、差異化的大模型應(yīng)用剛需。
北京大模型產(chǎn)業(yè)發(fā)展須打“組合拳”
當(dāng)前,結(jié)合產(chǎn)業(yè)發(fā)展階段和企業(yè)需求,北京可以圍繞人才、基金、產(chǎn)業(yè)生態(tài)等方面保障,加快建設(shè)智能算力基礎(chǔ)設(shè)施、提升高質(zhì)量數(shù)據(jù)供給能力、創(chuàng)新大模型應(yīng)用落地機(jī)制等舉措,培育大模型產(chǎn)業(yè)生態(tài)。
全力夯實(shí)人工智能底層基礎(chǔ)。開發(fā)自主品牌的國產(chǎn)人工智能芯片,積極引導(dǎo)大模型研發(fā)企業(yè)應(yīng)用國產(chǎn)人工智能芯片,加快提升人工智能算力供給的國產(chǎn)化率。提升算力資源統(tǒng)籌供給能力,落實(shí)算力伙伴計(jì)劃,建立算力資源調(diào)度平臺(tái),通過算力券、資金補(bǔ)貼等方式,支撐自主可控的大模型技術(shù)體系建設(shè)。
加強(qiáng)行業(yè)數(shù)據(jù)流通交易。鼓勵(lì)各類企業(yè)建設(shè)高水平行業(yè)數(shù)據(jù)集,加強(qiáng)行業(yè)數(shù)據(jù)流通交易,增加高質(zhì)量行業(yè)數(shù)據(jù)供給,繁榮行業(yè)大模型商業(yè)生態(tài)。鼓勵(lì)大模型團(tuán)隊(duì)與行業(yè)用戶多互通,交流大模型開發(fā)需求,共享數(shù)據(jù),并建立共贏機(jī)制。
加快創(chuàng)新應(yīng)用場景建設(shè)。依托北京創(chuàng)新潛能和資源優(yōu)勢,打造標(biāo)桿型示范場景,牽引大模型創(chuàng)新成果落地應(yīng)用。在政務(wù)、金融、醫(yī)療、文化旅游等領(lǐng)域,引導(dǎo)行業(yè)用戶向大模型廠商開放有價(jià)值的核心業(yè)務(wù)場景,探索大模型商業(yè)化模式和產(chǎn)業(yè)化發(fā)展路徑。
鼓勵(lì)大模型企業(yè)在多層次資本市場開展股權(quán)融資。引導(dǎo)和撬動(dòng)社會(huì)資本重點(diǎn)投向大模型產(chǎn)業(yè)。發(fā)揮人工智能產(chǎn)業(yè)基金支持作用,引導(dǎo)和撬動(dòng)社會(huì)資本重點(diǎn)投向大模型產(chǎn)業(yè)。通過北京市人工智能產(chǎn)業(yè)投資基金參與投資,重點(diǎn)投向人工智能芯片、訓(xùn)練數(shù)據(jù)及相關(guān)軟件等底層技術(shù)領(lǐng)域,大模型算法創(chuàng)新、可信AI等關(guān)鍵領(lǐng)域,以及大模型等人工智能技術(shù)產(chǎn)品開發(fā)和垂直行業(yè)創(chuàng)新應(yīng)用等相關(guān)領(lǐng)域。
做好大模型應(yīng)用監(jiān)管。推動(dòng)產(chǎn)業(yè)健康安全發(fā)展,堅(jiān)持“包容審慎”的總基調(diào),依法依理堅(jiān)守安全底線,構(gòu)建高標(biāo)準(zhǔn)評測及治理體系,持續(xù)推動(dòng)模型備案上線。加快建立技術(shù)新標(biāo)準(zhǔn),構(gòu)建圍繞大模型底層設(shè)施、關(guān)鍵技術(shù)、上層應(yīng)用的標(biāo)準(zhǔn)體系。督促大模型企業(yè)使用安全可控的技術(shù)手段開展自評估,為重點(diǎn)企業(yè)提供服務(wù)和指導(dǎo),爭取更多優(yōu)質(zhì)的大模型產(chǎn)品更快更好地上線服務(wù)。
(作者單位:中咨海外咨詢有限公司)