文 本刊記者 勒川
2022年,在智能技術(shù)創(chuàng)新的商業(yè)落地征途之中,挑戰(zhàn)比預(yù)想中來得更加猛烈。硬科技的終極價(jià)值,也在逆風(fēng)之中更加彰顯。這場(chǎng)大會(huì)上,十余位行業(yè)領(lǐng)域用他們過去的積淀積累,做出對(duì)未來的解答。
2022年是時(shí)代級(jí)機(jī)遇與挑戰(zhàn)交織的一年。一方面我們深刻地感知到,隨著硬科技創(chuàng)新、產(chǎn)學(xué)研轉(zhuǎn)化、全新冪集創(chuàng)新周期的到來,一場(chǎng)關(guān)于數(shù)字化、智能化的機(jī)器革命,正在加速落地。另一方面,全球形勢(shì)云譎波詭,技術(shù)創(chuàng)新也來到深水區(qū),內(nèi)外交織的挑戰(zhàn)比以往來得更加嚴(yán)峻。
2022年12月14日,由量子位主辦的MEET2023智能未來大會(huì)舉行。作為國內(nèi)最具影響力的智能商業(yè)峰會(huì),MEET大會(huì)繼續(xù)就智能科技的最新進(jìn)展進(jìn)行總結(jié)與展望。
關(guān)乎本源、關(guān)于終局的思考求解,要比以往更加迫切:科技發(fā)展的起伏周期,如何穿越?是終極場(chǎng)景倒推技術(shù)創(chuàng)新,所誕生的新場(chǎng)景、新物種、新應(yīng)用?還是順勢(shì)而為下的新計(jì)算、新方案、新價(jià)值?抑或是以一敵百,堅(jiān)定的技術(shù)創(chuàng)新信念者?
基于這樣的行業(yè)洞察,量子位MEET2023智能未來大會(huì)以“以終為始,生生不息”為主題,鄭緯民院士領(lǐng)銜在內(nèi)的近二十位產(chǎn)學(xué)研行業(yè)領(lǐng)袖在大會(huì)現(xiàn)場(chǎng)探討和分享了行業(yè)破局之道。
鄭緯民AI基準(zhǔn)的設(shè)計(jì)能達(dá)到4個(gè)指標(biāo)
首先開場(chǎng)的,是計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)這一學(xué)科泰斗,中國工程院院士、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系鄭緯民。毫無疑問,人工智能算力是當(dāng)前人工智能領(lǐng)域發(fā)展的關(guān)鍵,此次他主要分享了他們所在團(tuán)隊(duì)對(duì)人工智能的三件事。簡(jiǎn)單來說,就是AI與算力基礎(chǔ)設(shè)施的設(shè)計(jì)、評(píng)測(cè)和優(yōu)化。
第一件事,提出了一種AI算力基礎(chǔ)設(shè)施的架構(gòu)和平衡設(shè)計(jì)原則。目前全國20多個(gè)人工智能超算中心基本上都采納了他們團(tuán)隊(duì)的設(shè)計(jì)思想。
首先,他談到了HPC與AI之間的不同,包括應(yīng)用領(lǐng)域、運(yùn)算精度等方面?;诖?,他們提出了人工智能計(jì)算機(jī)設(shè)計(jì)的平衡性原則,包括計(jì)算平衡設(shè)計(jì)、網(wǎng)絡(luò)平衡計(jì)算、IO子系統(tǒng)設(shè)計(jì)。
目前,行業(yè)整體趨勢(shì)是HPC+AI+BigData融合在一起。未來兩到四年,三者融合的服務(wù)器就會(huì)出現(xiàn)。
第二件事,就是大規(guī)模人工智能算力基準(zhǔn)評(píng)測(cè)程序AIPerf。
傳統(tǒng)的AI算力評(píng)測(cè)基準(zhǔn)存在著只針對(duì)單個(gè)芯片、只是移動(dòng)端的硬件、可擴(kuò)展性不好等問題,于是他們就決定自己做一個(gè)。
AI基準(zhǔn)設(shè)計(jì)要達(dá)到這四個(gè)目標(biāo):統(tǒng)一的分?jǐn)?shù)、可變的規(guī)模、具有實(shí)際的人工智能意義、評(píng)測(cè)程序包含必要的多機(jī)通信。最終,以清華大學(xué)為主要團(tuán)隊(duì)做了AIPerf來測(cè)試,已于2020年11月15日發(fā)布。
第三件事,百萬億參數(shù)超大規(guī)模訓(xùn)練模型的加速方法。
學(xué)界達(dá)成一個(gè)基本共識(shí),那就是模型規(guī)模和模型效果呈正相關(guān)關(guān)系。但模型規(guī)模上去了,CPU的內(nèi)存、計(jì)算能力是有限的。因此大模型訓(xùn)練一定是多機(jī)的,分布并行的。
現(xiàn)在主要有三種并行方式:數(shù)據(jù)并行、模型并行、專家并行。他們把這三種并行訓(xùn)練模型開源到FastMOE系統(tǒng)當(dāng)中,得到了工業(yè)界許多認(rèn)可,比如阿里的淘寶天貓,騰訊、百度飛槳的MOE模塊都用到了他們的系統(tǒng)。
最后他希望,他們團(tuán)隊(duì)做的三點(diǎn)小貢獻(xiàn),能夠推動(dòng)人工智能的發(fā)展。
Ziad Asghar如何讓“智能網(wǎng)聯(lián)邊緣”成為現(xiàn)實(shí)
高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁Ziad Asghar,負(fù)責(zé)驍龍平臺(tái)的產(chǎn)品規(guī)劃以及公司所有產(chǎn)品線中應(yīng)用處理器相關(guān)技術(shù)。他的工作服務(wù)于公司所有業(yè)務(wù)部門,包括移動(dòng)、汽車、計(jì)算、XR、邊緣云和物聯(lián)網(wǎng)。
他在大會(huì)上提出:AI處理的重心正在持續(xù)向邊緣側(cè)轉(zhuǎn)移。
原因有多方面,大量的數(shù)據(jù)在邊緣側(cè)產(chǎn)生,當(dāng)今消費(fèi)者希望擁有更好的數(shù)據(jù)隱私、希望數(shù)據(jù)可靠,并希望及時(shí)獲取處理結(jié)果。
高通專注于“基于統(tǒng)一的技術(shù)路線圖”進(jìn)行產(chǎn)品開發(fā),能夠全面覆蓋智能網(wǎng)聯(lián)邊緣,實(shí)現(xiàn)規(guī)模化擴(kuò)展。
高通的A I技術(shù)已經(jīng)賦能2 0億終端,實(shí)現(xiàn)這一成果的核心是高通AI引擎(Qualcomm AI Engine)。高通AI引擎包含圖形處理單元、CPU,以及更核心的Hexagon處理器,其具備高度可擴(kuò)展性的硬件架構(gòu),并在性能和能效方面全面領(lǐng)先競(jìng)爭(zhēng)對(duì)手。
為了讓AI在終端側(cè)發(fā)揮最大作用,高通還帶來多項(xiàng)硬件和軟件技術(shù):支持INT4精度推理,高通傳感器中樞,高通AI軟件棧、Qualcomm AI Studio……
過去,幾乎所有的AI推理都在云端進(jìn)行。如今,他們已經(jīng)開始將大量推理工作轉(zhuǎn)移至邊緣側(cè)終端進(jìn)行。下一步,就是實(shí)現(xiàn)完全分布式的AI,也就是轉(zhuǎn)向終端側(cè)學(xué)習(xí)的范式。
利用終端側(cè)學(xué)習(xí),將能夠?yàn)槊恳粋€(gè)用戶打造個(gè)性化體驗(yàn),這就是高通正在前進(jìn)的方向。據(jù)Ziad介紹,高通AI研究團(tuán)隊(duì)一直專注不同的方法包括小樣本學(xué)習(xí)、無標(biāo)記數(shù)據(jù)持續(xù)學(xué)習(xí)、支持全局適應(yīng)的聯(lián)邦學(xué)習(xí)和低復(fù)雜性終端側(cè)學(xué)習(xí),來解決終端側(cè)學(xué)習(xí)部署的挑戰(zhàn)。
Ziad相信,目前所利用的終端側(cè)AI能力還只是冰山一角,而從智能車到元宇宙,終端側(cè)AI的需求巨大。
高通十分期待能夠引領(lǐng)市場(chǎng)向著充分利用智能網(wǎng)聯(lián)邊緣的方向繼續(xù)推進(jìn),讓智能網(wǎng)聯(lián)邊緣成為現(xiàn)實(shí)。
尤洋AI落地面臨很大問題,最先進(jìn)的AI 技術(shù)訓(xùn)練成本太高
潞晨科技董事長(zhǎng)兼總裁、新加坡國立大學(xué)校長(zhǎng)青年教授尤洋,介紹了一種全新的AI大模型解決方案Colossal-AI,面向未來各種大模型應(yīng)用場(chǎng)景的低成本落地。
首先,Colossal-AI解決的是一個(gè)什么樣的問題?從過去AI模型發(fā)展的參數(shù)量來看,2016年—2021年模型大小從200多萬增長(zhǎng)到了1.6萬億,相當(dāng)于翻了成千上萬倍。不管是大企業(yè)、小企業(yè),大家都普遍把自己的模型做得更大,因?yàn)樾Ч麜?huì)更好。
不穩(wěn)定型心絞痛有起病快、病情急、預(yù)后差的特點(diǎn),治療不及時(shí)極易造成心肌梗死。多數(shù)研究認(rèn)為,由冠狀動(dòng)脈粥樣硬化、破裂、急性血栓所致,同時(shí)和局部炎癥有密切關(guān)系[2] 。
但一個(gè)很大問題是大模型或者是最先進(jìn)的AI技術(shù)訓(xùn)練成本太高了。Stability AI每年光花計(jì)算的錢就大概2000萬美元。
因此未來迫切需要一個(gè)可擴(kuò)展、高效的計(jì)算基礎(chǔ)設(shè)施Colossal-AI。
其次,Colossal-AI主要由三部分組成。
1)高效的內(nèi)存管理系統(tǒng)。因?yàn)榇竽P捅举|(zhì)上還是太吃內(nèi)存。
2)自動(dòng)的N維并行技術(shù)。
3)大規(guī)模優(yōu)化技術(shù)。
從三方面把AI模型的訓(xùn)練部署性能提到最高,目標(biāo)是希望用戶只需要在自己?jiǎn)螜C(jī)筆記本上寫好代碼,通過Colossal-AI能夠無縫地部署到云端或者是超級(jí)計(jì)算機(jī)上。
目前訓(xùn)練大模型主要有三種并行方式:數(shù)據(jù)并行、張量并行、流水線并行。
Colossal-AI的解決方案首先是支持了上述主流并行方案,然后他們創(chuàng)新性地打造了2D張量并行、2.5D張量并行以及3D張量并行,以及提出了數(shù)據(jù)序列并行,還提供了降低顯存消耗的異構(gòu)內(nèi)存管理和大規(guī)模并行優(yōu)化,把它們整合起來提供一套自動(dòng)并行的解決方案。
其實(shí)AI工程師、研究員,不需要理解背后的技術(shù)細(xì)節(jié),只需要把模型的信息、計(jì)算資源告訴他們,就可以自動(dòng)地把計(jì)算資源能力發(fā)揮到最大化,同時(shí)完成虛擬模型訓(xùn)練和自動(dòng)部署,輕松低成本應(yīng)用AI大模型。
劉軍智算力就是創(chuàng)新力
浪潮信息副總裁、浪潮人工智能與高性能計(jì)算產(chǎn)品線總經(jīng)理劉軍分享的主題是“AI新時(shí)代 智算力就是創(chuàng)新力”。
劉軍提出了“算力當(dāng)量”的概念,用PetaFLOP/s-days(PD)這個(gè)指標(biāo)來衡量算力消耗,也就是每秒千萬億次計(jì)算完整運(yùn)行一天,完成一個(gè)任務(wù)需要多少這樣的計(jì)算量。
比如特斯拉的DOJO用于感知模型的訓(xùn)練和仿真,算力當(dāng)量是500個(gè)PD,AlphaFold2的訓(xùn)練消耗300個(gè)PD。
再加上AI大模型訓(xùn)練、數(shù)字人的建模和渲染等方向,可以確切地感受到今天在AI領(lǐng)域的眾多創(chuàng)新背后離不開智算力的支撐,所以說智算力就是創(chuàng)新力。
接下來,劉軍還分享了當(dāng)前智能計(jì)算發(fā)展的三個(gè)重要趨勢(shì):
第一是算力多元化。在國內(nèi)市場(chǎng)上有十幾種CPU芯片、將近100種AI算力芯片,原因是算力應(yīng)用場(chǎng)景多元化。這就需要從系統(tǒng)的硬件角度、從平臺(tái)的軟件角度來進(jìn)行相應(yīng)的創(chuàng)新支撐。
第二是模型巨量化,大模型使得AI從五年前的能聽會(huì)看走到今天能思考、會(huì)創(chuàng)作,下一步甚至到會(huì)推理、能決策的進(jìn)步。下一個(gè)挑戰(zhàn)是如何把大模型能力交付到眾多中小企業(yè)手中,幫助他們實(shí)現(xiàn)智能化轉(zhuǎn)型。
第三是元宇宙?,F(xiàn)在元宇宙的構(gòu)建包括協(xié)同創(chuàng)建、高精仿真、實(shí)時(shí)渲染、智能交互,每一個(gè)環(huán)節(jié)都需要大量算力去支撐。這里不光是AI計(jì)算,還有仿真計(jì)算、圖像渲染計(jì)算,這對(duì)算力基礎(chǔ)設(shè)施的硬件平臺(tái)和軟件棧都提出了更高的要求。
李笛我們?yōu)槭裁聪牒虲hatGPT交流?
AI繪畫、對(duì)話式AI為代表的AIGC今年在全球引發(fā)熱潮,小冰公司也作為行業(yè)先行者備受矚目:剛剛完成一輪10億元的新融資,用于推動(dòng)虛擬員工的普及。
不過,小冰公司首席執(zhí)行官李笛在會(huì)上沒有多談產(chǎn)品,而是分享了對(duì)大家更有借鑒意義的行業(yè)趨勢(shì)。
李笛認(rèn)為,每一次技術(shù)變革都是在改變?nèi)伺c世界/人與人之間的關(guān)系。
在人與世界關(guān)系這條線上,我們經(jīng)歷了門戶網(wǎng)站、搜索引擎、推薦算法。它們利用計(jì)算機(jī)系統(tǒng)實(shí)現(xiàn)了高并發(fā),一次觸達(dá)很多用戶。但缺點(diǎn)是轉(zhuǎn)化率低,如果想提高轉(zhuǎn)化率就需要人工客服,人力成本巨大。
下一站,該看向AI Being。
AI Being與之前的人機(jī)交互相比,關(guān)鍵不同在于高轉(zhuǎn)化率,如小冰島App的留存率就高達(dá)39%。
另一個(gè)例子是ChatGPT,通過它獲取知識(shí)比搜索引擎的準(zhǔn)確度要低,但為什么人們都愿意和它交流?
人們?cè)谑褂盟鼤r(shí)往往心里已經(jīng)有了答案。如果ChatGPT給出的結(jié)果都準(zhǔn)確,那人們會(huì)認(rèn)為它很強(qiáng)大,即使不準(zhǔn)確,人們也會(huì)覺得很有意思。
其實(shí)ChatGPT改善的不是準(zhǔn)確率而是行為,讓AI有了主體性。從行為模式判斷與從結(jié)果上判斷一個(gè)技術(shù),就會(huì)得到完全不同的結(jié)論:它能和你建立一種以往沒有過的一種關(guān)聯(lián),這種關(guān)聯(lián)的價(jià)值本身具有非常大的商業(yè)價(jià)值。
李笛認(rèn)為,AI Being的未來還會(huì)引發(fā)很多新的變革。
如數(shù)字員工會(huì)使toB和toC的界限變得模糊,比如銀行的數(shù)字客戶經(jīng)理可能會(huì)與客戶變成朋友。
又比如AI Being將不再隸屬于某一平臺(tái),人們?cè)诳头?、手機(jī)、汽車上與同一個(gè)AI Being交流,得到更加無縫、24小時(shí)、持續(xù)連貫的服務(wù)。
同時(shí)這種方式也能建立更好的反饋機(jī)制,推動(dòng)系統(tǒng)得到更好的發(fā)展。AI Being比現(xiàn)在的虛擬偶像等數(shù)字人應(yīng)用,還有千倍百倍的價(jià)值沒被看到。
李博智能車是當(dāng)下機(jī)器人的第一形態(tài)
各行各業(yè)進(jìn)入存量競(jìng)爭(zhēng)時(shí)期,互聯(lián)網(wǎng)經(jīng)濟(jì)機(jī)遇過去,下一個(gè)人類的星辰大海會(huì)在哪里?
路特斯科技副總裁、路特斯機(jī)器人公司總經(jīng)理李博認(rèn)為,“機(jī)器人時(shí)代”比“元宇宙時(shí)代”更符合人類對(duì)星辰大海的預(yù)期。
元宇宙是把人帶入虛擬世界,而機(jī)器人則是把AI帶到真實(shí)世界。李博分享了對(duì)“機(jī)器人時(shí)代”的關(guān)鍵認(rèn)知:
第一,智能車是機(jī)器人的第一形態(tài),也是當(dāng)下最重要的機(jī)器人形態(tài)。像掃地機(jī)器人、酒店服務(wù)機(jī)器人等,從市場(chǎng)規(guī)模、體量及社會(huì)影響力來說,和智能車相比仍存在差距。
第二,行業(yè)經(jīng)常提“軟件定義汽車”,但我們認(rèn)為“硬件定義軟件的天花板”。例如,當(dāng)不同年代的蘋果手機(jī)都升級(jí)到同樣的操作系統(tǒng),其體現(xiàn)出來的性能卻是千差萬別的。
第三,在更高更快更強(qiáng)的時(shí)代,路特斯是智能車的最佳實(shí)踐平臺(tái)。基于此,路特斯機(jī)器人推出四條產(chǎn)品線。
智能駕駛?cè)珬\浖鉀Q方案,包含端到端的高階智能駕駛系統(tǒng)、ADAS/PAS功能,以及車端OS操作系統(tǒng)及中間件等。
ROBOVERSE產(chǎn)學(xué)研生態(tài)系統(tǒng),一方面用路特斯機(jī)器人在實(shí)踐開發(fā)過程中產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù),打造公開數(shù)據(jù)集,為創(chuàng)業(yè)公司及院校賦能;另一方面支持院校做智能駕駛的探索和嘗試,在路特斯機(jī)器人的加持下,北京理工大學(xué)和同濟(jì)大學(xué)的方程式車隊(duì)在2022年中國大學(xué)生方程式賽事中各取得優(yōu)異成績(jī),其中,北京理工大學(xué)路特斯無人駕駛方程式車隊(duì)更是贏得2022中國大學(xué)生無人駕駛方程式大賽全國總冠軍。
智能駕駛運(yùn)營解決方案,核心目的是對(duì)當(dāng)下智能駕駛系統(tǒng)能力的不足做彌補(bǔ)和提升。例如路特斯平行守護(hù)系統(tǒng),讓后臺(tái)專業(yè)的平行守護(hù)駕駛員接入前臺(tái)車輛,輔助前臺(tái)車輛更好地完成智能駕駛?cè)蝿?wù),這一套系統(tǒng)在不久的將來,也會(huì)逐步對(duì)外賦能。
ROBO Galaxy智駕工具鏈SaaS系統(tǒng),也稱為智能駕駛的云端數(shù)據(jù)工廠。ROBO Galaxy包含七大模塊,分別是數(shù)據(jù)采集、數(shù)據(jù)合規(guī)、數(shù)據(jù)標(biāo)注、數(shù)據(jù)訓(xùn)練、數(shù)據(jù)仿真、數(shù)據(jù)管理及數(shù)據(jù)監(jiān)控,提供全流程服務(wù),并構(gòu)成了全生命周期的數(shù)據(jù)鏈閉環(huán)。
ROBO Galaxy不僅旨在提升算法軟件迭代速度,提供優(yōu)質(zhì)的測(cè)試環(huán)境,也致力于解決目前普遍存在的數(shù)據(jù)孤島與業(yè)務(wù)斷點(diǎn)問題。因此,李博認(rèn)為,未來的智能駕駛產(chǎn)品一定是批量化、高質(zhì)量、穩(wěn)定地生產(chǎn)出來,這就要依托ROBO Galaxy,讓智能駕駛開發(fā)從“手工坊”變成“流水線”。由此可見,ROBO Galaxy代表著智能駕駛未來的生產(chǎn)力。
段潤堯聰明的腦袋、足夠的資源和最好的技術(shù)匹配起來,就能做出量子計(jì)算機(jī)
當(dāng)前,量子時(shí)代正在加速到來,接近70%全球企業(yè)都想或正在布局相關(guān)技術(shù)。國內(nèi)像百度這樣的技術(shù)大廠,今年率先給出了從底層硬件到上層應(yīng)用的一整套產(chǎn)業(yè)化解決方案。
百度量子計(jì)算研究所所長(zhǎng)段潤堯就在大會(huì)現(xiàn)場(chǎng)分享了百度是如何思考量子計(jì)算的。
我們身處的這個(gè)時(shí)代其實(shí)已經(jīng)到了第二次量子革命,這幾年應(yīng)該是量子真正開始和計(jì)算相結(jié)合的關(guān)鍵幾年,為什么說量子計(jì)算出現(xiàn)是必不可少的?
第一,芯片尺寸小到一定程度就到了量子尺度。要想摩爾定律延續(xù)下去,就需要考慮新的計(jì)算模式。而且量子計(jì)算本身,能耗也非常低。
第二,數(shù)據(jù)量很大。想模擬一個(gè)量子系統(tǒng),哪怕非常小但所需存儲(chǔ)量也很巨大,比如300個(gè)量子比特,就超過整個(gè)宇宙可見原子數(shù)目。
第三,全新計(jì)算范式,在解決特定問題上有指數(shù)級(jí)優(yōu)勢(shì)。
第四,信息安全,可以攻破RSA系統(tǒng)。
也正因?yàn)檫@些可能性,量子科技一直受到行業(yè)關(guān)注。有相關(guān)機(jī)構(gòu)預(yù)計(jì),到了2031年將有8000億元市場(chǎng)規(guī)模直接與量子計(jì)算相關(guān)。
那么量子計(jì)算可以應(yīng)用在哪些方面呢?典型的有藥物研發(fā)、金融科技、材料模擬、信息安全等領(lǐng)域。
除此之外,量子計(jì)算與的人工智能還是一個(gè)相互糾纏的關(guān)系,從上層應(yīng)用、框架到底層硬件都可以產(chǎn)生相互聯(lián)系。另一方面,量子計(jì)算也受益于AI,尤其是深度學(xué)習(xí)。2020年百度就曾搭建了一個(gè)量子機(jī)器學(xué)習(xí)平臺(tái)。
即便有這么多機(jī)會(huì),那實(shí)際真正走入生活還需要多遠(yuǎn)?段潤堯團(tuán)隊(duì)正在做的就是量子計(jì)算的產(chǎn)業(yè)化道路。
那就需要解決這幾個(gè)方面的問題,硬件的穩(wěn)定性、好的軟件平臺(tái),以及自動(dòng)化的芯片設(shè)計(jì)方案。
百度提出了QIAN戰(zhàn)略。Q就是量子算法、量子AI及量子架構(gòu)。I就是軟件和硬件的基礎(chǔ)設(shè)施。除此之外,還要真正識(shí)別出一些具有重大應(yīng)用價(jià)值的場(chǎng)景,A就是實(shí)際的一些重要的應(yīng)用。最后當(dāng)然還有網(wǎng)絡(luò),N指量子互聯(lián)網(wǎng),除此之外也需要建立生態(tài)網(wǎng)絡(luò)。
演講的最后,段潤堯作了一下展望:“實(shí)際上我二十多年來一直在思考一個(gè)問題,如何真正能夠造出一臺(tái)量子計(jì)算機(jī)。我的結(jié)論其實(shí)很簡(jiǎn)單,就是聰明的腦袋,再加上有足夠的資源和現(xiàn)有的最好的技術(shù),匹配起來就可以做出量子計(jì)算機(jī)?!?/p>
從這個(gè)意義上講,全球可以有很多不同的組合都可以做出這樣的機(jī)器,這個(gè)過程是可以等價(jià)的。
劉鐵巖AI for Science,追求人類智能最光輝一面
同樣正在探尋AI for Science價(jià)值的還有微軟亞洲研究院副院長(zhǎng)、微軟研究院科學(xué)智能中心亞洲區(qū)負(fù)責(zé)人劉鐵巖。
最近十年,人工智能在很多任務(wù)已經(jīng)可以和人類媲美,效果驚艷。但這些結(jié)果主要集中在感知和認(rèn)知層面,并沒有反映出人類智能里最光輝的一面——認(rèn)識(shí)世界和改造世界。
微軟前同事Jim Gray曾對(duì)科學(xué)發(fā)現(xiàn)的四個(gè)范式做了總結(jié),分別是經(jīng)驗(yàn)范式、理論范式、計(jì)算范式和數(shù)據(jù)驅(qū)動(dòng)。最近幾年大家尤其關(guān)注的一種新范式,叫做AI for Science。它是前四種范式的有機(jī)結(jié)合,發(fā)揮了理論和經(jīng)驗(yàn)各自的特長(zhǎng),又把人工智能和計(jì)算科學(xué)融合在一起。劉鐵巖認(rèn)為,它值得叫做第五范式。
接著他就AI for Science分為三個(gè)方面進(jìn)行深入介紹。
第一,如何用AI求解物理方程?
我們可以不再用數(shù)值解法來求解物理方程,而是通過AI得到更高效解。并且只要有足夠算力就可以無限生成完美的訓(xùn)練數(shù)據(jù)。此外,近年來還出現(xiàn)了一種physics informed training,甚至不需要提前生成訓(xùn)練數(shù)據(jù),只需要在訓(xùn)練的過程中,動(dòng)態(tài)驗(yàn)證AI模型的輸出是否滿足物理方程,定義損失函數(shù)即可,而驗(yàn)證方程比求解方程簡(jiǎn)單的多。劉鐵巖介紹了他們團(tuán)隊(duì)在這個(gè)方向上的一些最新研究成果,如Graphormer,Deep Vortex Net,并展示了它們?cè)诜肿幽M、流體模擬等領(lǐng)域取得的突出成果。
第二,如何用AI從科學(xué)數(shù)據(jù)中發(fā)掘有效信息?
各種實(shí)驗(yàn)設(shè)備每年都產(chǎn)生海量數(shù)據(jù),但顯然不能靠人工有效處理;還有每年都有近150萬篇論文發(fā)表,但任何科學(xué)家都沒有精力讀完。劉鐵巖的團(tuán)隊(duì)利用AI方法來自動(dòng)分析高能粒子對(duì)撞的射流數(shù)據(jù),提出了LorentzNet模型,將洛倫茲等變性構(gòu)建在模型之中,在新粒子發(fā)現(xiàn)領(lǐng)域取得了比前人顯著提高的精度;他們還利用科學(xué)文獻(xiàn)訓(xùn)練了SPT模型,對(duì)科學(xué)文獻(xiàn)信息的科學(xué)知識(shí)進(jìn)行抽取、總結(jié)和預(yù)測(cè)。
第三,如何從實(shí)驗(yàn)數(shù)據(jù)出發(fā),用AI發(fā)現(xiàn)新的物理方程,形成科學(xué)發(fā)現(xiàn)的閉環(huán)。
比如物理的守恒定律,一旦實(shí)驗(yàn)數(shù)據(jù)不滿足守恒性,往往暗示著一些新物理規(guī)律的存在。劉鐵巖的團(tuán)隊(duì)設(shè)計(jì)了一個(gè)雙通道的AI模型,可精準(zhǔn)地從實(shí)驗(yàn)數(shù)據(jù)中自發(fā)地學(xué)到很多已有規(guī)律。
最后,他對(duì)AI for Science未來的發(fā)展表達(dá)了希冀:“我們相信AI for Science將會(huì)對(duì)自然科學(xué)產(chǎn)生巨大影響,尤其在解釋生命奧秘,以及保障環(huán)境可持續(xù)發(fā)展方面,都有很大的潛力,沿著這兩個(gè)方面我們進(jìn)行了很多探索。也希望大家加入我們,一起推動(dòng)科學(xué)發(fā)現(xiàn)的新邊界!”
賈揚(yáng)清工程化和開源是AI普惠最重要的兩大支撐
AIGC爆發(fā)成為當(dāng)下AI繞不過去的話題。如果溯源,是從1999年的紋理生成,到2015年前后的神經(jīng)風(fēng)格遷移,再到現(xiàn)在更強(qiáng)語義的AI創(chuàng)作。這些創(chuàng)新背后的推動(dòng)機(jī)制,總結(jié)來說就是AI普惠的兩大支撐:AI工程化和開源。
這也就是阿里巴巴集團(tuán)副總裁、阿里云計(jì)算平臺(tái)事業(yè)部負(fù)責(zé)人賈揚(yáng)清分享的主題。
工程化,讓開發(fā)、迭代到應(yīng)用的路徑變得更加簡(jiǎn)單;開源可以讓工作開展更加迅速,實(shí)現(xiàn)市場(chǎng)共贏。在這個(gè)基礎(chǔ)之上,AI的產(chǎn)業(yè)落地有以下明顯趨勢(shì):
第一,云原生的AI工程化平臺(tái);
第二,大規(guī)模端到端的異構(gòu)計(jì)算體系;
第三,通過算法的系統(tǒng)組合實(shí)現(xiàn)更加智能的、貼近用戶需求的產(chǎn)品;
最后,通過算法的開源助力AI在產(chǎn)業(yè)垂直化落地。
這四個(gè)趨勢(shì),無論從供給角度還是需求角度,都是推動(dòng)AI進(jìn)一步往前走的方向。接著賈揚(yáng)清從這四個(gè)角度介紹了他們正在做的事情。
其中,在端到端的異構(gòu)計(jì)算與優(yōu)化上,阿里開源的分布式訓(xùn)練框架EPL和推理優(yōu)化工具PAI-Blade,能讓算法工程師在訓(xùn)練和推理環(huán)節(jié)大幅提升效率;此外,通過軟硬件協(xié)同優(yōu)化,他們也研發(fā)了更貼合AI需求的計(jì)算設(shè)施。
在這個(gè)領(lǐng)域比較有意思的點(diǎn),是AI計(jì)算與傳統(tǒng)科學(xué)計(jì)算之間有很強(qiáng)的共性。AI for Science這個(gè)趨勢(shì)很明顯,分子學(xué)、物理、化學(xué)等領(lǐng)域需要處理海量科學(xué)數(shù)據(jù),而AI和數(shù)據(jù)系統(tǒng)所積累下來的異構(gòu)計(jì)算的模式和環(huán)境,正好符合這個(gè)需求。
“今天,非常多的專家、企業(yè)、開發(fā)者們?cè)诮ㄔO(shè)著上層的AI算法;而在AI底層,如何讓工具變得更加易用、更加普惠,這正是我們?cè)谧龅氖虑椤!?/p>
張杰對(duì)話式AI走到L0-L5的哪個(gè)階段?
在數(shù)智化轉(zhuǎn)型的大趨勢(shì)中,中關(guān)村科金以AI+數(shù)字化營銷g運(yùn)營g服務(wù)為引擎,為500余家金融、零售、教育、醫(yī)療、智能制造等行業(yè)頭部企業(yè)提供了數(shù)字化解決方案。
中關(guān)村科金技術(shù)副總裁張杰,在會(huì)上分享了關(guān)于對(duì)話式AI在企業(yè)服務(wù)中的一些觀點(diǎn)和經(jīng)驗(yàn)。
在過去60年時(shí)間里,對(duì)話式AI經(jīng)歷了三個(gè)大的技術(shù)發(fā)展階段:基于規(guī)則匹配的時(shí)代、“虛擬個(gè)人助理”應(yīng)用的時(shí)代和基于大規(guī)模預(yù)訓(xùn)練語言模型的時(shí)代。
發(fā)展到現(xiàn)階段,張杰認(rèn)為目前對(duì)話式AI幾個(gè)趨勢(shì)值得關(guān)注:
細(xì)分賽道,過去十幾年間對(duì)話式AI主要的應(yīng)用場(chǎng)景還是在toC,如智能音響、智能家電、個(gè)人手機(jī)助理等市場(chǎng)滲透率較高,依照《AI對(duì)話系統(tǒng)分級(jí)定義》已經(jīng)能夠達(dá)到L3的等級(jí)。相比之下,企業(yè)服務(wù)方面市場(chǎng)滲透率比較低、開發(fā)潛力大,同時(shí)技術(shù)成熟度相對(duì)落后,只能夠完成單一場(chǎng)景下的對(duì)話,在L1-L2之間。
對(duì)話形式,在腦機(jī)接口真正商用落地之前,對(duì)話仍然是最主要的一種溝通手段,除了基礎(chǔ)的文本和語音交互外,多模態(tài)、數(shù)字人的交互方式會(huì)越來越多,比如遠(yuǎn)程銀行、數(shù)字營業(yè)廳等。
從技術(shù)維度上來看,對(duì)話式AI不僅是對(duì)話的技術(shù),將來還會(huì)是多種前沿科技的一個(gè)集大成者,融合感知智能、認(rèn)知智能和決策智能。
聚焦在企業(yè)服務(wù)賽道上,張杰認(rèn)為對(duì)話式AI潛在市場(chǎng)空間巨大,應(yīng)用場(chǎng)景豐富,但現(xiàn)階段面臨著幾項(xiàng)技術(shù)挑戰(zhàn),例如場(chǎng)景遷移問題、可解釋性,快速運(yùn)維等。
如何解決這些難題呢?中關(guān)村科金在過去8年間,服務(wù)了10多個(gè)行業(yè)、500余家客戶的對(duì)話場(chǎng)景,總結(jié)出了一套雙引擎對(duì)話系統(tǒng)的技術(shù)實(shí)踐。領(lǐng)域知識(shí)中臺(tái)和對(duì)話分析系統(tǒng)作為對(duì)話決策系統(tǒng)的雙引擎,一方面,領(lǐng)域知識(shí)能夠提升系統(tǒng)的可解釋性和可運(yùn)維性;另一方面,會(huì)話分析能夠挖掘出話語背后的常見目的和常見的行為模式。
對(duì)于未來發(fā)展方向,張杰表示:“對(duì)話式AI在企業(yè)服務(wù)賽道上存在巨大的市場(chǎng)空間和技術(shù)提升空間,為此中關(guān)村科金提出了領(lǐng)域知識(shí)和會(huì)話分析雙驅(qū)動(dòng)的對(duì)話系統(tǒng)。希望通過對(duì)話式AI為企業(yè)打造金牌銷售,幫助企業(yè)帶來創(chuàng)新增長(zhǎng)和用戶體驗(yàn)的提升。”
劉偉只靠數(shù)據(jù)驅(qū)動(dòng)的AI缺乏可解釋性,要與領(lǐng)域知識(shí)相結(jié)合
騰訊醫(yī)療健康A(chǔ)IDD技術(shù)負(fù)責(zé)人劉偉從騰訊制藥AI算法實(shí)踐的角度來探討AI for Science的價(jià)值。
他主要作了三個(gè)部分的介紹:騰訊云深平臺(tái)、平臺(tái)案例分享,以及騰訊云深A(yù)I平臺(tái)的技術(shù)優(yōu)勢(shì)總結(jié)。
首先,目前騰訊云深A(yù)I藥物發(fā)現(xiàn)平臺(tái)主要包括兩大功能模塊,第一個(gè)功能模塊就是小分子藥物發(fā)現(xiàn),第二塊是大分子藥物發(fā)現(xiàn),主要指抗體藥物發(fā)現(xiàn)。其中,小分子藥物發(fā)現(xiàn)還包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、分子生成等模塊,大分子里面包括抗體結(jié)構(gòu)預(yù)測(cè)、抗體抗原的對(duì)接以及抗體的人源化改造等模塊組成。
此外,劉偉分享了他們幾年來在制藥AI實(shí)踐中的典型案例。包括國內(nèi)做的最早的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)tFold、結(jié)合物理學(xué)特征和本地?cái)?shù)據(jù)訓(xùn)練的ADMET基礎(chǔ)模型以及骨架躍遷分子生成算法等。
基于這些實(shí)踐的積累,劉偉團(tuán)隊(duì)搭建了屬于自己的優(yōu)勢(shì)壁壘。核心有四個(gè)方面。
第一塊,就是AI算法方面。藥物AI研發(fā)這塊的最主流就是圖神經(jīng)網(wǎng)絡(luò),在做藥物之前,騰訊在深度圖神經(jīng)網(wǎng)絡(luò)就有深厚的研發(fā)積累,包括現(xiàn)在的大規(guī)模隨機(jī)采樣、自監(jiān)督學(xué)習(xí)和層次圖深度學(xué)習(xí)等領(lǐng)域。
第二塊和第三塊,就是大算力、大數(shù)據(jù)的能力。比如在一個(gè)龐大的化學(xué)空間發(fā)現(xiàn)藥物分子是不容易的,這就要求AI模型能夠理解這么大的空間,也就需要分子、蛋白質(zhì)、核酸等領(lǐng)域的大模型,以及訓(xùn)練大模型的算力和基礎(chǔ)架構(gòu)。
最后一塊,AI與物理、化學(xué)領(lǐng)域知識(shí)方面的結(jié)合。這是基于之前的算法算力上面的能力新生長(zhǎng)出來的獨(dú)特優(yōu)勢(shì),騰訊云深在AI與量子化學(xué)的結(jié)合方向上研發(fā)了獨(dú)特的DeepQC框架,可以在大的體系上,花費(fèi)較少的算力達(dá)到高的精度。實(shí)際上,只靠數(shù)據(jù)驅(qū)動(dòng)的AI缺乏可解釋性,如果能將AI算法跟物理、化學(xué)領(lǐng)域知識(shí)結(jié)合起來,這樣訓(xùn)練出來的模型過擬合風(fēng)險(xiǎn)較低,在實(shí)際應(yīng)用中也有非常好的可解釋性。