国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從基礎(chǔ)智能到通用智能: 基于大模型的GenAI 和AGI 之現(xiàn)狀與展望

2024-04-30 08:07繆青海王興霞王雨桐陳圓圓田永林林懿倫馬嘉琪那曉翔王飛躍
自動(dòng)化學(xué)報(bào) 2024年4期
關(guān)鍵詞:聯(lián)邦人工智能模型

繆青海 王興霞, 楊 靜, 趙 勇 王雨桐 陳圓圓 田永林 俞 怡 林懿倫 鄢 然 馬嘉琪 那曉翔 王飛躍,

繼ChatGPT[1]之后,視頻生成大模型Sora 又一次掀起了全球智能化浪潮[2-3].Sora 借助跨模態(tài)基礎(chǔ)模型(Foundation model)的強(qiáng)大能力,初步展現(xiàn)出世界模擬器的潛力,加速?gòu)恼Z(yǔ)言智能向想象智能的轉(zhuǎn)變.在此背景下,生成式人工智能(Generative artificial intelligence,GenAI)作為實(shí)現(xiàn)通用人工智能(Artificial general intelligence,AGI)的重要方式之一,成為各國(guó)重點(diǎn)關(guān)注的領(lǐng)域.近年來(lái),我國(guó)高度重視新質(zhì)生產(chǎn)力的發(fā)展,在生成式人工智能領(lǐng)域也呈現(xiàn)出“百模大戰(zhàn)”的繁榮局面,但在創(chuàng)新首發(fā)、最高水準(zhǔn)等方面整體水平距離世界先進(jìn)仍有不小差距.因此,應(yīng)對(duì)挑戰(zhàn),從算力、數(shù)據(jù)、算法、人才、產(chǎn)業(yè)、安全、治理等方面探討應(yīng)對(duì)策略,成為當(dāng)務(wù)之急.

本文首先簡(jiǎn)述國(guó)內(nèi)外生成式人工智能的起源、發(fā)展與現(xiàn)狀,在此基礎(chǔ)上從數(shù)據(jù)、算力、算法、生態(tài)等方面對(duì)中外生成式人工智能發(fā)展進(jìn)行對(duì)比、分析.面對(duì)我國(guó)生成式人工智能所面臨的挑戰(zhàn),討論相應(yīng)的對(duì)策,特別是探討區(qū)塊鏈技術(shù)、DAO 與DeSci機(jī)制對(duì)于建立智能聯(lián)邦生態(tài)和基礎(chǔ)智能系統(tǒng)的重要意義,最后展望生成式人工智能的未來(lái)發(fā)展與社會(huì)影響.

1 國(guó)外發(fā)展現(xiàn)狀

1.1 理論與算法概述

基于大模型的生成式人工智能(GenAI)涉及多種算法、模型和理論,而深度學(xué)習(xí)則是構(gòu)建這些模型的基石.深度學(xué)習(xí)利用多層神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)輸入數(shù)據(jù)中的復(fù)雜模式和規(guī)律,實(shí)現(xiàn)了對(duì)數(shù)據(jù)特征的高效提取和表示[4].深度學(xué)習(xí)的研究歷史可以追溯到上世紀(jì)50 年代和60 年代,由于當(dāng)時(shí)計(jì)算資源有限、數(shù)據(jù)稀缺以及算法的限制,深度學(xué)習(xí)并沒(méi)有受到廣泛的關(guān)注和應(yīng)用.直到20 世紀(jì)末和21 世紀(jì)初,隨著計(jì)算機(jī)性能的提升和大規(guī)模數(shù)據(jù)的可用性增加,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)[5]、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNNs)[6]、深度信念網(wǎng)絡(luò)(Deep belief networks)[7]等深度學(xué)習(xí)模型先后被提出,尤其是在2012 年,AlexNet在ImageNet 數(shù)據(jù)集上取得了顯著的性能提升[8],引發(fā)了廣泛的關(guān)注和熱議,深度學(xué)習(xí)開(kāi)始逐漸成為人工智能領(lǐng)域的研究熱點(diǎn).深度學(xué)習(xí)的另一個(gè)里程碑是Vaswani 等于2017 年提出Transformer[9],其引入了自注意力機(jī)制(Self-Attention mechanism),使得模型能夠在不依賴于序列位置的情況下對(duì)自然語(yǔ)言序列中的單詞進(jìn)行建模,有效地捕捉長(zhǎng)距離依賴關(guān)系.Transformer 不僅被應(yīng)用于機(jī)器翻譯、語(yǔ)言建模、文本生成等自然語(yǔ)言處理任務(wù),還被廣泛應(yīng)用于圖片、視頻、語(yǔ)音處理與分析等多個(gè)領(lǐng)域[10-12].

隨著Transformer 的出現(xiàn),深度學(xué)習(xí)模型規(guī)模迅速擴(kuò)大,BERT、GPT 等一系列預(yù)訓(xùn)練語(yǔ)言大模型在自然語(yǔ)言處理領(lǐng)域取得突破性進(jìn)展,在包括文本生成、問(wèn)答、閱讀理解、邏輯推理等幾乎所有自然語(yǔ)言處理任務(wù)上取得了最高技術(shù)水平 (State of the art,SOTA)[13-22].在此基礎(chǔ)上,OpenAI 開(kāi)發(fā)了基于GPT-3.5 及以上版本的ChatGPT,由于其出色的對(duì)話生成性能,引發(fā)了人們對(duì)智能對(duì)話系統(tǒng)的廣泛興趣和關(guān)注,成為了近年來(lái)研究和應(yīng)用領(lǐng)域的熱點(diǎn)之一.隨著基于Transformer 的預(yù)訓(xùn)練模型在自然語(yǔ)言處理領(lǐng)域取得成功,該技術(shù)在計(jì)算機(jī)視覺(jué)和多模態(tài)預(yù)訓(xùn)練模型領(lǐng)域也開(kāi)始得到應(yīng)用,并展現(xiàn)出了出色的性能[23-24].

另一方面,擴(kuò)散模型(Diffusion models)[25]也是一類生成式人工智能模型,它們通過(guò)模擬數(shù)據(jù)的擴(kuò)散過(guò)程來(lái)生成新的樣本.這些模型的工作原理類似于物理學(xué)中的擴(kuò)散過(guò)程,即從高濃度區(qū)域向低濃度區(qū)域逐漸擴(kuò)散,直至達(dá)到平衡狀態(tài).在生成任務(wù)中,擴(kuò)散模型通常從一個(gè)隨機(jī)噪聲分布開(kāi)始,然后逐步引導(dǎo)這個(gè)噪聲向目標(biāo)數(shù)據(jù)分布轉(zhuǎn)變.這個(gè)過(guò)程可以通過(guò)迭代的方式進(jìn)行,每一步都會(huì)使噪聲更加接近真實(shí)的數(shù)據(jù)分布.具體來(lái)說(shuō),擴(kuò)散模型包含兩個(gè)主要階段: 正向擴(kuò)散(Forward process)和反向生成(Reverse process).擴(kuò)散模型在圖像生成、文本生成等領(lǐng)域表現(xiàn)出色,能夠生成高質(zhì)量的樣本.與其他生成模型如生成對(duì)抗網(wǎng)絡(luò)(GANs)和變分自編碼器(VAEs)相比,擴(kuò)散模型具有獨(dú)特的優(yōu)勢(shì),例如更好的樣本多樣性和更平滑的生成過(guò)程.

1.2 典型GenAI 模型

表1 列出了國(guó)外典型的GenAI 模型.在自然語(yǔ)言處理領(lǐng)域,2018 年是大語(yǔ)言模型(LLMs)發(fā)展的重要節(jié)點(diǎn).OpenAI 和Google 相繼推出了基于Transformer 的GPT-1 和BERT 模型[10-11],為這一領(lǐng)域的發(fā)展奠定了基礎(chǔ).GPT 和BERT 模型的發(fā)布引領(lǐng)了大語(yǔ)言模型的發(fā)展方向.隨后,RoBERTa 對(duì)BERT進(jìn)行了改進(jìn)和優(yōu)化,通過(guò)改進(jìn)掩碼方式、增加數(shù)據(jù)集規(guī)模和優(yōu)化訓(xùn)練方法,提升了在多個(gè)自然語(yǔ)言處理任務(wù)上的性能[26].BART 結(jié)合了編碼器解碼器結(jié)構(gòu)和掩碼語(yǔ)言模型的訓(xùn)練方式,能夠同時(shí)處理生成和填充任務(wù)[27].T5 則通過(guò)轉(zhuǎn)換器架構(gòu)實(shí)現(xiàn)了多種任務(wù)的統(tǒng)一模型,進(jìn)一步提高了自然語(yǔ)言處理任務(wù)的效率和性能[28].GPT 系列模型采用了自回歸生成方式,其中模型會(huì)逐步生成文本,每個(gè)詞的生成都依賴于先前生成的內(nèi)容[29].這種生成方式使得GPT模型在文本生成任務(wù)中表現(xiàn)突出,尤其在生成連貫、自然的文本方面效果顯著.2023 年3 月發(fā)布的GPT-4 具備多模態(tài)輸入輸出能力,能夠處理文字、圖像和語(yǔ)音數(shù)據(jù)[30].Google 隨后推出了PaLM 2,通過(guò)強(qiáng)化邏輯和推理訓(xùn)練,該模型在某些邏輯和推理任務(wù)上超越了GPT-4[31].在開(kāi)源大語(yǔ)言模型領(lǐng)域,Llama系列模型是典型代表,Meta 于2023 年6 月發(fā)布的Llama 2 在性能上接近于GPT-3.5[32-33].大語(yǔ)言模型最新的進(jìn)展是Anthropic 于2024 年3 月發(fā)布了Claude 3,該模型在多項(xiàng)任務(wù)上超越了GPT-4[34].

表1 國(guó)外主要GenAI 模型Table 1 Typical foreign GenAI models

隨著大語(yǔ)言模型在自然語(yǔ)言處理領(lǐng)域的成功應(yīng)用,人們開(kāi)始探索將這些模型擴(kuò)展到計(jì)算機(jī)視覺(jué)領(lǐng)域.與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型相比,Vision Transformer (ViT)模型通過(guò)引入自注意力機(jī)制,并利用更大規(guī)模數(shù)據(jù)集進(jìn)行學(xué)習(xí),在包括圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割、圖像生成和視頻摘要等多個(gè)領(lǐng)域?qū)崿F(xiàn)了顯著的精度提升[35].OpenAI 在2021 年1 月發(fā)布了DALL·E 模型,該模型根據(jù)給定的文本描述生成與描述相匹配的圖像.隨后,擴(kuò)散模型逐步受到關(guān)注,OpenAI 在2022 年4 月、2023 年9 月先后發(fā)布了DALL·E 2 和DALL·E 3 模型,進(jìn)一步提升了圖像生成的準(zhǔn)確性和創(chuàng)意性[36-37].Stability AI 在2022 年8 月發(fā)布了Stable Diffusion 模型[38],該模型在生成圖像時(shí)具有更好的穩(wěn)定性和控制性,被視為圖像生成發(fā)展過(guò)程中的一個(gè)里程碑事件.相比于圖像生成更多地關(guān)注單個(gè)靜態(tài)圖像的質(zhì)量和內(nèi)容,視頻生成除了要考慮靜態(tài)內(nèi)容的生成外,還需要考慮時(shí)間維度上的連續(xù)性和動(dòng)態(tài)變化,因而模型需要更深層次地理解時(shí)間序列數(shù)據(jù),并能夠準(zhǔn)確地預(yù)測(cè)和生成未來(lái)的幀.在近幾年的研究中,視頻生成領(lǐng)域涌現(xiàn)出多項(xiàng)引人注目的模型和技術(shù),為視頻內(nèi)容的創(chuàng)作和生成開(kāi)辟了新的前景.Meta 于2022 年9 月發(fā)布了Make-A-Video 模型,該模型以其卓越的視頻生成能力為用戶提供了高質(zhì)量視頻內(nèi)容的創(chuàng)作平臺(tái)[39].隨后,在2023 年2 月,Runway 公司推出了Gen-2 模型,該模型通過(guò)引入創(chuàng)新的算法和訓(xùn)練技術(shù),進(jìn)一步提升了視頻生成的質(zhì)量和多樣性.Google 于2024 年1 月發(fā)布了基于擴(kuò)散模型的Lumiere,利用Space-Time U-Net(STUNet) 架構(gòu)捕捉視頻中的時(shí)空信息,有效提高了視頻的長(zhǎng)度、運(yùn)動(dòng)的連貫性和一致性[40].近期,OpenAI 發(fā)布了Sora 模型,引發(fā)了全球的關(guān)注,該模型生成的畫(huà)面可以很好地展現(xiàn)場(chǎng)景中的光影關(guān)系,物體間的物理遮擋、碰撞關(guān)系[41].

通過(guò)上述分析,我們認(rèn)為生成式人工智能(GenAI)研發(fā)范式與之前的深度學(xué)習(xí)有著明顯的不同之處.在過(guò)去,深度學(xué)習(xí)的理論與算法研究主要由大學(xué)和學(xué)術(shù)界參與,而生成式人工智能的發(fā)展主要由包括OpenAI,Google,Meta,Anthropic,Midjourney和Stability AI 在內(nèi)的多家公司推動(dòng).這些公司在生成式人工智能領(lǐng)域投入了大量資源,并通過(guò)研發(fā)和商業(yè)應(yīng)用推動(dòng)了技術(shù)的進(jìn)步和應(yīng)用,使得生成式人工智能能夠更快地從實(shí)驗(yàn)室走向市場(chǎng),并在各個(gè)領(lǐng)域取得廣泛的應(yīng)用和影響.

2 國(guó)內(nèi)發(fā)展現(xiàn)狀

自2022 年11 月30 日ChatGPT 面世以來(lái),國(guó)產(chǎn)大模型迅速涌現(xiàn),呈現(xiàn)出百家爭(zhēng)鳴的態(tài)勢(shì).如圖1所示,不論是工業(yè)界還是學(xué)術(shù)界,都紛紛推出具有各自特色的大模型,并持續(xù)進(jìn)行迭代與升級(jí).百度于2019 年首次推出文心1.0 通用大模型[42],該模型當(dāng)前已升級(jí)至4.0 版本.阿里云、華為、騰訊、科大訊飛等廠商相繼推出通義千問(wèn)[43]、盤古[44]、混元1https://hunyuan.tencent.com/、星火2https://xinghuo.xfyun.cn/等大模型并向公眾開(kāi)放.在這場(chǎng)“百模大戰(zhàn)”中,不少初創(chuàng)企業(yè)也展現(xiàn)出了令人矚目的成績(jī),如2023 年4 月成立的北京月之暗面科技有限公司,其發(fā)布的Kimi 智能助手3https://kimi.moonshot.cn/大模型一經(jīng)推出即支持高達(dá)20 萬(wàn)漢字的無(wú)損上下文長(zhǎng)度,并在最新版本中將此指標(biāo)擴(kuò)展至驚人的200 萬(wàn)漢字,引起了廣泛關(guān)注.除此之外,學(xué)術(shù)界也在積極參與國(guó)產(chǎn)大模型的研究當(dāng)中,例如中國(guó)科學(xué)院自動(dòng)化所于2021 年6月發(fā)布的全球首個(gè)圖文音(視覺(jué)-文本-語(yǔ)音)三模態(tài)預(yù)訓(xùn)練模型——紫東太初大模型4https://taichu-web.ia.ac.cn/,北京智源研究院的悟道大模型5https://www.baai.ac.cn/,以及上海人工智能實(shí)驗(yàn)室與復(fù)旦大學(xué)等單位于2023 年6 月聯(lián)合發(fā)布的書(shū)生·浦語(yǔ)通用大模型(InternLM)[45].當(dāng)前,國(guó)產(chǎn)通用大模型已不乏百億,甚至千億參數(shù)量級(jí)的選手.為了促進(jìn)國(guó)產(chǎn)大模型技術(shù)與市場(chǎng)的進(jìn)一步發(fā)展,一些廠商提供了開(kāi)源版本的大模型,例如阿里云的Qwen 系列開(kāi)源模型,零一萬(wàn)物的Yi 系列開(kāi)源模型6https://www.lingyiwanwu.com/,以及智譜華章公司的GLM 系列7https://zhipuai.cn/,科大訊飛的iFlytekSpark 系列,百川智能的Baichuan 系列[46]等.

圖1 國(guó)產(chǎn)大模型發(fā)展全景Fig.1 Panorama of the development of domestic large models

在專用領(lǐng)域大模型方面,國(guó)內(nèi)的大模型主要集中在工業(yè)、醫(yī)學(xué)、金融、交通、教育、農(nóng)業(yè)、傳媒、司法、AI4S 等領(lǐng)域[47-63],如圖1 所示.

1)在AI4S 領(lǐng)域,華為盤古氣象大模型基于39年的全球氣象數(shù)據(jù)開(kāi)發(fā)了基于三維深度神經(jīng)網(wǎng)絡(luò)和地球特定先驗(yàn)知識(shí)的實(shí)時(shí)氣象預(yù)測(cè)系統(tǒng),在預(yù)測(cè)精度上首次超越傳統(tǒng)的基于數(shù)值的預(yù)測(cè)方法[64].華東師范大學(xué)的研究者構(gòu)建了ChenGPT1.08https://www.ecnu.edu.cn/info/1426/65145.htm,可以實(shí)現(xiàn)化學(xué)專業(yè)知識(shí)、生物醫(yī)藥以及通用領(lǐng)域的知識(shí)問(wèn)答.上海交通大學(xué)發(fā)布的白玉蘭科學(xué)大模型BAIChem9https://www.seiee.sjtu.edu.cn/index_news/8667.html,能夠?qū)崿F(xiàn)快速高效的藥物分子設(shè)計(jì),并在逆合成、產(chǎn)率預(yù)測(cè)、催化劑推薦等任務(wù)上取得了較高準(zhǔn)確率.

2)在教育領(lǐng)域,華東師范大學(xué)和北京語(yǔ)言大學(xué)在預(yù)訓(xùn)練大模型的基礎(chǔ)上,分別建立EduChat[65]和桃李教育大模型10https://github.com/blcuicall/taoli,能夠?qū)崿F(xiàn)考題設(shè)計(jì)與解答、課程咨詢問(wèn)答等功能.學(xué)而思開(kāi)發(fā)了九章大模型(Math-GPT)11https://www.mathgpt.com/能夠解決數(shù)學(xué)課程中的習(xí)題并提供解題思路.網(wǎng)易有道發(fā)布了子曰教育大模型12https://ziyue.youdao.com//home,支持聽(tīng)說(shuō)讀寫等多任務(wù)的智能培訓(xùn).

3)在工業(yè)領(lǐng)域,中國(guó)科學(xué)院大連化物所發(fā)布了化工大模型13http://dicp.cas.cn/xwdt/kyjz/202403/t20240324_7050498.html,能實(shí)現(xiàn)化工知識(shí)問(wèn)答、化工流程自動(dòng)生成等功能.中工互聯(lián)公司針對(duì)工業(yè)領(lǐng)域的故障預(yù)測(cè)、智能維護(hù)、方案優(yōu)化等任務(wù),構(gòu)建了“智工”大模型14http://www.ciictec.com/ciigpt,成為中國(guó)工業(yè)領(lǐng)域首個(gè)開(kāi)源大語(yǔ)言模型.中煤科工西安研究院利用礦井信息系統(tǒng),構(gòu)建了地質(zhì)垂直領(lǐng)域大模型——GeoGPT15http://www.cctegxian.com/html/news/2023-12-18/4185.html,實(shí)現(xiàn)地質(zhì)行業(yè)知識(shí)問(wèn)答,并成功應(yīng)用于透明地質(zhì)保障任務(wù)中.

4)在醫(yī)學(xué)領(lǐng)域,華南理工大學(xué)構(gòu)建了生活空間健康大模型“扁鵲”(BianQue)[66]和心理健康大模型“靈心”(SoulChat)[67],分別用于生理健康診斷問(wèn)答以及心理健康咨詢.香港中文大學(xué)基于中文問(wèn)診數(shù)據(jù),構(gòu)建了華佗GPT 模型[68],用于智能醫(yī)療問(wèn)答.浙江大學(xué)的研究團(tuán)隊(duì)構(gòu)建了啟真醫(yī)療大模型16https://github.com/CMKRG/QiZhenGPT.醫(yī)聯(lián)科技推出了medGPT 大模型17http://web-qa.medlinker.com/pc/product/medgpt,能夠?qū)? 000種疾病進(jìn)行初步診斷.在中醫(yī)藥大模型方面,百度健康與固生堂聯(lián)合發(fā)布了岐黃問(wèn)道大模型18http://www.dajingtcm.com/node/21;華東師范大學(xué)研發(fā)神農(nóng)中醫(yī)藥大模型(ShenNong-TCM)19https://github.com/ywjawmw/TCMEB;復(fù)旦大學(xué)和同濟(jì)大學(xué)合作研發(fā)了仲景中醫(yī)大語(yǔ)言模型(CMLM-ZhongJing)20https://github.com/SupritYoung/Zhongjing.

5)在金融領(lǐng)域,中國(guó)科學(xué)院成都計(jì)算機(jī)應(yīng)用研究所開(kāi)發(fā)了用于金融知識(shí)問(wèn)答的大模型“聚寶盆”21https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese.git.度小滿發(fā)布了中文金融領(lǐng)域的首個(gè)千億級(jí)開(kāi)源大模型“軒轅”[69].恒生電子發(fā)布了金融大模型LightGPT22https://www.hundsun.com/lightgpt.瀾舟科技發(fā)布了以金融為核心應(yīng)用的孟子大模型23https://www.langboat.com/portal/mengzi-gpt.香港科技大學(xué)研發(fā)了面向投資的金融大模型InvestLM24https://github.com/AbaciNLP/InvestLM.

政策面上,為了國(guó)產(chǎn)大模型的規(guī)范化和健康化發(fā)展,國(guó)家網(wǎng)信辦聯(lián)合國(guó)家發(fā)展改革委、教育部、科技部等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,規(guī)定對(duì)生成式AI 大模型實(shí)施“備案制”管理.此外,為了滿足當(dāng)前國(guó)產(chǎn)大模型發(fā)展所引發(fā)的巨大算力需求,我國(guó)陸續(xù)出臺(tái)了《全國(guó)一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實(shí)施方案》、《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》、《“十四五”數(shù)字經(jīng)濟(jì)發(fā)展規(guī)劃》等一系列文件推動(dòng)算力基礎(chǔ)設(shè)施建設(shè).

為了增強(qiáng)對(duì)蓬勃發(fā)展的國(guó)產(chǎn)大模型的認(rèn)識(shí),新華社研究院中國(guó)企業(yè)發(fā)展研究中心于2023 年發(fā)布了三版《2023 年人工智能大模型體驗(yàn)報(bào)告》,回顧了大模型產(chǎn)品市場(chǎng)的激烈競(jìng)爭(zhēng),并對(duì)當(dāng)前大模型產(chǎn)品和廠商進(jìn)行了整體測(cè)評(píng).同時(shí),多個(gè)機(jī)構(gòu)也推出了各自的大模型評(píng)測(cè)體系和排行榜,如“司南” (Open-Compass)、C-Eval、SuperCLUE 等,從中不難看出,廠商間的競(jìng)爭(zhēng)激烈,得分頻繁變動(dòng),這不僅展現(xiàn)了國(guó)產(chǎn)大模型的競(jìng)爭(zhēng)態(tài)勢(shì),也彰顯了該行業(yè)的活力與吸引力.

3 國(guó)內(nèi)外對(duì)比

本節(jié)在分析國(guó)內(nèi)外進(jìn)展的基礎(chǔ)上,從算力、數(shù)據(jù)、算法以及產(chǎn)業(yè)生態(tài)等四個(gè)維度對(duì)中美生成式AI 領(lǐng)域現(xiàn)狀進(jìn)行對(duì)比.由表2 可見(jiàn)中美之間存在顯著差異,美國(guó)領(lǐng)先優(yōu)勢(shì)明顯.

表2 中美生成式AI 領(lǐng)域現(xiàn)狀Table 2 Current status of generative AI fields in China and the United States

首先,在算力方面,美國(guó)企業(yè)英偉達(dá)占據(jù)全球AI 計(jì)算的壟斷地位,而華為在中國(guó)AI 計(jì)算領(lǐng)域最為領(lǐng)先.目前,雙方主力計(jì)算卡分別是英偉達(dá)的H100(SXM)25https://resources.nvidia.com/en-us-tensor-core/nvidia-tensorcore-gpu-datasheet和華為的昇騰Ascend 910 系列26https://e.huawei.com/cn/products/computing/ascend.以AI 計(jì)算基準(zhǔn)精度FP16 來(lái)看,H100(SXM)算力達(dá)到了1 979 TFLOPS,華為Ascend 910 為280 TFLOPS;以大模型訓(xùn)練所倚重的顯存來(lái)看,H100(SXM)具有80 G 第三代高帶寬顯存HBM3,華為Ascend 910 為16 G DDR4,而內(nèi)存類型的不同帶來(lái)更大差距;卡間互聯(lián)數(shù)據(jù)傳輸帶寬是訓(xùn)練大模型的重要瓶頸之一,H100(SXM)憑借英偉達(dá)獨(dú)有的NVLINK技術(shù)具有900 GB/s 的帶寬,昇騰910 的帶寬參數(shù)不詳.除此之外,驅(qū)動(dòng)、算子及API 接口是發(fā)揮硬件設(shè)備并行計(jì)算能力的支撐要素,是AI 算法的基石.英偉達(dá)的計(jì)算統(tǒng)一設(shè)備架構(gòu)CUDA,自2006 年創(chuàng)建后不斷迭代、性能完善、用戶眾多,在此基礎(chǔ)上發(fā)展出CuDNN 等專用庫(kù),已形成軟硬件協(xié)同的生態(tài)優(yōu)勢(shì).而華為自研的異構(gòu)計(jì)算架構(gòu)CANN 自2018年發(fā)布,起步較晚,功能正在逐步完善.需要注意的是,英偉達(dá)在2023 年中發(fā)布了H20027https://www.nvidia.com/en-us/data-center/h200/,第三代HBM顯存容量提升到141 G,大模型(Llama2 70B)的推理速度相比H100 翻倍.2024 年3 月,英偉達(dá)發(fā)布新一代GB200 Grace Blackwell 計(jì)算核心28https://www.nvidia.com/en-us/data-center/gb200-nvl72/,半精度FP16 算力達(dá)到10 000 TFLOPS,顯存容量達(dá)到384 G,大模型訓(xùn)練性能大幅提升.華為的升級(jí)版本Ascend 910B 和920 系列在算力、顯存方面都有提升,但具體數(shù)據(jù)沒(méi)有公布.在短期內(nèi),國(guó)內(nèi)外算力差距進(jìn)一步拉大.

其次,在訓(xùn)練數(shù)據(jù)方面,美國(guó)已經(jīng)形成了政府、社會(huì)之間職責(zé)清晰、分工明確、相互合作的運(yùn)行機(jī)制29阿里研究院《中美大模型的競(jìng)爭(zhēng)之路: 從訓(xùn)練數(shù)據(jù)講起》報(bào)告..一方面,政府建立數(shù)據(jù)開(kāi)放平臺(tái),負(fù)責(zé)維護(hù)和管理,確保數(shù)據(jù)質(zhì)量,提高可用性,降低公眾使用門檻.例如,PubMed30https://pubmed.ncbi.nlm.nih.gov/論文檢索系統(tǒng)包含了超過(guò)3 600萬(wàn)條生物醫(yī)學(xué)文獻(xiàn),國(guó)家氣象和海洋局、聯(lián)邦和地方法院也都實(shí)現(xiàn)了數(shù)據(jù)公開(kāi),并提供了API 接口供調(diào)用.另一方面,社會(huì)力量(開(kāi)源/非盈利組織、互聯(lián)網(wǎng)公司研究部門、學(xué)界和多類型機(jī)構(gòu)等)整合政府的開(kāi)放數(shù)據(jù)和網(wǎng)絡(luò)的公開(kāi)數(shù)據(jù),提升數(shù)據(jù)精細(xì)度和專業(yè)性,形成以開(kāi)源為主的高質(zhì)量訓(xùn)練語(yǔ)料.例如Eleuther AI 開(kāi)發(fā)的825 GB 英文語(yǔ)料庫(kù)The Pile31https://pile.eleuther.ai/,DeepMind 聯(lián)合33 家學(xué)術(shù)實(shí)驗(yàn)室創(chuàng)建了Open X-Embodiment 開(kāi)源數(shù)據(jù)集等.此外,在政府與社會(huì)力量協(xié)同方面,美國(guó)聯(lián)邦政府采取“應(yīng)開(kāi)盡開(kāi)”的原則,發(fā)揮了AI 訓(xùn)練數(shù)據(jù)“匯聚融合”的作用,建立統(tǒng)一的數(shù)據(jù)匯聚標(biāo)準(zhǔn),推動(dòng)多方協(xié)作的數(shù)據(jù)資源開(kāi)發(fā)利用,促進(jìn)多方數(shù)據(jù)融合.我國(guó)公共數(shù)據(jù)包括各級(jí)行政機(jī)關(guān)獲取的數(shù)據(jù),范圍較廣,但在開(kāi)放共享和開(kāi)發(fā)利用上存在不足,例如天氣數(shù)據(jù)在數(shù)據(jù)范圍和歷史跨度上有較大限制,法律領(lǐng)域的裁判文書(shū)網(wǎng)由社會(huì)公開(kāi)轉(zhuǎn)為僅供內(nèi)網(wǎng)查詢.社會(huì)力量主要結(jié)合海外優(yōu)質(zhì)開(kāi)源數(shù)據(jù)集,中文語(yǔ)料主要來(lái)源于網(wǎng)絡(luò)公開(kāi)數(shù)據(jù),政府?dāng)?shù)據(jù)貢獻(xiàn)少.總體而言,中文語(yǔ)料庫(kù)的量、質(zhì)、開(kāi)源情況都不如英文,這導(dǎo)致了訓(xùn)練大模型的困難,其中公共數(shù)據(jù)開(kāi)放不足和企業(yè)合規(guī)意識(shí)低是主要原因之一.相比之下,與美國(guó)政府和社會(huì)力量協(xié)同開(kāi)放數(shù)據(jù)以服務(wù)于訓(xùn)練語(yǔ)料的模式有所不同,我國(guó)尚未形成對(duì)大模型提供有效數(shù)據(jù)資源的生態(tài),存在數(shù)據(jù)資源碎片化和流通機(jī)制不完善的問(wèn)題.

第三,在算法、模型的創(chuàng)新方面,美國(guó)處于全面領(lǐng)先.2017 年谷歌提出的Transformer 已經(jīng)成為生成式AI 的核心模塊.在大語(yǔ)言模型方面,谷歌的BERT 和OpenAI 的GPT 最先開(kāi)啟了新時(shí)代,特別是OpenAI 發(fā)布的ChatGPT 成為AI 發(fā)展路程上的一個(gè)里程碑.而后續(xù)的GPT-4 以其在多數(shù)任務(wù)指標(biāo)上的優(yōu)異表現(xiàn),在眾多語(yǔ)言大模型中仍然占據(jù)榜首.Meta 開(kāi)源的Llama 大模型雖然稍晚、性能稍遜,但是因其開(kāi)源屬性,成為世界上眾多大模型的源頭.在文本生成圖像方面,OpenAI 的DALL·E和谷歌的Imagen 在2022 年最先發(fā)布,以其高真實(shí)度的效果迅速引起了全球范圍的注意,AIGC 進(jìn)入新時(shí)代.在文本生成視頻方面,OpenAI 在2024 年2 月發(fā)布Sora,再次取得歷史性突破.在大語(yǔ)言模型領(lǐng)域,國(guó)內(nèi)的百度、智源、中國(guó)科學(xué)院等單位具有先發(fā)優(yōu)勢(shì),推出文心一言、GLM 等大模型.2022 年以來(lái)在開(kāi)源力量等因素的推動(dòng)下,國(guó)內(nèi)形成“百模大戰(zhàn)”的繁榮局面,但整體上的性能沒(méi)有超過(guò)GPT-4 等國(guó)外模型.而在文本生成視頻方面,國(guó)內(nèi)與Sora 的差距更為明顯.

最后,在企業(yè)、學(xué)術(shù)、人才等產(chǎn)業(yè)生態(tài)方面,美國(guó)仍然全面的領(lǐng)先.根據(jù)State of AI Report 202332https://www.stateof.ai/統(tǒng)計(jì)數(shù)據(jù),初創(chuàng)企業(yè)“獨(dú)角獸”是引領(lǐng)AI 創(chuàng)新的重要力量,2022 年以來(lái),美國(guó)的AI 初創(chuàng)企業(yè)累計(jì)315 家,總估值5.9 萬(wàn)億美元,而同期中國(guó)初創(chuàng)企業(yè)70 家,估值1.3 萬(wàn)億美元,是美國(guó)的22%.在頂級(jí)研究機(jī)構(gòu)和人才方面,根據(jù)AMiner33https://www.aminer.org/統(tǒng)計(jì)數(shù)據(jù),美國(guó)占比超過(guò)55%,而中國(guó)不足14%,約是美國(guó)的四分之一.從過(guò)去三年發(fā)表的高被引論文數(shù)量來(lái)看,美國(guó)220 多篇,中國(guó)60 多篇,只是美國(guó)的四分之一稍多.在AI 創(chuàng)新活力城市數(shù)量來(lái)看,美國(guó)33 座城市入選,而中國(guó)是19 座,約為美國(guó)的60%.

綜合分析,我國(guó)在算力設(shè)施、數(shù)據(jù)質(zhì)量、技術(shù)水平、創(chuàng)新能力、資金投入、人才儲(chǔ)備、產(chǎn)業(yè)發(fā)展、生態(tài)建設(shè)等方面全面落后.結(jié)合國(guó)際環(huán)境等因素,縮短差距面臨諸多挑戰(zhàn).

4 安全與治理

技術(shù)進(jìn)步拓展了人工智能在復(fù)雜任務(wù)處理中的能力,但同時(shí)也帶來(lái)了前所未有的安全風(fēng)險(xiǎn).這些風(fēng)險(xiǎn)遍及人工智能全生命周期的各個(gè)階段,包括數(shù)據(jù)采集和標(biāo)注、模型研發(fā)和訓(xùn)練、模型部署和上線、模型開(kāi)放和應(yīng)用,如圖2 所示.隨著應(yīng)用領(lǐng)域增多,其風(fēng)險(xiǎn)影響范圍也從技術(shù)本身擴(kuò)展到特定行業(yè)領(lǐng)域,甚至覆蓋全社會(huì)群體.例如,數(shù)據(jù)采集和標(biāo)注階段,風(fēng)險(xiǎn)從數(shù)據(jù)本身的質(zhì)量,發(fā)展到對(duì)知識(shí)產(chǎn)權(quán)的侵害和個(gè)人隱私的泄露;模型研發(fā)和訓(xùn)練階段,風(fēng)險(xiǎn)從模型魯棒性和有效性,發(fā)展到可解釋性和可審計(jì)性;模型部署和上線階段,風(fēng)險(xiǎn)從代碼安全、網(wǎng)絡(luò)安全問(wèn)題,發(fā)展到價(jià)值觀與意識(shí)形態(tài)、虛假信息和幻覺(jué)等問(wèn)題;模型開(kāi)放和應(yīng)用階段,風(fēng)險(xiǎn)從對(duì)技術(shù)本身的信任問(wèn)題,發(fā)展到強(qiáng)人工智能可控及造成災(zāi)難性風(fēng)險(xiǎn)(戰(zhàn)爭(zhēng)、失業(yè)、社會(huì)動(dòng)蕩)問(wèn)題.同時(shí),新型風(fēng)險(xiǎn)如侵犯隱私、幫助犯罪等,也隨著智能體交互協(xié)作等技術(shù)的發(fā)展和應(yīng)用,呈現(xiàn)出影響范圍快速擴(kuò)大的趨勢(shì),引起各國(guó)政府、科研機(jī)構(gòu)、企業(yè)等社會(huì)各層面的高度重視.因此,采取全方位、體系化的安全治理措施以應(yīng)對(duì)風(fēng)險(xiǎn)已成為國(guó)內(nèi)外共識(shí).

圖2 人工智能全生命周期四階段主要風(fēng)險(xiǎn),風(fēng)險(xiǎn)影響范圍隨技術(shù)發(fā)展逐漸增大Fig.2 The main risks of the four stages in the artificial intelligence lifecycle,and the risk impact gradually increases with technological development

4.1 國(guó)際安全治理現(xiàn)狀

當(dāng)前,各國(guó)公司和機(jī)構(gòu)往往使用不同的安全維度以定義和應(yīng)對(duì)人工智能技術(shù)風(fēng)險(xiǎn).例如,OpenAI將“對(duì)齊”作為其發(fā)展通用人工智能的核心理念,強(qiáng)調(diào)“有用、真實(shí)、無(wú)害”作為其指導(dǎo)原則[70].斯坦福大學(xué)的HELM 模型側(cè)重于技術(shù)細(xì)節(jié),從準(zhǔn)確性、不確定性/校準(zhǔn)、魯棒性、公平性、偏見(jiàn)、毒性和推斷效率等維度全面評(píng)估模型性能及其社會(huì)影響[71].歐盟強(qiáng)調(diào)安全治理維度應(yīng)包括人權(quán)尊重、技術(shù)與安全、隱私與數(shù)據(jù)治理、透明度、多樣性、非歧視與公平、社會(huì)與環(huán)境福祉以及問(wèn)責(zé)制等[72].美國(guó)則側(cè)重責(zé)任、公平、可追溯、可靠、可治理性等要求,注重人工智能系統(tǒng)的透明度、責(zé)任歸屬和治理能力.不同治理維度反映出國(guó)際社會(huì)在人工智能安全方面的多元化關(guān)注,旨在確保技術(shù)發(fā)展促進(jìn)社會(huì)福祉的同時(shí),又能有效避免負(fù)面影響.

相應(yīng)地,國(guó)際實(shí)踐采用了一系列創(chuàng)新方法以確保人工智能的安全發(fā)展.水印技術(shù)廣泛應(yīng)用于保護(hù)知識(shí)產(chǎn)權(quán)和個(gè)人隱私,通過(guò)在數(shù)據(jù)或模型中嵌入隱形標(biāo)記,確保產(chǎn)權(quán)可追溯且數(shù)據(jù)合法使用[73].安全對(duì)齊技術(shù)通過(guò)確保人工智能系統(tǒng)的價(jià)值觀與其研發(fā)機(jī)構(gòu)所在的社會(huì)價(jià)值觀一致,以避免數(shù)據(jù)可能帶來(lái)的偏見(jiàn)或歧視.人類反饋強(qiáng)化學(xué)習(xí)通過(guò)整合人類反饋來(lái)優(yōu)化模型決策,確保人工智能行為更加符合人類期望和道德標(biāo)準(zhǔn)[74].對(duì)抗樣本防御機(jī)制致力于提升模型魯棒性,確保人工智能系統(tǒng)能抵御惡意輸入,維持決策的穩(wěn)定和可靠[75].這些方法已在多個(gè)安全維度上取得顯著成效.

4.2 國(guó)內(nèi)安全治理現(xiàn)狀

在國(guó)內(nèi),人工智能安全治理的重心放在大模型的部署與應(yīng)用階段,主要關(guān)注大模型部署應(yīng)用過(guò)程中的內(nèi)容管理與合規(guī)性,以及在產(chǎn)業(yè)融合中可能出現(xiàn)的安全風(fēng)險(xiǎn).依據(jù)《生成式人工智能服務(wù)管理暫行辦法》等規(guī)定,國(guó)內(nèi)治理維度聚焦違反社會(huì)主義核心價(jià)值觀內(nèi)容、歧視性內(nèi)容、商業(yè)違法違規(guī)、侵犯他人合法權(quán)益、無(wú)法滿足特定服務(wù)類型的安全要求、模型應(yīng)拒答的內(nèi)容及模型不應(yīng)拒答的內(nèi)容等七大維度[76],旨在確保人工智能在實(shí)際應(yīng)用中的安全性、合法性和道德性,反映了國(guó)內(nèi)在人工智能治理方面的具體需求和重點(diǎn)關(guān)注領(lǐng)域.

針對(duì)風(fēng)險(xiǎn)治理,國(guó)內(nèi)采取了覆蓋法律法規(guī)、內(nèi)部治理、第三方評(píng)測(cè)及針對(duì)特定產(chǎn)業(yè)垂域的綜合措施,架構(gòu)如圖3 所示.法規(guī)層面,我國(guó)發(fā)布了《生成式人工智能服務(wù)管理暫行辦法》等一系列法律法規(guī)和指導(dǎo)性文件,確保人工智能發(fā)展符合倫理與法治要求[77].內(nèi)部治理重視治理工具開(kāi)源、測(cè)評(píng)數(shù)據(jù)集構(gòu)建,研發(fā)紅藍(lán)攻防測(cè)試和復(fù)雜場(chǎng)景沙箱仿真環(huán)境測(cè)試等技術(shù),增強(qiáng)模型的安全性和魯棒性[78-82].第三方評(píng)測(cè)通過(guò)共建數(shù)據(jù)激勵(lì)和開(kāi)放組件,鼓勵(lì)多方參與和技術(shù)共享,提升評(píng)測(cè)的透明性和客觀性[83].針對(duì)車聯(lián)網(wǎng)、自動(dòng)駕駛和工業(yè)互聯(lián)網(wǎng)等產(chǎn)業(yè)垂域,采用沙箱測(cè)試、多智能體協(xié)同測(cè)評(píng)與認(rèn)證等手段,確保模型在復(fù)雜應(yīng)用場(chǎng)景中的安全可靠[84-88].

圖3 國(guó)內(nèi)人工智能安全評(píng)估體系Fig.3 Artificial intelligence safety evaluation system in China

國(guó)內(nèi)外在人工智能安全治理的實(shí)踐差異主要源于產(chǎn)業(yè)結(jié)構(gòu)和應(yīng)用重點(diǎn)的不同.國(guó)際上,主要是歐美國(guó)家,源于其在創(chuàng)意產(chǎn)業(yè)、法律法規(guī)、技術(shù)研發(fā)等領(lǐng)域的先進(jìn)地位,其治理手段更多聚焦于技術(shù)創(chuàng)新的開(kāi)發(fā)與實(shí)施、價(jià)值觀對(duì)齊及模型的公平性、透明度和可追溯性,反映出對(duì)數(shù)據(jù)隱私、產(chǎn)權(quán)保護(hù)[89-90]等問(wèn)題的重視.相對(duì)而言,國(guó)內(nèi)治理則更側(cè)重于大模型的內(nèi)容管理、合規(guī)性以及滿足產(chǎn)業(yè)特定需求,這與中國(guó)全球首位的網(wǎng)民數(shù)量、高度覆蓋居民生活方方面面的數(shù)字產(chǎn)業(yè)現(xiàn)狀密切相關(guān).此外,國(guó)內(nèi)在法律法規(guī)的制定上表現(xiàn)出更多的明確性和具體性,為人工智能的健康發(fā)展提供了法律框架和政策指導(dǎo).這種差異源于展示了技術(shù)發(fā)展與應(yīng)用在全球范圍內(nèi)的多樣性,也體現(xiàn)了不同文化背景和社會(huì)價(jià)值觀的影響.

未來(lái)的安全治理將朝著形成框架性風(fēng)險(xiǎn)體系的方向邁進(jìn),通過(guò)推行人工智能分級(jí)分類制度,為不同行業(yè)提供定制化的安全解決方案,保障交通、醫(yī)療、教育、金融等關(guān)鍵領(lǐng)域的應(yīng)用安全;更為關(guān)鍵的是,人工智能安全不僅是技術(shù)領(lǐng)域的挑戰(zhàn),更是關(guān)乎全人類福祉的全球性議題,國(guó)際合作、全社會(huì)參與將是核心.必須不斷加強(qiáng)國(guó)際合作,推動(dòng)彌合各國(guó)數(shù)字鴻溝,應(yīng)對(duì)全球人工智能安全挑戰(zhàn);開(kāi)展產(chǎn)學(xué)研合作與安全社區(qū)構(gòu)建,促進(jìn)安全技術(shù)創(chuàng)新和公眾信任,確保技術(shù)的普惠性和持續(xù)發(fā)展.

5 挑戰(zhàn)與對(duì)策

在生成式人工智能領(lǐng)域,我國(guó)在算力、數(shù)據(jù)、人才、產(chǎn)業(yè)、安全、治理、生態(tài)等方面面臨系統(tǒng)性挑戰(zhàn).

首先,算力短缺是我國(guó)當(dāng)前面臨的首要挑戰(zhàn).針對(duì)這一困境,我國(guó)應(yīng)統(tǒng)籌發(fā)展高能效AI 計(jì)算硬件體系: 一方面,大力研發(fā)專門用于生成式AI 的處理器,突破傳統(tǒng)的體系結(jié)構(gòu),同時(shí)特別加強(qiáng)芯片制造工藝的投入,形成完整的微電子產(chǎn)業(yè)鏈,完善智能計(jì)算底層算法與軟件.另一方面,注重AI 計(jì)算的能效設(shè)計(jì),優(yōu)化算力與帶寬的損耗,同時(shí)將可再生能源,如水電、太陽(yáng)能和風(fēng)能,整合到AI 計(jì)算設(shè)施中,參考比特幣“挖礦”的算力集中模式,發(fā)揮我國(guó)西部可再生能源的優(yōu)勢(shì),推廣“東數(shù)西算”,使生成式AI 計(jì)算更具經(jīng)濟(jì)性,同時(shí)帶動(dòng)國(guó)家全域發(fā)展.

其次,數(shù)據(jù)的質(zhì)與量直接決定著大模型的性能.面對(duì)我國(guó)AI 數(shù)據(jù)存在的諸多問(wèn)題,聯(lián)邦數(shù)據(jù)[91-93]是有效應(yīng)對(duì)方案.聯(lián)邦數(shù)據(jù)在基于人工智能的應(yīng)用中扮演重要角色,可有效解決數(shù)據(jù)資源短缺、碎片化、不共享等挑戰(zhàn).它將大數(shù)據(jù)轉(zhuǎn)化為數(shù)據(jù)智能,通過(guò)數(shù)據(jù)實(shí)驗(yàn)探索最佳解決方案,可有效應(yīng)對(duì)數(shù)據(jù)安全和隱私問(wèn)題.聯(lián)邦數(shù)據(jù)架構(gòu)包括真實(shí)數(shù)據(jù)、虛擬數(shù)據(jù)、聯(lián)邦數(shù)據(jù)實(shí)驗(yàn)、聯(lián)邦融合、聯(lián)邦安全和可信聯(lián)邦智慧六個(gè)組成部分.實(shí)際數(shù)據(jù)和數(shù)字孿生體生成的虛擬數(shù)據(jù)被處理和檢索,聯(lián)邦數(shù)據(jù)實(shí)驗(yàn)利用強(qiáng)化學(xué)習(xí)和并行強(qiáng)化學(xué)習(xí)找到最佳模型參數(shù),聯(lián)邦融合將本地模型合成全局最優(yōu)模型.數(shù)據(jù)安全和隱私由聯(lián)邦安全組件實(shí)現(xiàn),確保數(shù)據(jù)所有權(quán)和使用權(quán)分離.通過(guò)聯(lián)邦數(shù)據(jù)實(shí)驗(yàn)和聯(lián)邦融合,可獲得可信聯(lián)邦智慧,提高人工智能的自學(xué)習(xí)能力.

最后,彌補(bǔ)中外人工智能的差距離不開(kāi)可持續(xù)發(fā)展的生態(tài)環(huán)境.AI 人才創(chuàng)新AI 方法,AI 方法促進(jìn)AI 產(chǎn)業(yè),AI 產(chǎn)業(yè)促進(jìn)社會(huì)繁榮,富裕、開(kāi)放、公平的社會(huì)環(huán)境培育和吸引更優(yōu)秀的人才.中國(guó)科學(xué)院王飛躍研究員提出的“聯(lián)邦生態(tài)”為創(chuàng)建這一良性循環(huán)提供建設(shè)性框架[93].除了聯(lián)邦數(shù)據(jù)外,聯(lián)邦生態(tài)系統(tǒng)還包括聯(lián)邦控制和聯(lián)邦管理,其最終目標(biāo)是提供聯(lián)邦服務(wù).聯(lián)邦控制[94]是聯(lián)邦生態(tài)的核心執(zhí)行部分,旨在維護(hù)信息安全,保護(hù)數(shù)據(jù)的所有權(quán)、控制權(quán)、隱私權(quán)和使用權(quán).它通過(guò)分布式控制策略,為復(fù)雜系統(tǒng)提供高效、安全、可靠的控制和管理,確保各子系統(tǒng)的信息安全和權(quán)益保護(hù).聯(lián)邦控制通過(guò)定義聯(lián)邦合約實(shí)現(xiàn)數(shù)據(jù)的聯(lián)邦,建立聯(lián)邦數(shù)據(jù)的控制體系,包括存儲(chǔ)、傳輸、共享和使用,同時(shí)保證數(shù)據(jù)安全.聯(lián)邦管理[95]根據(jù)聯(lián)邦生態(tài)的總體目標(biāo)和要求做出管理決策,并根據(jù)系統(tǒng)狀態(tài)實(shí)時(shí)動(dòng)態(tài)調(diào)整,以達(dá)到最優(yōu)狀態(tài),實(shí)現(xiàn)整個(gè)生態(tài)系統(tǒng)的智能化管理.通過(guò)聯(lián)邦管理決策,聯(lián)邦生態(tài)能夠更好地實(shí)現(xiàn)其目標(biāo),在保證安全的前提下轉(zhuǎn)化為聯(lián)邦智能安全.聯(lián)邦服務(wù)是通過(guò)對(duì)聯(lián)邦數(shù)據(jù)的控制和管理實(shí)現(xiàn)的,是聯(lián)邦管理的最終目的.它利用設(shè)計(jì)的聯(lián)邦管理規(guī)則,在保障節(jié)點(diǎn)數(shù)據(jù)安全和隱私的前提下,實(shí)現(xiàn)對(duì)聯(lián)邦數(shù)據(jù)的管理和控制,不斷產(chǎn)生新的數(shù)據(jù),用于優(yōu)化管理決策.

近年來(lái),區(qū)塊鏈技術(shù)、去中心化自治組織和分布式自治運(yùn)營(yíng)(DAO)機(jī)制在DeSci 浪潮推動(dòng)下成為AI 生態(tài)新引擎[96-100].DeSci 旨在建立一個(gè)去中心化、透明和安全的網(wǎng)絡(luò),供科學(xué)家共享數(shù)據(jù)、信息和研究成果.去中心化特性使科學(xué)家能以更公平、民主的方式合作.DAO 是DeSci 的實(shí)現(xiàn)方式,為人工智能創(chuàng)新和應(yīng)用提供了新的組織形式.DAO 是一種通過(guò)代碼在區(qū)塊鏈網(wǎng)絡(luò)上運(yùn)行的數(shù)字組織,成員擁有決策和執(zhí)行權(quán),實(shí)現(xiàn)了民主和透明.基于DAO的工作顯示出未來(lái)發(fā)展?jié)摿?區(qū)塊鏈技術(shù)在DeSci中扮演重要角色,確保了真實(shí)、可信、可靠、可用和高效.聯(lián)邦控制依賴于區(qū)塊鏈技術(shù)的支持,實(shí)現(xiàn)了聯(lián)邦安全、共識(shí)、激勵(lì)和合約.聯(lián)邦安全利用區(qū)塊鏈的安全機(jī)制,在加密、傳輸和驗(yàn)證聯(lián)邦數(shù)據(jù)時(shí)發(fā)揮作用.聯(lián)邦共識(shí)確保了聯(lián)邦節(jié)點(diǎn)之間的分布式共識(shí).聯(lián)邦激勵(lì)設(shè)計(jì)了快速、穩(wěn)定、正向的激勵(lì)措施,平衡了節(jié)點(diǎn)之間的利益,提高了系統(tǒng)效率.聯(lián)邦合約通過(guò)智能合約算法自動(dòng)、安全地實(shí)現(xiàn)了聯(lián)邦控制.

聯(lián)邦生態(tài)可以全面處理從數(shù)據(jù)生產(chǎn)到數(shù)據(jù)使用再到服務(wù)用戶的全過(guò)程問(wèn)題.它基于智能生態(tài)系統(tǒng)研究思想,能將數(shù)據(jù)轉(zhuǎn)化為智能,適用于各種聯(lián)邦形式.聯(lián)邦生態(tài)通過(guò)建立松散的聯(lián)盟關(guān)系,加強(qiáng)隱私保護(hù),調(diào)動(dòng)積極性,提高參與度,以提高整體績(jī)效.區(qū)塊鏈的TRUE 和分布式自治管理之DAO 相結(jié)合即為“真道” (TAO),形成完整的可信AI 生態(tài)系統(tǒng)[101-102].

6 總結(jié)與展望

伴隨GenAI 的通用智能技術(shù)發(fā)展,未來(lái)的智能社會(huì)和產(chǎn)業(yè)將圍繞Karl Popper 的三個(gè)世界[103]之大模型展開(kāi).物理世界之機(jī)器人、心理世界之生物人、人工世界之?dāng)?shù)字人將按Pareto 法則組成一個(gè)嶄新的世界: 80%以上是數(shù)字人、15%以下是機(jī)器人、5%以下是生物人[104-106].受GenAI 驅(qū)動(dòng),數(shù)字人完成認(rèn)知和決策任務(wù),機(jī)器人主要負(fù)責(zé)物理勞動(dòng)和操作,生物人依托數(shù)字人和機(jī)器人進(jìn)行更高層次的創(chuàng)新和管理.

工作將以三種模式由三種員工協(xié)調(diào)完成: 上午AM (Autonomous mode,自主模式),數(shù)字人在機(jī)器人的輔助和生物人的關(guān)注下完成絕大部分工作,時(shí)長(zhǎng)20 小時(shí)以上;下午PM (Parallel mode,平行模式),數(shù)字人和機(jī)器人在生物人的遠(yuǎn)程或云端指導(dǎo)下完成大部分工作,時(shí)長(zhǎng)三小時(shí)以下;晚間EM(Expert or emergency mode,專家或應(yīng)急模式),生物人必須趕赴現(xiàn)場(chǎng),在數(shù)字人和機(jī)器人的幫助下完成工作,時(shí)長(zhǎng)一小時(shí)以內(nèi).新的工作模式和分工方式可以減輕勞動(dòng)強(qiáng)度、提高生產(chǎn)效率和擴(kuò)大服務(wù)范圍,有效應(yīng)對(duì)當(dāng)前面臨的人口負(fù)增長(zhǎng)和老齡化的問(wèn)題,同時(shí)將重塑人類的工作和生活方式.未來(lái)人類將立法禁止“996 (碼農(nóng))”的工作方式,演化為“1023智儂節(jié)”: 每天早上十點(diǎn)上班,下午二點(diǎn)下班,每周工作四天,每年從一月二十三日開(kāi)始工作,十月二十三日結(jié)束工作,啟動(dòng)一年一度的智儂節(jié),希望其他節(jié)日假期依然保留.

猜你喜歡
聯(lián)邦人工智能模型
一“炮”而紅 音聯(lián)邦SVSound 2000 Pro品鑒會(huì)完滿舉行
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
303A深圳市音聯(lián)邦電氣有限公司
2019:人工智能
人工智能與就業(yè)
數(shù)讀人工智能
3D打印中的模型分割與打包
下一幕,人工智能!
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究