郭全中 朱燕
【摘要】ChatGPT的上線掀起了大語言模型的熱潮,除了谷歌、微軟、OpenAI、百度、阿里巴巴等科技巨頭,創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)企業(yè)也紛紛布局大模型。目前,生成式大語言模型在搜索引擎、辦公軟件和諸多垂直領(lǐng)域有了初步應(yīng)用,加快了產(chǎn)業(yè)智能化發(fā)展的步伐,未來,大語言模型將探索更多垂類應(yīng)用場(chǎng)景,產(chǎn)業(yè)結(jié)構(gòu)將進(jìn)一步分化。但大模型在落地應(yīng)用過程中也面臨著技術(shù)和社會(huì)層面的問題,需要各國(guó)在生成式人工智能的管理方面進(jìn)行規(guī)范與治理。
【關(guān)鍵詞】大語言模型;ChatGPT;生成式;廣布局;重應(yīng)用
2022年11月30日,基于生成式預(yù)訓(xùn)練模型GPT-3.5微調(diào)而來的新一代對(duì)話式自然語言識(shí)別模型ChatGPT上線,這是人工智能研究實(shí)驗(yàn)室Open AI歷經(jīng)四年迭代推出的生成式大語言模型。一般而言,大模型是指具有海量參數(shù)和復(fù)雜架構(gòu),用于深度學(xué)習(xí)任務(wù)的大容量模型,它采用的“預(yù)訓(xùn)練大模型■下游任務(wù)微調(diào)”模式極大地提高了模型的通用能力,呈現(xiàn)出“大模型”和“小模型”協(xié)進(jìn)、通用性與專用性并進(jìn)的發(fā)展趨勢(shì)。2023年1月末,上線僅兩個(gè)月,ChatGPT的月活用戶便突破1億,成為全球用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。面對(duì)用戶的對(duì)話、翻譯、分類、修改回答等指令,ChatGPT均呈現(xiàn)出極強(qiáng)的對(duì)用戶意圖的理解能力,其語言理解能力、邏輯推理能力與生成內(nèi)容能力的大幅提升是在自然語言處理領(lǐng)域的重要突破,是生成式AI(AIGC)極為關(guān)鍵的發(fā)展節(jié)點(diǎn)。ChatGPT的成功標(biāo)志著人工智能從以專用小模型訓(xùn)練為主的“手工作坊時(shí)代”邁入到以通用大模型預(yù)訓(xùn)練為主的“工業(yè)化時(shí)代”,成為人工智能發(fā)展的分水嶺。[1]
一、廣布局:多類主體大力布局大語言模型
無論是在訓(xùn)練研發(fā)的上游市場(chǎng),還是落地應(yīng)用的下游市場(chǎng),以美國(guó)、中國(guó)為代表的國(guó)家均展開了廣泛布局,除了互聯(lián)網(wǎng)公司和AI公司,科研機(jī)構(gòu)、各垂直行業(yè)巨頭企業(yè)也紛紛加入大語言模型賽道。目前,大語言模型賽道主要分為兩類:一類是聚焦基礎(chǔ)層通用大模型訓(xùn)練的巨頭公司和科研機(jī)構(gòu),另一類是聚焦在開源大模型的基礎(chǔ)上訓(xùn)練垂類大模型或單純專注垂直行業(yè)具體應(yīng)用的中型公司和應(yīng)用型廠商。
(一)國(guó)外大語言模型的發(fā)展現(xiàn)狀
美國(guó)在大語言模型領(lǐng)域的布局方面處于領(lǐng)先地位。在上游市場(chǎng),OpenAI、Anthropic、谷歌、Meta等行業(yè)巨頭和斯坦福大學(xué)、麻省理工學(xué)院等科研機(jī)構(gòu)均研發(fā)出了代表性大模型,在大模型的通用性方面實(shí)現(xiàn)了跨越式突破。以微軟、Jasper為代表的下游市場(chǎng)則將語言生成能力與自身產(chǎn)品生態(tài)相結(jié)合,極大增強(qiáng)了自身產(chǎn)品生態(tài)的商業(yè)競(jìng)爭(zhēng)力。相較之下,英國(guó)和俄羅斯雖然也分別推出了Gopher、YaLM等大模型,但在研發(fā)和應(yīng)用上與美國(guó)還存在一定差距。
1.美國(guó)在大語言模型領(lǐng)域的發(fā)展處于領(lǐng)先地位
(1)上游市場(chǎng):以O(shè)penAI為首的“一超多強(qiáng)”局面。
作為傳統(tǒng)科技強(qiáng)國(guó),美國(guó)背倚雄厚的技術(shù)、資金與人才資源,在大語言模型方面的發(fā)展具有顯著優(yōu)勢(shì)。在上游市場(chǎng)領(lǐng)域,美國(guó)市場(chǎng)以O(shè)penAI為首,谷歌、Anthropic、Meta等科技巨頭和創(chuàng)業(yè)公司競(jìng)相追趕,形成了“一超多強(qiáng)”的競(jìng)爭(zhēng)局面。
OpenAI作為頂尖人工智能公司,其開發(fā)的ChatGPT是目前最具代表性的通用語言生成應(yīng)用。從GPT-1的1.17億、GPT-2的15億到GPT-3和GPT-3.5的1750億,再到GPT-4的萬億級(jí)以上的參數(shù)量,GPT系列模型的參數(shù)量不斷攀升。ChatGPT作為對(duì)話式機(jī)器人,聚焦多輪對(duì)話與情感交互,在“人性化”層面有了進(jìn)一步探索。除了可以完成連續(xù)對(duì)話、翻譯、編程、算術(shù)等工作外,ChatGPT還會(huì)根據(jù)用戶的質(zhì)疑發(fā)表道歉語句,并根據(jù)用戶需求修改、完善先前的回答。而OpenAI于2023年3月中旬發(fā)布的GPT-4又在GPT-3.5的模型上進(jìn)行了全方位升級(jí)。作為一個(gè)多模態(tài)大模型,GPT-4具備對(duì)圖片模態(tài)的分析推理能力,并能處理更長(zhǎng)的文本。目前,OpenAI與微軟、Duolingo、冰島政府等均有合作,迅速建立并不斷拓展產(chǎn)業(yè)應(yīng)用生態(tài)。整體而言,無論是在文本理解與生成領(lǐng)域,還是在大模型的通用功能實(shí)現(xiàn)方面,Chat GPT的綜合表現(xiàn)相對(duì)更為優(yōu)異。
Anthropic創(chuàng)始團(tuán)隊(duì)多為前OpenAI研究員,其開發(fā)的AI聊天助手Claude是對(duì)標(biāo)ChatGPT的大語言模型,主要用于理解用戶的自然語言,并進(jìn)行智能回答與交互。Claude的參數(shù)量相對(duì)較小,僅有520億。相較ChatGPT,Claude更強(qiáng)調(diào)語言生成應(yīng)用的安全性,為企業(yè)提供從數(shù)據(jù)到模型再到系統(tǒng)的人工智能應(yīng)用安全服務(wù),注重對(duì)類ChatGPT的邏輯錯(cuò)誤、負(fù)面信息等問題的檢測(cè)與回避,最大化地避免提供有害建議。
谷歌作為新一代科技巨頭,它在語言生成應(yīng)用領(lǐng)域并未搶占到先機(jī),其對(duì)標(biāo)ChatGPT的語言生成應(yīng)用Bard還沒有成型的商業(yè)模式,但其目標(biāo)是將Bard接入Google產(chǎn)品體系中,提升其產(chǎn)品生態(tài)與微軟產(chǎn)品生態(tài)競(jìng)爭(zhēng)的能力。[2]Bard此前是基于LaMDA模型開發(fā),但LaMDA的負(fù)責(zé)任AI實(shí)踐模式導(dǎo)致其回答存在生硬、淺層等局限,因而將從基于輕量級(jí)LaMDA模型升級(jí)為更大規(guī)模的PaLM模型。PaLM模型的參數(shù)量達(dá)5400億,幾乎是LaMDA的四倍。在此基礎(chǔ)上,升級(jí)后的Bard不僅將在常識(shí)推理和編程方面的回答上有所突破,在回答方式上也將更自然、更深入。目前,谷歌已開始嘗試將Bard跟旗下和外部產(chǎn)品集成,朝著實(shí)用與通用的方向發(fā)展。例如,谷歌嘗試在Chrome OS中整合Bard AI聊天機(jī)器人,引入“會(huì)話搜索”的實(shí)驗(yàn)性功能。
Facebook的母公司Meta也于2023年2月下旬推出了開源大語言模型LLaMA-13B。LLaMA-13B是Meta新語言模型家族“大型語言模型Meta AI”(簡(jiǎn)稱LLaMA)的一部分,Meta將其LLaMA模型稱為“基礎(chǔ)模型”,這意味著其將如在GPT-3的基礎(chǔ)上構(gòu)建ChatGPT一樣,用這些模型來幫助構(gòu)建更精細(xì)的AI模型。盡管LLaMA模型集合的參數(shù)從70億到650億個(gè)不等,遠(yuǎn)不及GPT-3模型的1750億個(gè)參數(shù),但這種相對(duì)較小的AI模型反而可能催生能在PC端和移動(dòng)端上運(yùn)行類似ChatGPT的語音助手,是最有安卓像的開源生態(tài)。LLaMA-13B在單一GPU上運(yùn)行的表現(xiàn)也超過了GPT-3,為不久的將來在消費(fèi)級(jí)硬件上實(shí)現(xiàn)類似ChatGPT的功能打開了大門。[3]此外,作為完全開源的領(lǐng)先模型,LLaMA具有高度的可配置性與泛化能力,還具備成為垂類AI模型的通用基座的潛力,加速垂類模型的發(fā)展。
此外,還有部分高校研究機(jī)構(gòu)也相繼推出了大模型,如斯坦福大學(xué)基于Meta的LLaMA-7B模型微調(diào)出新模型Alpaca,該模型僅用52K數(shù)據(jù)指令即可達(dá)到良好效果;麻省理工學(xué)院提出大語言模型跨界視覺領(lǐng)域新范式LAMPP,用于視覺感知和推理任務(wù)等。
(2)下游市場(chǎng):微軟處于絕對(duì)領(lǐng)先地位。
微軟在上游市場(chǎng)也有所布局,聯(lián)合英偉達(dá)發(fā)布了具有5300億參數(shù)量的自然語言生成模型MT-NLG,這是模型發(fā)布之時(shí)訓(xùn)練的最大、最強(qiáng)大的單片Transformer語言模型。但是,微軟在下游市場(chǎng)的表現(xiàn)更為突出,且占有絕對(duì)的市場(chǎng)領(lǐng)先地位。微軟打造了基于場(chǎng)景的語言生成應(yīng)用,并通過與OpenAI的合作將大語言模型與產(chǎn)品生態(tài)相結(jié)合,不斷探索語言生成的場(chǎng)景應(yīng)用潛力。在搜索引擎方面,微軟基于Edge瀏覽器的數(shù)據(jù),接入GPT-4,推出了AI版搜索引擎New Bing;在辦公軟件方面,微軟接入GPT-4與ChatGPT,推出365 Copilot;在代碼生成方面,微軟在其全球最大的代碼托管平臺(tái)GitHub上推出代碼生成應(yīng)用CopilotX。目前,微軟在語言生成應(yīng)用場(chǎng)景上實(shí)現(xiàn)了廣泛布局,形成了強(qiáng)大的業(yè)務(wù)矩陣。
JasperAI是一家專注營(yíng)銷領(lǐng)域內(nèi)容創(chuàng)作的公司,也是最早嘗試將大語言模型進(jìn)行商業(yè)化的公司之一。在ChatGPT發(fā)布前,JasperAI就基于GPT-3模型的API,通過模型微調(diào)打造了AI營(yíng)銷內(nèi)容生成平臺(tái),提供廣告文案、營(yíng)銷策劃、產(chǎn)品描述等多種類型的商業(yè)性文字的生成服務(wù)。但隨著ChatGPT面向公眾開放、成為C端現(xiàn)象級(jí)應(yīng)用后,JasperAI提供的部分基礎(chǔ)功能面臨被取代的風(fēng)險(xiǎn),對(duì)JasperAI的語言生成應(yīng)用市場(chǎng)造成了威脅。
2.英國(guó)、俄羅斯等發(fā)達(dá)國(guó)家也陸續(xù)布局,但較美國(guó)還有一定差距
在開發(fā)語言模型的過程中,谷歌旗下的英國(guó)的人工智能公司Deepmind探索了六類不同大小的Transformer模型,參數(shù)量從4400萬到2800億不等。Deepmind不僅提供了對(duì)包括模型規(guī)模與偏差在內(nèi)的訓(xùn)練數(shù)據(jù)集和模型行為的整體分析,還討論了語言模型在下游危害與AI安全等方面的問題,能進(jìn)行有害語言識(shí)別與事實(shí)核查。但整體而言,Gopher的應(yīng)用范圍相對(duì)狹窄,離通用性的實(shí)現(xiàn)還有較遠(yuǎn)距離。
Yandex擁有俄羅斯最大的搜索引擎,是俄羅斯的互聯(lián)網(wǎng)巨頭公司之一。YaLM 100B是Yandex開發(fā)的具有1000億參數(shù)的開源大模型,它可以生成和處理文本,在Yandex旗下的Alice語音助手和Yandex搜索中有了初步應(yīng)用,并允許研究和商業(yè)免費(fèi)使用。盡管Yandex已部分使用生成式神經(jīng)網(wǎng)絡(luò),但在形成搜索結(jié)果時(shí)并不能直接生成文本答案,而是作為輔助判別工具用于搜索引擎中,其發(fā)展僅處于行業(yè)中下游。
總的來說,美國(guó)在大語言模型開發(fā)方面保持著領(lǐng)先地位。從文本生成的直觀體驗(yàn)層面來看,目前ChatGPT的表現(xiàn)最為優(yōu)異。但對(duì)于谷歌等大廠而言,目前暫時(shí)落后于Open AI的主要原因是技術(shù)路線與公司戰(zhàn)略的差異,趕超GPT系列模型依然存在很大可能。在語言模型閉源趨勢(shì)明顯的環(huán)境下,Meta的開源語言模型則在促進(jìn)大語言模型研究方面作出了重要貢獻(xiàn)。相較傳統(tǒng)互聯(lián)網(wǎng)大廠,由頂尖技術(shù)人才初創(chuàng)的AI公司也成為大語言模型發(fā)展過程中的一股重要力量,并在不斷實(shí)現(xiàn)新的突破。
(二)中國(guó)的大語言模型大干快上
中國(guó)在大語言模型領(lǐng)域大干快上,目前國(guó)內(nèi)已經(jīng)有30多家公司發(fā)布或宣布研發(fā)大模型,布局企業(yè)以互聯(lián)網(wǎng)巨頭、AI公司、初創(chuàng)科技團(tuán)隊(duì)、科研院所和教育行業(yè)公司為主,如百度、阿里巴巴、騰訊、華為、商湯科技、科大訊飛、百川智能、清華大學(xué)、復(fù)旦大學(xué)以及網(wǎng)易有道、學(xué)而思等。我國(guó)大語言模型盡管與國(guó)外還有一定差距,但在參數(shù)量、跨模態(tài)、泛化能力等方面表現(xiàn)優(yōu)異,且在垂直領(lǐng)域有了廣泛的落地應(yīng)用。
在人工智能產(chǎn)業(yè)迎來熱潮時(shí),中國(guó)人工智能產(chǎn)業(yè)也抓住了這一難得的發(fā)展契機(jī),迎來了“國(guó)產(chǎn)ChatGPT元年”,大語言模型密集上線。相較國(guó)外產(chǎn)業(yè)巨頭致力于提升大語言模型的通用性,我國(guó)則聚焦垂類場(chǎng)景的應(yīng)用落地。以百度、阿里巴巴、騰訊、華為等為代表的互聯(lián)網(wǎng)巨頭在深耕通用大模型研發(fā)的同時(shí),積極根據(jù)自身產(chǎn)業(yè)生態(tài)布局進(jìn)行垂直基礎(chǔ)大模型打造;具備大模型自研能力的肩部公司則聚焦在開源模型和海量數(shù)據(jù)的基礎(chǔ)上打造垂類大模型,建立垂直領(lǐng)域的平臺(tái)生態(tài)。
在模型參數(shù)量方面,互聯(lián)網(wǎng)大廠的參數(shù)量遠(yuǎn)大于科研院所,基本處于千億級(jí)以上規(guī)模,如阿里巴巴的通義千問擁有10萬億級(jí)以上的參數(shù)量,騰訊混元大模型的參數(shù)量在萬億級(jí)以上,但科研院所的參數(shù)量多在千億級(jí)以下。在模型應(yīng)用方面,大部分公司和團(tuán)隊(duì)的大模型將以內(nèi)部應(yīng)用和面向B端的企業(yè)拓展服務(wù)為主,面向C端市場(chǎng)進(jìn)行規(guī)?;瘧?yīng)用的可能性較低。相較國(guó)外,我國(guó)在垂類大模型領(lǐng)域的發(fā)展更快。目前,我國(guó)已有不少中小型企業(yè)基于國(guó)內(nèi)外大模型“底座”訓(xùn)練適配自身所處行業(yè)的垂類模型,而已發(fā)布通用大模型的公司也推出了針對(duì)特定行業(yè)的大模型。值得一提的是,我國(guó)在大模型領(lǐng)域的開源趨勢(shì)明顯,如智譜AI的ChatGLM已經(jīng)開源,復(fù)旦大學(xué)邱錫彭教授團(tuán)隊(duì)的MOSS產(chǎn)品即將開源等,這些中文開源語言生成模型將極大地促進(jìn)我國(guó)通用大模型及垂類模型的發(fā)展。
(三)中外大語言模型差距背后的原因
目前,我國(guó)與外國(guó)尤其是美國(guó)在大語言模型的研發(fā)上還存在較大差距,在數(shù)據(jù)、算力、工程化能力等關(guān)鍵因素上存在短板。大語言模型更多僅聚焦于垂直領(lǐng)域的應(yīng)用,缺乏多技術(shù)融合創(chuàng)新帶來的通用能力。
第一,創(chuàng)新意識(shí)不足。一方面,大模型的高額研發(fā)成本和高風(fēng)險(xiǎn)特點(diǎn)限制了試錯(cuò)空間,導(dǎo)致我國(guó)企業(yè)在風(fēng)險(xiǎn)技術(shù)上更傾向于追隨與模仿。
第二,技術(shù)設(shè)施不完善。首先,我國(guó)在核心的人工智能算法上(算法透明度、魯棒性等)存在痛點(diǎn),關(guān)鍵技術(shù)缺乏進(jìn)一步突破;[4]其次,國(guó)外對(duì)中國(guó)的“芯片制裁”持續(xù)升級(jí),用于人工智能和高性能計(jì)算機(jī)的芯片獲取困難,國(guó)產(chǎn)智能芯片在性能上與英偉達(dá)A100和H100芯片差距較大;再次,中文開源高質(zhì)量數(shù)據(jù)相對(duì)匱乏,缺少用于大模型訓(xùn)練的經(jīng)過加工、清洗和標(biāo)注的數(shù)據(jù)集。
第三,制度環(huán)境有缺陷。美國(guó)的AIGC產(chǎn)業(yè)得以蓬勃發(fā)展的一個(gè)重要原因在于建立了保護(hù)和激勵(lì)創(chuàng)新的制度環(huán)境,在知識(shí)產(chǎn)權(quán)、風(fēng)險(xiǎn)投資、高等教育、人才集聚等方面不斷實(shí)現(xiàn)制度創(chuàng)新,而我國(guó)的強(qiáng)監(jiān)管環(huán)境則在一定程度上限制了人工智能產(chǎn)業(yè)能動(dòng)性的發(fā)揮。此外,隨著地緣政治緊張局勢(shì)的加劇,科技產(chǎn)業(yè)的中外合作也受到了較大限制。
第四,研發(fā)力量分散。大語言模型的研發(fā)具有高投入、高風(fēng)險(xiǎn)、長(zhǎng)周期的特征,這也決定了其對(duì)頂尖人才和核心團(tuán)隊(duì)的極高要求。目前,我國(guó)不僅研發(fā)領(lǐng)域分散,企業(yè)和高校在大數(shù)據(jù)、大模型等方面各有側(cè)重,頂尖人才也分散在不同機(jī)構(gòu)中,難以形成對(duì)標(biāo)Open AI的兼具核心技術(shù)與豐富經(jīng)驗(yàn)的領(lǐng)軍人物和團(tuán)隊(duì)。
二、重應(yīng)用:大語言模型積極探索落地場(chǎng)景
由于大語言模型的泛化能力極強(qiáng),通用性和實(shí)用性明顯,越來越多的企業(yè)在聚焦基礎(chǔ)層的通用大模型訓(xùn)練時(shí),也將目光放在了垂類大模型的研發(fā)上,重視并積極探索模型的落地場(chǎng)景應(yīng)用。目前,大語言模型已在搜索引擎、辦公軟件和金融、醫(yī)療、傳媒、教育等多個(gè)垂直行業(yè)落地應(yīng)用,并取得了良好效果。
(一)AI搜索引擎:個(gè)性化交互
隨著全球第二大搜索引擎微軟Bing在今年3月接入ChatGPT,搜索引擎這樣一個(gè)傳統(tǒng)行業(yè)迎來了新發(fā)展時(shí)代。New Bing在提供文本生成服務(wù)的同時(shí)還具有網(wǎng)頁信息總結(jié)功能,并能在互聯(lián)網(wǎng)上實(shí)時(shí)搜索信息。此外,Bing Chat也會(huì)在每個(gè)回復(fù)的底部注明其引用來源,以供用戶參考驗(yàn)證生成文本的準(zhǔn)確性。據(jù)微軟公布的消息,Bing接入ChatGPT一個(gè)月后的日活量破億,New Bing憑借優(yōu)秀的性能在短時(shí)間內(nèi)吸引了大量用戶,并在商業(yè)上直接威脅到了谷歌的搜索業(yè)務(wù)。目前,谷歌、百度等國(guó)內(nèi)外搜索引擎龍頭和360、知乎等公司紛紛開始加速在大模型嵌入搜索引擎應(yīng)用方面的布局,如谷歌的AI版搜索引擎Magi即將面世,360集團(tuán)推出360智腦服務(wù),知乎將“知海圖AI”中文大模型應(yīng)用于知乎的“熱榜摘要”等。
嵌入大模型后的搜索引擎將為用戶帶來諸多便利。第一,搜索形式和搜索結(jié)果呈現(xiàn)方式將不斷升級(jí),即關(guān)鍵詞式搜索轉(zhuǎn)變?yōu)閷?duì)話式搜索,線性排列式結(jié)果轉(zhuǎn)變?yōu)橐?guī)范的篇章閱讀式結(jié)果,用戶無需根據(jù)結(jié)果梳理即可得到具有清晰邏輯的篇章和規(guī)范的參考源。第二,交互性與針對(duì)性得以增強(qiáng)。以New Bing的搜索功能為例,用戶在搜索欄中最長(zhǎng)可輸入長(zhǎng)達(dá)1000字符的問題,并可進(jìn)行追問與反駁,以獲取具有高準(zhǔn)確度的搜索結(jié)果。
但大語言模型與搜索引擎的結(jié)合也會(huì)滋生出新的問題。首先,傳統(tǒng)廣告模式的商業(yè)邏輯受到?jīng)_擊。搜索引擎廣告是搜索引擎公司的主要收入來源,但大語言模型的生成結(jié)果注重功能性與準(zhǔn)確性,這將大大降低用戶對(duì)廣告鏈接的點(diǎn)擊率。因此,如何在創(chuàng)新升級(jí)的基礎(chǔ)上保持穩(wěn)定收入,探索與該文本生成邏輯相匹配的盈利模式尤為重要。其次,大語言模型的運(yùn)營(yíng)成本高昂,企業(yè)將面臨著是否面向C端用戶收費(fèi)的難題,施行收費(fèi)制度后用戶數(shù)量的擴(kuò)張與留存也將面臨風(fēng)險(xiǎn)。
(二)智能化辦公:淘汰重復(fù)性勞動(dòng)
大語言模型目前已嘗試嵌入?yún)f(xié)同辦公平臺(tái)、AI辦公工具、AI編程工具等辦公軟件,智能化辦公將成為大模型的另一重要應(yīng)用場(chǎng)景。首先,在協(xié)同辦公平臺(tái)領(lǐng)域,微軟是最早接入大語言模型的公司,2023年3月16日,微軟正式將GPT-4接入Office工具,推出AI版Office“全家桶”——Microsoft 365 Copilot,在Word中AI能秒出文稿和配圖,根據(jù)用戶需求修改文風(fēng)和排版;在Excel中對(duì)數(shù)據(jù)進(jìn)行清洗和分析后可總結(jié)關(guān)鍵信息,并進(jìn)行可視化呈現(xiàn);在Outlook中則可自動(dòng)總結(jié)郵件要點(diǎn),并生成郵件初稿。在國(guó)內(nèi),釘釘于4月11日接入阿里巴巴的通義千問大模型,同日,字節(jié)跳動(dòng)旗下的辦公軟件飛書對(duì)其智能助手“My AI”進(jìn)行了預(yù)告;4月17日,百度宣布文心一言大模型在百度內(nèi)部全面應(yīng)用在智能工作平臺(tái)“如流”上,助力員工的代碼編寫、思路搭建等日常工作。其次,在AI辦公工具領(lǐng)域,Notion于2月推出了基于ChatGPT的企業(yè)服務(wù)工具Notion AI,以及熱門類GPT應(yīng)用ChatPDF的推出等,這類AI辦公工具的功能極為廣泛,包括但不限于總結(jié)會(huì)議、回復(fù)郵件、整理PDF文檔。最后,在AI編程工具領(lǐng)域,微軟旗下的代碼托管平臺(tái)GitHub接入GPT-4推出輔助編程工具CopilotX,AWS的實(shí)時(shí)AI編程伴侶Amazon CodeWhisperer也免費(fèi)向開發(fā)者開放等,這些AI編程軟件不僅可以根據(jù)開發(fā)者的語言指令生成代碼建議,還能提供實(shí)時(shí)的錯(cuò)誤代碼修復(fù)建議。
目前看來,大語言模型接入?yún)f(xié)同辦公平臺(tái)并未完全取代相關(guān)腦力工作,它提供的大多是簡(jiǎn)單瑣碎的工作內(nèi)容,其目的在于淘汰重復(fù)性勞動(dòng)。具體而言,這類應(yīng)用主要面向三類場(chǎng)景:一是面向工作群體,承擔(dān)簡(jiǎn)單的重復(fù)性工作,快速提取員工所需信息;二是面向?qū)W生群體,提煉文檔要點(diǎn),承擔(dān)如演示文稿般的形式上的工作;三是面向有創(chuàng)意想法的人,AI可從史料、文學(xué)等作品中提取信息供用戶參考,拓寬用戶的想象維度。
(三)垂直領(lǐng)域應(yīng)用:迭代行業(yè)場(chǎng)景
建立垂直行業(yè)的平臺(tái)生態(tài)、迭代行業(yè)場(chǎng)景是觸達(dá)應(yīng)用場(chǎng)景落地的重要方向。目前,大語言模型已在金融、醫(yī)療、電商、營(yíng)銷、傳媒、教育等多個(gè)垂直領(lǐng)域展開應(yīng)用,并不斷展望新的應(yīng)用場(chǎng)景。國(guó)外主要通過在垂直領(lǐng)域嵌入大語言模型的方式進(jìn)行應(yīng)用,如摩根士丹利利用GPT-4搜索研報(bào)內(nèi)容,協(xié)助資管顧問工作;海外生鮮電商平臺(tái)Intacart的食物搜索工具基于ChatGPT推出了食物推薦應(yīng)用,為客戶購(gòu)物提供參考;客戶關(guān)系管理領(lǐng)域SaaS巨頭Salesforce基于ChatGPT推出了相關(guān)AI產(chǎn)品,幫助銷售人員、客服專員等完成基礎(chǔ)性工作。國(guó)內(nèi)企業(yè)則根據(jù)自身產(chǎn)業(yè)生態(tài)布局,致力打造垂直基礎(chǔ)大模型。以百度為例,百度和多行業(yè)的頭部企業(yè)聯(lián)合研發(fā)融合了行業(yè)數(shù)據(jù)和專家經(jīng)驗(yàn)的NLP大模型,如與國(guó)家電網(wǎng)聯(lián)合打造的NLP大模型“國(guó)網(wǎng)—百度·文心”,通過設(shè)計(jì)電力領(lǐng)域?qū)嶓w判別和文檔判別等作為預(yù)訓(xùn)練任務(wù)讓文心模型深度學(xué)習(xí)電力行業(yè)知識(shí),實(shí)現(xiàn)了對(duì)數(shù)據(jù)、算力與技術(shù)等資源的統(tǒng)籌優(yōu)化;與人民網(wǎng)輿情數(shù)據(jù)中心合作研發(fā)了“人民網(wǎng)—百度·文心”大模型,在人民網(wǎng)輿情數(shù)據(jù)中心積淀的行業(yè)知識(shí)和任務(wù)樣本數(shù)據(jù)的基礎(chǔ)上進(jìn)行訓(xùn)練,并已應(yīng)用于輿情分析、新聞內(nèi)容審核分類、新聞?wù)傻阮I(lǐng)域,相較從前的基線模型,大模型在人民網(wǎng)各應(yīng)用的自然語言處理任務(wù)效果方面有了顯著提升。
探索大模型在各垂直領(lǐng)域場(chǎng)景中的應(yīng)用,觸達(dá)多個(gè)細(xì)分場(chǎng)景與業(yè)務(wù)場(chǎng)景的應(yīng)用落地,有利于推動(dòng)相關(guān)產(chǎn)業(yè)實(shí)現(xiàn)從人力密集型向智能密集型轉(zhuǎn)變,實(shí)現(xiàn)產(chǎn)業(yè)的智能化升級(jí),進(jìn)一步解放重復(fù)性腦力工作勞動(dòng)力??偟膩碚f,大語言模型的落地應(yīng)用仍處于初級(jí)發(fā)展?fàn)顟B(tài),性能和配套服務(wù)不足、產(chǎn)業(yè)模式不成熟、存在隱私漏洞、監(jiān)管體系尚未建立等是亟待解決的阻礙其落地進(jìn)程的問題。隨著產(chǎn)業(yè)模式發(fā)展日趨成熟,大語言模型的產(chǎn)業(yè)結(jié)構(gòu)將進(jìn)一步分化,形成囊括“上游—中游—下游”全流域的產(chǎn)業(yè)鏈格局,加快產(chǎn)業(yè)智能化發(fā)展的步伐。
三、大語言模型的應(yīng)用風(fēng)險(xiǎn)及治理策略的最新進(jìn)展
由于大語言模型自身存在的技術(shù)問題,加上相關(guān)法律法規(guī)不完善,導(dǎo)致大語言模型在落地應(yīng)用過程中存在諸多亟待治理的問題,美國(guó)、中國(guó)也相繼在生成式人工智能的治理領(lǐng)域開展布局。
(一)大語言模型落地應(yīng)用存在的風(fēng)險(xiǎn)
從技術(shù)層面來看,一方面,由于大語言模型的生成機(jī)制難以解釋,其回答也難以追溯其邏輯與理由,缺乏可解釋性,容易生成錯(cuò)誤信息,影響用戶判斷。在法律、醫(yī)學(xué)等嚴(yán)謹(jǐn)、敏感的領(lǐng)域,錯(cuò)誤的法律和醫(yī)學(xué)知識(shí)可能會(huì)導(dǎo)致用戶違法或使用錯(cuò)誤急救方式,對(duì)自身健康和社會(huì)安全造成傷害。加上大語言模型存在算法偏見,可能會(huì)無意中放大社會(huì)文化歧視,誤導(dǎo)用戶的價(jià)值觀。另一方面,人工智能是基于收錄了他人享有版權(quán)作品的數(shù)據(jù)庫(kù)生成內(nèi)容,因此生成內(nèi)容很可能面臨侵權(quán)風(fēng)險(xiǎn)。
從社會(huì)層面來看,第一,大語言模型可能會(huì)侵犯用戶隱私、泄露一些組織乃至國(guó)家的機(jī)密信息,對(duì)個(gè)人身心健康、企業(yè)安全和國(guó)家安全造成威脅。第二,大語言模型易被多行業(yè)、多領(lǐng)域?yàn)E用,例如,內(nèi)容生成技術(shù)使得以低廉價(jià)格生成有效虛假信息等成為可能,有可能誘發(fā)信息欺詐、線上詐騙等犯罪行為;在現(xiàn)有教育體系缺乏應(yīng)對(duì)準(zhǔn)備的情況下,學(xué)生可能會(huì)在開卷測(cè)試中用其作弊或出現(xiàn)利用AI生成文本生成論文的學(xué)術(shù)不端行為。第三,大模型在內(nèi)容生成與數(shù)據(jù)預(yù)測(cè)方面的能力較高,對(duì)重復(fù)性工作的可替代性強(qiáng),有可能對(duì)傳統(tǒng)的低創(chuàng)造性與低情感性腦力勞動(dòng)崗位的嚴(yán)重威脅。第四,大語言模型的普及應(yīng)用可能會(huì)加大科技發(fā)達(dá)地區(qū)與其他地區(qū)之間的數(shù)字鴻溝。
(二)大語言模型落地應(yīng)用的治理策略進(jìn)展
由于這類生成式人工智能的應(yīng)用相對(duì)較新,它們?cè)诤艽蟪潭壬先蕴幱跓o監(jiān)管狀態(tài)。目前,為促進(jìn)生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用,各國(guó)都在就如何對(duì)生成類人工智能進(jìn)行有效治理與監(jiān)管這一問題進(jìn)行積極探索,并有了初步進(jìn)展。
美國(guó)率先對(duì)生成式人工智能的監(jiān)管領(lǐng)域展開探索。2023年1月26日,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院發(fā)布了《AI風(fēng)險(xiǎn)管理框架1.0》,從治理、映射、測(cè)量和管理四部分對(duì)AI風(fēng)險(xiǎn)管控與問責(zé)制度等進(jìn)行了規(guī)定。5月5日,美國(guó)國(guó)家科學(xué)基金會(huì)宣布將撥款1.4億美元成立7個(gè)國(guó)家級(jí)人工智能研究機(jī)構(gòu),確保美國(guó)在AI領(lǐng)域保持領(lǐng)先的同時(shí)遏制AI引發(fā)的社會(huì)問題和道德問題。5月16日,OpenAI的CEO Sam
Altman出席了美國(guó)參議院聽證會(huì),參與關(guān)于AI監(jiān)管話題的討論。在聽證會(huì)上,Sam Altman建議通過成立監(jiān)管AI的新的政府機(jī)構(gòu),為AI模型創(chuàng)建安全標(biāo)準(zhǔn),要求獨(dú)立專家對(duì)模型在各指標(biāo)上的表現(xiàn)進(jìn)行獨(dú)立審核,對(duì)AI模型進(jìn)行嚴(yán)格監(jiān)管,并認(rèn)為生成式人工智能工具需要一套新的責(zé)任框架。紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)名譽(yù)教授Gary Marcus在會(huì)上也指出,此前熱議的“暫停大規(guī)模人工智能模型研發(fā)”聯(lián)名信的目的并非要求暫停研發(fā)AI,而是希望在具備足夠規(guī)范、安全的AI管理措施出臺(tái)之前,暫停部署比GPT-4更大的AI模型。
2023年4月11日,我國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,明確了生成式人工智能的定義、相關(guān)產(chǎn)品和服務(wù)提供者的合規(guī)義務(wù)。這意味著我國(guó)將逐步完善人工智能法律體系,對(duì)生成式人工智能進(jìn)行嚴(yán)格、科學(xué)監(jiān)管。
四、結(jié)語
大語言模型的多模態(tài)發(fā)展趨勢(shì)特征進(jìn)一步拓寬了語言生成的場(chǎng)景應(yīng)用維度和商業(yè)化維度,如何實(shí)現(xiàn)內(nèi)容安全、數(shù)據(jù)安全和保護(hù)個(gè)人隱私,如何處理競(jìng)爭(zhēng)關(guān)系,如何高效賦能行業(yè),將成為生成式大模型應(yīng)用規(guī)?;仨氁紤]和解決的技術(shù)問題與社會(huì)問題,在生成式人工智能的治理問題上,政府、企業(yè)、用戶等應(yīng)進(jìn)一步合力探索。
參考文獻(xiàn):
[1]趙朝陽,朱貴波,王金橋.Chat GPT給語言大模型帶來的啟示和多模態(tài)大模型新的發(fā)展思路[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2023,7(3):26-35.
[2]易觀分析.AIGC產(chǎn)業(yè)研究報(bào)告2023:語言生成篇[EB/OL].(202
3-05-16)[2023-05-19].https://mp.weixin.qq.com/s/MMZE08EVc3jItWc
BJyIpjg.
[3]騰訊科技.Meta推出大語言模型LLaMA參加AI大戰(zhàn):比GPT-3小10倍,表現(xiàn)更好[EB/OL].(2023-02-25)[2023-05-19].https://new.qq.com/rain/a/20230225A021BI00.
[4]華東政法大學(xué)政治學(xué)研究院和人工智能與大數(shù)據(jù)指數(shù)研究院.人工智能通用大模型(Chat GPT)的進(jìn)展、風(fēng)險(xiǎn)與應(yīng)對(duì)[EB/OL].(2023
-02-23)[2023-05-19].http://fxcxw.org.cn/dyna/content.php?id=25211.
作者簡(jiǎn)介:郭全中,中央民族大學(xué)新聞與傳播學(xué)院教授(北京 100081),互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展與治理研究中心主任(北京 100081),江蘇紫金傳媒智庫(kù)高級(jí)研究員(南京 211199);朱燕,中央民族大學(xué)新聞與傳播學(xué)院碩士生(北京 100081)。
編校:王 謙