廣布局、重應(yīng)用：生成式大語言模型的新進(jìn)展

2023-09-12 00:32郭全中朱燕

新聞愛好者 2023年8期

郭全中朱燕

【摘要】ChatGPT的上線掀起了大語言模型的熱潮，除了谷歌、微軟、OpenAI、百度、阿里巴巴等科技巨頭，創(chuàng)業(yè)公司和其他互聯(lián)網(wǎng)企業(yè)也紛紛布局大模型。目前，生成式大語言模型在搜索引擎、辦公軟件和諸多垂直領(lǐng)域有了初步應(yīng)用，加快了產(chǎn)業(yè)智能化發(fā)展的步伐，未來，大語言模型將探索更多垂類應(yīng)用場(chǎng)景，產(chǎn)業(yè)結(jié)構(gòu)將進(jìn)一步分化。但大模型在落地應(yīng)用過程中也面臨著技術(shù)和社會(huì)層面的問題，需要各國(guó)在生成式人工智能的管理方面進(jìn)行規(guī)范與治理。

【關(guān)鍵詞】大語言模型；ChatGPT；生成式；廣布局；重應(yīng)用

2022年11月30日，基于生成式預(yù)訓(xùn)練模型GPT-3.5微調(diào)而來的新一代對(duì)話式自然語言識(shí)別模型ChatGPT上線，這是人工智能研究實(shí)驗(yàn)室Open AI歷經(jīng)四年迭代推出的生成式大語言模型。一般而言，大模型是指具有海量參數(shù)和復(fù)雜架構(gòu)，用于深度學(xué)習(xí)任務(wù)的大容量模型，它采用的“預(yù)訓(xùn)練大模型■下游任務(wù)微調(diào)”模式極大地提高了模型的通用能力，呈現(xiàn)出“大模型”和“小模型”協(xié)進(jìn)、通用性與專用性并進(jìn)的發(fā)展趨勢(shì)。2023年1月末，上線僅兩個(gè)月，ChatGPT的月活用戶便突破1億，成為全球用戶增長(zhǎng)速度最快的消費(fèi)級(jí)應(yīng)用程序。面對(duì)用戶的對(duì)話、翻譯、分類、修改回答等指令，ChatGPT均呈現(xiàn)出極強(qiáng)的對(duì)用戶意圖的理解能力，其語言理解能力、邏輯推理能力與生成內(nèi)容能力的大幅提升是在自然語言處理領(lǐng)域的重要突破，是生成式AI（AIGC）極為關(guān)鍵的發(fā)展節(jié)點(diǎn)。ChatGPT的成功標(biāo)志著人工智能從以專用小模型訓(xùn)練為主的“手工作坊時(shí)代”邁入到以通用大模型預(yù)訓(xùn)練為主的“工業(yè)化時(shí)代”，成為人工智能發(fā)展的分水嶺。[1]

一、廣布局：多類主體大力布局大語言模型

無論是在訓(xùn)練研發(fā)的上游市場(chǎng)，還是落地應(yīng)用的下游市場(chǎng)，以美國(guó)、中國(guó)為代表的國(guó)家均展開了廣泛布局，除了互聯(lián)網(wǎng)公司和AI公司，科研機(jī)構(gòu)、各垂直行業(yè)巨頭企業(yè)也紛紛加入大語言模型賽道。目前，大語言模型賽道主要分為兩類：一類是聚焦基礎(chǔ)層通用大模型訓(xùn)練的巨頭公司和科研機(jī)構(gòu)，另一類是聚焦在開源大模型的基礎(chǔ)上訓(xùn)練垂類大模型或單純專注垂直行業(yè)具體應(yīng)用的中型公司和應(yīng)用型廠商。

（一）國(guó)外大語言模型的發(fā)展現(xiàn)狀

美國(guó)在大語言模型領(lǐng)域的布局方面處于領(lǐng)先地位。在上游市場(chǎng)，OpenAI、Anthropic、谷歌、Meta等行業(yè)巨頭和斯坦福大學(xué)、麻省理工學(xué)院等科研機(jī)構(gòu)均研發(fā)出了代表性大模型，在大模型的通用性方面實(shí)現(xiàn)了跨越式突破。以微軟、Jasper為代表的下游市場(chǎng)則將語言生成能力與自身產(chǎn)品生態(tài)相結(jié)合，極大增強(qiáng)了自身產(chǎn)品生態(tài)的商業(yè)競(jìng)爭(zhēng)力。相較之下，英國(guó)和俄羅斯雖然也分別推出了Gopher、YaLM等大模型，但在研發(fā)和應(yīng)用上與美國(guó)還存在一定差距。

1.美國(guó)在大語言模型領(lǐng)域的發(fā)展處于領(lǐng)先地位

（1）上游市場(chǎng)：以O(shè)penAI為首的“一超多強(qiáng)”局面。

作為傳統(tǒng)科技強(qiáng)國(guó)，美國(guó)背倚雄厚的技術(shù)、資金與人才資源，在大語言模型方面的發(fā)展具有顯著優(yōu)勢(shì)。在上游市場(chǎng)領(lǐng)域，美國(guó)市場(chǎng)以O(shè)penAI為首，谷歌、Anthropic、Meta等科技巨頭和創(chuàng)業(yè)公司競(jìng)相追趕，形成了“一超多強(qiáng)”的競(jìng)爭(zhēng)局面。

OpenAI作為頂尖人工智能公司，其開發(fā)的ChatGPT是目前最具代表性的通用語言生成應(yīng)用。從GPT-1的1.17億、GPT-2的15億到GPT-3和GPT-3.5的1750億，再到GPT-4的萬億級(jí)以上的參數(shù)量，GPT系列模型的參數(shù)量不斷攀升。ChatGPT作為對(duì)話式機(jī)器人，聚焦多輪對(duì)話與情感交互，在“人性化”層面有了進(jìn)一步探索。除了可以完成連續(xù)對(duì)話、翻譯、編程、算術(shù)等工作外，ChatGPT還會(huì)根據(jù)用戶的質(zhì)疑發(fā)表道歉語句，并根據(jù)用戶需求修改、完善先前的回答。而OpenAI于2023年3月中旬發(fā)布的GPT-4又在GPT-3.5的模型上進(jìn)行了全方位升級(jí)。作為一個(gè)多模態(tài)大模型，GPT-4具備對(duì)圖片模態(tài)的分析推理能力，并能處理更長(zhǎng)的文本。目前，OpenAI與微軟、Duolingo、冰島政府等均有合作，迅速建立并不斷拓展產(chǎn)業(yè)應(yīng)用生態(tài)。整體而言，無論是在文本理解與生成領(lǐng)域，還是在大模型的通用功能實(shí)現(xiàn)方面，Chat GPT的綜合表現(xiàn)相對(duì)更為優(yōu)異。

Anthropic創(chuàng)始團(tuán)隊(duì)多為前OpenAI研究員，其開發(fā)的AI聊天助手Claude是對(duì)標(biāo)ChatGPT的大語言模型，主要用于理解用戶的自然語言，并進(jìn)行智能回答與交互。Claude的參數(shù)量相對(duì)較小，僅有520億。相較ChatGPT，Claude更強(qiáng)調(diào)語言生成應(yīng)用的安全性，為企業(yè)提供從數(shù)據(jù)到模型再到系統(tǒng)的人工智能應(yīng)用安全服務(wù)，注重對(duì)類ChatGPT的邏輯錯(cuò)誤、負(fù)面信息等問題的檢測(cè)與回避，最大化地避免提供有害建議。

谷歌作為新一代科技巨頭，它在語言生成應(yīng)用領(lǐng)域并未搶占到先機(jī)，其對(duì)標(biāo)ChatGPT的語言生成應(yīng)用Bard還沒有成型的商業(yè)模式，但其目標(biāo)是將Bard接入Google產(chǎn)品體系中，提升其產(chǎn)品生態(tài)與微軟產(chǎn)品生態(tài)競(jìng)爭(zhēng)的能力。[2]Bard此前是基于LaMDA模型開發(fā)，但LaMDA的負(fù)責(zé)任AI實(shí)踐模式導(dǎo)致其回答存在生硬、淺層等局限，因而將從基于輕量級(jí)LaMDA模型升級(jí)為更大規(guī)模的PaLM模型。PaLM模型的參數(shù)量達(dá)5400億，幾乎是LaMDA的四倍。在此基礎(chǔ)上，升級(jí)后的Bard不僅將在常識(shí)推理和編程方面的回答上有所突破，在回答方式上也將更自然、更深入。目前，谷歌已開始嘗試將Bard跟旗下和外部產(chǎn)品集成，朝著實(shí)用與通用的方向發(fā)展。例如，谷歌嘗試在Chrome OS中整合Bard AI聊天機(jī)器人，引入“會(huì)話搜索”的實(shí)驗(yàn)性功能。

Facebook的母公司Meta也于2023年2月下旬推出了開源大語言模型LLaMA-13B。LLaMA-13B是Meta新語言模型家族“大型語言模型Meta AI”（簡(jiǎn)稱LLaMA）的一部分，Meta將其LLaMA模型稱為“基礎(chǔ)模型”，這意味著其將如在GPT-3的基礎(chǔ)上構(gòu)建ChatGPT一樣，用這些模型來幫助構(gòu)建更精細(xì)的AI模型。盡管LLaMA模型集合的參數(shù)從70億到650億個(gè)不等，遠(yuǎn)不及GPT-3模型的1750億個(gè)參數(shù)，但這種相對(duì)較小的AI模型反而可能催生能在PC端和移動(dòng)端上運(yùn)行類似ChatGPT的語音助手，是最有安卓像的開源生態(tài)。LLaMA-13B在單一GPU上運(yùn)行的表現(xiàn)也超過了GPT-3，為不久的將來在消費(fèi)級(jí)硬件上實(shí)現(xiàn)類似ChatGPT的功能打開了大門。[3]此外，作為完全開源的領(lǐng)先模型，LLaMA具有高度的可配置性與泛化能力，還具備成為垂類AI模型的通用基座的潛力，加速垂類模型的發(fā)展。

此外，還有部分高校研究機(jī)構(gòu)也相繼推出了大模型，如斯坦福大學(xué)基于Meta的LLaMA-7B模型微調(diào)出新模型Alpaca，該模型僅用52K數(shù)據(jù)指令即可達(dá)到良好效果；麻省理工學(xué)院提出大語言模型跨界視覺領(lǐng)域新范式LAMPP，用于視覺感知和推理任務(wù)等。

（2）下游市場(chǎng)：微軟處于絕對(duì)領(lǐng)先地位。

微軟在上游市場(chǎng)也有所布局，聯(lián)合英偉達(dá)發(fā)布了具有5300億參數(shù)量的自然語言生成模型MT-NLG，這是模型發(fā)布之時(shí)訓(xùn)練的最大、最強(qiáng)大的單片Transformer語言模型。但是，微軟在下游市場(chǎng)的表現(xiàn)更為突出，且占有絕對(duì)的市場(chǎng)領(lǐng)先地位。微軟打造了基于場(chǎng)景的語言生成應(yīng)用，并通過與OpenAI的合作將大語言模型與產(chǎn)品生態(tài)相結(jié)合，不斷探索語言生成的場(chǎng)景應(yīng)用潛力。在搜索引擎方面，微軟基于Edge瀏覽器的數(shù)據(jù)，接入GPT-4，推出了AI版搜索引擎New Bing；在辦公軟件方面，微軟接入GPT-4與ChatGPT，推出365 Copilot；在代碼生成方面，微軟在其全球最大的代碼托管平臺(tái)GitHub上推出代碼生成應(yīng)用CopilotX。目前，微軟在語言生成應(yīng)用場(chǎng)景上實(shí)現(xiàn)了廣泛布局，形成了強(qiáng)大的業(yè)務(wù)矩陣。

JasperAI是一家專注營(yíng)銷領(lǐng)域內(nèi)容創(chuàng)作的公司，也是最早嘗試將大語言模型進(jìn)行商業(yè)化的公司之一。在ChatGPT發(fā)布前，JasperAI就基于GPT-3模型的API，通過模型微調(diào)打造了AI營(yíng)銷內(nèi)容生成平臺(tái)，提供廣告文案、營(yíng)銷策劃、產(chǎn)品描述等多種類型的商業(yè)性文字的生成服務(wù)。但隨著ChatGPT面向公眾開放、成為C端現(xiàn)象級(jí)應(yīng)用后，JasperAI提供的部分基礎(chǔ)功能面臨被取代的風(fēng)險(xiǎn)，對(duì)JasperAI的語言生成應(yīng)用市場(chǎng)造成了威脅。

2.英國(guó)、俄羅斯等發(fā)達(dá)國(guó)家也陸續(xù)布局，但較美國(guó)還有一定差距

在開發(fā)語言模型的過程中，谷歌旗下的英國(guó)的人工智能公司Deepmind探索了六類不同大小的Transformer模型，參數(shù)量從4400萬到2800億不等。Deepmind不僅提供了對(duì)包括模型規(guī)模與偏差在內(nèi)的訓(xùn)練數(shù)據(jù)集和模型行為的整體分析，還討論了語言模型在下游危害與AI安全等方面的問題，能進(jìn)行有害語言識(shí)別與事實(shí)核查。但整體而言，Gopher的應(yīng)用范圍相對(duì)狹窄，離通用性的實(shí)現(xiàn)還有較遠(yuǎn)距離。

Yandex擁有俄羅斯最大的搜索引擎，是俄羅斯的互聯(lián)網(wǎng)巨頭公司之一。YaLM 100B是Yandex開發(fā)的具有1000億參數(shù)的開源大模型，它可以生成和處理文本，在Yandex旗下的Alice語音助手和Yandex搜索中有了初步應(yīng)用，并允許研究和商業(yè)免費(fèi)使用。盡管Yandex已部分使用生成式神經(jīng)網(wǎng)絡(luò)，但在形成搜索結(jié)果時(shí)并不能直接生成文本答案，而是作為輔助判別工具用于搜索引擎中，其發(fā)展僅處于行業(yè)中下游。

總的來說，美國(guó)在大語言模型開發(fā)方面保持著領(lǐng)先地位。從文本生成的直觀體驗(yàn)層面來看，目前ChatGPT的表現(xiàn)最為優(yōu)異。但對(duì)于谷歌等大廠而言，目前暫時(shí)落后于Open AI的主要原因是技術(shù)路線與公司戰(zhàn)略的差異，趕超GPT系列模型依然存在很大可能。在語言模型閉源趨勢(shì)明顯的環(huán)境下，Meta的開源語言模型則在促進(jìn)大語言模型研究方面作出了重要貢獻(xiàn)。相較傳統(tǒng)互聯(lián)網(wǎng)大廠，由頂尖技術(shù)人才初創(chuàng)的AI公司也成為大語言模型發(fā)展過程中的一股重要力量，并在不斷實(shí)現(xiàn)新的突破。

（二）中國(guó)的大語言模型大干快上

中國(guó)在大語言模型領(lǐng)域大干快上，目前國(guó)內(nèi)已經(jīng)有30多家公司發(fā)布或宣布研發(fā)大模型，布局企業(yè)以互聯(lián)網(wǎng)巨頭、AI公司、初創(chuàng)科技團(tuán)隊(duì)、科研院所和教育行業(yè)公司為主，如百度、阿里巴巴、騰訊、華為、商湯科技、科大訊飛、百川智能、清華大學(xué)、復(fù)旦大學(xué)以及網(wǎng)易有道、學(xué)而思等。我國(guó)大語言模型盡管與國(guó)外還有一定差距，但在參數(shù)量、跨模態(tài)、泛化能力等方面表現(xiàn)優(yōu)異，且在垂直領(lǐng)域有了廣泛的落地應(yīng)用。

在人工智能產(chǎn)業(yè)迎來熱潮時(shí)，中國(guó)人工智能產(chǎn)業(yè)也抓住了這一難得的發(fā)展契機(jī)，迎來了“國(guó)產(chǎn)ChatGPT元年”，大語言模型密集上線。相較國(guó)外產(chǎn)業(yè)巨頭致力于提升大語言模型的通用性，我國(guó)則聚焦垂類場(chǎng)景的應(yīng)用落地。以百度、阿里巴巴、騰訊、華為等為代表的互聯(lián)網(wǎng)巨頭在深耕通用大模型研發(fā)的同時(shí)，積極根據(jù)自身產(chǎn)業(yè)生態(tài)布局進(jìn)行垂直基礎(chǔ)大模型打造；具備大模型自研能力的肩部公司則聚焦在開源模型和海量數(shù)據(jù)的基礎(chǔ)上打造垂類大模型，建立垂直領(lǐng)域的平臺(tái)生態(tài)。

在模型參數(shù)量方面，互聯(lián)網(wǎng)大廠的參數(shù)量遠(yuǎn)大于科研院所，基本處于千億級(jí)以上規(guī)模，如阿里巴巴的通義千問擁有10萬億級(jí)以上的參數(shù)量，騰訊混元大模型的參數(shù)量在萬億級(jí)以上，但科研院所的參數(shù)量多在千億級(jí)以下。在模型應(yīng)用方面，大部分公司和團(tuán)隊(duì)的大模型將以內(nèi)部應(yīng)用和面向B端的企業(yè)拓展服務(wù)為主，面向C端市場(chǎng)進(jìn)行規(guī)?；瘧?yīng)用的可能性較低。相較國(guó)外，我國(guó)在垂類大模型領(lǐng)域的發(fā)展更快。目前，我國(guó)已有不少中小型企業(yè)基于國(guó)內(nèi)外大模型“底座”訓(xùn)練適配自身所處行業(yè)的垂類模型，而已發(fā)布通用大模型的公司也推出了針對(duì)特定行業(yè)的大模型。值得一提的是，我國(guó)在大模型領(lǐng)域的開源趨勢(shì)明顯，如智譜AI的ChatGLM已經(jīng)開源，復(fù)旦大學(xué)邱錫彭教授團(tuán)隊(duì)的MOSS產(chǎn)品即將開源等，這些中文開源語言生成模型將極大地促進(jìn)我國(guó)通用大模型及垂類模型的發(fā)展。

（三）中外大語言模型差距背后的原因

目前，我國(guó)與外國(guó)尤其是美國(guó)在大語言模型的研發(fā)上還存在較大差距，在數(shù)據(jù)、算力、工程化能力等關(guān)鍵因素上存在短板。大語言模型更多僅聚焦于垂直領(lǐng)域的應(yīng)用，缺乏多技術(shù)融合創(chuàng)新帶來的通用能力。

第一，創(chuàng)新意識(shí)不足。一方面，大模型的高額研發(fā)成本和高風(fēng)險(xiǎn)特點(diǎn)限制了試錯(cuò)空間，導(dǎo)致我國(guó)企業(yè)在風(fēng)險(xiǎn)技術(shù)上更傾向于追隨與模仿。

第二，技術(shù)設(shè)施不完善。首先，我國(guó)在核心的人工智能算法上（算法透明度、魯棒性等）存在痛點(diǎn)，關(guān)鍵技術(shù)缺乏進(jìn)一步突破；[4]其次，國(guó)外對(duì)中國(guó)的“芯片制裁”持續(xù)升級(jí)，用于人工智能和高性能計(jì)算機(jī)的芯片獲取困難，國(guó)產(chǎn)智能芯片在性能上與英偉達(dá)A100和H100芯片差距較大；再次，中文開源高質(zhì)量數(shù)據(jù)相對(duì)匱乏，缺少用于大模型訓(xùn)練的經(jīng)過加工、清洗和標(biāo)注的數(shù)據(jù)集。

第三，制度環(huán)境有缺陷。美國(guó)的AIGC產(chǎn)業(yè)得以蓬勃發(fā)展的一個(gè)重要原因在于建立了保護(hù)和激勵(lì)創(chuàng)新的制度環(huán)境，在知識(shí)產(chǎn)權(quán)、風(fēng)險(xiǎn)投資、高等教育、人才集聚等方面不斷實(shí)現(xiàn)制度創(chuàng)新，而我國(guó)的強(qiáng)監(jiān)管環(huán)境則在一定程度上限制了人工智能產(chǎn)業(yè)能動(dòng)性的發(fā)揮。此外，隨著地緣政治緊張局勢(shì)的加劇，科技產(chǎn)業(yè)的中外合作也受到了較大限制。

第四，研發(fā)力量分散。大語言模型的研發(fā)具有高投入、高風(fēng)險(xiǎn)、長(zhǎng)周期的特征，這也決定了其對(duì)頂尖人才和核心團(tuán)隊(duì)的極高要求。目前，我國(guó)不僅研發(fā)領(lǐng)域分散，企業(yè)和高校在大數(shù)據(jù)、大模型等方面各有側(cè)重，頂尖人才也分散在不同機(jī)構(gòu)中，難以形成對(duì)標(biāo)Open AI的兼具核心技術(shù)與豐富經(jīng)驗(yàn)的領(lǐng)軍人物和團(tuán)隊(duì)。

二、重應(yīng)用：大語言模型積極探索落地場(chǎng)景

由于大語言模型的泛化能力極強(qiáng)，通用性和實(shí)用性明顯，越來越多的企業(yè)在聚焦基礎(chǔ)層的通用大模型訓(xùn)練時(shí)，也將目光放在了垂類大模型的研發(fā)上，重視并積極探索模型的落地場(chǎng)景應(yīng)用。目前，大語言模型已在搜索引擎、辦公軟件和金融、醫(yī)療、傳媒、教育等多個(gè)垂直行業(yè)落地應(yīng)用，并取得了良好效果。

（一）AI搜索引擎：個(gè)性化交互

隨著全球第二大搜索引擎微軟Bing在今年3月接入ChatGPT，搜索引擎這樣一個(gè)傳統(tǒng)行業(yè)迎來了新發(fā)展時(shí)代。New Bing在提供文本生成服務(wù)的同時(shí)還具有網(wǎng)頁信息總結(jié)功能，并能在互聯(lián)網(wǎng)上實(shí)時(shí)搜索信息。此外，Bing Chat也會(huì)在每個(gè)回復(fù)的底部注明其引用來源，以供用戶參考驗(yàn)證生成文本的準(zhǔn)確性。據(jù)微軟公布的消息，Bing接入ChatGPT一個(gè)月后的日活量破億，New Bing憑借優(yōu)秀的性能在短時(shí)間內(nèi)吸引了大量用戶，并在商業(yè)上直接威脅到了谷歌的搜索業(yè)務(wù)。目前，谷歌、百度等國(guó)內(nèi)外搜索引擎龍頭和360、知乎等公司紛紛開始加速在大模型嵌入搜索引擎應(yīng)用方面的布局，如谷歌的AI版搜索引擎Magi即將面世，360集團(tuán)推出360智腦服務(wù)，知乎將“知海圖AI”中文大模型應(yīng)用于知乎的“熱榜摘要”等。

嵌入大模型后的搜索引擎將為用戶帶來諸多便利。第一，搜索形式和搜索結(jié)果呈現(xiàn)方式將不斷升級(jí)，即關(guān)鍵詞式搜索轉(zhuǎn)變?yōu)閷?duì)話式搜索，線性排列式結(jié)果轉(zhuǎn)變?yōu)橐?guī)范的篇章閱讀式結(jié)果，用戶無需根據(jù)結(jié)果梳理即可得到具有清晰邏輯的篇章和規(guī)范的參考源。第二，交互性與針對(duì)性得以增強(qiáng)。以New Bing的搜索功能為例，用戶在搜索欄中最長(zhǎng)可輸入長(zhǎng)達(dá)1000字符的問題，并可進(jìn)行追問與反駁，以獲取具有高準(zhǔn)確度的搜索結(jié)果。

但大語言模型與搜索引擎的結(jié)合也會(huì)滋生出新的問題。首先，傳統(tǒng)廣告模式的商業(yè)邏輯受到?jīng)_擊。搜索引擎廣告是搜索引擎公司的主要收入來源，但大語言模型的生成結(jié)果注重功能性與準(zhǔn)確性，這將大大降低用戶對(duì)廣告鏈接的點(diǎn)擊率。因此，如何在創(chuàng)新升級(jí)的基礎(chǔ)上保持穩(wěn)定收入，探索與該文本生成邏輯相匹配的盈利模式尤為重要。其次，大語言模型的運(yùn)營(yíng)成本高昂，企業(yè)將面臨著是否面向C端用戶收費(fèi)的難題，施行收費(fèi)制度后用戶數(shù)量的擴(kuò)張與留存也將面臨風(fēng)險(xiǎn)。

（二）智能化辦公：淘汰重復(fù)性勞動(dòng)

大語言模型目前已嘗試嵌入?yún)f(xié)同辦公平臺(tái)、AI辦公工具、AI編程工具等辦公軟件，智能化辦公將成為大模型的另一重要應(yīng)用場(chǎng)景。首先，在協(xié)同辦公平臺(tái)領(lǐng)域，微軟是最早接入大語言模型的公司，2023年3月16日，微軟正式將GPT-4接入Office工具，推出AI版Office“全家桶”——Microsoft 365 Copilot，在Word中AI能秒出文稿和配圖，根據(jù)用戶需求修改文風(fēng)和排版；在Excel中對(duì)數(shù)據(jù)進(jìn)行清洗和分析后可總結(jié)關(guān)鍵信息，并進(jìn)行可視化呈現(xiàn)；在Outlook中則可自動(dòng)總結(jié)郵件要點(diǎn)，并生成郵件初稿。在國(guó)內(nèi)，釘釘于4月11日接入阿里巴巴的通義千問大模型，同日，字節(jié)跳動(dòng)旗下的辦公軟件飛書對(duì)其智能助手“My AI”進(jìn)行了預(yù)告；4月17日，百度宣布文心一言大模型在百度內(nèi)部全面應(yīng)用在智能工作平臺(tái)“如流”上，助力員工的代碼編寫、思路搭建等日常工作。其次，在AI辦公工具領(lǐng)域，Notion于2月推出了基于ChatGPT的企業(yè)服務(wù)工具Notion AI，以及熱門類GPT應(yīng)用ChatPDF的推出等，這類AI辦公工具的功能極為廣泛，包括但不限于總結(jié)會(huì)議、回復(fù)郵件、整理PDF文檔。最后，在AI編程工具領(lǐng)域，微軟旗下的代碼托管平臺(tái)GitHub接入GPT-4推出輔助編程工具CopilotX，AWS的實(shí)時(shí)AI編程伴侶Amazon CodeWhisperer也免費(fèi)向開發(fā)者開放等，這些AI編程軟件不僅可以根據(jù)開發(fā)者的語言指令生成代碼建議，還能提供實(shí)時(shí)的錯(cuò)誤代碼修復(fù)建議。

目前看來，大語言模型接入?yún)f(xié)同辦公平臺(tái)并未完全取代相關(guān)腦力工作，它提供的大多是簡(jiǎn)單瑣碎的工作內(nèi)容，其目的在于淘汰重復(fù)性勞動(dòng)。具體而言，這類應(yīng)用主要面向三類場(chǎng)景：一是面向工作群體，承擔(dān)簡(jiǎn)單的重復(fù)性工作，快速提取員工所需信息；二是面向?qū)W生群體，提煉文檔要點(diǎn)，承擔(dān)如演示文稿般的形式上的工作；三是面向有創(chuàng)意想法的人，AI可從史料、文學(xué)等作品中提取信息供用戶參考，拓寬用戶的想象維度。

（三）垂直領(lǐng)域應(yīng)用：迭代行業(yè)場(chǎng)景

建立垂直行業(yè)的平臺(tái)生態(tài)、迭代行業(yè)場(chǎng)景是觸達(dá)應(yīng)用場(chǎng)景落地的重要方向。目前，大語言模型已在金融、醫(yī)療、電商、營(yíng)銷、傳媒、教育等多個(gè)垂直領(lǐng)域展開應(yīng)用，并不斷展望新的應(yīng)用場(chǎng)景。國(guó)外主要通過在垂直領(lǐng)域嵌入大語言模型的方式進(jìn)行應(yīng)用，如摩根士丹利利用GPT-4搜索研報(bào)內(nèi)容，協(xié)助資管顧問工作；海外生鮮電商平臺(tái)Intacart的食物搜索工具基于ChatGPT推出了食物推薦應(yīng)用，為客戶購(gòu)物提供參考；客戶關(guān)系管理領(lǐng)域SaaS巨頭Salesforce基于ChatGPT推出了相關(guān)AI產(chǎn)品，幫助銷售人員、客服專員等完成基礎(chǔ)性工作。國(guó)內(nèi)企業(yè)則根據(jù)自身產(chǎn)業(yè)生態(tài)布局，致力打造垂直基礎(chǔ)大模型。以百度為例，百度和多行業(yè)的頭部企業(yè)聯(lián)合研發(fā)融合了行業(yè)數(shù)據(jù)和專家經(jīng)驗(yàn)的NLP大模型，如與國(guó)家電網(wǎng)聯(lián)合打造的NLP大模型“國(guó)網(wǎng)—百度·文心”，通過設(shè)計(jì)電力領(lǐng)域?qū)嶓w判別和文檔判別等作為預(yù)訓(xùn)練任務(wù)讓文心模型深度學(xué)習(xí)電力行業(yè)知識(shí)，實(shí)現(xiàn)了對(duì)數(shù)據(jù)、算力與技術(shù)等資源的統(tǒng)籌優(yōu)化；與人民網(wǎng)輿情數(shù)據(jù)中心合作研發(fā)了“人民網(wǎng)—百度·文心”大模型，在人民網(wǎng)輿情數(shù)據(jù)中心積淀的行業(yè)知識(shí)和任務(wù)樣本數(shù)據(jù)的基礎(chǔ)上進(jìn)行訓(xùn)練，并已應(yīng)用于輿情分析、新聞內(nèi)容審核分類、新聞?wù)傻阮I(lǐng)域，相較從前的基線模型，大模型在人民網(wǎng)各應(yīng)用的自然語言處理任務(wù)效果方面有了顯著提升。

探索大模型在各垂直領(lǐng)域場(chǎng)景中的應(yīng)用，觸達(dá)多個(gè)細(xì)分場(chǎng)景與業(yè)務(wù)場(chǎng)景的應(yīng)用落地，有利于推動(dòng)相關(guān)產(chǎn)業(yè)實(shí)現(xiàn)從人力密集型向智能密集型轉(zhuǎn)變，實(shí)現(xiàn)產(chǎn)業(yè)的智能化升級(jí)，進(jìn)一步解放重復(fù)性腦力工作勞動(dòng)力?？偟膩碚f，大語言模型的落地應(yīng)用仍處于初級(jí)發(fā)展?fàn)顟B(tài)，性能和配套服務(wù)不足、產(chǎn)業(yè)模式不成熟、存在隱私漏洞、監(jiān)管體系尚未建立等是亟待解決的阻礙其落地進(jìn)程的問題。隨著產(chǎn)業(yè)模式發(fā)展日趨成熟，大語言模型的產(chǎn)業(yè)結(jié)構(gòu)將進(jìn)一步分化，形成囊括“上游—中游—下游”全流域的產(chǎn)業(yè)鏈格局，加快產(chǎn)業(yè)智能化發(fā)展的步伐。

三、大語言模型的應(yīng)用風(fēng)險(xiǎn)及治理策略的最新進(jìn)展

由于大語言模型自身存在的技術(shù)問題，加上相關(guān)法律法規(guī)不完善，導(dǎo)致大語言模型在落地應(yīng)用過程中存在諸多亟待治理的問題，美國(guó)、中國(guó)也相繼在生成式人工智能的治理領(lǐng)域開展布局。

（一）大語言模型落地應(yīng)用存在的風(fēng)險(xiǎn)

從技術(shù)層面來看，一方面，由于大語言模型的生成機(jī)制難以解釋，其回答也難以追溯其邏輯與理由，缺乏可解釋性，容易生成錯(cuò)誤信息，影響用戶判斷。在法律、醫(yī)學(xué)等嚴(yán)謹(jǐn)、敏感的領(lǐng)域，錯(cuò)誤的法律和醫(yī)學(xué)知識(shí)可能會(huì)導(dǎo)致用戶違法或使用錯(cuò)誤急救方式，對(duì)自身健康和社會(huì)安全造成傷害。加上大語言模型存在算法偏見，可能會(huì)無意中放大社會(huì)文化歧視，誤導(dǎo)用戶的價(jià)值觀。另一方面，人工智能是基于收錄了他人享有版權(quán)作品的數(shù)據(jù)庫(kù)生成內(nèi)容，因此生成內(nèi)容很可能面臨侵權(quán)風(fēng)險(xiǎn)。

從社會(huì)層面來看，第一，大語言模型可能會(huì)侵犯用戶隱私、泄露一些組織乃至國(guó)家的機(jī)密信息，對(duì)個(gè)人身心健康、企業(yè)安全和國(guó)家安全造成威脅。第二，大語言模型易被多行業(yè)、多領(lǐng)域?yàn)E用，例如，內(nèi)容生成技術(shù)使得以低廉價(jià)格生成有效虛假信息等成為可能，有可能誘發(fā)信息欺詐、線上詐騙等犯罪行為；在現(xiàn)有教育體系缺乏應(yīng)對(duì)準(zhǔn)備的情況下，學(xué)生可能會(huì)在開卷測(cè)試中用其作弊或出現(xiàn)利用AI生成文本生成論文的學(xué)術(shù)不端行為。第三，大模型在內(nèi)容生成與數(shù)據(jù)預(yù)測(cè)方面的能力較高，對(duì)重復(fù)性工作的可替代性強(qiáng)，有可能對(duì)傳統(tǒng)的低創(chuàng)造性與低情感性腦力勞動(dòng)崗位的嚴(yán)重威脅。第四，大語言模型的普及應(yīng)用可能會(huì)加大科技發(fā)達(dá)地區(qū)與其他地區(qū)之間的數(shù)字鴻溝。

（二）大語言模型落地應(yīng)用的治理策略進(jìn)展

由于這類生成式人工智能的應(yīng)用相對(duì)較新，它們?cè)诤艽蟪潭壬先蕴幱跓o監(jiān)管狀態(tài)。目前，為促進(jìn)生成式人工智能技術(shù)健康發(fā)展和規(guī)范應(yīng)用，各國(guó)都在就如何對(duì)生成類人工智能進(jìn)行有效治理與監(jiān)管這一問題進(jìn)行積極探索，并有了初步進(jìn)展。

美國(guó)率先對(duì)生成式人工智能的監(jiān)管領(lǐng)域展開探索。2023年1月26日，美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院發(fā)布了《AI風(fēng)險(xiǎn)管理框架1.0》，從治理、映射、測(cè)量和管理四部分對(duì)AI風(fēng)險(xiǎn)管控與問責(zé)制度等進(jìn)行了規(guī)定。5月5日，美國(guó)國(guó)家科學(xué)基金會(huì)宣布將撥款1.4億美元成立7個(gè)國(guó)家級(jí)人工智能研究機(jī)構(gòu)，確保美國(guó)在AI領(lǐng)域保持領(lǐng)先的同時(shí)遏制AI引發(fā)的社會(huì)問題和道德問題。5月16日，OpenAI的CEO Sam

Altman出席了美國(guó)參議院聽證會(huì)，參與關(guān)于AI監(jiān)管話題的討論。在聽證會(huì)上，Sam Altman建議通過成立監(jiān)管AI的新的政府機(jī)構(gòu)，為AI模型創(chuàng)建安全標(biāo)準(zhǔn)，要求獨(dú)立專家對(duì)模型在各指標(biāo)上的表現(xiàn)進(jìn)行獨(dú)立審核，對(duì)AI模型進(jìn)行嚴(yán)格監(jiān)管，并認(rèn)為生成式人工智能工具需要一套新的責(zé)任框架。紐約大學(xué)心理學(xué)和神經(jīng)科學(xué)名譽(yù)教授Gary Marcus在會(huì)上也指出，此前熱議的“暫停大規(guī)模人工智能模型研發(fā)”聯(lián)名信的目的并非要求暫停研發(fā)AI，而是希望在具備足夠規(guī)范、安全的AI管理措施出臺(tái)之前，暫停部署比GPT-4更大的AI模型。

2023年4月11日，我國(guó)國(guó)家互聯(lián)網(wǎng)信息辦公室起草了《生成式人工智能服務(wù)管理辦法（征求意見稿）》，明確了生成式人工智能的定義、相關(guān)產(chǎn)品和服務(wù)提供者的合規(guī)義務(wù)。這意味著我國(guó)將逐步完善人工智能法律體系，對(duì)生成式人工智能進(jìn)行嚴(yán)格、科學(xué)監(jiān)管。

四、結(jié)語

大語言模型的多模態(tài)發(fā)展趨勢(shì)特征進(jìn)一步拓寬了語言生成的場(chǎng)景應(yīng)用維度和商業(yè)化維度，如何實(shí)現(xiàn)內(nèi)容安全、數(shù)據(jù)安全和保護(hù)個(gè)人隱私，如何處理競(jìng)爭(zhēng)關(guān)系，如何高效賦能行業(yè)，將成為生成式大模型應(yīng)用規(guī)?；仨氁紤]和解決的技術(shù)問題與社會(huì)問題，在生成式人工智能的治理問題上，政府、企業(yè)、用戶等應(yīng)進(jìn)一步合力探索。

參考文獻(xiàn)：

[1]趙朝陽，朱貴波，王金橋.Chat GPT給語言大模型帶來的啟示和多模態(tài)大模型新的發(fā)展思路[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)，2023，7（3）：26-35.

[2]易觀分析.AIGC產(chǎn)業(yè)研究報(bào)告2023：語言生成篇[EB/OL].（202

3-05-16）[2023-05-19].https：//mp.weixin.qq.com/s/MMZE08EVc3jItWc

BJyIpjg.

[3]騰訊科技.Meta推出大語言模型LLaMA參加AI大戰(zhàn)：比GPT-3小10倍，表現(xiàn)更好[EB/OL].（2023-02-25）[2023-05-19].https：//new.qq.com/rain/a/20230225A021BI00.

[4]華東政法大學(xué)政治學(xué)研究院和人工智能與大數(shù)據(jù)指數(shù)研究院.人工智能通用大模型（Chat GPT）的進(jìn)展、風(fēng)險(xiǎn)與應(yīng)對(duì)[EB/OL].（2023

-02-23）[2023-05-19].http：//fxcxw.org.cn/dyna/content.php？id=25211.

作者簡(jiǎn)介：郭全中，中央民族大學(xué)新聞與傳播學(xué)院教授（北京 100081），互聯(lián)網(wǎng)平臺(tái)企業(yè)發(fā)展與治理研究中心主任（北京 100081），江蘇紫金傳媒智庫(kù)高級(jí)研究員（南京 211199）；朱燕，中央民族大學(xué)新聞與傳播學(xué)院碩士生（北京 100081）。

編校：王謙

新聞愛好者2023年8期

新聞愛好者的其它文章: 個(gè)性時(shí)鐘：復(fù)媒體環(huán)境中青年群體的平臺(tái)搖擺與時(shí)間感知的關(guān)系研究; 基于數(shù)字技術(shù)的網(wǎng)絡(luò)內(nèi)容生產(chǎn)方式變遷研究; 從區(qū)塊鏈版權(quán)到數(shù)字復(fù)刻：元宇宙中的媒介融合路徑; 中國(guó)共產(chǎn)黨百年新聞?shì)浾摴ぷ鹘?jīng)驗(yàn)、邏輯及其現(xiàn)實(shí)意義; 多元·共振·創(chuàng)新：媒體融合視域下的短視頻全國(guó)“兩會(huì)”報(bào)道; 全球交往視角下新型主流媒體國(guó)際傳播效能提升研究

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

廣布局、重應(yīng)用：生成式大語言模型的新進(jìn)展

廣布局、重應(yīng)用：生成式大語言模型的新進(jìn)展