對(duì)話式人工智能賦能科研創(chuàng)新的可能性、局限性及未來(lái)發(fā)展

2023-06-12 19:57周青

出版參考 2023年4期

周青

摘要：以ChatGPT為代表的對(duì)話式人工智能的出現(xiàn)給科研生產(chǎn)帶來(lái)了新的機(jī)遇，為科研創(chuàng)新提供了新的空間與可能。對(duì)話式人工智能賦能科研創(chuàng)新的可能性在于，一是擁有海量訓(xùn)練數(shù)據(jù)助力知識(shí)的整合與創(chuàng)新，二是多種人工智能技術(shù)助力復(fù)雜知識(shí)性任務(wù)的完成。未來(lái)人類會(huì)將更多注意力轉(zhuǎn)向如何以人工智能賦能科研創(chuàng)新，并在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡。

關(guān)鍵詞：ChatGPT 對(duì)話式人工智能科研創(chuàng)新

2022年11月美國(guó)人工智能實(shí)驗(yàn)室OpenAI公司推出對(duì)話式人工智能工具ChatGPT，這一大型語(yǔ)言模型很快引爆了全球人工智能市場(chǎng)，引發(fā)一場(chǎng)人工智能新競(jìng)賽。對(duì)話式人工智能的浪潮迅速席卷全球，對(duì)科技、教育、設(shè)計(jì)、編程等眾多行業(yè)產(chǎn)生了巨大沖擊，引發(fā)了強(qiáng)烈震動(dòng)。受此影響，國(guó)內(nèi)外科技公司紛紛加碼相關(guān)研發(fā)，相繼推出自研的對(duì)話式人工智能工具，并加快與其他軟件和應(yīng)用的集成整合?？梢韵胍?jiàn)，在不久的將來(lái)，對(duì)話式人工智能將在社會(huì)各個(gè)垂直領(lǐng)域加快應(yīng)用。人工智能對(duì)科研行業(yè)也將產(chǎn)生巨大影響，將極大改變以往的科研模式、優(yōu)化科研流程，給加速科研創(chuàng)新帶來(lái)新的空間與可能。

一、對(duì)話式人工智能賦能科研創(chuàng)新的可能性

以ChatGPT為主要代表的對(duì)話式人工智能已經(jīng)可以通過(guò)自然語(yǔ)言理解人類意圖，完成人類指令，輸出具有一定準(zhǔn)確性和邏輯性的結(jié)果，其輔助優(yōu)化科研流程、提升科研效率的功能已經(jīng)得到了大量驗(yàn)證。那么，這類人工智能工具是否也有助于激發(fā)科研創(chuàng)新？下文從三個(gè)角度來(lái)探討對(duì)話式人工智能賦能科研創(chuàng)新的可能性。

1.海量訓(xùn)練數(shù)據(jù)助力知識(shí)的整合與創(chuàng)新

對(duì)話式人工智能是一種在預(yù)訓(xùn)練階段需要使用海量知識(shí)數(shù)據(jù)進(jìn)行訓(xùn)練的大型語(yǔ)言模型，其訓(xùn)練語(yǔ)料中包含的全部知識(shí)遠(yuǎn)遠(yuǎn)超過(guò)人類個(gè)體在有限的生命時(shí)間內(nèi)所能掌握的廣度和深度。此外，海量訓(xùn)練數(shù)據(jù)集中包含多個(gè)學(xué)科眾多領(lǐng)域的知識(shí)，使得人工智能在知識(shí)學(xué)習(xí)的過(guò)程中能完成知識(shí)的整合與重構(gòu)，在解決專業(yè)性和知識(shí)性問(wèn)題，特別是需要跨學(xué)科研究以及涉及交叉學(xué)科知識(shí)的問(wèn)題時(shí)，會(huì)有令人意想不到的知識(shí)連接，從而表現(xiàn)出一定的創(chuàng)新性。

對(duì)科研人員來(lái)說(shuō)，對(duì)話式人工智能工具在多學(xué)科多領(lǐng)域知識(shí)整合重構(gòu)基礎(chǔ)上呈現(xiàn)出的知識(shí)連接能夠引發(fā)使用者的“頭腦風(fēng)暴”，刺激其從不同視角進(jìn)行思考，在其借助人工智能進(jìn)行科學(xué)研究的各個(gè)環(huán)節(jié)，如確定研究方向、選擇研究概念、考證研究邏輯、設(shè)計(jì)研究框架、收集實(shí)驗(yàn)數(shù)據(jù)、驗(yàn)證實(shí)驗(yàn)結(jié)果等，都有可能激發(fā)研究者的創(chuàng)意與靈感火花。

OpenAI已證實(shí)，GPT-4能基于學(xué)科知識(shí)的整合完成具有一定知識(shí)性和復(fù)雜程度的任務(wù)，表現(xiàn)出良好的遷移能力和泛化能力，其在專業(yè)性和學(xué)術(shù)性上的表現(xiàn)已接近人類水平。我國(guó)也已關(guān)注到對(duì)話式人工智能在推進(jìn)科研創(chuàng)新方面的空間與可能。如科技部已在近期啟動(dòng)“人工智能驅(qū)動(dòng)的科學(xué)研究”（AI for Science）專項(xiàng)部署工作，結(jié)合數(shù)學(xué)、物理、化學(xué)、天文等基礎(chǔ)學(xué)科關(guān)鍵問(wèn)題，圍繞藥物研發(fā)、基因研究、生物育種、新材料研發(fā)等重點(diǎn)領(lǐng)域科研需求，布局“人工智能驅(qū)動(dòng)的科學(xué)研究”研發(fā)體系。[1]

2.多種人工智能技術(shù)助力復(fù)雜知識(shí)性任務(wù)的完成

對(duì)話式人工智能在技術(shù)上的跨越式發(fā)展來(lái)源于人工智能兩大分支領(lǐng)域即機(jī)器學(xué)習(xí)與自然語(yǔ)言處理領(lǐng)域的持續(xù)技術(shù)積累，以及多項(xiàng)底層技術(shù)的不斷創(chuàng)新。例如，采用Transformer模型來(lái)進(jìn)行文本內(nèi)容的特征抽?。煌ㄟ^(guò)深度學(xué)習(xí)（Deep Learning）來(lái)研究如何有效增加模型層深及模型參數(shù)容量以提升模型復(fù)雜度；采用生成式預(yù)訓(xùn)練（GPT，Generative Pre-trained）+微調(diào)（Fine-tuning）的模式解決下游任務(wù)的遷移問(wèn)題；采用自回歸模型（Auto-Regressive Model）+零樣本/少量樣本（Zero/Few Shot）模式解決自然語(yǔ)言生成問(wèn)題，等等。

正是這些底層技術(shù)的不斷創(chuàng)新，以ChatGPT為代表的對(duì)話式人工智能工具得以不斷完善語(yǔ)言模型、修正算法策略、進(jìn)行多樣化語(yǔ)料訓(xùn)練，實(shí)現(xiàn)學(xué)習(xí)機(jī)制的自我迭代更新，從而在自然語(yǔ)言理解與生成任務(wù)中表現(xiàn)出良好的邏輯推理能力。這種邏輯推理能力表現(xiàn)在：理解語(yǔ)義之間的關(guān)聯(lián)、保證輸出結(jié)果的一致性和連貫性；基于人類的反饋調(diào)整輸出結(jié)果；對(duì)復(fù)雜問(wèn)題的拆解與分層次分步驟處理；能力的遷移與泛化等。

因而，科研人員可以利用人工智能的邏輯推理能力，輔助完成復(fù)雜的知識(shí)性任務(wù)。在這個(gè)過(guò)程中，使用者需要通過(guò)投喂背景語(yǔ)料、提高提問(wèn)與指令的精確性與指向性、調(diào)整嘗試不同提示語(yǔ)以及提供相似案例，不斷引導(dǎo)人工智能對(duì)回答進(jìn)行修正。這種“提問(wèn)—反饋—進(jìn)一步提問(wèn)—更深入反饋”的進(jìn)階式人機(jī)對(duì)話過(guò)程，同時(shí)也刺激使用者思考積累的疑問(wèn)、梳理思路與想法、分層次分步驟拆解復(fù)雜問(wèn)題，進(jìn)行歸納、演繹、類比、推理等思維活動(dòng)。

由于大型語(yǔ)言模型復(fù)雜的模型結(jié)構(gòu)與巨量參數(shù)規(guī)模，人類尚無(wú)法理解人工智能模型內(nèi)部的一系列具體決策過(guò)程，以及它是如何產(chǎn)生邏輯推理能力的。但可以肯定的是，ChatGPT這樣的對(duì)話式人工智能在面對(duì)具有一定復(fù)雜程度的知識(shí)性任務(wù)時(shí)，能夠模擬人類思考與解決問(wèn)題的心理過(guò)程，呈現(xiàn)令人驚艷的表現(xiàn)，從而為激發(fā)科研創(chuàng)新提供可能。

3.強(qiáng)大算力助力對(duì)未知領(lǐng)域的科研探索

某些未知領(lǐng)域的科研探索比較復(fù)雜，有時(shí)需要處理大量數(shù)據(jù)、進(jìn)行大量計(jì)算、針對(duì)復(fù)雜結(jié)構(gòu)建模，或是設(shè)計(jì)不同方案、理清復(fù)雜關(guān)系、應(yīng)對(duì)多重任務(wù)，這類研究人類通過(guò)手工操作往往難以實(shí)現(xiàn)。而對(duì)話式人工智能的強(qiáng)大算力可以大大加快科研進(jìn)程，保證在較短時(shí)間內(nèi)完成海量運(yùn)算，規(guī)避人工操作的大量人力和時(shí)間成本，保證研究的持續(xù)推進(jìn)，從而激發(fā)對(duì)于未知領(lǐng)域的探索。

一個(gè)例子是藥物的研發(fā)，新藥物研發(fā)的關(guān)鍵性任務(wù)是識(shí)別具有特定生物活性的化學(xué)物質(zhì)。通過(guò)構(gòu)建化學(xué)結(jié)構(gòu)式生成、確定打分函數(shù)，人工智能可以加快化學(xué)物質(zhì)生物活性的驗(yàn)證過(guò)程。[2]另一個(gè)例子是針對(duì)物種共存模式的研究，由于物種共存模式的復(fù)雜性，傳統(tǒng)實(shí)驗(yàn)方法難以對(duì)植物群落的物種共存模式進(jìn)行預(yù)測(cè)，但是人工智能工具卻可以通過(guò)復(fù)制和模擬物種構(gòu)成及其在不同類型土壤中的相互關(guān)系，發(fā)現(xiàn)有更大可能在物種構(gòu)成方面帶來(lái)高度多樣性的先鋒物種。[3]

可見(jiàn)，越是那些需要為復(fù)雜系統(tǒng)建模、進(jìn)行高階結(jié)構(gòu)設(shè)計(jì)，或是設(shè)計(jì)規(guī)劃實(shí)驗(yàn)、分解流程步驟的領(lǐng)域，如生物科學(xué)、材料科學(xué)領(lǐng)域或是藥物研發(fā)領(lǐng)域，人工智能越是有可能提供研究的新方法和新途徑。

總之，“借助機(jī)器學(xué)習(xí)對(duì)高維問(wèn)題的表達(dá)能力，人類可以更加真實(shí)細(xì)致地刻畫(huà)復(fù)雜系統(tǒng)的機(jī)理”[4]，隨著人工智能技術(shù)的飛速發(fā)展，未來(lái)我國(guó)將“逐步構(gòu)建以人工智能支撐基礎(chǔ)和前沿科學(xué)研究的新模式，加速我國(guó)科學(xué)研究范式變革和能力提升”[5]。

二、對(duì)話式人工智能賦能科研創(chuàng)新的局限性

1.受限于數(shù)據(jù)和算力的制約

一方面，可獲取的預(yù)訓(xùn)練數(shù)據(jù)集的數(shù)量和質(zhì)量決定了人工智能工具的表現(xiàn)。大量開(kāi)源和開(kāi)放英文高質(zhì)量語(yǔ)料資源為國(guó)外對(duì)話式人工智能工具的開(kāi)發(fā)提供了便利。GPT-3的英文訓(xùn)練數(shù)據(jù)中有大量數(shù)據(jù)來(lái)自維基百科、開(kāi)放圖書(shū)館網(wǎng)站、論文期刊網(wǎng)站（如arXiv.org）、技術(shù)問(wèn)答社區(qū)（如Stack Exchange）、新聞存檔網(wǎng)站（如The Real News Network）、醫(yī)療數(shù)據(jù)網(wǎng)站（如Pub Med）、代碼社區(qū)（如GitHub）、網(wǎng)頁(yè)爬蟲(chóng)數(shù)據(jù)網(wǎng)站（Common Crawl）?！跋噍^于英文數(shù)據(jù)，中文數(shù)據(jù)的開(kāi)源程度較低，導(dǎo)致中文數(shù)據(jù)集的規(guī)模相對(duì)較小。[6]MOSS團(tuán)隊(duì)曾表示，“中文網(wǎng)頁(yè)上的干擾信息較多”[7]，這制約了處理中文語(yǔ)料的對(duì)話式人工智能的發(fā)展。隨著大型語(yǔ)言模型的快速發(fā)展，也有計(jì)算機(jī)科學(xué)家預(yù)測(cè)，“到2026年，大型語(yǔ)言模型的訓(xùn)練將耗盡互聯(lián)網(wǎng)上的可用文本數(shù)據(jù)，屆時(shí)將沒(méi)有新的訓(xùn)練數(shù)據(jù)可供使用”[8]，大型語(yǔ)言模型的進(jìn)一步發(fā)展將面臨困難。

另一方面，大型語(yǔ)言模型的訓(xùn)練與應(yīng)用有賴于大量算力的支持。語(yǔ)言模型要達(dá)到一定的規(guī)模，一定時(shí)長(zhǎng)和頻次的訓(xùn)練，才能產(chǎn)生邏輯推理，展現(xiàn)處理復(fù)雜問(wèn)題的能力。而模型的規(guī)模越大，需要的算力也就越多。類似ChatGPT這樣的大型語(yǔ)言模型的每次回應(yīng)指令，都需要數(shù)十億次的計(jì)算。因此，新訓(xùn)練一個(gè)類似的大模型，需要上萬(wàn)塊高性能GPU芯片的支持。可以說(shuō)，當(dāng)前誰(shuí)能獲得更多的高性能GPU芯片，誰(shuí)就能在對(duì)話式人工智能的訓(xùn)練與應(yīng)用上占得先機(jī)。

此外，在算力有限的背景下，如何分享和分配對(duì)話式人工智能工具的訪問(wèn)權(quán)也將成為越來(lái)越引發(fā)關(guān)注的問(wèn)題。此前，由于訪問(wèn)需求量過(guò)大造成的算力緊張，OpenAI公司曾短暫暫停付費(fèi)用戶注冊(cè)，并大規(guī)模清理亞洲等區(qū)域批量注冊(cè)的賬號(hào)。未來(lái)隨著人工智能在科研行業(yè)滲透率的不斷提升，算力緊張?jiān)斐傻娜斯ぶ悄茉L問(wèn)權(quán)的差異將成為拉大彼此之間科研差距的潛在風(fēng)險(xiǎn)。

2.有賴于使用者的人工審核與全流程把控

一方面，使用者需要對(duì)人工智能的輸出結(jié)果進(jìn)行人工審核與把關(guān)。這是因?yàn)閷?duì)話式人工智能是一種語(yǔ)言生成模型，其生成原理不同于搜索引擎的“匹配制”，即并非在已有數(shù)據(jù)庫(kù)中搜索與關(guān)鍵詞最匹配或最相近的結(jié)果，而是采用自回歸模型的“預(yù)測(cè)式”生成辦法，即根據(jù)使用者輸入文本的前一部分內(nèi)容依次預(yù)測(cè)下一個(gè)詞，以此確定輸出內(nèi)容。這種“預(yù)測(cè)式”生成模式?jīng)Q定了其輸出結(jié)果的真實(shí)性和可靠性受到了限制，即使采用了過(guò)濾和篩選機(jī)制，也難以完全避免生成虛假信息、帶有偏向性或是誤導(dǎo)性的信息。因此，需要使用者通過(guò)人工審核對(duì)輸出結(jié)果進(jìn)行把關(guān)，考察其真實(shí)性、準(zhǔn)確性、邏輯性、有效性、可操作性等?？傊斯ぶ悄苜x能科研創(chuàng)新要求使用者了解人工智能工具的生成原理、局限性與使用邊界，對(duì)其輸出結(jié)果進(jìn)行人工審核與把關(guān)。

另一方面，對(duì)話式人工智能作為一種大型語(yǔ)言模型，其擁有的海量訓(xùn)練數(shù)據(jù)意味著人機(jī)對(duì)話的演進(jìn)方向有無(wú)數(shù)種可能。要讓人工智能了解哪一個(gè)對(duì)話方向符合使用者的需要，有賴于使用者給予人工智能恰當(dāng)而精確的持續(xù)反饋，即對(duì)人機(jī)對(duì)話進(jìn)行全流程把控和引導(dǎo)。這種把控與引導(dǎo)包括：投喂合適的科研語(yǔ)料以幫助人工智能學(xué)習(xí)背景知識(shí)，準(zhǔn)確描述需求與意圖，嘗試不同的交互方式，如提問(wèn)—回答、輸入指令、設(shè)定目標(biāo)、界定情境、設(shè)定角色、提出個(gè)性化要求，等等。總之，只有給予人工智能持續(xù)的精確反饋與引導(dǎo)，對(duì)人機(jī)對(duì)話的演進(jìn)方向進(jìn)行全流程把控，才能更好地干預(yù)、調(diào)整、改進(jìn)人工智能的輸出結(jié)果，不斷推進(jìn)研究的深入。

三、未來(lái)發(fā)展方向：在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡

隨著ChatGPT的快速風(fēng)靡，通過(guò)對(duì)話式人工智能進(jìn)行的科研造假與由此引發(fā)的版權(quán)風(fēng)險(xiǎn)等問(wèn)題已得到學(xué)界的廣泛討論，然而，技術(shù)的不當(dāng)使用根源在于人，未來(lái)隨著抄襲檢測(cè)工具的開(kāi)發(fā)與完善、科研評(píng)價(jià)標(biāo)準(zhǔn)的調(diào)整與改進(jìn)，人類正確科研價(jià)值觀的逐漸確立，人工智能工具的負(fù)面影響終將慢慢消解。科研工作者會(huì)將注意力更多轉(zhuǎn)向探索人工智能工具的使用邊界，發(fā)掘其在不同場(chǎng)景不同任務(wù)下可能實(shí)現(xiàn)的最大功能，將其打造成為具有多樣化集成性功能的科研輔助工具，以優(yōu)化科研流程，賦能科研創(chuàng)新。

總之，以ChatGPT為代表的對(duì)話式人工智能在技術(shù)上的跨越式發(fā)展預(yù)示著邁向通用人工智能的歷史洪流已然開(kāi)啟。從歷史發(fā)展的進(jìn)程來(lái)看，未來(lái)社會(huì)各個(gè)行業(yè)與人工智能工具的深度綁定將加速實(shí)現(xiàn)，人工智能工具將最終成為人類社會(huì)智能基礎(chǔ)設(shè)施中必不可少的一部分。同時(shí)，面對(duì)數(shù)據(jù)泄露、隱私侵犯、虛假信息、人機(jī)競(jìng)爭(zhēng)等各種潛在風(fēng)險(xiǎn)，人類將持續(xù)推進(jìn)人工智能技術(shù)的迭代升級(jí)，針對(duì)如何建設(shè)“可信賴”的人工智能進(jìn)行更廣泛的討論，爭(zhēng)取對(duì)人工智能模型和算法的透明度、可解釋性等的監(jiān)管在更大范圍達(dá)成一致，以在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡。

（作者單位系《中國(guó)特色社會(huì)主義研究》雜志社）

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

對(duì)話式人工智能賦能科研創(chuàng)新的可能性、局限性及未來(lái)發(fā)展

對(duì)話式人工智能賦能科研創(chuàng)新的可能性、局限性及未來(lái)發(fā)展