国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

對(duì)話式人工智能賦能科研創(chuàng)新的可能性、局限性及未來(lái)發(fā)展

2023-06-12 19:57周青
出版參考 2023年4期
關(guān)鍵詞:科研創(chuàng)新

周青

摘 要:以ChatGPT為代表的對(duì)話式人工智能的出現(xiàn)給科研生產(chǎn)帶來(lái)了新的機(jī)遇,為科研創(chuàng)新提供了新的空間與可能。對(duì)話式人工智能賦能科研創(chuàng)新的可能性在于,一是擁有海量訓(xùn)練數(shù)據(jù)助力知識(shí)的整合與創(chuàng)新,二是多種人工智能技術(shù)助力復(fù)雜知識(shí)性任務(wù)的完成。未來(lái)人類會(huì)將更多注意力轉(zhuǎn)向如何以人工智能賦能科研創(chuàng)新,并在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡。

關(guān)鍵詞:ChatGPT 對(duì)話式人工智能 科研創(chuàng)新

2022年11月美國(guó)人工智能實(shí)驗(yàn)室OpenAI公司推出對(duì)話式人工智能工具ChatGPT,這一大型語(yǔ)言模型很快引爆了全球人工智能市場(chǎng),引發(fā)一場(chǎng)人工智能新競(jìng)賽。對(duì)話式人工智能的浪潮迅速席卷全球,對(duì)科技、教育、設(shè)計(jì)、編程等眾多行業(yè)產(chǎn)生了巨大沖擊,引發(fā)了強(qiáng)烈震動(dòng)。受此影響,國(guó)內(nèi)外科技公司紛紛加碼相關(guān)研發(fā),相繼推出自研的對(duì)話式人工智能工具,并加快與其他軟件和應(yīng)用的集成整合??梢韵胍?jiàn),在不久的將來(lái),對(duì)話式人工智能將在社會(huì)各個(gè)垂直領(lǐng)域加快應(yīng)用。人工智能對(duì)科研行業(yè)也將產(chǎn)生巨大影響,將極大改變以往的科研模式、優(yōu)化科研流程,給加速科研創(chuàng)新帶來(lái)新的空間與可能。

一、對(duì)話式人工智能賦能科研創(chuàng)新的可能性

以ChatGPT為主要代表的對(duì)話式人工智能已經(jīng)可以通過(guò)自然語(yǔ)言理解人類意圖,完成人類指令,輸出具有一定準(zhǔn)確性和邏輯性的結(jié)果,其輔助優(yōu)化科研流程、提升科研效率的功能已經(jīng)得到了大量驗(yàn)證。那么,這類人工智能工具是否也有助于激發(fā)科研創(chuàng)新?下文從三個(gè)角度來(lái)探討對(duì)話式人工智能賦能科研創(chuàng)新的可能性。

1.海量訓(xùn)練數(shù)據(jù)助力知識(shí)的整合與創(chuàng)新

對(duì)話式人工智能是一種在預(yù)訓(xùn)練階段需要使用海量知識(shí)數(shù)據(jù)進(jìn)行訓(xùn)練的大型語(yǔ)言模型,其訓(xùn)練語(yǔ)料中包含的全部知識(shí)遠(yuǎn)遠(yuǎn)超過(guò)人類個(gè)體在有限的生命時(shí)間內(nèi)所能掌握的廣度和深度。此外,海量訓(xùn)練數(shù)據(jù)集中包含多個(gè)學(xué)科眾多領(lǐng)域的知識(shí),使得人工智能在知識(shí)學(xué)習(xí)的過(guò)程中能完成知識(shí)的整合與重構(gòu),在解決專業(yè)性和知識(shí)性問(wèn)題,特別是需要跨學(xué)科研究以及涉及交叉學(xué)科知識(shí)的問(wèn)題時(shí),會(huì)有令人意想不到的知識(shí)連接,從而表現(xiàn)出一定的創(chuàng)新性。

對(duì)科研人員來(lái)說(shuō),對(duì)話式人工智能工具在多學(xué)科多領(lǐng)域知識(shí)整合重構(gòu)基礎(chǔ)上呈現(xiàn)出的知識(shí)連接能夠引發(fā)使用者的“頭腦風(fēng)暴”,刺激其從不同視角進(jìn)行思考,在其借助人工智能進(jìn)行科學(xué)研究的各個(gè)環(huán)節(jié),如確定研究方向、選擇研究概念、考證研究邏輯、設(shè)計(jì)研究框架、收集實(shí)驗(yàn)數(shù)據(jù)、驗(yàn)證實(shí)驗(yàn)結(jié)果等,都有可能激發(fā)研究者的創(chuàng)意與靈感火花。

OpenAI已證實(shí),GPT-4能基于學(xué)科知識(shí)的整合完成具有一定知識(shí)性和復(fù)雜程度的任務(wù),表現(xiàn)出良好的遷移能力和泛化能力,其在專業(yè)性和學(xué)術(shù)性上的表現(xiàn)已接近人類水平。我國(guó)也已關(guān)注到對(duì)話式人工智能在推進(jìn)科研創(chuàng)新方面的空間與可能。如科技部已在近期啟動(dòng)“人工智能驅(qū)動(dòng)的科學(xué)研究”(AI for Science)專項(xiàng)部署工作,結(jié)合數(shù)學(xué)、物理、化學(xué)、天文等基礎(chǔ)學(xué)科關(guān)鍵問(wèn)題,圍繞藥物研發(fā)、基因研究、生物育種、新材料研發(fā)等重點(diǎn)領(lǐng)域科研需求,布局“人工智能驅(qū)動(dòng)的科學(xué)研究”研發(fā)體系。[1]

2.多種人工智能技術(shù)助力復(fù)雜知識(shí)性任務(wù)的完成

對(duì)話式人工智能在技術(shù)上的跨越式發(fā)展來(lái)源于人工智能兩大分支領(lǐng)域即機(jī)器學(xué)習(xí)與自然語(yǔ)言處理領(lǐng)域的持續(xù)技術(shù)積累,以及多項(xiàng)底層技術(shù)的不斷創(chuàng)新。例如,采用Transformer模型來(lái)進(jìn)行文本內(nèi)容的特征抽?。煌ㄟ^(guò)深度學(xué)習(xí)(Deep Learning)來(lái)研究如何有效增加模型層深及模型參數(shù)容量以提升模型復(fù)雜度;采用生成式預(yù)訓(xùn)練(GPT,Generative Pre-trained)+微調(diào)(Fine-tuning)的模式解決下游任務(wù)的遷移問(wèn)題;采用自回歸模型(Auto-Regressive Model)+零樣本/少量樣本(Zero/Few Shot)模式解決自然語(yǔ)言生成問(wèn)題,等等。

正是這些底層技術(shù)的不斷創(chuàng)新,以ChatGPT為代表的對(duì)話式人工智能工具得以不斷完善語(yǔ)言模型、修正算法策略、進(jìn)行多樣化語(yǔ)料訓(xùn)練,實(shí)現(xiàn)學(xué)習(xí)機(jī)制的自我迭代更新,從而在自然語(yǔ)言理解與生成任務(wù)中表現(xiàn)出良好的邏輯推理能力。這種邏輯推理能力表現(xiàn)在:理解語(yǔ)義之間的關(guān)聯(lián)、保證輸出結(jié)果的一致性和連貫性;基于人類的反饋調(diào)整輸出結(jié)果;對(duì)復(fù)雜問(wèn)題的拆解與分層次分步驟處理;能力的遷移與泛化等。

因而,科研人員可以利用人工智能的邏輯推理能力,輔助完成復(fù)雜的知識(shí)性任務(wù)。在這個(gè)過(guò)程中,使用者需要通過(guò)投喂背景語(yǔ)料、提高提問(wèn)與指令的精確性與指向性、調(diào)整嘗試不同提示語(yǔ)以及提供相似案例,不斷引導(dǎo)人工智能對(duì)回答進(jìn)行修正。這種“提問(wèn)—反饋—進(jìn)一步提問(wèn)—更深入反饋”的進(jìn)階式人機(jī)對(duì)話過(guò)程,同時(shí)也刺激使用者思考積累的疑問(wèn)、梳理思路與想法、分層次分步驟拆解復(fù)雜問(wèn)題,進(jìn)行歸納、演繹、類比、推理等思維活動(dòng)。

由于大型語(yǔ)言模型復(fù)雜的模型結(jié)構(gòu)與巨量參數(shù)規(guī)模,人類尚無(wú)法理解人工智能模型內(nèi)部的一系列具體決策過(guò)程,以及它是如何產(chǎn)生邏輯推理能力的。但可以肯定的是,ChatGPT這樣的對(duì)話式人工智能在面對(duì)具有一定復(fù)雜程度的知識(shí)性任務(wù)時(shí),能夠模擬人類思考與解決問(wèn)題的心理過(guò)程,呈現(xiàn)令人驚艷的表現(xiàn),從而為激發(fā)科研創(chuàng)新提供可能。

3.強(qiáng)大算力助力對(duì)未知領(lǐng)域的科研探索

某些未知領(lǐng)域的科研探索比較復(fù)雜,有時(shí)需要處理大量數(shù)據(jù)、進(jìn)行大量計(jì)算、針對(duì)復(fù)雜結(jié)構(gòu)建模,或是設(shè)計(jì)不同方案、理清復(fù)雜關(guān)系、應(yīng)對(duì)多重任務(wù),這類研究人類通過(guò)手工操作往往難以實(shí)現(xiàn)。而對(duì)話式人工智能的強(qiáng)大算力可以大大加快科研進(jìn)程,保證在較短時(shí)間內(nèi)完成海量運(yùn)算,規(guī)避人工操作的大量人力和時(shí)間成本,保證研究的持續(xù)推進(jìn),從而激發(fā)對(duì)于未知領(lǐng)域的探索。

一個(gè)例子是藥物的研發(fā),新藥物研發(fā)的關(guān)鍵性任務(wù)是識(shí)別具有特定生物活性的化學(xué)物質(zhì)。通過(guò)構(gòu)建化學(xué)結(jié)構(gòu)式生成、確定打分函數(shù),人工智能可以加快化學(xué)物質(zhì)生物活性的驗(yàn)證過(guò)程。[2]另一個(gè)例子是針對(duì)物種共存模式的研究,由于物種共存模式的復(fù)雜性,傳統(tǒng)實(shí)驗(yàn)方法難以對(duì)植物群落的物種共存模式進(jìn)行預(yù)測(cè),但是人工智能工具卻可以通過(guò)復(fù)制和模擬物種構(gòu)成及其在不同類型土壤中的相互關(guān)系,發(fā)現(xiàn)有更大可能在物種構(gòu)成方面帶來(lái)高度多樣性的先鋒物種。[3]

可見(jiàn),越是那些需要為復(fù)雜系統(tǒng)建模、進(jìn)行高階結(jié)構(gòu)設(shè)計(jì),或是設(shè)計(jì)規(guī)劃實(shí)驗(yàn)、分解流程步驟的領(lǐng)域,如生物科學(xué)、材料科學(xué)領(lǐng)域或是藥物研發(fā)領(lǐng)域,人工智能越是有可能提供研究的新方法和新途徑。

總之,“借助機(jī)器學(xué)習(xí)對(duì)高維問(wèn)題的表達(dá)能力,人類可以更加真實(shí)細(xì)致地刻畫(huà)復(fù)雜系統(tǒng)的機(jī)理”[4],隨著人工智能技術(shù)的飛速發(fā)展,未來(lái)我國(guó)將“逐步構(gòu)建以人工智能支撐基礎(chǔ)和前沿科學(xué)研究的新模式,加速我國(guó)科學(xué)研究范式變革和能力提升”[5]。

二、對(duì)話式人工智能賦能科研創(chuàng)新的局限性

1.受限于數(shù)據(jù)和算力的制約

一方面,可獲取的預(yù)訓(xùn)練數(shù)據(jù)集的數(shù)量和質(zhì)量決定了人工智能工具的表現(xiàn)。大量開(kāi)源和開(kāi)放英文高質(zhì)量語(yǔ)料資源為國(guó)外對(duì)話式人工智能工具的開(kāi)發(fā)提供了便利。GPT-3的英文訓(xùn)練數(shù)據(jù)中有大量數(shù)據(jù)來(lái)自維基百科、開(kāi)放圖書(shū)館網(wǎng)站、論文期刊網(wǎng)站(如arXiv.org)、技術(shù)問(wèn)答社區(qū)(如Stack Exchange)、新聞存檔網(wǎng)站(如The Real News Network)、醫(yī)療數(shù)據(jù)網(wǎng)站(如Pub Med)、代碼社區(qū)(如GitHub)、網(wǎng)頁(yè)爬蟲(chóng)數(shù)據(jù)網(wǎng)站(Common Crawl)?!跋噍^于英文數(shù)據(jù),中文數(shù)據(jù)的開(kāi)源程度較低,導(dǎo)致中文數(shù)據(jù)集的規(guī)模相對(duì)較小。[6]MOSS團(tuán)隊(duì)曾表示,“中文網(wǎng)頁(yè)上的干擾信息較多”[7],這制約了處理中文語(yǔ)料的對(duì)話式人工智能的發(fā)展。隨著大型語(yǔ)言模型的快速發(fā)展,也有計(jì)算機(jī)科學(xué)家預(yù)測(cè),“到2026年,大型語(yǔ)言模型的訓(xùn)練將耗盡互聯(lián)網(wǎng)上的可用文本數(shù)據(jù),屆時(shí)將沒(méi)有新的訓(xùn)練數(shù)據(jù)可供使用”[8],大型語(yǔ)言模型的進(jìn)一步發(fā)展將面臨困難。

另一方面,大型語(yǔ)言模型的訓(xùn)練與應(yīng)用有賴于大量算力的支持。語(yǔ)言模型要達(dá)到一定的規(guī)模,一定時(shí)長(zhǎng)和頻次的訓(xùn)練,才能產(chǎn)生邏輯推理,展現(xiàn)處理復(fù)雜問(wèn)題的能力。而模型的規(guī)模越大,需要的算力也就越多。類似ChatGPT這樣的大型語(yǔ)言模型的每次回應(yīng)指令,都需要數(shù)十億次的計(jì)算。因此,新訓(xùn)練一個(gè)類似的大模型,需要上萬(wàn)塊高性能GPU芯片的支持。可以說(shuō),當(dāng)前誰(shuí)能獲得更多的高性能GPU芯片,誰(shuí)就能在對(duì)話式人工智能的訓(xùn)練與應(yīng)用上占得先機(jī)。

此外,在算力有限的背景下,如何分享和分配對(duì)話式人工智能工具的訪問(wèn)權(quán)也將成為越來(lái)越引發(fā)關(guān)注的問(wèn)題。此前,由于訪問(wèn)需求量過(guò)大造成的算力緊張,OpenAI公司曾短暫暫停付費(fèi)用戶注冊(cè),并大規(guī)模清理亞洲等區(qū)域批量注冊(cè)的賬號(hào)。未來(lái)隨著人工智能在科研行業(yè)滲透率的不斷提升,算力緊張?jiān)斐傻娜斯ぶ悄茉L問(wèn)權(quán)的差異將成為拉大彼此之間科研差距的潛在風(fēng)險(xiǎn)。

2.有賴于使用者的人工審核與全流程把控

一方面,使用者需要對(duì)人工智能的輸出結(jié)果進(jìn)行人工審核與把關(guān)。這是因?yàn)閷?duì)話式人工智能是一種語(yǔ)言生成模型,其生成原理不同于搜索引擎的“匹配制”,即并非在已有數(shù)據(jù)庫(kù)中搜索與關(guān)鍵詞最匹配或最相近的結(jié)果,而是采用自回歸模型的“預(yù)測(cè)式”生成辦法,即根據(jù)使用者輸入文本的前一部分內(nèi)容依次預(yù)測(cè)下一個(gè)詞,以此確定輸出內(nèi)容。這種“預(yù)測(cè)式”生成模式?jīng)Q定了其輸出結(jié)果的真實(shí)性和可靠性受到了限制,即使采用了過(guò)濾和篩選機(jī)制,也難以完全避免生成虛假信息、帶有偏向性或是誤導(dǎo)性的信息。因此,需要使用者通過(guò)人工審核對(duì)輸出結(jié)果進(jìn)行把關(guān),考察其真實(shí)性、準(zhǔn)確性、邏輯性、有效性、可操作性等??傊斯ぶ悄苜x能科研創(chuàng)新要求使用者了解人工智能工具的生成原理、局限性與使用邊界,對(duì)其輸出結(jié)果進(jìn)行人工審核與把關(guān)。

另一方面,對(duì)話式人工智能作為一種大型語(yǔ)言模型,其擁有的海量訓(xùn)練數(shù)據(jù)意味著人機(jī)對(duì)話的演進(jìn)方向有無(wú)數(shù)種可能。要讓人工智能了解哪一個(gè)對(duì)話方向符合使用者的需要,有賴于使用者給予人工智能恰當(dāng)而精確的持續(xù)反饋,即對(duì)人機(jī)對(duì)話進(jìn)行全流程把控和引導(dǎo)。這種把控與引導(dǎo)包括:投喂合適的科研語(yǔ)料以幫助人工智能學(xué)習(xí)背景知識(shí),準(zhǔn)確描述需求與意圖,嘗試不同的交互方式,如提問(wèn)—回答、輸入指令、設(shè)定目標(biāo)、界定情境、設(shè)定角色、提出個(gè)性化要求,等等。總之,只有給予人工智能持續(xù)的精確反饋與引導(dǎo),對(duì)人機(jī)對(duì)話的演進(jìn)方向進(jìn)行全流程把控,才能更好地干預(yù)、調(diào)整、改進(jìn)人工智能的輸出結(jié)果,不斷推進(jìn)研究的深入。

三、未來(lái)發(fā)展方向:在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡

隨著ChatGPT的快速風(fēng)靡,通過(guò)對(duì)話式人工智能進(jìn)行的科研造假與由此引發(fā)的版權(quán)風(fēng)險(xiǎn)等問(wèn)題已得到學(xué)界的廣泛討論,然而,技術(shù)的不當(dāng)使用根源在于人,未來(lái)隨著抄襲檢測(cè)工具的開(kāi)發(fā)與完善、科研評(píng)價(jià)標(biāo)準(zhǔn)的調(diào)整與改進(jìn),人類正確科研價(jià)值觀的逐漸確立,人工智能工具的負(fù)面影響終將慢慢消解。科研工作者會(huì)將注意力更多轉(zhuǎn)向探索人工智能工具的使用邊界,發(fā)掘其在不同場(chǎng)景不同任務(wù)下可能實(shí)現(xiàn)的最大功能,將其打造成為具有多樣化集成性功能的科研輔助工具,以優(yōu)化科研流程,賦能科研創(chuàng)新。

總之,以ChatGPT為代表的對(duì)話式人工智能在技術(shù)上的跨越式發(fā)展預(yù)示著邁向通用人工智能的歷史洪流已然開(kāi)啟。從歷史發(fā)展的進(jìn)程來(lái)看,未來(lái)社會(huì)各個(gè)行業(yè)與人工智能工具的深度綁定將加速實(shí)現(xiàn),人工智能工具將最終成為人類社會(huì)智能基礎(chǔ)設(shè)施中必不可少的一部分。同時(shí),面對(duì)數(shù)據(jù)泄露、隱私侵犯、虛假信息、人機(jī)競(jìng)爭(zhēng)等各種潛在風(fēng)險(xiǎn),人類將持續(xù)推進(jìn)人工智能技術(shù)的迭代升級(jí),針對(duì)如何建設(shè)“可信賴”的人工智能進(jìn)行更廣泛的討論,爭(zhēng)取對(duì)人工智能模型和算法的透明度、可解釋性等的監(jiān)管在更大范圍達(dá)成一致,以在保證人類安全與促進(jìn)科技發(fā)展之間尋求平衡。

(作者單位系《中國(guó)特色社會(huì)主義研究》雜志社)

猜你喜歡
科研創(chuàng)新
科研創(chuàng)新要素集聚、產(chǎn)業(yè)優(yōu)化與區(qū)域經(jīng)濟(jì)增長(zhǎng)
環(huán)境科學(xué)專業(yè)本科生科研創(chuàng)新能力培養(yǎng)方法與長(zhǎng)效機(jī)制