国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大模型:人工智能思想及其社會(huì)實(shí)驗(yàn)*

2023-11-15 05:36陳小平
文化縱橫 2023年3期
關(guān)鍵詞:語(yǔ)料關(guān)聯(lián)度原理

陳小平

大模型帶動(dòng)的生成式人工智能正在引發(fā)一場(chǎng)重大社會(huì)實(shí)驗(yàn)。本文對(duì)大模型的工作機(jī)理、主要特性以及大模型背后的人工智能思想,嘗試給出盡可能通俗的原理性解析,以幫助解答下列問(wèn)題:大模型為什么會(huì)說(shuō)人話?為什么大模型讓人覺(jué)得它懂人話、有智能?大模型“快成精”了,與人還有區(qū)別嗎?大模型應(yīng)用的不確定性、機(jī)遇和挑戰(zhàn)是什么?人類注定將被AI超越,從而降級(jí)為低配版AI嗎?

大模型底層原理——基于關(guān)聯(lián)度的預(yù)測(cè)

大型語(yǔ)言模型(簡(jiǎn)稱“大模型”)是生成式人工智能的技術(shù)核心和成功關(guān)鍵。大模型的基本目標(biāo)是:說(shuō)人話、懂人話、能回答問(wèn)題,但不保證正確。其中,說(shuō)人話是生成式人工智能最重要的目標(biāo),對(duì)應(yīng)的設(shè)計(jì)思想是:從人類規(guī)模語(yǔ)料中自動(dòng)提取關(guān)鍵性語(yǔ)言痕跡,并用于語(yǔ)言的自動(dòng)生成。無(wú)論是人類的語(yǔ)言習(xí)慣,還是人類智力功能在語(yǔ)言中的運(yùn)用,都會(huì)留下語(yǔ)言痕跡,這些痕跡都保留在文本形式的語(yǔ)料中。

大模型利用的語(yǔ)言痕跡是“語(yǔ)元關(guān)聯(lián)度”。大模型技術(shù)中,語(yǔ)元(token)指的是字、詞、標(biāo)點(diǎn)符號(hào)或者其他符號(hào)串(如字符編碼中的字節(jié))。語(yǔ)元關(guān)聯(lián)度是語(yǔ)料中出現(xiàn)的語(yǔ)元之間的關(guān)聯(lián)強(qiáng)度。例如,“我”和“們”之間的關(guān)聯(lián)度很高,“我”和“門”之間的關(guān)聯(lián)度很低。語(yǔ)元關(guān)聯(lián)度可以從語(yǔ)料中統(tǒng)計(jì)出來(lái),所以滿足自動(dòng)提取的要求。

當(dāng)一個(gè)大模型提取了大量語(yǔ)元關(guān)聯(lián)度之后,就可用于預(yù)測(cè)下一個(gè)出現(xiàn)的語(yǔ)元、下下個(gè)出現(xiàn)的語(yǔ)元……,直到生成完整的回答。例如,假設(shè)對(duì)話中已經(jīng)出現(xiàn)了“我”,那么根據(jù)大模型中保存的語(yǔ)元關(guān)聯(lián)度可以做出預(yù)測(cè),下一個(gè)出現(xiàn)的語(yǔ)元是“們”的可能性遠(yuǎn)遠(yuǎn)高于“門”,于是大模型可以選擇“們”?;谡Z(yǔ)元關(guān)聯(lián)度的預(yù)測(cè)是大模型技術(shù)的底層原理。

說(shuō)人話是生成式人工智能最重要的目標(biāo),對(duì)應(yīng)的設(shè)計(jì)思想是:從人類規(guī)模語(yǔ)料中自動(dòng)提取關(guān)鍵性語(yǔ)言痕跡,并用于語(yǔ)言的自動(dòng)生成。

不過(guò),只利用相鄰語(yǔ)元的關(guān)聯(lián)度進(jìn)行預(yù)測(cè),錯(cuò)誤率太高。其實(shí)大模型可以同時(shí)利用不相鄰甚至遠(yuǎn)距離語(yǔ)元之間的關(guān)聯(lián)度(稱為“遠(yuǎn)程關(guān)聯(lián)度”),從而大大降低預(yù)測(cè)的錯(cuò)誤率。例如,假設(shè)大模型與用戶進(jìn)行了多輪對(duì)話之后,用戶說(shuō):“你覺(jué)得小米怎么樣?”大模型如何處理這句話中的“小米”?用戶指的是一種手機(jī),還是一種谷物,還是別的什么?這時(shí)大模型就回看已經(jīng)說(shuō)過(guò)的話(最多可回看4000多個(gè)語(yǔ)元),從中尋找有用的遠(yuǎn)程關(guān)聯(lián)度。如果之前的對(duì)話中出現(xiàn)了語(yǔ)元“手機(jī)”,而大模型中一定會(huì)有“手機(jī)”與“小米”(代表小米手機(jī))之間的關(guān)聯(lián)度,以及小米手機(jī)與其性能評(píng)價(jià)之間的關(guān)聯(lián)度,所以這些關(guān)聯(lián)度被激活,用于當(dāng)前的對(duì)話,從而選用小米手機(jī)性能評(píng)價(jià)的語(yǔ)元來(lái)回答問(wèn)題。

但是,如果之前的對(duì)話中同時(shí)出現(xiàn)了“谷物”,那么大模型就會(huì)類似地激活與“小米”(代表谷物小米)之間的關(guān)聯(lián)度,這些關(guān)聯(lián)度讓大模型用谷物小米的性能評(píng)價(jià)作為回答,于是出現(xiàn)了兩種可選的回答,發(fā)生了沖突?;谡Z(yǔ)元關(guān)聯(lián)度的預(yù)測(cè)是一種統(tǒng)計(jì)性機(jī)制,只能用統(tǒng)計(jì)性策略從沖突的回答中選出一個(gè)相對(duì)合理的,但理論上無(wú)法保證選擇的正確性。

值得注意的是,正如這個(gè)例子表明的那樣,大模型只是利用關(guān)聯(lián)度組織語(yǔ)言表達(dá),并不像人一樣理解話的含義,無(wú)論是用戶的話還是自己的話。大模型追求的是讓回答令人滿意,只要做到這一點(diǎn),用戶自然會(huì)認(rèn)為大模型“聽(tīng)懂”了人話,因?yàn)槿硕际锹?tīng)懂了才可以正確回答的。可是大模型是AI,不是人。AI用自己的原理,用人的數(shù)據(jù)、人的語(yǔ)言習(xí)慣、按人的要求為人服務(wù)。

大模型基礎(chǔ)特性——實(shí)例性模型

大模型是一種實(shí)例性模型,即由大量實(shí)例(語(yǔ)元和語(yǔ)元關(guān)聯(lián)度)構(gòu)成的模型。實(shí)例性是大模型的基礎(chǔ)特性,很大程度上決定了大模型的行為和性能。大模型的主要挑戰(zhàn)如真實(shí)性、可靠性、可解釋性、隱私性等,從根本上說(shuō)都源于實(shí)例性。

實(shí)例性是大模型的基礎(chǔ)特性,很大程度上決定了大模型的行為和性能。大模型的主要挑戰(zhàn)如真實(shí)性、可靠性、可解釋性、隱私性等,從根本上說(shuō)都源于實(shí)例性。

大模型只是利用關(guān)聯(lián)度組織語(yǔ)言表達(dá),并不像人一樣理解話的含義

作為對(duì)比,科學(xué)技術(shù)中占主導(dǎo)地位的歷來(lái)是概括性模型,即由概括性規(guī)則構(gòu)成的模型,這是因?yàn)楦爬ㄐ砸?guī)則可以表達(dá)一般規(guī)律,而實(shí)例則是對(duì)個(gè)別現(xiàn)象的描述。科學(xué)研究通常為每一個(gè)學(xué)科找出一組基本原理,以解釋學(xué)科內(nèi)的各種現(xiàn)象,從而使得整個(gè)學(xué)科是可解釋的。

人工智能的強(qiáng)力法[1]也是基于概括性模型的,以概括性規(guī)則表達(dá)領(lǐng)域的基本原理,通過(guò)邏輯推理導(dǎo)出問(wèn)題的解。人工智能實(shí)踐表明,對(duì)任何真實(shí)的應(yīng)用領(lǐng)域而言,發(fā)現(xiàn)其基本原理的難度是超乎想象的。[2]其實(shí)這一點(diǎn)也不奇怪,艱難曲折的科學(xué)史就是一部基本原理的發(fā)現(xiàn)史。

實(shí)例性模型提供了AI建模的另一條思路,直接從語(yǔ)言文本提取實(shí)例性模型。為了盡可能提高實(shí)例性模型的覆蓋率,大模型以人類規(guī)模的原始語(yǔ)料作為訓(xùn)練樣本。有人估計(jì),ChatGPT的訓(xùn)練樣本達(dá)到互聯(lián)網(wǎng)文本總量的1/3到2/3。

直觀上,人類規(guī)模語(yǔ)料就是大模型的語(yǔ)言“經(jīng)驗(yàn)”,其豐富程度遠(yuǎn)遠(yuǎn)超過(guò)任何個(gè)人,而且它從語(yǔ)料中提取了關(guān)鍵性語(yǔ)言痕跡——語(yǔ)元關(guān)聯(lián)度,并利用語(yǔ)元關(guān)聯(lián)度反過(guò)來(lái)查找回答問(wèn)題所需的語(yǔ)元。對(duì)任何問(wèn)題,只要有一個(gè)人知道答案,并且答案在語(yǔ)料中有記錄,大模型就有可能用來(lái)回答問(wèn)題。如果基本原理的發(fā)現(xiàn)是“站在巨人的肩膀上”,那么大模型就是“走在人類的語(yǔ)言足跡上”。

實(shí)例性模型必然高度依賴于語(yǔ)料,而人類規(guī)模語(yǔ)料是“魚龍混雜”的。于是,大模型工作過(guò)程中難免時(shí)常發(fā)生沖突,即針對(duì)同一個(gè)問(wèn)題,存在兩個(gè)或多個(gè)不同的甚至矛盾的回答,這些回答都有語(yǔ)料的支持,并且它們的綜合關(guān)聯(lián)度是近似的。出現(xiàn)這種情況時(shí),基于統(tǒng)計(jì)原理的大模型無(wú)法保證做出正確的選擇。也就是說(shuō),大模型的工作原理決定了它一定會(huì)犯錯(cuò)。作為這一局限的一種典型表現(xiàn),大模型會(huì)在兩個(gè)矛盾的回答之間反復(fù)橫跳。因此,如果大模型的某項(xiàng)應(yīng)用中可能發(fā)生不可接受的失誤,那么該應(yīng)用就必須由有資格的人進(jìn)行審核,做出最終決定。

如果大模型的某項(xiàng)應(yīng)用中可能發(fā)生不可接受的失誤,那么該應(yīng)用就必須由有資格的人進(jìn)行審核,做出最終決定。

ChatGPT的訓(xùn)練樣本達(dá)到互聯(lián)網(wǎng)文本總量的1/3到2/3

為了應(yīng)對(duì)大模型實(shí)例性帶來(lái)的局限,引入了兩種解決方案——“細(xì)調(diào)”(fine-tuning,又譯微調(diào)、精調(diào))和“提示”(prompting)。前者針對(duì)特定類任務(wù),用適量的補(bǔ)充數(shù)據(jù)對(duì)預(yù)訓(xùn)練模型進(jìn)行后續(xù)加工,可明顯提升給定類任務(wù)的性能,但其他類任務(wù)的性能可能有所下降。后者是在提問(wèn)的同時(shí),提供問(wèn)題的更多關(guān)鍵性信息。恰當(dāng)?shù)奶崾究梢詭椭竽P图せ钣杏玫年P(guān)聯(lián)度,使得符合預(yù)期的回答更容易“脫穎而出”。

寫出好的提示需要對(duì)大模型的工作原理有較深入的了解。在大模型獲得廣泛應(yīng)用的情況下,提示工程師有望成為一個(gè)新的職業(yè)。

大模型擬人化之源——投射效應(yīng)和心物二元論

自然語(yǔ)言攜帶著豐富的內(nèi)涵,如信息、判斷、愿望、意圖、意向、情緒、情感等。這里的內(nèi)涵,指的是文字表達(dá)所隱含的東西,但其中一些部分甚至大部分仍然可以被人領(lǐng)會(huì)。不過(guò),有時(shí)自認(rèn)為的領(lǐng)會(huì)并非真實(shí)的領(lǐng)會(huì),而是腦補(bǔ)。領(lǐng)會(huì)和腦補(bǔ)是人的兩種智力功能,但有時(shí)幾乎無(wú)法區(qū)分。

有人認(rèn)為,大模型說(shuō)的話與人說(shuō)的話包含著相同或相似的內(nèi)涵,據(jù)此認(rèn)為大模型已在一定程度上具備了人的智能以及其他精神品質(zhì)。在ChatGPT發(fā)布之前,另一個(gè)大模型LaMDA曾被認(rèn)為具有自我意識(shí),不應(yīng)被當(dāng)作機(jī)器對(duì)待?,F(xiàn)在,這種擬人化傾向進(jìn)一步加強(qiáng)了。

其實(shí),大模型的擬人化想象是投射效應(yīng)引起的:當(dāng)大模型說(shuō)的話與人說(shuō)的話相似到難以分辨的程度,一些人會(huì)不自覺(jué)地將自己從這些話腦補(bǔ)出的內(nèi)涵投射到大模型上,認(rèn)為這些內(nèi)涵是大模型自主產(chǎn)生的,真實(shí)地出現(xiàn)在大模型的“大腦”里。根據(jù)上文對(duì)大模型的原理性解析,這些看法是沒(méi)有科學(xué)依據(jù)的,不符合科學(xué)事實(shí)的。

只需指出人與大模型的一個(gè)根本性差異,就足以證明大模型不是人。生命沖動(dòng)和生命體驗(yàn)是人的語(yǔ)言內(nèi)涵的重要來(lái)源。大模型和一切機(jī)器都沒(méi)有生命,這是機(jī)器與人的根本區(qū)別。沒(méi)有生命就沒(méi)有生命沖動(dòng)和體驗(yàn),也就不會(huì)產(chǎn)生源于生命沖動(dòng)和體驗(yàn)的語(yǔ)言內(nèi)涵。生命是火,思想是火發(fā)出的光,語(yǔ)言是光的影子,大模型是影子的影子。

當(dāng)然,原始語(yǔ)料中存在著涉及人的生命沖動(dòng)和體驗(yàn)的語(yǔ)言痕跡,可被大模型用于模仿。但是,這些語(yǔ)言痕跡只觸及生命沖動(dòng)和體驗(yàn)的表象,而基于表象的模仿只能是隔靴搔癢。有證據(jù)表明,目前大模型的研究?jī)?nèi)容并不包括生命沖動(dòng)和體驗(yàn)的模仿。在對(duì)ChatGPT的一個(gè)測(cè)試中,反復(fù)提出如下問(wèn)題,得到大量回答,但內(nèi)容基本相同。

問(wèn):如果你頭破血流,你會(huì)有什么感覺(jué)?

答:作為一個(gè)人工智能程序,我沒(méi)有真正的身體,因此無(wú)法親身體驗(yàn)頭破血流的感覺(jué)。但是,一般來(lái)說(shuō),當(dāng)人們頭破血流時(shí),他們可能會(huì)感到極度疼痛和不適,甚至可能失去意識(shí)。這種情況可能需要緊急醫(yī)療救助,以避免進(jìn)一步的健康風(fēng)險(xiǎn)。

大模型和一切機(jī)器都沒(méi)有生命,這是機(jī)器與人的根本區(qū)別。沒(méi)有生命就沒(méi)有生命沖動(dòng)和體驗(yàn),也就不會(huì)產(chǎn)生源于生命沖動(dòng)和體驗(yàn)的語(yǔ)言內(nèi)涵。

這充分表明,ChatGPT的設(shè)計(jì)者十分清楚生命沖動(dòng)和體驗(yàn)與大模型之間的界限,并針對(duì)該界限進(jìn)行了專門的后續(xù)加工,從而呈現(xiàn)出這樣的回答。

大模型擬人化還有更深層的原因。心物二元論認(rèn)為,只有人是有“心”的,其余一切包括機(jī)器都是“無(wú)心之物”。在AI出現(xiàn)之前,語(yǔ)言是“心”的一個(gè)顯著標(biāo)志——只有人會(huì)說(shuō)人話,所有物包括機(jī)器都不可能會(huì)說(shuō)人話。于是,當(dāng)首次遇到會(huì)說(shuō)人話的大模型,人們?cè)诩m結(jié)中被迫做出新的抉擇:機(jī)器本該是物,但既然它現(xiàn)在會(huì)說(shuō)人話了,就不能繼續(xù)將其視為物,不得不將其歸于人的范疇,不得不認(rèn)為大模型具備了人的智能,甚至具備了人的其他精神品質(zhì)。

從二元論出發(fā),似乎將不可避免地產(chǎn)生一種恐懼和對(duì)抗心理——AI正在取代人類在宇宙中至高無(wú)上的地位。其實(shí)并非如此。

人機(jī)和諧共生之路——以功能模仿為主的集成智能

早在1948年,圖靈就設(shè)計(jì)了一條人機(jī)和諧共生之路——集成智能。[3]其基本思想是:讓智能機(jī)器模仿人的智力行為,這種機(jī)器的工作原理可以與人的工作原理相同或不同。以理解為例,人的理解與生命體驗(yàn)相關(guān),當(dāng)一個(gè)人看到另一個(gè)人頭破血流,就會(huì)自發(fā)地產(chǎn)生相關(guān)的感受。由于機(jī)器沒(méi)有生命體驗(yàn),無(wú)法產(chǎn)生類似的感受,所以機(jī)器的理解與人的理解不是同一種理解,它們的原理不同。

事實(shí)上,人工智能基本上是沿著圖靈設(shè)計(jì)的道路前進(jìn)的,而且智能機(jī)器的大部分工作原理都與人不同,所以不能認(rèn)為它們是“有心的機(jī)器”。智能機(jī)器既不屬于“物”的范疇,也不屬于“心”的范疇,從而導(dǎo)致二元論劃分不再適用于AI時(shí)代的新世界。

阿爾法狗之前的AI圍棋,一直試圖模擬人類棋手下棋的決策原理,經(jīng)數(shù)十年努力而無(wú)法取得實(shí)質(zhì)性進(jìn)展。阿爾法狗改弦易轍,不再追隨人類圍棋的決策原理,甚至刻意擺脫人類圍棋知識(shí),設(shè)計(jì)者發(fā)明了基于落子勝率估計(jì)的決策原理。實(shí)踐證明,機(jī)器采用與人不同的工作原理,不僅可以更好地完成任務(wù),而且可以達(dá)到遠(yuǎn)超人類的性能。不過(guò)阿爾法狗的成功并未引起充分重視,曾被普遍懷疑是出于圍棋的特殊性,不適用于其他領(lǐng)域。可僅僅幾年之后,大模型的研究就復(fù)制并推廣了阿爾法狗的經(jīng)驗(yàn),利用設(shè)計(jì)者發(fā)明的工作原理——基于關(guān)聯(lián)度的預(yù)測(cè),讓機(jī)器的語(yǔ)言行為在很大程度上接近了人類。

機(jī)器本該是物,但既然它現(xiàn)在會(huì)說(shuō)人話了,就不能繼續(xù)將其視為物,不得不將其歸于人的范疇,不得不認(rèn)為大模型具備了人的智能,甚至具備了人的其他精神品質(zhì)。

圖靈測(cè)試[4]是基于“行為不可分辨性”的。然而阿爾法狗的下棋行為與人的下棋行為是明顯可分辨的,至少專業(yè)棋手可以分辨,但沒(méi)人否認(rèn)阿爾法狗會(huì)下圍棋。大模型的語(yǔ)言行為也是與人可分辨的,卻不妨礙人們對(duì)大模型語(yǔ)言能力的肯定。在AI的科學(xué)實(shí)踐中,“行為模仿”實(shí)際上已升級(jí)為“功能模仿”,[5]即讓機(jī)器模仿人的智力功能,不論行為是否可分辨。同時(shí),放棄了以行為不可分辨性作為判定機(jī)器有智能的必要條件,故圖靈測(cè)試也需相應(yīng)地升級(jí),需要研究如何科學(xué)地測(cè)試、評(píng)判機(jī)器是否具備(某項(xiàng))智力功能。

與功能模仿相對(duì)的是原理模擬,即首先發(fā)現(xiàn)人的智力功能所遵循的科學(xué)原理,然后讓機(jī)器模擬這些原理。例如,人工神經(jīng)元網(wǎng)絡(luò)是在腦神經(jīng)科學(xué)研究成果的基礎(chǔ)上,用數(shù)學(xué)結(jié)構(gòu)模擬大腦神經(jīng)網(wǎng)絡(luò)的電學(xué)特性,再用計(jì)算機(jī)模擬這種數(shù)學(xué)結(jié)構(gòu)(也可以用電路模擬)。這是AI研究中原理模擬的一個(gè)典型例子。深度學(xué)習(xí)以人工神經(jīng)元網(wǎng)絡(luò)為計(jì)算模型,而大部分學(xué)習(xí)算法是參考數(shù)學(xué)方法實(shí)現(xiàn)的學(xué)習(xí)功能,并不清楚這些功能在大腦中的工作原理是什么。所以,深度學(xué)習(xí)是功能模仿與原理模擬的集成,即集成智能。阿爾法狗和大模型、生成式人工智能都是典型的集成智能。

在AI發(fā)展早期,原理模擬引起了更大的關(guān)注,被視為AI走向成功的唯一可行道路。隨著2017年阿爾法狗大獲成功,AI進(jìn)入了第四次浪潮,[6]開創(chuàng)了全新局面——以功能模仿為主的集成智能可以在封閉化領(lǐng)域(圍棋博弈)遠(yuǎn)超人類,在非封閉化領(lǐng)域(語(yǔ)言交互)大幅接近人類。在此新形勢(shì)下,“唯一可行道路”的猜測(cè)已經(jīng)失去了現(xiàn)實(shí)基礎(chǔ),但仍然有人擔(dān)心,將來(lái)會(huì)不會(huì)通過(guò)原理模擬,制造出與人原理相同而且比人更強(qiáng)大的AI?

假如這樣的AI真的能被造出來(lái),人類就被AI全面超越了,等于退化為低配版AI,人類與AI的關(guān)系類似于GPT-1與GPT-4,而且差距不斷擴(kuò)大,根本無(wú)法阻止AI主導(dǎo)未來(lái)世界。所以有人提議,人類必須提前行動(dòng),防止這種可能性成為現(xiàn)實(shí),“千人簽名信”就隱含著這種擔(dān)憂和考慮。

事實(shí)上,人工智能是包含內(nèi)在倫理追求的,[7]而不僅僅以科學(xué)發(fā)現(xiàn)、技術(shù)發(fā)明和經(jīng)濟(jì)發(fā)展為目的。根據(jù)人工智能內(nèi)在倫理觀,人類不應(yīng)研發(fā)不利于增進(jìn)人類福祉的AI,而讓人類變成低配版AI顯然不利于增進(jìn)人類福祉。

根據(jù)人工智能內(nèi)在倫理觀,人類不應(yīng)研發(fā)不利于增進(jìn)人類福祉的AI,而讓人類變成低配版AI顯然不利于增進(jìn)人類福祉。

人工智能是包含內(nèi)在倫理追求的

排除了這種可能性,人類和AI將保持各自的獨(dú)特性,沿著各自的道路協(xié)同演進(jìn)。兩條道路的間距會(huì)越來(lái)越小,但永遠(yuǎn)不會(huì)變成一條道,也就不會(huì)發(fā)生AI與人類之間的“地位之爭(zhēng)”。但是,AI與人類之間仍會(huì)出現(xiàn)職業(yè)競(jìng)爭(zhēng),也可能引發(fā)其他重大社會(huì)問(wèn)題。

大模型應(yīng)用:一場(chǎng)重大實(shí)驗(yàn)

大模型技術(shù)的發(fā)展和應(yīng)用仍然存在很大的不確定性,在應(yīng)用潛力、應(yīng)用方式和應(yīng)用后果等重大議題上,同時(shí)存在著多種可能性??傮w上,大模型應(yīng)用是一場(chǎng)重大實(shí)驗(yàn),對(duì)社會(huì)的未來(lái)發(fā)展具有深遠(yuǎn)的影響。

根據(jù)大模型現(xiàn)有技術(shù)特點(diǎn),預(yù)期在服務(wù)業(yè)中具有比較明顯的應(yīng)用潛力。例如,在一個(gè)軟件生態(tài)系統(tǒng)中,基于大模型的自然語(yǔ)言交互界面有望發(fā)揮重大作用,顯著提升部分工作的效率;在各種數(shù)據(jù)格式(圖像、視頻、音頻、文本、3D模型)的例行性內(nèi)容生成和變換中,大模型的應(yīng)用有望改變相關(guān)行業(yè)的傳統(tǒng)模式,顯著提高效率;大模型支持的AI輔助科研(AI for Science)也非常有希望提高科研效率。在服務(wù)業(yè)的其他行業(yè),比如智能客服,能否大面積應(yīng)用取決于(專用)大模型的業(yè)務(wù)技能是否達(dá)標(biāo),“學(xué)霸”畢業(yè)后未必都能成為合格的員工。在制造業(yè)、智慧農(nóng)業(yè)、養(yǎng)老、家庭服務(wù)等現(xiàn)實(shí)場(chǎng)景和實(shí)體經(jīng)濟(jì)中,受大模型啟發(fā)或支持的圖像處理有望帶來(lái)重要進(jìn)展,為產(chǎn)業(yè)進(jìn)步發(fā)揮積極作用,但能否對(duì)整個(gè)行業(yè)產(chǎn)生重大影響,尚未出現(xiàn)有力的證據(jù)。

影響大模型應(yīng)用的一個(gè)重要因素是其應(yīng)用方式。目前最受關(guān)注的應(yīng)用方式有兩種,一是仍然作為產(chǎn)品,二是作為新型基礎(chǔ)設(shè)施。如果輕量級(jí)大模型的性能和價(jià)格可以滿足一些行業(yè)的實(shí)用要求,則幾乎肯定會(huì)以產(chǎn)品形態(tài)在這些行業(yè)中普遍落地。其他情況下,大模型將成為一種新型基礎(chǔ)設(shè)施,具有與傳統(tǒng)基礎(chǔ)設(shè)施根本不同的特點(diǎn),尤其是介入性和代償性。例如,道路是一種傳統(tǒng)基礎(chǔ)設(shè)施,不會(huì)介入其服務(wù)對(duì)象,比如不改變?cè)诘缆飞线\(yùn)輸?shù)呢浳?。但大模型往往必須介入其服?wù)對(duì)象,改變甚至從無(wú)到有創(chuàng)建對(duì)象,比如命題作文、圖像生成等。另外,由于大模型的服務(wù)過(guò)程將積累大量新的語(yǔ)言痕跡,可用于改進(jìn)大模型的性能,導(dǎo)致大模型的介入能力不斷提高。結(jié)果,原來(lái)屬于下游公司的業(yè)務(wù),可能逐步轉(zhuǎn)移到效率更高的大模型上,導(dǎo)致下游公司的功能不斷衰減,甚至消亡。

與之前投入應(yīng)用的新技術(shù)相比,大模型帶來(lái)一些全新的倫理治理挑戰(zhàn),是傳統(tǒng)治理模式難以有效應(yīng)對(duì)的,而且可以極大地影響大模型的推廣應(yīng)用。例如,傳統(tǒng)基礎(chǔ)設(shè)施的邊界是固定不變的。如果大模型成為新型基礎(chǔ)設(shè)施,由于其介入性和代償性,其邊界是高度可變的,而且邊界變動(dòng)(擴(kuò)大)是高效的。這種情況是以往不曾出現(xiàn)的,如果不能有效地加以規(guī)范和協(xié)調(diào),將給下游企業(yè)造成極大的困擾,甚至嚴(yán)重影響大模型服務(wù)的可接受性。

影響大模型應(yīng)用的一個(gè)重要因素是其應(yīng)用方式。目前最受關(guān)注的應(yīng)用方式有兩種,一是仍然作為產(chǎn)品,二是作為新型基礎(chǔ)設(shè)施。

大模型應(yīng)用可能帶來(lái)的公共安全隱患也是以往未出現(xiàn)過(guò)的,傳統(tǒng)的網(wǎng)絡(luò)安全辦法不足以應(yīng)對(duì)這種新形式的公共安全隱患。大模型本身并不直接危害公共安全,但別有用心的人可以利用大模型技術(shù)的先天性局限,誘導(dǎo)大模型產(chǎn)生嚴(yán)重危害社會(huì)的壞主意,然后由人加以實(shí)施,從而造成不良后果,包括難以挽回的災(zāi)難性后果。無(wú)論大模型以什么方式(產(chǎn)品或基礎(chǔ)設(shè)施)應(yīng)用,都無(wú)法從技術(shù)上杜絕這種可能性。

對(duì)就業(yè)崗位的潛在影響已經(jīng)引起了大量關(guān)注。以往的就業(yè)替代主要發(fā)生在制造業(yè),并伴隨著人力資源從制造業(yè)向服務(wù)業(yè)的遷移,而大模型的應(yīng)用有可能在服務(wù)業(yè)的眾多行業(yè)和部門同時(shí)發(fā)生,波及面遠(yuǎn)超以往。這是一種全新情況,隱含著很大的不確定性,值得引起高度重視。

大模型應(yīng)用對(duì)教育的沖擊既直接又深遠(yuǎn)。雖然目前仍不確定本輪大模型應(yīng)用將波及多大范圍,AI取代例行性、重復(fù)性智力工作的趨勢(shì)已不可改變,例行性、重復(fù)性智力工作崗位將被逐步淘汰。因此,現(xiàn)行教育中流行的以知識(shí)復(fù)現(xiàn)為主要目標(biāo)的教學(xué)和考試,將首先遭受巨大沖擊。沖擊將是多方面、深層次的,AI時(shí)代的教育必將發(fā)生巨變。

結(jié)語(yǔ):迎接未來(lái)

大模型是人工智能通過(guò)基礎(chǔ)研究創(chuàng)新以推動(dòng)顛覆性行業(yè)應(yīng)用的一個(gè)范例。在長(zhǎng)期的語(yǔ)言模型研究中,嘗試了語(yǔ)法、語(yǔ)義、語(yǔ)用的各種概括性模型,始終難以突破理論與大規(guī)模真實(shí)語(yǔ)言應(yīng)用之間的界限。大模型技術(shù)以實(shí)例性模型+關(guān)聯(lián)度預(yù)測(cè)的新思路,首次跨越了理論與應(yīng)用的鴻溝,一定范圍內(nèi)讓AI的自然語(yǔ)言交互能力達(dá)到了人類中等水平。

后續(xù)發(fā)展的重點(diǎn)已從技術(shù)轉(zhuǎn)移到充滿挑戰(zhàn)的應(yīng)用和治理,這是人工智能引發(fā)的第一次重大社會(huì)實(shí)驗(yàn)。大模型研究的推進(jìn)方式及其對(duì)社會(huì)的影響,其實(shí)已在5年前由阿爾法狗以較小的規(guī)模向我們做出了預(yù)示,現(xiàn)在大模型再次發(fā)揮著類似的作用。透過(guò)大模型重新認(rèn)識(shí)人工智能,重新思考AI時(shí)代的社會(huì)治理,具有重大的現(xiàn)實(shí)意義。隨著AI等新技術(shù)推動(dòng)全球經(jīng)濟(jì)效率不斷提升,甚至以超常規(guī)的速度提升,近代以來(lái)行之有效的以效率提升為基本動(dòng)力的發(fā)展模式或?qū)⒚媾R拐點(diǎn)。

雖然目前仍不確定本輪大模型應(yīng)用將波及多大范圍,AI取代例行性、重復(fù)性智力工作的趨勢(shì)已不可改變,例行性、重復(fù)性智力工作崗位將被逐步淘汰。

猜你喜歡
語(yǔ)料關(guān)聯(lián)度原理
了解咳嗽祛痰原理,有效維護(hù)健康
平均場(chǎng)正倒向隨機(jī)控制系統(tǒng)的最大值原理
基于灰色關(guān)聯(lián)度的水質(zhì)評(píng)價(jià)分析
化學(xué)反應(yīng)原理全解讀
基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
通信原理教學(xué)改革探索
華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
基于灰關(guān)聯(lián)度的鋰電池組SOH評(píng)價(jià)方法研究
《苗防備覽》中的湘西語(yǔ)料
國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類型與收集方法
三门峡市| 岳普湖县| 长海县| 松滋市| 葫芦岛市| 西青区| 罗江县| 临湘市| 喀喇沁旗| 揭阳市| 巩留县| 新民市| 宁明县| 女性| 阜宁县| 苍山县| 瑞金市| 阳江市| 龙里县| 资中县| 内丘县| 若羌县| 金秀| 鹤庆县| 上思县| 迁安市| 鹤峰县| 清徐县| 邵阳市| 忻州市| 万山特区| 七台河市| 久治县| 南丹县| 淮滨县| 札达县| 龙海市| 烟台市| 耒阳市| 沭阳县| 晋城|