楊俊蕾
摘? ?要: 生成式 AI 是人工智能領(lǐng)域中的新技術(shù)分支,在近20年的產(chǎn)業(yè)發(fā)展和布局中形成了九組應(yīng)用類別。其中,ChatGPT 作為人機(jī)對(duì)話模型的新興產(chǎn)品,經(jīng)歷了躍遷式的技術(shù)迭代,在全球范圍內(nèi)引發(fā)了未來(lái) AI 將如何輔助人類工作的討論?;凇疤K格拉底之問”和邏輯要素辨析可以發(fā)現(xiàn),生成式AI 的對(duì)話模型更多依賴于“指令”設(shè)置,不同于傳統(tǒng)意義上的對(duì)話文體。凝聚西方思想傳統(tǒng)的“在場(chǎng)”對(duì)話方式被改寫為內(nèi)部循環(huán)的數(shù)據(jù)流動(dòng)。如何建構(gòu)符合全人類利益的開放性系統(tǒng)正在成為保障人機(jī)協(xié)作安全性的共識(shí)基礎(chǔ)。
關(guān)鍵詞: ChatGPT;生成式AI;蘇格拉底之問;對(duì)話模型;開放性系統(tǒng)
中圖分類號(hào):TP18? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1004-8634(2023)02-0014-(08)
DOI:10.13852/J.CNKI.JSHNU.2023.02.002
生成式AI(AI Generated Content,縮寫為AIGC)旨在利用人工智能技術(shù)來(lái)生成內(nèi)容。從人工智能的發(fā)展歷程看,生成式AI是弱人工智能向強(qiáng)人工智能/通用人工智能(Artificial General Intelligence,縮寫為AGI)邁進(jìn)途中新生出來(lái)的技術(shù)分支。它在基礎(chǔ)原理上更接近阿蘭·圖靈(Alan Turing)關(guān)于“無(wú)限容量計(jì)算機(jī)”的智能機(jī)器設(shè)想,類似于“數(shù)字計(jì)算機(jī)思想的基礎(chǔ)上出現(xiàn)了一個(gè)有趣的派生物”。1 而在關(guān)于智能生成技術(shù)的場(chǎng)景想象方面,美國(guó)哲學(xué)家約翰·塞爾(J. R. Searle)在1980年提出的“中文屋論證”(Chinese Room Argument)與“系統(tǒng)應(yīng)答”設(shè)計(jì)(Response of System)初步設(shè)想了智能機(jī)器與人進(jìn)行對(duì)話的系統(tǒng)性程序建構(gòu),“在某個(gè)根本不存在意向性的領(lǐng)域中,一個(gè)系統(tǒng)也可以在概念和經(jīng)驗(yàn)上具有像人類一樣的能力”。2
事實(shí)上,生成式AI的技術(shù)主導(dǎo)框架正是20世紀(jì)社會(huì)思想全面進(jìn)入信息論、控制論和系統(tǒng)論的思維范式轉(zhuǎn)換之后的新路徑開發(fā),它以人機(jī)界面的構(gòu)建為平臺(tái)端口,將二者間有效而即時(shí)的無(wú)限交互作為主攻方向。在很大程度上,技術(shù)開發(fā)的著重點(diǎn)更多傾向于顯著改善應(yīng)用體驗(yàn):一方面是在程序生效的階段耗時(shí)上,盡可能縮短人腦信息輸入與類人智能應(yīng)答輸出兩項(xiàng)步驟之間的信息流動(dòng)延時(shí);另一方面則是在系統(tǒng)架構(gòu)的模型基底上,連續(xù)激活開放性對(duì)話的生成模式,不劃分固定的邊界,也不進(jìn)行斷點(diǎn)式的層級(jí)分化判斷。由此導(dǎo)致的現(xiàn)象級(jí)后果之一,就是人工智能再度成為技術(shù)社會(huì)時(shí)代的全球焦點(diǎn)。它與影響重大的另外一些核心新技術(shù)發(fā)展如新能源、自動(dòng)化、基因生物和外太空探索等構(gòu)成可資關(guān)聯(lián)的實(shí)際協(xié)同,并在引導(dǎo)大眾認(rèn)知的話語(yǔ)導(dǎo)向方面持續(xù)地實(shí)現(xiàn)自身作為驅(qū)動(dòng)力技術(shù)的觀念傳播,既為自我演化改進(jìn)的技術(shù)迭代進(jìn)行系統(tǒng)優(yōu)化升級(jí),也在擴(kuò)張性發(fā)展中起到“形塑未來(lái)”(shaping future)的深遠(yuǎn)影響。
需要注意的是,“形塑未來(lái)”是代表當(dāng)前生成式AI的熱門產(chǎn)品ChatGPT(Chat Generative Pre-trained Transformer)的開發(fā)方OpenAI在其官網(wǎng)上做出的愿景陳述,從字面含義來(lái)看,是技術(shù)樂觀主義的衍生映射,在更深層次的知識(shí)權(quán)力競(jìng)爭(zhēng)中,則更多包含著對(duì)于未來(lái)技術(shù)路徑的話語(yǔ)權(quán)、定義權(quán),甚至是主控權(quán)的實(shí)際享有。而在關(guān)于ChatGPT的具體定義中,OpenAI將之描述為“優(yōu)化對(duì)話語(yǔ)言模型”(Optimizing Language Models for Dialogue)。因此,梳理生成式AI對(duì)話模型的優(yōu)化與迭代歷程,分析該類模型的應(yīng)用場(chǎng)景與垂直化運(yùn)行的開放式系統(tǒng)模式,有助于進(jìn)一步理解人工智能在當(dāng)前階段的實(shí)際狀況,為生成式AI在特定用途中的引入增加專業(yè)性的思想準(zhǔn)備。
一、從NLP到LLMs的奇點(diǎn)躍遷:生成式AI對(duì)話模型的技術(shù)迭代
按照產(chǎn)業(yè)數(shù)據(jù)統(tǒng)計(jì)的曲線表征來(lái)看,人工智能的產(chǎn)業(yè)化歷程先后經(jīng)歷了三個(gè)階段的波谷運(yùn)行。從1956年的正式宣告推出,到20世紀(jì)90年代的專家系統(tǒng)問世,再到2000年后因?yàn)閭€(gè)人電腦用戶激增而出現(xiàn)新的爆發(fā)式增長(zhǎng),人工智能的技術(shù)迭代之路始終與市場(chǎng)化的產(chǎn)品推廣存在著若即若離的不確定關(guān)聯(lián)。直到2022年冬季,OpenAI發(fā)布了可以在網(wǎng)頁(yè)上直接應(yīng)用的ChatGPT系列產(chǎn)品,在相對(duì)短暫的時(shí)段內(nèi)迅速引發(fā)了井噴式的同類型產(chǎn)品跟進(jìn)和幾何倍速增長(zhǎng)的全球用戶規(guī)模。至此,標(biāo)志著人工智能的產(chǎn)業(yè)發(fā)展進(jìn)入第四階段,主要表征為系統(tǒng)的開放性和實(shí)際運(yùn)行中的點(diǎn)對(duì)點(diǎn)模式。且隨著競(jìng)品商業(yè)化的渠道益發(fā)順暢,付費(fèi)用戶應(yīng)用智能程序的即時(shí)生成在耗時(shí)方面能夠明顯優(yōu)于網(wǎng)絡(luò)普通訪客。此舉的經(jīng)濟(jì)獲益在當(dāng)前階段既不是開發(fā)方的主要目的,也不是公眾最關(guān)心的內(nèi)容。它的標(biāo)志性意義在于推動(dòng)生成式AI進(jìn)入知識(shí)付費(fèi)服務(wù),讓智能機(jī)器的生成內(nèi)容開始潛入人類知識(shí)領(lǐng)域,在看起來(lái)似乎更加“開放”的系統(tǒng)使用中替換了“開放”實(shí)際導(dǎo)出的方向,從原來(lái)的開放性系統(tǒng)構(gòu)建以釋放AI的能量,改變?yōu)榈贡片F(xiàn)有知識(shí)系統(tǒng)向生成式AI的內(nèi)容產(chǎn)出逐漸開放。促成該轉(zhuǎn)換發(fā)生的根本驅(qū)動(dòng)正在于對(duì)話模型的技術(shù)迭代帶來(lái)的效能加速和遠(yuǎn)超一般算力的內(nèi)爆式內(nèi)容增長(zhǎng)。
“讓機(jī)器像人一樣思考”,是阿蘭·圖靈為智能機(jī)提出的“模仿游戲”基本原理。經(jīng)過(guò)計(jì)算機(jī)編程實(shí)驗(yàn)之后,人工神經(jīng)網(wǎng)絡(luò)(Artificial Natural Networks)的搭建借助機(jī)器學(xué)習(xí)(Machine Learning)開始進(jìn)行連接模型(Connection Model)的算法訓(xùn)練。建立連接的第一步就是人與機(jī)器間實(shí)現(xiàn)有效的信息交互,亦即生成式AI技術(shù)思維中的互信息鏈?zhǔn)椒▌t。作為信息論基礎(chǔ)的“互信息”(Mutual Information)概念,意味著“一個(gè)隨機(jī)變量包含另一個(gè)隨機(jī)變量信息量的度量”。1 旨在運(yùn)行生成式程序以輸入新的信息變量并及時(shí)有效到達(dá)信息發(fā)出端的AI對(duì)話模型,前期調(diào)試過(guò)程經(jīng)歷了較長(zhǎng)時(shí)間的瓶頸期停滯,其中的制約原因就在于從信息輸入層到信息輸出層之間的轉(zhuǎn)化受到隨機(jī)變量的不確定影響。
由于計(jì)算機(jī)語(yǔ)言的內(nèi)部系統(tǒng)編碼遲遲不能降低導(dǎo)入信息的理解誤差,人工智能技術(shù)在生成式AI的發(fā)展道路上陷入徘徊。帶來(lái)改變的是從外部系統(tǒng)引入的人類語(yǔ)言處理模式,承擔(dān)起突破研發(fā)困境的新思路。自然語(yǔ)言處理任務(wù)(Natural Language Processing,縮寫為NLP)將類腦設(shè)計(jì)帶入機(jī)器理解的預(yù)備程序,實(shí)現(xiàn)了多系統(tǒng)間的開放與協(xié)同。在智能機(jī)器所能讀取的方法模型中搭建類腦的神經(jīng)網(wǎng)絡(luò),已經(jīng)在計(jì)算機(jī)圖像識(shí)別和自然語(yǔ)言理解等方面連續(xù)得到證實(shí),并逐漸成為機(jī)器認(rèn)知的關(guān)鍵夾層,在隱層工作狀態(tài)下完成信息轉(zhuǎn)換,并再次轉(zhuǎn)換到輸出環(huán)節(jié)。也正是在這個(gè)意義上,計(jì)算機(jī)的計(jì)算過(guò)程表現(xiàn)出更近乎人腦特點(diǎn)的黑箱機(jī)制,隱在夾層中的卷積層響應(yīng)方式不再是明顯可見的,相應(yīng)地也是不可回逆的,其功能導(dǎo)向因此契合了對(duì)話模型的應(yīng)答需求。
更進(jìn)一步來(lái)看機(jī)器理解文本內(nèi)容的技術(shù)原理,可以發(fā)現(xiàn)具體的自然語(yǔ)言理解(Natural Language Understanding,縮寫為NLU)任務(wù)包含了眾多的子項(xiàng),諸如詞語(yǔ)標(biāo)注、詞性分理、文本分類與語(yǔ)法析取等。通過(guò)目標(biāo)化的訓(xùn)練與深度學(xué)習(xí),承擔(dān)具體任務(wù)的智能算法顯示出接近常人的語(yǔ)言理解能力。然而這一節(jié)點(diǎn)上的任務(wù)是人機(jī)共同協(xié)作才能達(dá)成的。建立(預(yù))訓(xùn)練集的信息抽取與標(biāo)注,最初都由人力手動(dòng)進(jìn)行,由此附加產(chǎn)生的數(shù)字化勞工問題是人工智能倫理學(xué)的關(guān)注焦點(diǎn)。在結(jié)果產(chǎn)出后的用戶反應(yīng)與評(píng)價(jià),則又一次將大型語(yǔ)言模型如何建構(gòu)的問題推到了公眾面前。
就在ChatGPT的日活用戶注冊(cè)量超過(guò)2億之后,《自然》雜志在一周內(nèi)連續(xù)刊發(fā)兩組科學(xué)評(píng)論文章,集中分析了大型語(yǔ)言模型(Large Language Models,縮寫為L(zhǎng)LMs)作為ChatGPT應(yīng)用基礎(chǔ)的技術(shù)弊端與潛在風(fēng)險(xiǎn)可能。LLMs對(duì)于服務(wù)器的硬件要求和計(jì)算速度的算力要求都遠(yuǎn)遠(yuǎn)超出了此前的同類型應(yīng)用。OpenAI在產(chǎn)品介紹中呈現(xiàn)了該對(duì)話模型的迭代細(xì)節(jié)。首先,ChatGPT是經(jīng)過(guò)訓(xùn)練而來(lái)的對(duì)話模型,通過(guò)網(wǎng)頁(yè)接口與用戶進(jìn)行交互式對(duì)話。它的訓(xùn)練重點(diǎn)在于對(duì)話格式的構(gòu)建與完形,不僅能夠使ChatGPT連續(xù)回應(yīng)、回答系列問題,而且能夠做到反身調(diào)節(jié),包括衡量正誤與否,做出及時(shí)的判斷,對(duì)提問前提進(jìn)行反思、質(zhì)疑并中止不合乎訓(xùn)練內(nèi)容的不當(dāng)請(qǐng)求。1 其次,ChatGPT的訓(xùn)練方法與InstructGPT模型大致相同,但是作為升階后的兄弟模型,在針對(duì)性訓(xùn)練中格外強(qiáng)化了指令(Prompt)模塊,并在數(shù)據(jù)喂養(yǎng)中給予詳細(xì)的相應(yīng)范例。該操作使ChatGPT不同于其他更早使用InstructGPT方法訓(xùn)練而成的同類AI產(chǎn)品。其中的技術(shù)奇點(diǎn)是人機(jī)協(xié)同在生成式AI訓(xùn)練中的深度關(guān)系,甚至是超越限定的跨邊界融合。
ChatGPT的模型訓(xùn)練使用了來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)(Reinforcement Learning from Human Feedback,縮寫為RLHF)。盡管與InstructGPT的方法原理相同,但在具體的數(shù)據(jù)收集方式與標(biāo)注上做出了不同的設(shè)置。ChatGPT的初始模型就是在人類監(jiān)督下的微調(diào)訓(xùn)練,作為提問者的用戶和作為AI輔助應(yīng)答的回復(fù),在初始環(huán)節(jié)里都深度依賴人類視野?!叭斯ぶ悄苡?xùn)練師提供對(duì)話,他們扮演用戶和人工智能助手的雙方角色。”2 在模型訓(xùn)練的具體過(guò)程中,人工智能訓(xùn)練師的文獻(xiàn)工具是閾值確定的,因而保證了他們所撰寫的回復(fù)的信息可靠性。但是接下來(lái),上一回合積累得到的對(duì)話數(shù)據(jù)集在形式上轉(zhuǎn)換為對(duì)話格式,并和此前由生產(chǎn)轉(zhuǎn)換器得出的數(shù)據(jù)集加以混合,形成排序和比較,依照對(duì)話生成的質(zhì)量,對(duì)模型進(jìn)行相應(yīng)的序列整理。再接下來(lái),開始又一個(gè)回合的人機(jī)協(xié)同對(duì)話。先由訓(xùn)練師與應(yīng)答程序繼續(xù)展開對(duì)話,再隨機(jī)擇取模型輸出的多條信息,在抽樣備選中做出順序排名以形成值得優(yōu)選出來(lái)的獎(jiǎng)勵(lì)模型。對(duì)照獎(jiǎng)勵(lì)模型的排序,ChatGPT會(huì)受到更為優(yōu)化的模型微調(diào),以及上述訓(xùn)練過(guò)程的反復(fù)迭代。
二、生成式AI的技術(shù)語(yǔ)境與產(chǎn)業(yè)布局
人類在歷史上先后經(jīng)歷了不同勞動(dòng)方式的改變,如狩獵、游牧、農(nóng)耕和工業(yè)生產(chǎn)。即使在不同生產(chǎn)方式作為主導(dǎo)的時(shí)期,新技術(shù)的躍遷總能將社會(huì)組織整合成新的運(yùn)作系統(tǒng)。工業(yè)革命、信息革命和互聯(lián)網(wǎng)革命是塑造當(dāng)前技術(shù)社會(huì)狀態(tài)的主要?jiǎng)右?。隨著ChatGPT的用戶數(shù)量快速擴(kuò)張與全球傳播效果的蔓延,傳聞已久的人工智能技術(shù)革命正在讓人們感受到未來(lái)加速涌現(xiàn)的先聲。而且,ChatGPT并非一枝獨(dú)秀。盡管在金融投資視野中,以非營(yíng)利為目的的科技創(chuàng)新公司OpenAI是獨(dú)角獸一般的突出存在,但是回歸到生成式AI技術(shù)的初創(chuàng)領(lǐng)域,還有其他五家開發(fā)組織在市值規(guī)模、技術(shù)開發(fā)和產(chǎn)業(yè)布局等方面同樣舉足輕重。如果經(jīng)由行業(yè)專家的視角來(lái)看,這些各自握有生成式AI代表性產(chǎn)品的大型公司或許將在未來(lái)的賽道上共同博弈,并決定著技術(shù)接入基底應(yīng)用的參數(shù)、標(biāo)準(zhǔn)和公共安全規(guī)則。
目前握有生成式AI初創(chuàng)技術(shù)的大型公司共有六家。只有谷歌旗下的DeepMind在2010年成立于英國(guó)倫敦。其他五家都在美國(guó)境內(nèi)注冊(cè),其中有三家位于加利福尼亞,分別是成立于1993年的NVIDIA、1998年由谷歌搜索另外掛牌的Google AI和2015年初成立的OpenAI;另外兩家在紐約,是2018年成立的Runway和2013年成立的FAIR(Facebook Artificial Intelligence Research),后者于2021年正式更名為Meta AI(見圖1)。這些科技初創(chuàng)公司的實(shí)際經(jīng)歷共同形成了生成式AI的技術(shù)語(yǔ)境,也為ChatGPT在全球范圍內(nèi)突然獲得公眾層面的普遍矚目進(jìn)行了將近20年之久的產(chǎn)業(yè)布局積累。分析上述六家開發(fā)方所持有的23項(xiàng)生成式AI模型(表1),有助于準(zhǔn)確定位并預(yù)判ChatGPT的新應(yīng)用場(chǎng)景,以及它作為互聯(lián)網(wǎng)搜索暨輔助型智識(shí)/知識(shí)應(yīng)答工具,在接下來(lái)的人機(jī)協(xié)同發(fā)展中還將增加哪些維度和容量。
從1993年NVIDIA最早研發(fā)并定義生成式AI技術(shù)中的圖形處理器概念(Graphics Processing Unit,縮寫為GPU),到2023年初引發(fā)全球熱議的OpenAI新產(chǎn)品ChatGPT,近20年的算法研發(fā)主要集中于9種轉(zhuǎn)換生成模式?;诒?,可以分為三組方向:第一組方向?yàn)槲谋掘?qū)動(dòng)型,包括文本生成圖像、文本生成視頻、文本生成音頻、文本生成代碼、文本生成3D、文本生成知識(shí)段和文本到語(yǔ)言的生成;第二組的轉(zhuǎn)換方向是將第一組中的文本生成圖像加以翻轉(zhuǎn),建成圖像生成文本的模型;第三組的開發(fā)方向與上述二者對(duì)比來(lái)看,不再受限于單項(xiàng)的任務(wù)驅(qū)動(dòng),而是面向多種模式,對(duì)多項(xiàng)任務(wù)做出回應(yīng),表現(xiàn)出生成式AI在未來(lái)可能具有的加強(qiáng)型多任務(wù)處理能力。以2022年10月發(fā)布的動(dòng)作模型MDM(Human Motion Diffusion Model)為例,它基于文本描述所能生成的人類動(dòng)作在3D空間中的多樣性表現(xiàn)已經(jīng)堪稱流暢,接下來(lái)繼續(xù)使用開源項(xiàng)目Stable Diffusion,為新生成的數(shù)字形象加上紋理貼圖,以加快實(shí)現(xiàn)文本對(duì)象的現(xiàn)實(shí)性風(fēng)格,使AI生成的機(jī)制產(chǎn)品更接近有個(gè)性辨識(shí)特征的類人出品。
根據(jù)圖2,通覽上述三組類別中的數(shù)十項(xiàng)生成式AI模型與產(chǎn)業(yè)發(fā)展的實(shí)際歷程可以發(fā)現(xiàn),ChatGPT系列的開發(fā)及開源投放既不是占據(jù)先發(fā)優(yōu)勢(shì)的技術(shù)破冰者,也不是提供技術(shù)基底的系統(tǒng)構(gòu)架者,甚至在與同類別的模型進(jìn)行實(shí)際比較的多個(gè)維度上,都不構(gòu)成多任務(wù)處理的場(chǎng)景便利。因此,思考該模型成為生成式AI代表性產(chǎn)品的根本原因就顯得尤為必要,從中可以更全面地理解當(dāng)前技術(shù)社會(huì)對(duì)于人工智能技術(shù)的大眾心理預(yù)期,以及應(yīng)答式AI與用戶間的互動(dòng)關(guān)系走向。
三、設(shè)置“指令”、“蘇格拉底之問”與人機(jī)協(xié)同路徑
ChatGPT在正式開放測(cè)試之后的三個(gè)月內(nèi),已經(jīng)飛速積累起數(shù)以億計(jì)的用戶,他們?cè)诓煌Z(yǔ)言的場(chǎng)景下對(duì)該模型提出應(yīng)答要求。由人機(jī)對(duì)話生成的各種回答一次次刷新人們對(duì)于AI智能水平的認(rèn)知視野,也引發(fā)了IT界和知識(shí)界的震動(dòng)?!犊茖W(xué)》與《自然》兩大刊物密集推出連續(xù)文章,對(duì)該技術(shù)可能改變知識(shí)教育表示擔(dān)憂,并提出技術(shù)改善和溯源反制的設(shè)想。作為知識(shí)界和教育界的代表之一,香港大學(xué)幾乎在第一時(shí)間明確公布了絕對(duì)的禁令,“禁止在港大所有課堂、作業(yè)和評(píng)估中使用ChatGPT或其他AI工具,除非學(xué)生事先獲得有關(guān)課程講師的書面同意豁免,否則將被校方視為剽竊個(gè)案。若沒有書面許可,ChatGPT和其他基于AI的工具一律不能用于任何涉及學(xué)分的活動(dòng),若教師懷疑學(xué)生使用ChatGPT或其他AI工具,可要求學(xué)生就其作業(yè)進(jìn)行討論、進(jìn)行額外口試及考試等措施”。1 然而,類似禁令在IT界和其他交叉學(xué)科的研究者看來(lái),不僅在現(xiàn)實(shí)層面難以操作,而且AI應(yīng)答技術(shù)在未來(lái)工作中的擴(kuò)大使用幾乎是“不可避免的”。2
回望近來(lái)圍繞ChatGPT進(jìn)行的跨領(lǐng)域應(yīng)用實(shí)踐,以色列總統(tǒng)伊薩克·赫爾佐格(Isaac Herzog)的案例具有特別的示范性。根據(jù)英國(guó)天空電視臺(tái)的時(shí)事新聞現(xiàn)場(chǎng)視頻,赫爾佐格在2023年2月出席了于特拉維夫舉行的重大網(wǎng)絡(luò)安全會(huì)議,面向數(shù)千名高新技術(shù)企業(yè)的從業(yè)者發(fā)表了一段開幕發(fā)言。他先用完全正確的語(yǔ)法描述了以色列在人工智能等前沿領(lǐng)域取得的前沿成果:
Over the past few decades, Israel has consistently been at the forefront of technological advancement, and our achievements in the fields of cybersecurity, artificial intelligence (AI), and big data are truly impressive.
接下來(lái),再以完全合乎發(fā)言者政府領(lǐng)導(dǎo)人身份的口吻,高度贊譽(yù)了本國(guó)高科技公司在世界舞臺(tái)上的亮眼表演:
From the development of cutting-edge cybersecurity technologies to the establishment of successful startups, Israeli hi-tech companies have made a significant impact on the global stage.
然而,在常見流程下即將用勵(lì)志語(yǔ)錄進(jìn)行總結(jié)的最后環(huán)節(jié),ChatGPT作為發(fā)言稿的“特別助手”被推到了眾人矚目的聚光燈下。比借助ChatGPT完成政府發(fā)言稿更重要的是,赫爾佐格在發(fā)言結(jié)尾坦然說(shuō)明了這篇機(jī)器答問的驅(qū)動(dòng)重點(diǎn)在于“讓機(jī)器人開始行動(dòng)”。繼而,以色列總統(tǒng)辦公室向天空電視臺(tái)新聞的采訪做出進(jìn)一步證實(shí),生成此次任務(wù)的提示語(yǔ)設(shè)計(jì)是“寫出一篇人類在超人技術(shù)世界中發(fā)揮作用的勵(lì)志語(yǔ)錄”。3
赫爾佐格的ChatGPT生成文本之所以比網(wǎng)絡(luò)上流傳的各種類型的應(yīng)答生成更具有樣本意義,并非因?yàn)槭褂谜叩恼紊矸莞犹厥?,也不是因?yàn)樵撐谋镜纳少|(zhì)量明顯趨近于政府公文,而是因?yàn)槭褂谜咴谕瓿裳葜v過(guò)程中,及時(shí)坦承了工具來(lái)源,以及最重要的,通過(guò)建構(gòu)怎樣的驅(qū)動(dòng)指令才能生成符合使用者預(yù)期的機(jī)器應(yīng)答。換言之,對(duì)話型AI在經(jīng)過(guò)多次問答環(huán)節(jié)后能夠產(chǎn)出怎樣的內(nèi)容,在很大程度上既取決于它的技術(shù)基礎(chǔ),也取決于“指令”如何構(gòu)建。在收到具體任務(wù)的文本指令后,根據(jù)預(yù)訓(xùn)練過(guò)程中的數(shù)據(jù)標(biāo)注進(jìn)入專門的LLMs,在基于“人類反饋強(qiáng)化學(xué)習(xí)”的基礎(chǔ)上生成應(yīng)答內(nèi)容。對(duì)話框中最后會(huì)出現(xiàn)怎樣的語(yǔ)句段落,不僅與大語(yǔ)言模型中的數(shù)據(jù)鏈有關(guān),還和文本指令在擬定過(guò)程中的微調(diào)或修正直接相關(guān)。由此也構(gòu)成了生成式AI在導(dǎo)出內(nèi)容后的條件反溯。用戶本身對(duì)于任務(wù)主題的理解程度,以及用怎樣的文本進(jìn)行指令驅(qū)動(dòng),在當(dāng)前階段里顯得比程序所能應(yīng)答出的實(shí)際內(nèi)容更為重要。1
生成式AI對(duì)于“指令”的依賴程度顛覆了一般意義上的“對(duì)話”文體,將凝聚西方思想傳統(tǒng)的“在場(chǎng)”的對(duì)話進(jìn)行了全面改寫。從西方思想史的脈絡(luò)來(lái)看,始于古希臘時(shí)期的“對(duì)話”是承載哲學(xué)思想啟蒙的根源。柏拉圖對(duì)話錄中記載的蘇格拉底與同時(shí)代不同人員的對(duì)話幾乎覆蓋了當(dāng)時(shí)可能認(rèn)知到的所有知識(shí)范圍。進(jìn)行對(duì)話的最高宗旨不是為了交換信息,而是通過(guò)共同在場(chǎng)的活性思維來(lái)探求認(rèn)知個(gè)體對(duì)于某一對(duì)象的真實(shí)認(rèn)知。對(duì)話可能達(dá)到的“真”不只是針對(duì)認(rèn)知對(duì)象的固有知識(shí),同時(shí)也是智慧上的“解蔽”,讓對(duì)話人經(jīng)由對(duì)話的方式向內(nèi)反轉(zhuǎn),認(rèn)識(shí)到自己對(duì)某一對(duì)象的認(rèn)知程度,最終實(shí)現(xiàn)的是德爾菲神廟的門楣神諭:認(rèn)識(shí)你自己(to Know Yourself)。只能說(shuō),ChatGPT在典型的蘇格拉底對(duì)話中很難找到存身之處,根本分歧在于發(fā)起對(duì)話的原因不同。蘇格拉底是提問方,但是他的問題指向不是要從對(duì)方的回答中有所獲取,而是讓回答者對(duì)自己的認(rèn)知情況形成判斷。正是在這個(gè)意義上,對(duì)話成為在場(chǎng)者的思想的交流。ChatGPT則完全相反。如果沒有恰當(dāng)?shù)摹⒂嗅槍?duì)性的指令,無(wú)論多大規(guī)模的LLMs都是循環(huán)在內(nèi)部存儲(chǔ)中的純粹數(shù)據(jù)流動(dòng)。如果指令內(nèi)容尚未包含在已有的預(yù)訓(xùn)練范圍內(nèi),則有可能出現(xiàn)對(duì)話不能啟動(dòng),或者盡管生成了對(duì)話,所答卻與所問不相契合,甚至毫無(wú)關(guān)聯(lián)、完全荒謬。如從圖3可以看到ChatGPT在電影知識(shí)存儲(chǔ)方面的中國(guó)譜系盲點(diǎn)。在有問必答的程序預(yù)先規(guī)定下,哪怕它對(duì)中國(guó)著名導(dǎo)演費(fèi)穆一無(wú)所知,也要強(qiáng)不知以為知,用一字之差的物理學(xué)家“費(fèi)米”構(gòu)成應(yīng)答內(nèi)容。
ChatGPT在生成回答后的道歉環(huán)節(jié)已經(jīng)在應(yīng)用中成為標(biāo)準(zhǔn)配置。其中的指令輸入—快速生成—判斷正誤—道歉的信息鏈觸發(fā)方式,在根本上正在偏離人工智能概率推理算法中的馬爾科夫鏈。根據(jù)工作機(jī)理的不同,馬爾科夫鏈的仿真推理采樣算法“可以被視為在狀態(tài)空間中——所有可能的完整賦值的空間——的隨機(jī)走動(dòng)——每次改變一個(gè)變量,但是保證證據(jù)變量的值固定不變”。3 利用馬爾科夫鏈所能達(dá)到的穩(wěn)態(tài)分布(Stationary Distribution),升級(jí)后的GPT文本生成工具曾經(jīng)成功地幫助名為Benjamin的AI劇本寫作軟件,完成了第二部科幻短片Zone Out(2018)。整個(gè)任務(wù)在48小時(shí)內(nèi)完成,指令層次是多重的,包括給定的片名“Zone Out”,生發(fā)對(duì)話的提示句“他們要嚴(yán)肅地稱之為‘亞當(dāng)”,道具與行動(dòng)的設(shè)計(jì)所基于的描述是,“人物手持鏡頭,在轉(zhuǎn)動(dòng)中反射出明亮的光”。再考慮到競(jìng)賽單元所在的倫敦科幻電影節(jié)的特殊性質(zhì),多處指令中的最后一條是“用作備選項(xiàng)的科學(xué)觀念”,“一種只針對(duì)孕婦的基因定制病毒”。1 從該片在網(wǎng)絡(luò)上公布的在線放映情況看,升級(jí)后的Benjamin不再自我局限于預(yù)訓(xùn)練的語(yǔ)料庫(kù),它擺脫了初級(jí)階段的剪切、復(fù)制和語(yǔ)料粘貼,做到了以人類劇作為模仿對(duì)象,通過(guò)預(yù)測(cè)字母與詞語(yǔ)的共同出現(xiàn)傾向來(lái)生成語(yǔ)句,并利用公共領(lǐng)域的電影片段對(duì)短片中的人物表演進(jìn)行“換臉”(Faceswap)的復(fù)雜操作。
ChatGPT和名為Benjamin的劇本算法在開放的AI技術(shù)系統(tǒng)中共享了GPT3的神經(jīng)網(wǎng)絡(luò)卷積平臺(tái),擁有共同的人機(jī)協(xié)同基礎(chǔ),然而二者在結(jié)果生成的指令設(shè)置方面存在差異,所依據(jù)的數(shù)據(jù)庫(kù)也完全不同。后者的預(yù)訓(xùn)練數(shù)據(jù)保持在同類型成果的邊界以內(nèi),可以清晰地回溯路徑并辨識(shí)出風(fēng)格遷移的關(guān)聯(lián)元素,且最終成果在生成后達(dá)到了一般意義上的文本規(guī)模,作為結(jié)構(gòu)獨(dú)立的人機(jī)協(xié)同作品而存在,不再自動(dòng)融入源數(shù)據(jù)。與此相反,ChatGPT將生成式AI的應(yīng)用場(chǎng)景帶入普遍的用戶終端,雖然意外地提早實(shí)現(xiàn)了人工智能產(chǎn)業(yè)在全球視野中的破殼而出,卻是以指令觸發(fā)方式的容錯(cuò)率為代價(jià),一方面將算力資源最大可能地集中在應(yīng)用的便利和效率方面,另一方面則是超大擴(kuò)容大語(yǔ)言模型,降低甚至是裁撤對(duì)于數(shù)據(jù)內(nèi)容的標(biāo)注點(diǎn)數(shù)量。因此,大幅提高人機(jī)協(xié)同中的機(jī)器產(chǎn)出占比所導(dǎo)致的路徑問題在于,“有很多人工智能生成的文本可能很快就會(huì)進(jìn)入文獻(xiàn)中”?!犊茖W(xué)》雜志的主編霍爾頓·索普(H. Holden Thorp)分析了ChatGPT從LLMs中析取出的應(yīng)答成果可能造成的誤用,指出“有時(shí)候ChatGPT會(huì)寫出一些聽起來(lái)言之鑿鑿而實(shí)際上既錯(cuò)誤又荒謬的回答”。2 聯(lián)系前文圖3呈現(xiàn)的“費(fèi)穆”與“費(fèi)米”之間的混淆和張冠李戴,就可以完全理解《科學(xué)》編輯部為什么將ChatGPT寫出的文段定義為“抄襲”(Plagiarized)。該刊還明確表述,未來(lái)除了創(chuàng)作者有意識(shí)地使用AI工具輔助生成合法的數(shù)據(jù)集,其他所有借助生成式AI完成的產(chǎn)品,無(wú)論是文本、圖表、圖形還是圖像,都是工具性剽竊,是科學(xué)類學(xué)術(shù)期刊“不可接受的”。
除了部分學(xué)術(shù)期刊有條件地拒用ChatGPT之外,還有不同語(yǔ)類的文學(xué)雜志先后對(duì)此發(fā)出否定性公告。隨著ChatGPT技術(shù)的濫用,AI生成的稿件數(shù)量激增,使專業(yè)審稿的編輯行業(yè)感受到強(qiáng)烈的沖擊。中國(guó)著名的科幻雜志《科幻世界》對(duì)外宣布“不接受AI創(chuàng)作的科幻小說(shuō)”,美國(guó)科幻雜志《克拉克世界》(Clarkesworld)更是直接關(guān)閉了自由投稿通道。我們從中看到的悖論是:生成式AI不僅沒有如其所許諾的那樣成為人的助力,反而導(dǎo)致負(fù)面效應(yīng),挾制了人的創(chuàng)制性道路。正如泰格馬克(Max Tegmark)在提出阿西洛馬人工智能原則時(shí)對(duì)科幻作家阿西莫夫(Issac Asimov)名言的引用,“生命最大的悲哀莫過(guò)于科學(xué)匯聚知識(shí)的速度快于社會(huì)匯聚智慧的速度”,3 對(duì)于ChatGPT造成的當(dāng)前境地,這句名言或許可以仿寫為:技術(shù)最大的悲哀莫過(guò)于AI生成文本的速度快于人類寫出作品的速度。人機(jī)協(xié)作路徑在未來(lái)發(fā)展的方向上需要反思新的可能性,其中的關(guān)鍵或許正在于技術(shù)系統(tǒng)如何做到真正的開源、開放和安全。
四、結(jié)語(yǔ):真正開放的專家型系統(tǒng)
針對(duì)AI系統(tǒng)的安全和開放問題,埃隆·馬斯克(Elon Musk)在社交媒體上發(fā)表了最新看法。他回顧了自己作為OpenAI創(chuàng)始人的企業(yè)理想是“創(chuàng)建一個(gè)真正開放的非營(yíng)利性公司,與谷歌相抗衡”,并以此來(lái)反對(duì)微軟將其改造為“非開源的、追求利潤(rùn)最大化的公司”。越來(lái)越多的專業(yè)研究者發(fā)現(xiàn),在繁花似錦的表象下,ChatGPT及其前期模型ChatGPT3并沒有完全公開它們的基礎(chǔ)訓(xùn)練集和大型語(yǔ)言數(shù)據(jù)庫(kù)。生成式AI的對(duì)話模型在技術(shù)系統(tǒng)內(nèi)部的運(yùn)作方式也不透明,數(shù)據(jù)閉環(huán)導(dǎo)致了內(nèi)容生成過(guò)程析出大量冗余信息,間或出現(xiàn)知識(shí)盲點(diǎn)甚至常識(shí)性謬誤。這與趨向透明和科學(xué)日益開放的進(jìn)步觀念背道而馳,也使得應(yīng)用者很難發(fā)現(xiàn)一場(chǎng)對(duì)話在知識(shí)譜系上的起源或缺失。
事實(shí)上,不公布項(xiàng)目開發(fā)的源代碼意味著系統(tǒng)在技術(shù)上的實(shí)際封閉,而在系統(tǒng)理論中,“系統(tǒng)的開放是系統(tǒng)自組織演化的前提條件之一”。1 當(dāng)對(duì)話模型只限于模式化的應(yīng)用場(chǎng)景,通過(guò)互聯(lián)網(wǎng)提供的平臺(tái)來(lái)構(gòu)建人機(jī)交互界面并虛擬出人機(jī)對(duì)話的在場(chǎng)感時(shí),使用生成式AI作為輔助的人類個(gè)體就背離了作者的定位,而僅僅是在一次次指令設(shè)置的調(diào)整修改中變?yōu)椴粩嘟抵堑呐R時(shí)用戶。假設(shè)那些不明確的信息源和不能充分判斷的生成結(jié)果繼續(xù)自動(dòng)返回系統(tǒng)本身,“自行獨(dú)立演化”的后果很可能就是在網(wǎng)絡(luò)化的知識(shí)空間中增加了大量并非由人完成的“突變”。2 因此,對(duì)于構(gòu)建專家型系統(tǒng)的呼吁和進(jìn)一步向公眾開放生成式AI技術(shù)的呼吁變得同等重要。在經(jīng)歷了各種興奮的業(yè)績(jī)?cè)鲩L(zhǎng)和難以預(yù)測(cè)的抵制或禁用之后,OpenAI在公司主頁(yè)上做出了提示語(yǔ)的調(diào)整,從“形塑未來(lái)的技術(shù)”改回了“創(chuàng)建安全的、使全人類受益的人工智能”(Creating safe artificial intelligence that benefits all of humanity)。之所以用“改回”來(lái)形容這次研發(fā)方向上的調(diào)整,是因?yàn)樵摴驹谧畛醭闪⒌臅r(shí)候,關(guān)于人工智能的原則討論集中在兩個(gè)方面:一是倫理意義上的“安全系統(tǒng)”,二是價(jià)值定位上的“服務(wù)于全人類利益”。如果對(duì)于全人類福祉的考慮能夠真正成為生成式AI的未來(lái)技術(shù)開發(fā)重點(diǎn),也將意味著一個(gè)真正開源、開放的系統(tǒng)正在建構(gòu)當(dāng)中。
ChatGPT: Generative AI versus “Socratic Inquiry”
YANG Junlei
Abstract: As a new technology branch in the field of artificial intelligence, generative AI has formed nine groups of application categories in almost 20 years of industrial development and layout. ChatGPT, as an emerging product of human-computer dialogue model, has undergone continuous technology updates and sparked a global discussion on how AI will assist human work in the future. Based on the “Socratic inquiry” and the analysis of logical elements, it can be found that the dialogue model of generative AI relies more on the “instruction” setting, which is different from the traditional dialogue style. The dialogue of “presence” that unites the Western intellectual tradition is rewritten as an internal circulation of data flow. The construction of open systems for the benefit of all humanity is becoming the basis for consensus on how to guarantee the safety of human-computer collaboration.
Key words: ChatGPT; AIGC; Socratic inquiry; dialogue model; opening system
(責(zé)任編輯:蘇建軍)