收稿日期:2023-09-01
作者簡介:楊逸云(1992—),女,武漢大學(xué)文學(xué)院博士研究生(湖北武漢,430072);宋時磊(1982—),男,文學(xué)博士,武漢大學(xué)漢語寫作研究中心研究員,文學(xué)院副教授,中國寫作學(xué)會副秘書長(湖北武漢,430072)。
基金項目:武漢大學(xué)人工智能問題融通研究專項課題“人工智能寫作的技術(shù)路徑、倫理困境與法律風(fēng)險”(2020AI005)的階段性成果。
①參見楊俊蕾:《機器,技術(shù)與AI寫作的自反性》,載《學(xué)術(shù)論壇》2018年第2期;楊丹丹:《人工智能寫作與文學(xué)新變》,載《藝術(shù)評論》2019年第10期;劉欣:《人工智能寫作“主體性”的再思考》,載《中州學(xué)刊》2019年第10期。
摘要:人工智能寫作雖經(jīng)歷了從理性主義到經(jīng)驗主義的范式轉(zhuǎn)變,但始終具有以下三種特質(zhì):首先,寫作過程由人機共同合作完成,計算機是人工智能寫作的顯性作者;其次,其基礎(chǔ)是語言模型,理性主義范式采用基于語法規(guī)則的模型,經(jīng)驗主義范式則采用基于統(tǒng)計的語言模型和基于神經(jīng)網(wǎng)絡(luò)的語言模型;最后,人工智能通過計算寫作生成自然語言文本。這三種特質(zhì)彰顯了人工智能寫作的實質(zhì),即計算機以語言模型生成自然語言文本的過程?;诂F(xiàn)有學(xué)術(shù)成果,研究者可在進一步明確研究邊界、拓寬研究視野、改進研究方法等方面著力,促進人工智能寫作的理論發(fā)展。
關(guān)鍵詞:人工智能寫作;理性主義;經(jīng)驗主義;語言模型;自然語言文本
中圖分類號:I04;TP18" " " 文獻(xiàn)標(biāo)識碼:A" " " 文章編號:1003-8477(2024)04-0038-09
人工智能寫作是人工智能(Artificial Intelligence,AI)技術(shù)的應(yīng)用之一。近年來,人工智能已寫出了不少引人注目的作品,如微軟“小冰”的《陽光失了玻璃窗》,“快筆小新”、Dreamwriter等生成的新聞報道等等。自2022年始,國內(nèi)外又推出ChatGPT、kimi、文心一言等基于大語言模型的寫作工具,人工智能寫作迅速成為億萬民眾矚目的對象和全球?qū)W界討論的焦點。人工智能寫作勇立21世紀(jì)信息技術(shù)的潮頭,攜手人文藝術(shù),成為溝通“兩種文化”[1]的橋梁。在人文社科領(lǐng)域,學(xué)界已廣泛探討了與人工智能寫作相關(guān)的諸多理論問題,包括寫作主體、技術(shù)生成機制以及審美創(chuàng)造等。①不過,關(guān)于如何認(rèn)識人工智能寫作的本質(zhì),怎樣理解人工智能寫作科學(xué)實驗與人文實驗的雙重屬性,并在跨學(xué)科視域下找尋有利于觀察人工智能寫作現(xiàn)象的立場、獲得溝通科技與人文的交互性視角等問題,學(xué)界還未取得廣泛共識。本文擬從理性主義與經(jīng)驗主義兩種自然語言處理研究范式出發(fā),回溯人工智能寫作歷史,嘗試界定人工智能寫作的概念,展望人工智能寫作研究的發(fā)展前景。
一、歷史回顧
1956年,約翰·麥卡錫(John McCarthy)在達(dá)特茅斯會議上,首次提出了人工智能的概念。而人工智能寫作實踐卻可追溯至1952年,當(dāng)時英國計算機學(xué)者克里斯托弗·斯特雷奇(Christopher Strachey)用計算機程序生成文本,拉開了人工智能寫作的序幕。人工智能寫作深受理性主義和經(jīng)驗主義兩種研究范式的影響,理性主義方法以阿夫拉姆·諾姆·喬姆斯基(Avram Noam Chomsky)的語法理論為基礎(chǔ),又稱基于規(guī)則的方法(rule-based approach),即通過專家編制規(guī)則,構(gòu)造相應(yīng)的寫作程序,旨在通過手工編碼大量的先驗知識和推理機制,復(fù)制人類大腦中的語言能力。[2](p10)但是,理性主義方法面臨著知識瓶頸,有關(guān)研究進展緩慢,于是經(jīng)驗主義方法隨之興起。經(jīng)驗主義方法以香農(nóng)(Claude Shannon)的信息論為理論基礎(chǔ),又稱基于統(tǒng)計的方法(statistic-based approach),主張通過建立特定的數(shù)學(xué)模型學(xué)習(xí)復(fù)雜、廣泛的語言結(jié)構(gòu),[2](p10)并很快在機器翻譯1、漢語對聯(lián)寫作2等方面取得驕人成績。
20世紀(jì)90年代,基于理性主義方法的人工智能已在詩歌、戲劇、小說等文體寫作領(lǐng)域嶄露頭角。21世紀(jì)以來,基于統(tǒng)計和神經(jīng)網(wǎng)絡(luò)的經(jīng)驗主義方法后來居上,并在人工智能寫作方面不斷推出令人震驚的學(xué)術(shù)成果??傮w來看,國內(nèi)人工智能寫作的實踐雖起步較晚,但自20世紀(jì)80年代開始,其進程基本與國外同步。
(一)理性主義范式下的人工智能寫作
20世紀(jì)八九十年代,國內(nèi)人工智能寫作實踐主要在詩歌領(lǐng)域展開。1984年,上海育才中學(xué)的梁建章設(shè)計了一款詩詞創(chuàng)作軟件,獲得首屆青少年計算機程序設(shè)計競賽初中組四等獎,這是我國最早的人工智能寫作實例。梁建章設(shè)計的詩詞創(chuàng)作軟件,平均不到30秒即可創(chuàng)作一首五言絕句。為設(shè)計這一軟件,他學(xué)習(xí)了《唐詩三百首》《千家詩新注》《學(xué)詩百法》,根據(jù)語法句式結(jié)構(gòu)、對偶、韻律等設(shè)計出詩歌寫作規(guī)則,再將500多個詩詞常用詞匯納入計算機數(shù)據(jù)庫。[3](p39)與梁建章的軟件不同,1989年劉慈欣設(shè)計的“電子詩人”專產(chǎn)現(xiàn)代詩歌。它用VF編程,含5個程序模塊、6個詞庫、1個語法庫,產(chǎn)詩量為每秒200行(不押韻)或每秒150行(押韻),產(chǎn)詩的方式絕對全自動,除了告知行數(shù)外,不需任何人為干預(yù)。3劉慈欣認(rèn)為現(xiàn)代詩歌講究朦朧和自由,沒有絕對的標(biāo)準(zhǔn),因此現(xiàn)代詩歌的生成也不需要嚴(yán)格的專家知識。程序員獵戶與劉慈欣持同樣看法,他認(rèn)為現(xiàn)代詩歌的規(guī)律是主謂賓的“亂搭配”及形容詞、名詞、動詞的“亂搭配”,并據(jù)此開發(fā)出“獵戶星”免費在線寫詩軟件。工程師張小紅則對現(xiàn)代詩歌的生成有著不同看法,1994年,他開發(fā)出智能寫作軟件“GS文章自動生成系統(tǒng)”,并把軟件生成的作品結(jié)集為《心訴無語——計算機詩歌》和《中國機器詩》,其中《中國機器詩》以電子形式出版,獲得國家版權(quán)局計算機軟件著作權(quán)。張小紅的寫作軟件采用“詩歌坐標(biāo)構(gòu)思法”生成現(xiàn)代詩,這一方法類似于雅各布森詩歌理論中的對等原則,即將詩歌中的詞語分別對應(yīng)到坐標(biāo)軸,x軸為組合軸、y軸為選擇軸,將x軸與y軸上的信息進行強化聯(lián)結(jié),就生成了詩歌。與此相似的還有林鴻程(稻香老農(nóng))開發(fā)的古典詩歌智能寫作軟件“電腦作詩機”、“大作家”自動寫作軟件等等。
人工智能的寫作實踐,引發(fā)了學(xué)界關(guān)注。對于這個嶄新事物,學(xué)者們采用了多種不同的指稱方式,例如“計算機輔助寫作系統(tǒng)”“智能輔助寫作”“電腦自動寫作”“機器智能寫作”等等。值得指出的是,當(dāng)時學(xué)界并未將其作為獨立的研究對象,而是普遍認(rèn)為人工智能寫作是電腦寫作的高級發(fā)展階段。1
(二)經(jīng)驗主義范式下的人工智能寫作
21世紀(jì)以來,基于經(jīng)驗主義的人工智能詩歌寫作實踐令人矚目。這類寫作程序均建立了數(shù)據(jù)集,通過學(xué)習(xí)和分析其中的詩歌,搭建寫詩模型。當(dāng)用戶輸入詩歌題目時,模型便會通過概率計算出與該題目相關(guān)的字詞,組合成最終的詩歌。如微軟“小冰”學(xué)習(xí)了1920年以來519位中國詩人的現(xiàn)代詩,通過不斷訓(xùn)練擁有了寫作現(xiàn)代詩的能力,并于2017年出版了首部由人工智能寫作的詩集《陽光失了玻璃窗》。同年,清華大學(xué)開發(fā)的人工智能詩歌寫作軟件“九歌”登上中央電視臺科技類挑戰(zhàn)節(jié)目《機智過人》,與青年詩人比拼詩詞創(chuàng)作,并成功通過現(xiàn)場圖靈測試。2019年,封面團隊的“小封”通過學(xué)習(xí)數(shù)百位詩人的詩歌,來創(chuàng)作現(xiàn)代詩和古體詩,出版了詩集《萬物都相愛》。京東、百度等網(wǎng)絡(luò)平臺也開發(fā)了相應(yīng)的詩歌寫作軟件。目前,網(wǎng)絡(luò)上較為活躍的人工智能寫作平臺還包括“詩三百”、華為“樂府”等。
同一時期,人工智能新聞寫作也取得了較大成功。國內(nèi)機器新聞寫作在2015—2019年出現(xiàn)一個小高峰,媒體紛紛開發(fā)了自己的寫作機器人。2015年,騰訊新聞上線了寫作機器人Dreamwriter,它從國家統(tǒng)計局網(wǎng)站中獲取數(shù)據(jù),并選擇一些高級統(tǒng)計師的評論建議,僅用一分鐘就完成了國內(nèi)第一條由機器寫作的稿件《8月CPI同比上漲2.0%,創(chuàng)12個月新高》。同年,新華社使用“快筆小新”為體育部、經(jīng)濟信息部等部門和《中國證券報》等報刊提供財經(jīng)、體育類新聞稿件。2016年,中國地震臺網(wǎng)在四川發(fā)生地震的幾分鐘后就使用寫稿機器人發(fā)布了新聞。同年,今日頭條的“張小明”在奧運會報道中也嶄露頭角,它主要從文字直播數(shù)據(jù)中進行語句篩選與融合,進而生成賽事報道。隨后幾年間,《南方都市報》《封面?zhèn)髅健贰稄B門日報》、百家號等媒體紛紛使用寫作機器人批量生成新聞。2
在小說領(lǐng)域,陳楸帆使用自主研發(fā)的人工智能寫作程序“AI 科幻世界”完成了人機交互寫作《恐懼機器》《出神狀態(tài)》等短篇科幻小說,并發(fā)起了首次華語科幻AI人機共創(chuàng)寫作實驗項目“共生紀(jì)”。華東師范大學(xué)王峰團隊采用“國內(nèi)大語言模型+提示詞工程+人工后期潤色”的方式發(fā)布了超過100萬字的人機融合式長篇小說《天命使徒》。此外,經(jīng)驗主義范式還催生了不少輔助寫作軟件和平臺,如“筆神”“彩云小夢”“WPS智能寫作”“法律文書智能輔助”“在線劇本智能寫作”等,為寫作者提供了數(shù)據(jù)庫聯(lián)想、續(xù)寫等功能,只要使用者輸入相關(guān)文字,平臺便會推送關(guān)聯(lián)文本信息,以供參考。
2022年,OpenAI推出的ChatGPT可以按照人類提示自主完成詩歌、小說、新聞、學(xué)術(shù)論文等各種文體的寫作,通用人工智能不再遙不可及。隨著技術(shù)進步,基于經(jīng)驗主義的人工智能寫作質(zhì)量大幅提升,相關(guān)研究課題數(shù)量也顯著增長。在諸多研究中,不僅有針對寫作基礎(chǔ)問題的研究,如人工智能寫作的主體、原理、文本形態(tài)、讀者接受情況等;還有針對不同文體寫作的研究,如對人工智能詩歌、人工智能小說、機器新聞等的專題討論。然而,有關(guān)人工智能寫作概念的研究幾近缺位。從理性主義到經(jīng)驗主義,人工智能寫作已經(jīng)積累了足夠的研究樣本,進行概念界定的條件早已具備,但多數(shù)研究忽略了這一基礎(chǔ)問題,轉(zhuǎn)而直接投入具體理論研究中。厘清概念是開展系統(tǒng)理論研究的基礎(chǔ),只有通過明確的定義,才能深入探討人工智能寫作的本質(zhì)、挑戰(zhàn)及應(yīng)對措施,推動相關(guān)研究向前邁進。ChatGPT等大語言模型的火爆出圈使人工智能寫作現(xiàn)象再次成為各界焦點,人文學(xué)者如何充分吸收自然科學(xué)的研究成果,從跨學(xué)科的角度理解并界定人工智能寫作的概念,成為21世紀(jì)中國寫作研究的當(dāng)務(wù)之急。
二、概念界定
人工智能寫作是計算機科學(xué)自然語言處理技術(shù)的應(yīng)用之一,人文社會科學(xué)界則傾向于將人工智能寫作理解為新技術(shù)詞匯“人工智能”與舊藝術(shù)概念“寫作”的疊加,[4](p85)該如何界定人工智能寫作概念?筆者認(rèn)為,首先要考慮人工智能寫作的特殊性,避免簡單類比人類寫作概念的傾向;其次要充分考慮人工智能發(fā)展的技術(shù)路徑,盡量從技術(shù)與藝術(shù)的交互角度切入?;谶@兩點,筆者將從誰在寫、怎么寫、所寫為何這三個維度探究人工智能寫作概念的內(nèi)涵。
(一)誰在寫?——計算機
談到人工智能寫作,首先遇到的問題就是誰在寫?是人還是機器?對此,學(xué)界多從主體性角度予以討論,如,張強等認(rèn)為主體性是人獨有的,只認(rèn)可人的作者地位;[5](p42-46)又如,劉欣、[6](p153-158)畢日生等、[7](p69-75)周建瓊[8](p145-150)則將當(dāng)前的人工智能寫作主體視為一種人機間性主體。人工智能寫作由人機合作完成,人類的參與主要體現(xiàn)在前期人工智能寫作程序的開發(fā)及后期對寫作結(jié)果的刪選中,而人工智能生成文本的整個過程都由計算機在“中文屋”1中完成,并不需要人類直接干預(yù)。因此,筆者認(rèn)為有必要強調(diào)計算機的顯性作者2地位。近兩年GPT模型的發(fā)明與運用更加凸顯了人工智能寫作這種自在自為的性質(zhì)。
計算是人工智能寫作與人類寫作最根本的區(qū)別。人類寫作由人腦構(gòu)思成文,而人工智能寫作則是計算機通過計算完成的。人工智能將自然語言轉(zhuǎn)換成數(shù)值,通過計算得出結(jié)果,然后再轉(zhuǎn)換回文本形態(tài)。誠如美國硅谷人工智能研究院院長皮埃羅·斯加魯菲(Piero Scaruffi)所言:“到目前為止,無論何時人工智能解決了一個問題(例如,在圍棋比賽中戰(zhàn)勝人類大師),人們都會發(fā)現(xiàn)這種解決方法并沒有任何特別之處,只是在高速計算機上進行了非常復(fù)雜的數(shù)學(xué)運算罷了?!盵9](p31)在以往的人工智能寫作研究中,學(xué)者往往選擇重視計算的方法,將人工智能寫作定性為程序?qū)懽骰蛩惴▽懽?,而忽略了實施計算的主體——計算機。雖然人工智能寫作程序承載著人腦的思想,是實現(xiàn)人工智能寫作的靈魂,但如若沒有計算機這一平臺,再好的程序也無法發(fā)揮作用。
作為計算的主體,計算機在人工智能寫作中扮演著十分重要的角色,它為程序和算法的實現(xiàn)提供了硬件和軟件環(huán)境,使人工智能能夠處理大量的數(shù)據(jù)、完成復(fù)雜的任務(wù)。當(dāng)前人工智能寫作對計算機運算能力的要求越來越高,例如谷歌在2018年開發(fā)的用于人工智能寫作的BERT語言模型只有3.4億模型參數(shù)量,而到了2020年,由OpenAI 公司開發(fā)的GPT-3語言模型已超過了1750億個參數(shù)量。目前,人工智能寫作正處于以計算能力換取寫作效果的階段,創(chuàng)造龐大的模型似乎成為人工智能寫作不可逆轉(zhuǎn)的趨勢,計算機的計算能力也直接決定了經(jīng)驗主義范式下人工智能寫作未來發(fā)展的可能。
(二)怎么寫?——建立語言模型
語言模型是人工智能寫作實現(xiàn)的具體方法。在人工智能寫作過程中,計算機難以直接處理復(fù)雜的自然語言,因此需要將自然語言用數(shù)學(xué)方法形式化,建立語言的形式模型,簡稱語言模型。[10](p17-24)語言模型的發(fā)展經(jīng)歷了從理性主義方法到經(jīng)驗主義方法的轉(zhuǎn)變。在人工智能寫作發(fā)展初期,理性主義通過歸納語言規(guī)則來實現(xiàn)語言的表示和推理,雖然在特定領(lǐng)域取得了成功,但其在處理人類語言的復(fù)雜性方面存在局限。隨著大規(guī)模語料庫的出現(xiàn),經(jīng)驗主義逐漸在發(fā)展中占據(jù)主導(dǎo)地位,并在處理大規(guī)模文本數(shù)據(jù)方面成績顯著,ChatGPT等大型語言模型便是其代表。
1.理性主義范式語言模型
“情書生成器”是理性主義范式語言模型的代表性實踐。1952年,克里斯托弗在第一臺商用通用計算機“馬克1號”(Ferranti Mark I)上開發(fā)了“情書生成器”,專門用于情書寫作??死锼雇懈ハ胱層嬎銠C模仿人類思維生成多樣化的成果,于是自制了一套情書寫作規(guī)則,并將這些規(guī)則轉(zhuǎn)換為計算機指令。首先,他從羅杰英語同義詞詞庫中選擇了70個左右的基本詞匯,然后根據(jù)語法規(guī)則編制出了五句話的情書生成模型。他主要設(shè)計了兩種句型,一種是“我的lt;形容詞gt;lt;名詞gt;lt;副詞gt;lt;動詞gt;”,另一種是“你是我的lt;形容詞gt;lt;名詞gt;”。生成器可以隨機選擇使用哪種類型的句子,但如果有兩個連續(xù)第二種類型的句子,則第一句以冒號結(jié)尾,第二句前面的“你是我的”被省略。整封情書一共有五句話,最后以“你的lt;副詞gt; M. U. C.”結(jié)尾。句型確定后,再將對應(yīng)詞性的詞語隨機填充到規(guī)則當(dāng)中,便可產(chǎn)生一封情書,如下所示:[11](p25-31)
親愛的甜心
你是我的狂熱伙伴。我的感情奇怪地緊緊抓住你的熱情愿望。我喜歡你的心。你是我渴望的同情:我溫柔的喜歡。
你美麗的 M. U. C.
克里斯托弗的這一嘗試,開啟了人工智能寫作的先河。上文所述梁建章、劉慈欣、張小紅等人發(fā)明的文本生成軟件均使用這種寫作方法。
2.經(jīng)驗主義范式語言模型
與理性主義不同,經(jīng)驗主義認(rèn)為大腦并沒有先天的語言知識,語言知識是基于經(jīng)驗發(fā)展而來的,完成自然語言處理任務(wù)不一定要經(jīng)過“理解”的階段。經(jīng)驗主義研究范式將人工智能寫作視為概率求解問題,通過概率確定自然語言出現(xiàn)的可能性,概率越大,句子的合理性越充分。經(jīng)驗主義范式下的人工智能可以在大規(guī)模文本數(shù)據(jù)上進行訓(xùn)練,生成的內(nèi)容質(zhì)量相對較高,由于其底層邏輯為概率統(tǒng)計,被姜峰楠(Ted Chiang)等學(xué)者稱為“應(yīng)用統(tǒng)計學(xué)”。[12]
(1)基于統(tǒng)計的語言模型
經(jīng)驗主義最初采用的是基于統(tǒng)計的語言模型(statistics-based language model)。這種模型通常依賴于數(shù)據(jù)集,通過分析數(shù)據(jù)集中的文本數(shù)據(jù)來計算單詞序列出現(xiàn)的概率。假設(shè)給定一個語料庫詞典V,所有的單詞w都是詞典V當(dāng)中的,wi∈V。統(tǒng)計語言模型計算的就是任意單詞序列合理的概率p(w1,w2,…,wn),其中,p≥0。假設(shè)訓(xùn)練集中共有N個句子,接下來數(shù)一下單詞序列(w1,w2,…,wn)出現(xiàn)的次數(shù)n,即可得出概率p(w1,w2,…,wn) =[nN]。但是,一旦這個單詞序列(w1,w2,…,wn)沒有在訓(xùn)練集中出現(xiàn)過,模型的輸出概率就會變成0。為了解決這一問題,人工智能研究者采用了概率論中的鏈?zhǔn)椒▌t,將長句子的概率分解為多個簡單部分的乘積,并假設(shè)每個詞的出現(xiàn)概率僅與它前面的詞相關(guān)。通過這種方式,計算機可以逐步計算每個詞的條件概率,并將它們相乘得到整個句子的概率,即p(w1,w2,…,wn)≈ p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1),這就是二元語法模型(Bigram Model),同理可推廣至三元語法模型(Trigram Model)、N元語法模型(N-gram Model)。1
由于統(tǒng)計語言模型學(xué)習(xí)能力有限,需要學(xué)習(xí)的詞組太多,如果訓(xùn)練集中缺少某些詞組,這些未出現(xiàn)的詞組將導(dǎo)致計算出的概率值為零。即使采取平滑技術(shù)解決,將所有詞組出現(xiàn)的次數(shù)加1,仍會出現(xiàn)諸如維度災(zāi)難2的問題,于是基于神經(jīng)網(wǎng)絡(luò)的語言模型(neural-network-based language model)3應(yīng)運而生。
(2)基于神經(jīng)網(wǎng)絡(luò)的語言模型
神經(jīng)網(wǎng)絡(luò)語言模型的基礎(chǔ)仍然是概率計算,但它使用詞向量表示單詞或單詞組合,并在此基礎(chǔ)上通過神經(jīng)網(wǎng)絡(luò)表示語言模型,提高了語言表達(dá)效率,成為當(dāng)前人工智能寫作使用的主流方法。
首先,神經(jīng)網(wǎng)絡(luò)語言模型提出詞向量的概念,采用具有一定維度的實數(shù)向量表示單詞的分布式,以此代替統(tǒng)計語言模型中使用的離散變量,解決了維度災(zāi)難問題。其次,神經(jīng)網(wǎng)絡(luò)語言模型用神經(jīng)網(wǎng)絡(luò)建模語言,對于從來沒見過的單詞搭配也能通過詞向量擬合出對應(yīng)的概率,避免了零概率問題。神經(jīng)網(wǎng)絡(luò)是一種模仿人腦神經(jīng)元連接方式的計算模型,它由許多相互連接的神經(jīng)元組成,每個神經(jīng)元都與其他神經(jīng)元相連,并通過這些連接傳遞信息。2003年,約書亞·本吉奧提出第一個前饋神經(jīng)網(wǎng)絡(luò)語言模型(FFNNLM),該模型先在輸入層輸入詞向量,然后通過隱藏層對詞向量進行加權(quán)和轉(zhuǎn)換,最后由輸出層給出可能出現(xiàn)的單詞的概率。在訓(xùn)練過程中,神經(jīng)網(wǎng)絡(luò)會調(diào)整連接權(quán)重,以便更準(zhǔn)確地預(yù)測單詞序列。之后,為了更好地捕捉和分析單詞序列特征的信息,其他學(xué)者又提出了循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN)、長短期記憶模型(LSTM)、序列到序列模型(Seq2Seq)等等。目前,人工智能寫作最先進的神經(jīng)網(wǎng)絡(luò)語言模型為雙向編碼器表示模型(BERT)和生成式預(yù)訓(xùn)練模型(GPT)。
對于人工智能而言,建立語言的形式化模型,并使之能以一定的數(shù)學(xué)形式嚴(yán)密規(guī)整地表示出來是最有困難和挑戰(zhàn)性的一步,因此,語言模型直接決定了人工智能寫作的質(zhì)量。目前,理性主義和經(jīng)驗主義方法下的語言模型各有優(yōu)勢,在不同文體寫作領(lǐng)域都取得了一定成績。
(三)寫的是什么?——自然語言文本
人工智能寫作的文稿可以稱為“作品”嗎?由于涉及知識產(chǎn)權(quán),法學(xué)界重點關(guān)注了這一問題,并形成兩種鮮明的觀點。1文學(xué)界的多數(shù)學(xué)者則仍然使用傳統(tǒng)的“作品”一詞來指代人工智能生成的內(nèi)容。筆者認(rèn)為,人工智能寫作與人類寫作存在本質(zhì)差異,為凸顯二者區(qū)別,建議將人工智能寫作的文稿稱作“自然語言文本”。
人工智能通過數(shù)據(jù)、算法、算力完成寫作任務(wù),其本質(zhì)是計算寫作,并不具有主觀精神與意識。人類寫作由“心”生發(fā),與人工智能依靠的“機芯”有著根本區(qū)別。[13](p94-99)下文以“云松”主題為例比較人工智能生成的詩歌文本與人類詩歌的差異。
云松[14](p263)
鑾仙玉骨寒,松虬雪友繁。
大千收眼底,斯調(diào)不同凡。
這首《云松》由前述梁建章設(shè)計的詩詞創(chuàng)作軟件生成,屬于理性主義范式下的人工智能寫作。該詩夸贊了云松的高大聳立及其不同凡響的氣質(zhì),文字看似對偶工整,實則缺乏內(nèi)在邏輯,如“松虬雪友繁”一句,松樹盤曲的枝干與“雪友繁”之間似乎并無聯(lián)系。
在“詩三百”平臺中輸入古詩主題“云松”,選擇五言絕句,即可快速得到下面這首基于經(jīng)驗主義范式的文本:
云松
白鶴舞清秋,云松共偃休。
何時歸去此,長伴赤松游。
該平臺擁有較大的古詩數(shù)據(jù)庫,當(dāng)用戶輸入詩歌主題后,平臺通過概率計算推測出首聯(lián)的首字“白”,然后利用“白”和語義向量繼續(xù)推測出第二個字“鶴”,再根據(jù)“鶴”和語義向量推測出第三個字“舞”,依此類推,直到預(yù)測出終止符。這首《云松》前兩句描述了一只在深秋起舞的白鶴站在云松旁休息的情景;后兩句追問白鶴何時回到仙人身邊,陪伴仙人游歷。雖說題目為“云松”,但詩歌內(nèi)容并未圍繞云松展開??梢?,人工智能生成的詩歌內(nèi)容與題目的關(guān)系并不緊密,似未達(dá)到詩歌寫作的基本標(biāo)準(zhǔn)。
同樣是描寫松樹,李白的《南軒松》以其超凡脫俗的意境和深邃的情感,將松樹的高潔品質(zhì)與詩人的志趣相融合,展現(xiàn)了一幅生動而富有哲理的畫面。從寫作技巧上看,既展現(xiàn)出清晰的邏輯層次,又對詞句進行了精心雕琢。詩歌的首聯(lián)即破題,頷聯(lián)和頸聯(lián)寫景,尾聯(lián)借孤松寄托詩人高遠(yuǎn)灑脫的情懷。
南軒松[15](p962)
南軒有孤松,柯葉自綿冪。
清風(fēng)無閑時,瀟灑終日夕。
陰生古苔綠,色染秋煙碧。
何當(dāng)凌云霄,直上數(shù)千尺。
比較三種文本,就可以發(fā)現(xiàn)人工智能寫作與人類寫作之間的差異。首先,從作詩動機看,人工智能只是在完成一項以“云松”為主題的寫作任務(wù),并不理解自己的操作有何意義;而人類的寫作則是“情動于中而形于言”,[16](p34)是李白在觀察到南窗外的松樹時產(chǎn)生了感悟,繼而運思和行文。一個是“要我寫”,動力來源于外部;一個是“我要寫”,有強烈的內(nèi)在動機。其次,從作詩過程看,人類的寫作受到作者性格、閱歷及文化環(huán)境影響,李白寫作《南軒松》時正棲止于安陸,雖隱居山中,但仍在尋求復(fù)出時機,因而寫出“何當(dāng)凌云霄,直上數(shù)千尺”的詩句,以孤松自喻,表達(dá)出對未來的期盼;而人工智能寫作的詩歌主要受數(shù)據(jù)庫和算法制約,在“詩三百”版本的《云松》中,“何時”“歸去”“長伴赤松游”等都可在先前的詩歌中找到原型??梢哉f,人工智能寫作并非嚴(yán)格意義上的原創(chuàng),不具有人類寫作的創(chuàng)造性,只是一種制作。如果嚴(yán)格對標(biāo)人類寫作的概念,人工智能寫作就成為了一個不言自明、不攻自破的偽命題。[17](p137-144)因此,人工智能寫作的結(jié)果更適合稱為“自然語言文本”。
筆者提出“自然語言文本”的概念,還有以下兩方面的考慮。其一,文本是作品的存在形態(tài),它與作品的關(guān)系可以用一個短語來說明——某某作品的文本。文本是低級的,同時也是基礎(chǔ)的,它可以是一句話、一個段落或一個篇章;而作品則是高級的,往往蘊含了豐富的精神價值。當(dāng)前人工智能生成的文稿并非都能達(dá)到作品的水平,文本的用法顯然更加貼切。其二,從技術(shù)層面上看,文本生成本身就是自然語言處理中的一個重要研究領(lǐng)域,它曾被認(rèn)為是人工智能寫作的學(xué)術(shù)性說法。[18]但僅僅使用文本來代替作品,仍容易產(chǎn)生歧義,因為計算機領(lǐng)域中的文本除了指主流意義上的語言文字外,還包括代碼等其他編碼化的電子信號。因此,有必要在文本前面加上自然語言的限定,使表述更加精確。
通過探究誰在寫、怎么寫、所寫為何等寫作學(xué)基本問題,筆者認(rèn)為,人工智能寫作的實質(zhì)是計算機以語言模型生成自然語言文本的過程?;谌斯ぶ悄芗夹g(shù)來對人工智能寫作進行概念界定,更符合人工智能寫作的本質(zhì),且有利于確立觀察人工智能寫作現(xiàn)象的穩(wěn)定立場,進一步深化人工智能寫作的研究。
三、研究展望
人工智能寫作及其研究既受技術(shù)迅猛發(fā)展的影響,也與人文社科多學(xué)科交叉互動,處于科技與人文交匯的前沿。當(dāng)前,人工智能寫作及其研究仍處于起步階段,概念界定僅僅是人工智能寫作系統(tǒng)性理論研究的第一步。在厘清概念的基礎(chǔ)上,還需要明確人工智能寫作的研究對象;開闊研究視野,警惕僅僅研究某種人工智能寫作范式的傾向;同時注意研究過程中跨學(xué)科方法的運用,避免從單一的人文或科學(xué)角度開展研究。
(一)明確研究對象:厘清人工智能寫作研究的邊界
一直以來,人工智能寫作都沒有一個明確統(tǒng)一的概念,相關(guān)研究的邊界不甚清晰。在以往研究中,人工智能寫作或被理解為一種技術(shù),或被當(dāng)作一種寫作現(xiàn)象。如若將其看成一種技術(shù),那么,只有計算機以語言模型生成的自然語言文本才屬于人工智能寫作,與此相關(guān)的事物皆為人工智能寫作研究的對象?;诖嗽瓌t,需要指出以下兩點注意事項:第一,不應(yīng)將所有自稱為人工智能寫作的軟件或平臺都納入研究范圍。由于人工智能已成為時尚的標(biāo)志性用詞,市面上一些偽原創(chuàng)軟件也想搭乘人工智能的快車獲取商業(yè)利益,但這些軟件只能對寫作素材進行同義替換或順序調(diào)整,并不符合人工智能寫作的定義,不能作為人工智能寫作研究的對象。第二,一些符合人工智能寫作概念但并未以此命名的機器寫作現(xiàn)象應(yīng)當(dāng)納入研究。例如生成式聊天機器人經(jīng)常被學(xué)者忽略,但它的工作原理其實與人工智能寫作的原理相同。聊天機器人有兩種類別,一種是檢索式,一種是生成式。檢索式聊天機器人有明確的問答數(shù)據(jù)庫,使用語句匹配的形式查找答案,并不涉及文本生成;而生成式聊天機器人是在大量的語料訓(xùn)練基礎(chǔ)之上,利用語言模型生成回答文本的,故也應(yīng)該納入人工智能寫作研究的范圍。
倘若將人工智能寫作視為一種寫作現(xiàn)象,那么,應(yīng)該明確寫作研究本身的范圍,而不能隨意擴大或縮小。寫作基礎(chǔ)理論中的寫作主體、客體、受體和載體,都是可研究的對象;文體寫作中的審美性文體、析理性文體及應(yīng)用性文體也都屬于可研究的領(lǐng)域,包括人工智能詩歌、人工智能小說等等。在機器新聞寫作的文體研究中,部分學(xué)者默認(rèn)機器新聞寫作包含了寫作本身以外的新聞分發(fā)及傳播等環(huán)節(jié),這就擴大了研究對象的范圍。在文學(xué)寫作研究當(dāng)中,有些學(xué)者又縮小了研究對象的范圍,將人工智能寫作僅僅定義為一種文學(xué)生產(chǎn),但事實上,人工智能寫作不僅包括文學(xué)寫作,還涵蓋了非文學(xué)寫作。
(二)開闊研究視野:以全面的眼光看待人工智能寫作
當(dāng)下,大語言模型在人工智能寫作中取得了顯著成績,但不能僅將研究視野局限于此,而應(yīng)認(rèn)識到技術(shù)是不斷演進的,未來的“鐘擺”也許還要回歸至理性主義,1理性主義范式下的文本同樣具有重要研究價值。
一方面,對比基于理性主義和經(jīng)驗主義方法生成的文本,可以深入揭示人工智能在特定文體寫作中的發(fā)展趨勢和獨特屬性。例如在新聞文體寫作領(lǐng)域,隨著技術(shù)方法的轉(zhuǎn)變,機器新聞寫作的發(fā)展并未日趨向上,而是面臨著趨冷的狀況。理性主義方法指導(dǎo)下的新聞寫作,往往可以以秒級的速度生成新聞,文稿質(zhì)量雖然一般,但符合新聞的基本原則;而經(jīng)驗主義方法下生成的新聞如若未經(jīng)人工審核,十分容易違反新聞寫作的原則。2023年由ChatGPT生成的一則杭州限號假新聞在網(wǎng)絡(luò)上廣泛傳播,引起了較大反響,該新聞的結(jié)構(gòu)與內(nèi)容并無明顯錯誤,卻違背了新聞的真實性原則,因此在ChatGPT被各個行業(yè)爭相使用之時,新聞行業(yè)并未表現(xiàn)出過多的熱情。因此,未來是否應(yīng)使用理性主義與經(jīng)驗主義結(jié)合的方法來生成新聞以及假新聞傳播所造成的系列衍生問題,特別是安全治理問題都可成為學(xué)界討論的重點問題。
另一方面,將基于理性主義與經(jīng)驗主義方法生成的文本進行文體間的分析,有助于進一步深入理解各種文體的特點及其與人工智能的獨特關(guān)系。例如,ChatGPT一經(jīng)出現(xiàn),學(xué)術(shù)教育領(lǐng)域便面臨著巨大的沖擊和變革,一些學(xué)生使用其完成學(xué)術(shù)論文寫作,這說明基于經(jīng)驗主義的人工智能在學(xué)術(shù)論文寫作領(lǐng)域取得了較好成績。對比來看,學(xué)術(shù)論文與新聞兩種文體在人工智能寫作的應(yīng)用發(fā)展過程中呈現(xiàn)出了不同的效果,而兩者的差異具體體現(xiàn)在哪些方面,為什么會存在這些差異等也是未來人工智能寫作研究者需要關(guān)注的問題。
(三)更新研究方法:促進技術(shù)和人文的對話與合作
人工智能寫作是科技與人文的結(jié)合。學(xué)界對人工智能寫作的研究,不僅應(yīng)立足于科學(xué)原理探討和技術(shù)層面分析,而且還要重視人文學(xué)科的基礎(chǔ)理論,通過人文學(xué)科的視角審視人工智能寫作的技術(shù)挑戰(zhàn),為科技進步提供富有啟發(fā)性的建議,實現(xiàn)人文研究對技術(shù)的反哺。
首先,從技術(shù)角度考察人工智能寫作的基本原理,研究者能更清晰地理解人工智能寫作的底層邏輯。學(xué)界對人工智能寫作的研究,存在一些人類中心主義[19](p8-14)的預(yù)設(shè)立場,對從技術(shù)視角提出的相關(guān)問題重視不夠。例如,在探究人工智能寫作原理時,學(xué)界偏重以人類寫作的特點和水平為評價標(biāo)準(zhǔn),一定程度上忽視了人工智能寫作內(nèi)蘊的創(chuàng)新意義。再如,關(guān)于人工智能寫作主體的研究,部分學(xué)者引入“作者之死”等文學(xué)理論觀照當(dāng)前的人工智能寫作。然而,先前的理論討論的是寫作主體與作品、讀者的關(guān)系,而人工智能寫作主體首要關(guān)注的卻是一種寫作主體與另一種寫作主體間的關(guān)系。如果從技術(shù)角度出發(fā),可以把人工智能寫作的主體問題轉(zhuǎn)換為人機交互的技術(shù)考察。
其次,人工智能寫作是人類寫作的鏡像,人文研究者同樣可以從文學(xué)藝術(shù)角度對技術(shù)的開發(fā)和改善提出合理建議。例如趙汀陽在研究大語言模型時,大膽假設(shè)如果有一種“動詞邏輯”可被用來分析事件和問題的生成關(guān)系與客觀結(jié)構(gòu),就能夠與分析真值關(guān)系的“名詞邏輯”(即現(xiàn)代形式邏輯)形成配合,從而幫助我們更為充分地理解意識和語言,理解語言何以成為自身的自我解釋系統(tǒng)。如果人工智能學(xué)會了動詞邏輯,或許就能夠發(fā)展出自我意識從而成為真正的主體。[20](p41-45)未來,如果人文研究者能從語言學(xué)和寫作學(xué)的角度提出更多設(shè)想,也許會反向促進人工智能寫作技術(shù)的發(fā)展,在真正意義上實現(xiàn)科技與人文的結(jié)合。
四、結(jié)語
人工智能已開啟自動寫作的時代,由此引發(fā)的劃時代革命將寫作理論提升到了全新高度,傳統(tǒng)以人類為中心的寫作研究范式已無法充分解釋由此引發(fā)的新寫作現(xiàn)象。面對人工智能寫作帶來的新問題,從技術(shù)原理出發(fā)對其展開全面剖析,進行明確的概念界定,便成為研究的首要任務(wù)。人工智能寫作經(jīng)歷了從理性主義到經(jīng)驗主義的范式轉(zhuǎn)變,寫作水平逐步提升,不少人工智能專家認(rèn)為人工智能已經(jīng)出現(xiàn)了智能“涌現(xiàn)”1能力。但實際上,當(dāng)前以ChatGPT為代表的人工智能寫作本質(zhì)上仍然是計算寫作,計算機是通過編程展現(xiàn)人類智能水平的,[21](p417-424)還未實現(xiàn)從制造到創(chuàng)造的飛躍。只有進入強人工智能時代,人工智能才會發(fā)生質(zhì)的改變。屆時,“機器人成立作家協(xié)會”便會成為現(xiàn)實,當(dāng)前的概念界定及系列研究也將同步更新。總之,科技同人文的跨學(xué)科融合研究已是大勢所趨,如何在研究中既充分考慮到技術(shù)的本質(zhì)及發(fā)展方向,又保持人文學(xué)者的特質(zhì),是每一位人工智能寫作研究者都應(yīng)思考的問題。只有在理論和實踐中不斷探索人類寫作的優(yōu)勢,時刻保持居安思危的憂患意識,才能更好地應(yīng)對人工智能時代寫作學(xué)面臨的挑戰(zhàn)。
參考文獻(xiàn):
[1][英]斯諾.兩種文化[M].紀(jì)樹立,譯.北京:生活·讀書·新知三聯(lián)書店,1994.
[2]陳鄞.自然語言處理基本理論和方法[M].李生,主審.哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2013.
[3]周新英.“計算機普及要從娃娃做起”——記上海市中小學(xué)生電子計算機教育[J].人民教育,1985,(1).
[4]耿弘明.AI時代藝術(shù)概念的產(chǎn)生方式及其反思[J].藝術(shù)學(xué)研究,2022,(2).
[5]張強,王超.人工智能時代的寫作主體性位移[J].當(dāng)代作家評論,2020,(5).
[6]劉欣.人工智能寫作“主體性”的再思考[J].中州學(xué)刊,2019,(10).
[7]畢日生,宋時磊.人工智能文學(xué)寫作“作者”問題之思[J].寫作,2020,(3).
[8]周建瓊.人工智能寫作背景下作者主體性的消解與重構(gòu)——以陳楸帆人機交互寫作實驗為中心[J].當(dāng)代文壇,2021,(4).
[9][美]皮埃羅·斯加魯菲.智能的本質(zhì):人工智能與機器人領(lǐng)域的64個大問題[M].任莉,張建宇,譯.北京:人民郵電出版社,2017.
[10]馮志偉,丁曉梅.計算語言學(xué)中的語言模型[J].外語電化教學(xué),2021,(6).
[11]Strachey C.The“Thinking”Machine[J].Encounter,1954,3(4).
[12]Murgia M.Sci-fi Writer Ted Chiang: ‘The Machines We Have Now Are Not Conscious’ [EB/OL].https://www.ft.com/content/c1f6d948-3dde-405f-924c-09cc0 dcf8c84,2023-06-02/2023-08-10.
[13]陶鋒,劉嘉敏.文心與機芯:中國古代文論視閾下的人工智能文學(xué)[J].文藝爭鳴,2020(7).
[14]張壽萱,徐建毅,張建生.中文信息的計算機處理[M].北京:宇航出版社,1984.
[15](唐)李白.李太白全集(下)[M].(清)王琦,注.北京:中華書局,2011.
[16](明)郝敬.毛詩原解 毛詩序說(上冊)[M].向輝,點校.北京:中華書局,2021.
[17]楊丹丹.人工智能寫作的“鏡像”與“正名”[J].廣州文藝,2019,(9).
[18]宋睿華.好玩的文本生成[EB/OL]. https://www.sohu.com/a/123411822_472869,2017-01-04/2023-08-17.
[19]余謀昌.走出人類中心主義[J].自然辯證法研究,1994,(7).
[20]趙汀陽.替人工智能著想[J].哲學(xué)動態(tài),2023,(7).
[21]Searle J R.Minds,Brains,and Programs[J].Behavioral and Brain Sciences,1980,3(3).
責(zé)任編輯" "孔德智
11988年計算語言學(xué)會上,國際商用機器公司(IBM)的Thomas J. Watson研究中心機器翻譯小組發(fā)表了關(guān)于統(tǒng)計機器翻譯(Statistical Machine Translation, SMT,一種機器翻譯方法)的論文,并推出法語/英語的翻譯系統(tǒng)Candide,標(biāo)志著大數(shù)據(jù)時代統(tǒng)計學(xué)派的興起。參見顧駿、郭毅可編:《人與機器:思想人工智能》,上海大學(xué)出版社2018年版,第124頁。
2統(tǒng)計機器翻譯被借用到人工智能寫作實踐中,微軟亞洲研究院將其用于對聯(lián)的自動寫作,可以在開放條件下生成較高質(zhì)量的對聯(lián),在當(dāng)時取得了頗為震撼的效果。參見孫茂松:《詩歌自動寫作芻議》,載《數(shù)字人文》2020年第1期。
3參見劉慈欣新浪博客博文《電子詩人》,https://blog.sina.com.cn/s/blog_540d5e8001000329.html。
1參見袁明光:《語文建設(shè)的新課題——電腦寫作》,載《語文建設(shè)》1992年第1期;閆俊清主編:《現(xiàn)代科技寫作簡明教程》,天津科學(xué)技術(shù)出版社1995年版。
2更多關(guān)于國內(nèi)新聞寫作機器人的信息參見楊逸云:《人工智能寫作的應(yīng)用現(xiàn)狀與問題》,載《寫作》2021年第1期。
1“中文屋”是美國哲學(xué)家約翰·塞爾(John Searle)提出的思想實驗。塞爾假設(shè)一個人位于房間中,這個房間只有一個出口和一個紙片槽。房間內(nèi)的人不懂中文,但是他可以使用一本中文翻譯書以及一些規(guī)則,根據(jù)接收到的中文問題編寫中文答案并將其放在紙片槽中。雖然他不理解中文,但是通過翻譯書和規(guī)則,卻可以回答中文問題,從而給人以他理解中文的印象。塞爾通過這個思想實驗來說明,雖然計算機可以執(zhí)行各種復(fù)雜的計算任務(wù),但它們就像中文屋的人一樣,并沒有真正理解所處理的信息。見[美]約翰·塞爾:《心、腦與科學(xué)》,楊音萊譯,上海譯文出版社2006年版,第23—24頁。
2筆者認(rèn)為,計算機是人工智能寫作的顯性作者,人則是計算機背后的隱性作者。
1對統(tǒng)計語言模型更具體的描述可參見馮志偉、丁曉梅:《計算語言學(xué)中的語言模型》,載《外語電化教學(xué)》2021年第6期。
2維度災(zāi)難指的是隨著數(shù)據(jù)特征(維度)數(shù)量的增加,數(shù)據(jù)點在高維空間中的分布變得稀疏,導(dǎo)致機器學(xué)習(xí)模型的性能下降和計算資源需求呈指數(shù)級增長的現(xiàn)象。
32003年,約書亞·本吉奧(Yoshua Bengio)等人的文章“ANeural Probabilistic Language Model”(《一種神經(jīng)概率語言模型》)提出了神經(jīng)網(wǎng)絡(luò)語言模型,該文通常被認(rèn)為是深度學(xué)習(xí)在自然語言處理中應(yīng)用的開始。深度學(xué)習(xí)能夠?qū)?shù)據(jù)進行精準(zhǔn)建模,提高了語言生成精度,基本淘汰了基于統(tǒng)計的語言模型。
1以李偉民為代表的部分學(xué)者認(rèn)為人工智能生成的內(nèi)容能構(gòu)成作品,以王遷為代表的部分學(xué)者則持相反意見。參見李偉民:《人工智能詩集的版權(quán)歸屬研究》,載《電子知識產(chǎn)權(quán)》2019年第1期;王遷:《論人工智能生成的內(nèi)容在著作權(quán)法中的定性》,載《法律科學(xué)(西北政法大學(xué)學(xué)報)》2017年第5期;王遷:《再論人工智能生成的內(nèi)容在著作權(quán)法中的定性》,載《政法論壇》2023年第4期。
1自然語言處理專家丘吉認(rèn)為,經(jīng)驗主義和理性主義應(yīng)該像鐘擺一樣,每隔二十多年來回振蕩一次。參見Church K. A Pendulum Swung Too Far. Linguistic Issues in Language Technology, 2011,6(5).
1人工智能的“涌現(xiàn)”指人工智能出現(xiàn)的出乎意料的新行為和功能,這些行為可能與初始訓(xùn)練目標(biāo)無關(guān),是隱式歸納而不是顯式構(gòu)造的。參見Bommasani R, Hudson D A, Adeli E, et al. On the Opportunities and Risks of Foundation Models. arXiv 2108.07258 [Preprint] April 8, 2024 [cited 2021Aug 16]. Available from:https://doi.org/10.48550/arXiv.2108.07258.