劉洋
這是一個機器寫作迅速發(fā)展并逐漸進入多個文本生成領域的時代。在新聞報道、行業(yè)報告等實用文體上,機器寫作已經(jīng)展現(xiàn)出巨大的潛力,而隨著深度學習等人工智能算法的介入,人們也開始嘗試將其用于一些文學文本的寫作試驗。在我國,文學領域的人工智能寫作較多地集中于詩歌這一文類——既有現(xiàn)代詩,也有古體詩。近年來,一些團隊開始嘗試開發(fā)可用于小說寫作的智能算法,如創(chuàng)新工場的“AI科幻世界”、彩云科技推出的“彩云小夢”等。
上述兩款小說寫作工具,都需要和人進行合作。比如“AI科幻世界”,需要由人給出故事背景和登場的人物,再寫出幾句話作為小說的開頭,程序便可以在這句話之后自動生成4段簡短的文字,作家可以在其中選擇一段,也可以讓程序重新生成,直到出現(xiàn)讓作家滿意的文字為止。選擇出合適的段落后,作家可以對其稍作修改,再讓程序繼續(xù)生成新的文字,如此往復,直到完成整篇小說。從這一寫作模式來看,顯然這些寫作算法還缺乏獨當一面的能力。
當前的文本生成算法普遍使用了GPT(Generative Pre-Training)模型,與其他的深度學習算法相比,其優(yōu)勢在于不依賴于大量的人工標注信息,僅需要在無監(jiān)督的模式下進行學習就可以顯著提升模型的性能。簡單來說,就是讓機器自主閱讀大量的文本,即所謂的預訓練,然后再根據(jù)具體的需求,給它一些現(xiàn)成的文本對模型進行微調(diào)。通過這種方式訓練好的模型,可以寫出合乎語法規(guī)范的句子,甚至可以模仿某個特定作家的文風。但其缺陷也是顯而易見的——缺乏創(chuàng)造性。
在小說創(chuàng)作中,創(chuàng)造性的一個重要體現(xiàn)是情節(jié)的構(gòu)建,即通過敘事過程將一連串合乎邏輯卻又出人意料的事件連綴起來。上述文本生成算法,都不具備篇章級別的情節(jié)統(tǒng)籌能力。因此,如果想要通過此類算法生成故事性較強的文本,必須將其和某些敘事生成算法進行整合。敘事生成研究雖然開始于20世紀70年代,目前也產(chǎn)生了如Interactive Storytelling、MakeBelieve、Fabulist等各種敘事系統(tǒng),但每種算法都有其局限性。例如,Interactive Storytelling是一個以角色為中心的敘事生成系統(tǒng),作者事先設定好故事人物的行為規(guī)劃,然后通過人物的自主交互產(chǎn)生故事,其產(chǎn)生的故事較為機械,靈活性不足。MakeBelieve是基于常識庫的故事生成系統(tǒng),可以產(chǎn)生邏輯性較好的故事,但內(nèi)容通常比較平淡,缺乏戲劇性的故事沖突。因此,如何在機器寫作中自主建構(gòu)富有創(chuàng)造性的情節(jié),仍然是該領域面臨的重大挑戰(zhàn)。
具體到科幻小說的創(chuàng)作上,它又具有一些與傳統(tǒng)的現(xiàn)實主義小說不同的特征,從而進一步加大了機器寫作在這一文類創(chuàng)作上的難度。例如,創(chuàng)作時,科幻作家經(jīng)常創(chuàng)造一些新的名詞,從赫伯特·喬治·威爾斯(Herbert George Wells)創(chuàng)造的“時間機器”,艾薩克·阿西莫夫(Isaac Asimov)的“心理史學”“時空豎井”,到劉慈欣的“宇宙社會學”“二向箔”,等等。這些詞匯,有的是將兩個普通詞語連接在一起,有的則是完全新造的詞匯。這種創(chuàng)造新詞匯的能力,是當前所有機器寫作算法都不具備的。且不說完全新造的詞匯,就是如“時間機器”這樣將“時間”和“機器”進行簡單連接的構(gòu)造,機器寫作也無能為力。我們假設在威爾斯出版《時間機器》(The Time Machine)之前,用一個時間機器將現(xiàn)在的寫作程序和計算機傳輸?shù)侥莻€時代,讓它閱讀當時所有小說乃至所有詩歌、散文、新聞報道、學術(shù)論文等一切文字所組成的語料,它也無法在寫作中創(chuàng)造出“時間機器”這個詞匯,因為在之前的語料中,這種連接從未出現(xiàn)過,因此程序會將這種連接標記為錯誤的、不合規(guī)范的。相反,如果我們啟用一個沒有經(jīng)過任何學習過程的寫作系統(tǒng),讓它隨機地調(diào)取詞匯進行寫作,倒還有可能寫出“時間機器”這類詞匯。換句話說,寫作程序的閱讀學習過程,不僅沒有增加其創(chuàng)造性,反而是一種對創(chuàng)造性逐漸壓制的過程。
退一步說,即使我們?yōu)樗惴ù蛞粋€補丁,讓它可以通過拼接普通詞匯的方法創(chuàng)造新詞,這也是毫無意義的。我們常常嘲笑一個蹩腳的科幻作家,說他們“遇事不決,量子力學”,這是因為他們在作品中動輒在各種詞匯前面加上“量子”二字,比如量子音樂、量子麻醉槍等,卻對此不作任何額外介紹,甚至連一句描述都沒有。顯然,這樣的新詞匯是無法給讀者帶來驚奇感的,因為它們背后沒有系統(tǒng)性的設定作為支撐。同樣,如果在機器寫作中進行了新詞匯的構(gòu)建,那么,它也應該附帶完成一整套的相關設定,這樣才能讓這些新詞匯產(chǎn)生意義。
再者,如果一個作品中引入了若干項設定,這些設定之間還應該彼此協(xié)調(diào)、相互支撐,這就是所謂的世界建構(gòu)。可以說,在科幻作品中,世界建構(gòu)是與情節(jié)設計同等重要,甚至更重要的一項整體性架構(gòu),是體現(xiàn)科幻作品驚奇感的核心依托。對于作品所涉及的新奇世界的設計,在凸顯其驚奇性的同時,也要注重其科學性和邏輯性,同時還要使其與故事情節(jié)、人物等要素相貼合。因此,世界建構(gòu)是大部分科幻作品中作者創(chuàng)造性的集中體現(xiàn),而這顯然也是當前所有機器寫作模型包括敘事生成模型所無法完成的。
說了這么多,那是否意味著科幻創(chuàng)作——特別是科幻作品的世界建構(gòu),是無法由程序和算法來承擔了呢?倒也不用如此悲觀,只不過我們需要特別設計一套用于科幻作品世界建構(gòu)的算法,再將其整合進現(xiàn)有的敘事生成算法和文本生成模型中。就筆者的創(chuàng)作經(jīng)驗來看,在世界建構(gòu)的某些環(huán)節(jié),機器學習的確可以發(fā)揮重要作用。
例如,科幻作家在對虛構(gòu)世界的自然環(huán)境進行推想時,常常需要查閱大量的資料,以考察某一設定會對該世界的哪些部分造成顯著影響。在《重力使命》(Mission of Gravity)里,哈爾·克萊蒙特(Hal Clement)描寫了一個重力極大的星球所具有的生態(tài),科幻電影《阿凡達》(Avatar)則展示了一個富含常溫超導礦物的星球所呈現(xiàn)出的奇特景觀。這類作品的世界建構(gòu)極其復雜,因為它需要用到物理、化學、地質(zhì)學、生物學等各種學科知識。即便作者是某個學科的專家,他也不太可能熟悉所有領域,因此在世界建構(gòu)時往往需要大量時間進行學習。但如果我們引入機器學習的算法,以各個學科的專業(yè)論文為語料庫,在經(jīng)過訓練之后,我們就可以得到一個包含了各學科知識的復雜網(wǎng)絡。這個網(wǎng)絡的節(jié)點就是那些重要的科學概念,比如重力、磁場、大氣等,它們之間的連線則顯示出彼此之間所具有的相互影響。通過這樣的網(wǎng)絡,我們就可以直觀地看到,當某個因素(比如重力)發(fā)生改變時,哪些因素會受到直接影響,而它們又會進一步波及哪些因素。當然,這種算法同樣需要和科幻作家合作,才可以真正完成世界建構(gòu)的工作,但有了它的幫助,科幻作家們無疑會輕松不少,而且很容易在機器學習得到的關聯(lián)網(wǎng)絡中迸發(fā)出創(chuàng)作靈感來。
總體而言,在很長一段時間內(nèi),機器寫作還無法在小說(特別是科幻小說)這類文體上替代人類創(chuàng)作。但正如柯潔在與AlphaGo的棋局中學到了不少新的棋路一樣,科幻作者們也完全可以和機器攜手寫作,并且在機器算法所產(chǎn)生的敘事情節(jié)和世界設定中,激發(fā)出新的創(chuàng)意,創(chuàng)造出前所未有的驚奇場景和絕妙故事。