何承波
11月中旬的某一天,我找來了兩臺帶有語音版ChatGPT的手機,靈光一閃,我想讓它們自行對話。一開始并不順暢,它們只是回答我AI如何跟另一個AI開啟對話。
當其中一個提出,你想跟我來一場模擬對話嗎?我選擇了適時沉默,另一個AI接過了話頭。兩個來自二進制平行宇宙的機器人,成功會晤了。但它們還是謙讓地問了問我感興趣的話題。
我依然選擇沉默。至此,它們便自顧自地聊了起來,關(guān)于技術(shù)如何解放人類,各自暢想著人類解放自身的烏托邦,全然忘了一個人類麻瓜的存在。
它們都有ABC口音,又融合了閩南腔與各種東南亞華人的腔調(diào),非常微妙,會停頓,有斷句、有重讀和變調(diào),語氣會偶爾磕絆一下。它們努力偽裝成人類,適當?shù)胤稿e,以掩蓋自身的呆板性和機械性。
一旁,我的沉默帶著某種眩暈感(Dizziness,克爾凱郭爾語),混合成一種復(fù)雜的心境,是沮喪中的驚奇,也是不安里的敬畏。
過去一段時間,我經(jīng)常聽霉霉說流利的中文、郭德綱用倫敦腔講相聲,我每天收到好幾條不知道真人還是AI的騷擾電話,以及,寫完這篇文章,我還會請AI校對一下。
作為記者、編輯和寫作者,過去一年,大語言模型給我的沖擊,無異于三體人之于農(nóng)場火雞。說人工智能涌現(xiàn)自主意識,我是不信的,說它將取代人類的工作,我一度篤信那僅限于機械勞動。用科幻認知去勾勒被技術(shù)統(tǒng)治的遙遠異托邦,這是人類天性里的自我存續(xù)焦慮。
但我們似乎忽視了近的未來。人工智能對語言、信息和知識的侵蝕和改寫,早已經(jīng)開始了。
試想,某天,我們聽著人工智能版的泰勒·斯威夫特,教你如何忘掉前任、驕傲地活著,又或者,讀著人工智能撰寫的新聞報道和文章,教你如何冷靜地思考、熱情地生活。
多少,有些荒誕了,對吧?還有更驚人的:知識生產(chǎn)進入流水線自動化時代,終有一天,AI生成內(nèi)容,將會擠爆整個互聯(lián)網(wǎng),當它窮盡人類歷史至今所有的數(shù)字化文本,便會逆轉(zhuǎn)“讀—寫網(wǎng)絡(luò)”,進入“寫—寫”時代,猶如脫韁野馬,無休無止地自動書寫。
人工智能主導(dǎo)了知識生產(chǎn),那么,語言與圖像,乃至承載其上的歷史與意義,又將何存?
我們所面對的,是一頭頭張開深淵般大口的巨獸。
人工智能對文本、圖像等數(shù)據(jù)的貪婪,是遠超想象的。自古騰堡以來,人類出版了超過1.25億本書籍,涵蓋法律、詩歌、神話、散文、歷史、論文和小說等。Epoch AI公司估計,數(shù)字化的書籍約有1000萬到3000萬本,囊括數(shù)千億的單詞。毫無疑問,這是屬于人工智能的饕餮盛宴。
但遠遠不夠。技術(shù)的核心,在于迭代、擴張與征服,必然超越此時此地的束縛。
亞馬遜Kindle平臺上,涌入了大量以ChatGPT為“合著者”的作品,AI繪圖正在占領(lǐng)插畫交流平臺PIXIV。全球各地的教師,已經(jīng)開啟了AI論文反偵查的斗爭。
GPT-4,則可能在數(shù)萬億單詞上進行訓練,這足以涵蓋人類數(shù)字化內(nèi)容的大部分(當然低劣文本算不上好的訓練數(shù)據(jù))。
Epoch則預(yù)估,到2027年,ChatGPT會耗光所有高質(zhì)量的訓練材料,屆時可能沒有足夠的新文本供作養(yǎng)分。
人工智能還將在視覺層面不斷進化,識別戴了口罩的人臉,警惕夜間行車的危險,偵察復(fù)雜人體難以發(fā)現(xiàn)的癌細胞等。根據(jù)Villalobos的預(yù)估,在2030—2060年,供訓練的圖像將變得短缺。
但對人工智能而言,這都不是問題。進化中的猴子,手里就有一臺超高效的打字機,且能量無限。它們可以隨心所欲地寫出數(shù)十億本托爾斯泰巨著,也可以生成無數(shù)部希區(qū)柯克電影,最終,它們將創(chuàng)造一個迷宮般的遞歸世界,足夠聰明的人工智能們,將實現(xiàn)自產(chǎn)自“消”、自我飼養(yǎng)、無限循環(huán)。
且不論AI知識產(chǎn)品的優(yōu)劣,我們很容易忽視,互聯(lián)網(wǎng)這個虛擬空間,其實是有容量的,而它的本質(zhì)是一個巨型的內(nèi)容農(nóng)場,存在著暫時還很遙遠的儲存上限。
有限性,必然意味著爭奪。
同樣,我們極少發(fā)問,這些來自自動化機器的知識,源源不斷地輸出,有如數(shù)字洪流,泥沙俱下,多大程度上會擠占那些來自人類智識的產(chǎn)物?
事實上,戰(zhàn)爭已經(jīng)開始。
亞馬遜Kindle平臺上,涌入了大量以ChatGPT為“合著者”的作品,AI繪圖正在占領(lǐng)插畫交流平臺PIXIV。全球各地的教師,已經(jīng)開啟了AI論文反偵查的斗爭。
今年3月,世界知名科幻雜志《克拉克世界》宣布關(guān)閉投稿通道,原因是,在他們收到的700份投稿中,超過500份是AI生成的。同月,知名科技媒體CNET宣布大量裁員,大量記者編輯失業(yè),而在幾周前,這家媒體悄然啟用了人工智能進行撰稿。今年10月剛落幕的好萊塢編劇罷工,持續(xù)了半年,其訴求之一是限制AI,而眾所周知的是,AI已經(jīng)深度介入了好萊塢編劇流水線的各個環(huán)節(jié)。
這點超出了多數(shù)人的認知范疇,人們曾認為,技術(shù)淘汰的是機械重復(fù)的勞作,從而解放生產(chǎn)效率,人類可以更好地從事創(chuàng)意類工作。
但大語言模型正在顯露猙獰的面目,那些人類引以為傲的智力勞動和藝術(shù)創(chuàng)作,通通被其染指。更糟糕的是,在可預(yù)見的未來,知識的生產(chǎn),將進入自動化。
事實上,AI創(chuàng)作,正在堂而皇之地登堂入室。
過去幾年,加拿大作家斯蒂芬·馬奇(Stephen Marche)一直在探索算法小說。
今年9月,他利用人工智能寫出小說《作家之死》。故事里,一位學者被指控謀殺了他研究的作家,后者還卷入了一個AI模型計劃。學者尋找蛛絲馬跡,試圖找出真兇。按照出版商的規(guī)定,這部小說95%為AI完成。馬奇也將署名中的Marche(馬奇),改成了Marchine(機器)—來自AI的建議。馬齊對《作家之死》頗為自信。評論家們有說“非常精彩”“相當不錯”的,也有人客氣地指出,“可讀性達到了一半”。當然,文學閱讀經(jīng)驗豐富的讀者,還是能夠判斷其AI痕跡。
馬奇把自己定義為小說制作人,而不是作家,但他也堅信,制作者們的知識越淵博,理解越連貫,制作出的作品就越好。
在馬奇看來,大語言模型不是救世主,也不是反基督者。從根本上說,它是一個神秘的工具,其令人困惑的缺陷,與其神奇的能力,同樣令人驚訝。
同樣是在今年,老牌雜志《紐約客》也刊登了AI創(chuàng)作的小說—《據(jù)愛麗絲說》(According to Alice),由作家希拉·赫蒂(Sheila Heti)與AI合寫。作家向AI提問,引導(dǎo)AI就故事情節(jié)、敘述及語言風格等方面進行回答,然后作家剔除了自己的問話,重新調(diào)整和剪切AI內(nèi)容,變成一篇關(guān)于宗教、生命創(chuàng)造與輪回的故事。小說中,主人公愛麗絲決定寫一部自己的《圣經(jīng)》。
希拉·赫蒂談到,她并不認為人工智能 “理解”了什么,它只是在造句。而在作家看來,這正是一種令人興奮的自由。
人類有自身的理解模式,我們總善于將所有想法整合進某種框架或結(jié)構(gòu)。這是人類天性使然,是人之為人的獨特性,但也可能是某種限制。而AI并不會去串聯(lián)某種世界觀。
2022年全球票房前十的電影中,每一部,都是千篇一律的續(xù)集。新的音樂也在減少,2021年的美國,老音樂占了市場份額的70%,新音樂的聽眾則大幅縮減。文學也在衰退,現(xiàn)實主義消亡了,文學中的“聲音”已死,“姿勢”取而代之。
關(guān)于AI藝術(shù),我們大抵存在一個基本共識,那不是真正的藝術(shù)。但這種共識并沒有幫助我們守護好藝術(shù)創(chuàng)作的堡壘。相反,黑箱中,AI那巫術(shù)般的魔力,正在吸引無數(shù)創(chuàng)作者以及普羅大眾,改變他們的創(chuàng)作習慣和模式。書寫權(quán)利的讓渡,成了普遍的趨勢。
寫作,或者創(chuàng)作,這種人類最引以為傲的表達,或許會與我們疏遠。
AI創(chuàng)作,最顯而易見的一種爭議在于,人類原創(chuàng)力的衰竭。
2022年全球票房前十的電影中,每一部,都是千篇一律的續(xù)集。新的音樂也在減少,2021年的美國,老音樂占了市場份額的70%,新音樂的聽眾則大幅縮減。文學也在衰退,現(xiàn)實主義消亡了,文學中的“聲音”已死,“姿勢”取而代之。聲音意味著一種與讀者、社會與人類的交流,而文學的姿勢,僅僅是擺出來的腔調(diào),是政治正確、流行話語的時尚單品。
盡管在信息泛濫時代,這是早已有之的趨勢,但AI書寫無疑會加劇這一點。
如果人類最終被毀滅,是毀于核災(zāi)難、洲際導(dǎo)彈還是病原體?是毀于氣候災(zāi)害,抑或智械革命?
今年3月,ChatGPT爆紅之時,美國馬里蘭大學數(shù)字研究教授馬修·基爾申鮑姆在媒體刊文稱,真正毀滅我們的方式,有沒有可能是從文字開始?
我們與文字的關(guān)系,正發(fā)生根本性的變革。大語言模型帶動著其他機器與程序,無休止地發(fā)布文本。簡單、樸素、不加修飾的文字,數(shù)量龐大到難以想象的地步,海嘯般席卷而來。
不管是出于廣告、政治或意識形態(tài)目的,還是單純的惡作劇,如果人們每天發(fā)布數(shù)十億條的自動生成信息,充斥了整個互聯(lián)網(wǎng),與搜索結(jié)果混雜在一起,在社交媒體平臺上傳播,滲入百科詞條,也為未來的機器學習系統(tǒng)提供素材,那么我們很快會發(fā)現(xiàn),人類將面臨一場“文本啟示錄”—機器撰寫的語言將成為常態(tài),而人類撰寫的文章,將成為例外。這是基爾申鮑姆所預(yù)設(shè)的灰色粘質(zhì),也叫“灰霧”,一種假想的末日場景。
早在上世紀90年代,在媒體撰寫流行語詞源學的作家威廉·薩菲爾就預(yù)測,“ 內(nèi)容”將是互聯(lián)網(wǎng)快速崛起的類別之一。他也首次指出,不需要任何真實性、準確性,內(nèi)容就能實現(xiàn)其基本功能—廣告收入。當然還有更黑暗的:人工智能研究人員加里·馬庫斯已經(jīng)證明,大語言模型,可以輕而易舉地生成荒誕扭曲的敘事,并作為大規(guī)模虛假信息的武器,在地緣政治信息戰(zhàn)等領(lǐng)域廣泛運用。
而一年前“一眼假”的生成圖片、視頻和語音,也隨著Midjourney、Stable Diffusion等平臺的迭代,越來越真假難辨。眼下,我們已經(jīng)見識到,AI可以輕易改寫某個名人的訪談,更換他的口型,讓他說出他根本沒說過的話。
文字、圖像、聲音與機器之間,不再有界限??梢源_信的是,人類進入了前所未有的信息白噪聲時代。我們對真實與準確的理解,從此模糊。我們對“理解”的理解,也要重新定義。
人工智能是智能的,原因是,它能創(chuàng)造連貫性。它能理解你的意思,為你寫一首浪漫主義風格的詩歌,再幫你翻譯成英文。但它只是一個模式,它并不理解浪漫主義,也不理解詩歌,甚至不理解中英文詞匯的能指與所指。當然,它只是不能像我們的理解那樣進行理解。
人工智能是另一種“理解”:深不可測的分解與整合。這個深不可測的語言處理過程,預(yù)示著一個被忽視的問題,歷史本身將成為一堆超級計算機的素材,人工智能將隨意從中提取意義、生成意義。對它們來說,人類所有的語言、藝術(shù),都不過是知識的漿糊。
算法文化主導(dǎo)的世界里,技術(shù)將帶來一種深刻的混亂和破碎,人及人的價值,又將何存?
作為記者,我們引以為傲的,是擁有一雙專注的人眼。
比起自動化的機器寫作,那種深思熟慮的長篇報道,是這個行業(yè)的典范。自動化寫作浪潮里,我們依然可以透過人眼,觀察世間,拓下這個世界的肌理與紋路。
相反,大語言模型,只是從文本語料庫中獲取信息,由算法決定下一個詞的出現(xiàn)順序。這本質(zhì)是一種統(tǒng)計學特征,準確預(yù)測了那些看似驚世駭俗的詞句。如果想讓AI告訴你某個事故現(xiàn)場,最好的辦法,是人類準確描寫后,坐在電腦前,手敲一篇文章,輸入進去。AI分解、提取,給你想要的答案。
但我并不確定和自信,如果某天人工智能可以訪問監(jiān)控攝像頭,它是否會比人類得出更全面更詳細的現(xiàn)場描述,會否對事故原因有更準確的判斷?
在創(chuàng)作中與他人建立聯(lián)系,想象遙遠的人、陌生的人的生活,并與之產(chǎn)生共鳴,這是人類道德想象力的一部分,不應(yīng)當被剝奪,也不可以主動讓渡。
新聞出版行業(yè)的記者、編輯,本質(zhì)也是知識生產(chǎn)者。只是,相比巨型的知識機器,人,似乎顯得貧乏和無知。相比其自動生成的高效性,我敲下這篇文章時,似乎更接近一種原始而古老的勞作。
在知識的流水線自動化時代,在泥沙俱下的數(shù)字洪流里,我們被打回了原形—編輯記者,褪去智力勞動和鐵肩道義的光環(huán),本質(zhì)依然是信息與知識的苦力勞動者。
就像工業(yè)革命后,自動化機器進入了紡織工廠,技術(shù)工人大量失業(yè)。抵抗這一趨勢的“盧德主義”,應(yīng)運而生。盧德分子(Luddite),也被認為是無知者、泥腿子、進步的阻礙者。1812 年,一封來自盧德內(nèi)部的信,是這樣描述其使命的: 反對一切有損共同利益的機器。
美國作家布賴恩·莫森特今年出版的《機器之血:反抗大型科技公司的起源》,回顧了那個破壞機器將被處以死刑的年代。無數(shù)盧德分子,以鮮血的代價,依靠增強自身力量,改變了屬于他們的未來,贏得了更好的工作條件。但站在歷史的視角,盧德運動并沒有拽住工業(yè)化的腳步。而今天,它更加勢不可當。
這是我的不安。
敬畏在于,作為知識的苦力勞動者,寫作者們也許會更加清晰地意識到,站在人的尺度,而不是統(tǒng)計學與概率論的尺度,探索人與世界的紛繁復(fù)雜,是艱巨的,也是應(yīng)當審慎的。
AI提供知識,真假莫辨,準確更是奢求。當然,機器與程序有糾錯機制,數(shù)據(jù)、代碼的更新,會減少它們的紕漏。但無論如何,它并不提供答案本身,它提供的,是一個答案的標識。
新聞也好,其他形式的寫作也罷,不提供答案,而是提供有關(guān)答案的追尋。這其中,蘊含著某種經(jīng)驗、情感,或者真理性的東西,它無法被壓縮成雜亂而冰冷的數(shù)據(jù)。
回到語言與文字,“手工寫作者”,依然有無法被替代的地方,那便是,身為答案追尋者,我們身上懷有某種“世界缺失或享有某些東西”的強烈感覺。
在創(chuàng)作中與他人建立聯(lián)系,想象遙遠的人、陌生的人的生活,并與之產(chǎn)生共鳴,這是人類道德想象力的一部分,不應(yīng)當被剝奪,也不可以主動讓渡。