国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)智、翻譯與數(shù)字人文研究的“任務(wù)”

2024-05-25 16:10:05華東師范大學(xué)袁筱一
外語教學(xué)理論與實踐 2024年1期
關(guān)鍵詞:數(shù)智任務(wù)外語

華東師范大學(xué) 袁筱一

華東師范大學(xué) 甘 露

提 要:隨著數(shù)智時代的到來,大語言模型對包括外語學(xué)科在內(nèi)的人文研究產(chǎn)生了深刻的影響,在大語言模型相對傳統(tǒng)機器翻譯取得了巨大進步的前提下,本文從文學(xué)的根本問題出發(fā),闡釋了作為拓展語言處理可能性工具的大語言模型的“模仿”本質(zhì),重新審視人文研究在數(shù)智時代的生存境遇,提出了未來數(shù)字人文研究應(yīng)該關(guān)注的問題,最后從語言之于人類的意義、數(shù)字人文研究的跨學(xué)科視野、對人類理性的再思考、數(shù)字人文的人文依歸出發(fā),指出了數(shù)字人文研究的人文本質(zhì),旨在就大語言模型與包括外語學(xué)科在內(nèi)的人文學(xué)科未來發(fā)展之間的關(guān)系以及文學(xué)翻譯研究的方向提供思考與研究借鑒。

一、 引言

自然語言處理技術(shù)的飛躍、ChatGPT與其他各種類型的大語言模型以及專業(yè)語言模型的研發(fā)和大規(guī)模使用標(biāo)志著人類進入數(shù)智時代,幾乎對所有行業(yè)產(chǎn)生了顛覆性的沖擊,教育首當(dāng)其沖。在《GPT時代人類再騰飛》一書中,作者里德·霍夫曼(Reid Hoffman)援引德克薩斯大學(xué)奧斯汀分校史蒂文·明茨(Steven Mintz)教授的一篇專欄文章,展現(xiàn)了教育如何被一系列技術(shù)所改變:“就像谷歌降低了人們對堅不可摧的記憶力的依賴,電子計算器加速了復(fù)雜數(shù)字運算,維基百科取代了紙質(zhì)百科全書,在線數(shù)據(jù)庫降低了人們對龐大實體圖書館的依賴,ChatGPT等平臺同樣也將深刻改變?nèi)祟愖钫湟暤募寄??!?里德·霍夫曼,2023: 26)

可以想象,在高等教育的各個學(xué)科領(lǐng)域中,以外語教學(xué)和翻譯為基礎(chǔ)發(fā)展而來的外語學(xué)科會受到怎樣的沖擊。與其他學(xué)科領(lǐng)域相比,大語言模型帶來的不僅是研究范式上的顛覆,更是直擊外語學(xué)科的根本。依賴于深度神經(jīng)網(wǎng)絡(luò)技術(shù)發(fā)展的大語言模型能夠借助“運算”在跨語際實踐中初步替代經(jīng)過較長時間才能系統(tǒng)習(xí)得語言知識的“外語人”,這已經(jīng)是不爭的事實。因此,對于外語學(xué)科來說,不僅僅是傳統(tǒng)研究內(nèi)容和研究范式需要應(yīng)變的問題,而且是學(xué)科存在的合理性與合法性受到了前所未有的質(zhì)疑,尤其是外語學(xué)科工具理性的那一部分價值。

*本文從大語言模型擅長完成的“任務(wù)”出發(fā),考察大語言模型為語言實踐和人文研究帶來的具體問題和挑戰(zhàn),試圖就大語言模型與包括外語學(xué)科在內(nèi)的人文學(xué)科未來發(fā)展之間的關(guān)系給出自己的思考。

二、 大語言模型的“創(chuàng)造性”與外語學(xué)科的“危機感”

翻譯毫無疑問是外語學(xué)科最為傳統(tǒng),同時也是最為重要的“陣地”。在外語學(xué)科的人才培養(yǎng)體系中,有相當(dāng)一部分也是以高端翻譯人才為培養(yǎng)目標(biāo)。因而,大語言模型的橫空出世似乎在一夜之間就消解了作為職業(yè)而存在的翻譯,以翻譯人才為培養(yǎng)目標(biāo)的外語專業(yè)也隨之遭遇危機。事實上,早在大語言模型之前,學(xué)習(xí)型的翻譯軟件在某種程度上已經(jīng)顛覆了我們對于機器翻譯“邊界”的認(rèn)知。與微軟小冰在創(chuàng)作上的“成就”相似,這一類的人工智能翻譯軟件都擁有海量的知識數(shù)據(jù)庫。正如肖杰在《從“微軟小冰”探討人工智能的前景與未來》一文中所總結(jié)的,我們可以將這類語言處理軟件的運作過程簡化為通過相對專門的語料“對大數(shù)據(jù)進行再加工”,對人類某一種具有創(chuàng)造性的“語料(例如情感)進行偵測,跟蹤并判斷”,“再與知識庫進行匹配,從而實現(xiàn)類似的”語言實踐活動(肖杰,2018: 10)。至此,機器在語言實踐這一主體性行為上邁出了一大步,也揭示了更具“創(chuàng)造性”的語言處理模式的可能性。

我們不妨把大語言模型理解為對語言處理可能性的進一步拓展。它的應(yīng)用范圍更廣,所接受的數(shù)據(jù)訓(xùn)練量也更大,而不是僅限于對某一種語料“進行偵測,跟蹤并判斷”。據(jù)《ChatGPT的運行模式、關(guān)鍵技術(shù)及未來圖景》一文所述,ChatGPT“在有3 000億單詞的語料上預(yù)訓(xùn)練擁有1 750億(GPT-4已經(jīng)達到了100萬億)參數(shù)的模型”,因此,它展示了三種強大的能力,“一是語言生成能力”,“二是上下文學(xué)習(xí)能力”,“三是世界知識能力”(朱光輝等,2023: 117)。跨語際的信息轉(zhuǎn)換當(dāng)然不是ChatGPT等大語言模型唯一的突破性功能,但就實踐體驗而言,它的確因為龐大的數(shù)據(jù)以及所謂的“世界知識能力”而在翻譯上展現(xiàn)出更高的完成度,其語言生成也更加“自然”。

的確,經(jīng)過不同學(xué)習(xí)型翻譯器以及大語言模型的實驗,雖然在不同類型文本翻譯上的表現(xiàn)不盡相同,但總的說來,相較于傳統(tǒng)的翻譯軟件或機器翻譯,能力較高的大語言模型的進步還是可圈可點(1)在一門與文學(xué)翻譯主體的研究項目相關(guān)的課程上,我們分別運用德國公司DeepL翻譯器、訊飛星火、GPT-3.5及GPT-4進行翻譯實驗。翻譯實驗的主要對象為文學(xué)文本,涉及英漢、法漢等語言間翻譯。如果以錯誤率為翻譯質(zhì)量標(biāo)準(zhǔn),翻譯能力從低到高分別為訊飛星火、DeepL、GPT-3.5/4,而GPT-3.5與GPT-4在翻譯能力上相差不多。。其“創(chuàng)造力”主要表現(xiàn)在三個方面: 首先,得益于“世界知識能力”,大語言模型出錯相對更少,尤其是GPT-3.5或GPT-4。特別是在文學(xué)翻譯中,大語言模型能力較好,并因擁有更為龐大的語料而具備追溯詞源、準(zhǔn)確釋義的能力。GPT的語料主要來自Common Crawl、WebText等語料庫,還有一部分來自書籍和報刊雜志,另有一小部分來自維基百科,這就使得大語言模型在很多時候可以實現(xiàn)一部分需要參照不同時代、不同地區(qū)的文化知識才能完成的理解。其次,大語言模型的“上下文學(xué)習(xí)能力”也的確為它提供了一定的邏輯判斷能力。我們可以觀察到,傳統(tǒng)的翻譯軟件更趨向作為方法的直譯,這并不是因為傳統(tǒng)的翻譯軟件更加秉持直譯的立場,而是它無法完成闡釋所要求的復(fù)雜程序,從而只能夠完成相對直接的語義意義的翻譯。大語言模型卻可以在有限的范圍內(nèi),對于具有鮮明文學(xué)標(biāo)記的影射、隱喻以及與前置詞有一定距離的代詞進行理解與判斷,并傳遞相對正確的意義。最后,在翻譯的再表達階段,我們也能夠發(fā)現(xiàn),大語言模型不僅能夠在多義之中進行選擇,也表現(xiàn)出一定的邏輯推理和綜合判斷能力,因而在翻譯的過程中出現(xiàn)了較為明顯的刪減或是增譯。

事實上,盡管誠如霍夫曼所言,GPT-4,即GPT的最新一代仍然“既非無所不知,也非絕對可靠”,離“具備與人類類似的常識推理能力和自我意識”(里德·霍夫曼,2023: 20)的程度差得很遠(yuǎn),但我們?nèi)匀粸榇笳Z言模型的闡釋能力感到震驚。這是否意味著“人工智能”在語言的使用上不僅能夠模仿人類的智能,甚至能夠超越人類的智能?畢竟人類個體大腦對于知識的存儲能力離100萬億單詞的容量相去甚遠(yuǎn)。至今還給人類留下一絲僥幸的地方在于,由于算力的限制,目前大語言模型在“上下文學(xué)習(xí)能力”方面還有較多限制。在文學(xué)翻譯中,一旦文本的各種能指或所指層面的深層網(wǎng)絡(luò)超出了2 000詞的范圍,大語言模型仍舊顯示出一定的能力不足。這使得即便是能力較高的大語言模型的錯誤率仍然高于文學(xué)翻譯的行業(yè)標(biāo)準(zhǔn)。但技術(shù)樂觀派和人文悲觀派都不懷疑,算力的提高是遲早的事情,并且在未來會呈幾何倍數(shù)增長。因此接下來,只要再加強訓(xùn)練,機器在文學(xué)翻譯上甚至能夠顯示出更多的自主性和創(chuàng)造性或許也是指日可待的事情。

在大語言模型出現(xiàn)并得到廣泛應(yīng)用之前,文學(xué)翻譯或許是與外語學(xué)科諸多關(guān)聯(lián)領(lǐng)域中最后的“圣地”。究其原因,恰恰與“創(chuàng)造性”有關(guān)。此前,并不完全了解技術(shù)進展的人文學(xué)者天真地認(rèn)為,人類的主體性是無法定量的,從而也無法被機器征服。而這一想法在被以Alpha Go為轉(zhuǎn)折點的人工智能領(lǐng)域的發(fā)展顛覆之后,人文學(xué)者在震驚之余,幾乎全部以“成見性反對”的態(tài)度來應(yīng)對。誠如文學(xué)翻譯一般,人類最富創(chuàng)造性的“圣地”——例如繪畫、音樂或文學(xué)創(chuàng)作——都有淪落的危險。于是,2023年10月,包括奧爾加·托爾卡爾丘克、安妮·埃爾諾、本杰倫、蕾拉·斯利瑪尼、讓-菲利普·圖森等著名作家在內(nèi)的藝術(shù)家們在法國《解放報》上聯(lián)合簽名發(fā)表聲明,“明確要求”“出版社、字幕、譯制及畫外音技術(shù)服務(wù)提供商、影視制作及發(fā)行商、游戲工作室以及新聞機構(gòu)拒絕把人工智能用作翻譯和一切藝術(shù)作品及文本的工具”,因為“翻譯行為是人類的行為。這樣的行為要求的是經(jīng)驗,是思考,是感覺,是風(fēng)格的創(chuàng)造,而不是基于大數(shù)據(jù)基礎(chǔ)的機器的復(fù)制行為”(2023年10月4日,Libération第17版)。如果說邊界守不住了,那就需要人為設(shè)置界限。

但是,我們可以進一步思考的問題是,大語言模型的“創(chuàng)造性”真的給人類專有的創(chuàng)造性領(lǐng)域帶來了危機嗎?或者,危機只是我們的感覺而已?大語言模型的“創(chuàng)造性”究竟如何定義?大語言模型的“創(chuàng)造性”與人類的“創(chuàng)造性”毫無分別,甚至是替代關(guān)系嗎?

三、 大語言模型的“創(chuàng)造性”實質(zhì): 一個基于文學(xué)本質(zhì)的回答

在聽?wèi){自己被危機感淹沒之前,我們首先還是需要回到“文學(xué)是什么”以及“語言是什么”的老問題上來。這就告訴我們,和外語學(xué)科相關(guān)的文學(xué)研究、文學(xué)理論研究以及語言研究并非是無意義的。在數(shù)智時代,基礎(chǔ)研究為我們提供的一些思考與結(jié)論或許才真正能夠幫助我們部分消除作為人類的“危機感”。

“文學(xué)是什么”以及“語言是什么”當(dāng)然是個大問題。我們在此不必走得太遠(yuǎn)。薩特在《什么是文學(xué)?》中用最簡單的話語告訴我們,“畫家不是想在畫布上繪制符號,他是要‘創(chuàng)造’一種東西”,雖然在持寫作介入觀的薩特看來,寫作的指向遠(yuǎn)比其他藝術(shù)行為的指向更加明確——藝術(shù)也的確是寫作的一種形式——但是他關(guān)于藝術(shù)的元素與將藝術(shù)元素“組合”在一起的表述更有助于我們參透“創(chuàng)造”的實質(zhì): 藝術(shù)家將這些元素放置在一起,用“動機”,或者說“靈魂”加以串聯(lián),創(chuàng)造出有別于元素物質(zhì)的新事物,后者是屬于想象域的,“從不(直接)表達他(藝術(shù)家)的憤怒、焦慮或喜悅: 它們滲透在作品中;雖然它們已經(jīng)滲透在那些本身已經(jīng)具有某種意義的色調(diào)中,但藝術(shù)家的情感卻變得模糊而晦暗,沒有人能完全辨認(rèn)出它們”(Sartre, 1948: 15)。在這一段關(guān)于藝術(shù)的表述里,薩特道出了藝術(shù)(語言)創(chuàng)作的三個特征: 一是藝術(shù)創(chuàng)造取決于藝術(shù)調(diào)用的元素,如色彩或者文學(xué)中的詞語,同樣取決于這些文字的“組合”;二是“靈魂”是新的“事物”生成的關(guān)鍵,藝術(shù)家在“靈魂”的驅(qū)動下,借助藝術(shù)創(chuàng)作的“動機”將他可以調(diào)用的元素符號進行組合和轉(zhuǎn)換,生成為其“想象之物”;三是“動機”一旦落入符號里,成為“想象之物”,它會變得“模糊而晦暗”。這三個特征既決定了包括文學(xué)翻譯在內(nèi)的藝術(shù)創(chuàng)造的本質(zhì),也充分展現(xiàn)了從本身具有意義的符號到藝術(shù)家“想象之物”的過程。雖然變得“模糊而晦暗”的“動機”并不是我們閱讀、觀看或者聆聽藝術(shù)創(chuàng)造時要追尋的唯一目標(biāo),但它決定性地參與到創(chuàng)造的過程中,也是讀者、觀眾和聽眾在理解藝術(shù)創(chuàng)造時重要的參照。

在對文學(xué)藝術(shù)創(chuàng)造的本質(zhì)有所理解之后,我們就能夠更好地理解大語言模型在“創(chuàng)造性”上的進展。相較于傳統(tǒng)的翻譯軟件,無論是學(xué)習(xí)型的翻譯軟件,還是大語言模型,解決的都是藝術(shù)創(chuàng)造第一個本質(zhì)層面的問題,即從理解符號本身的意義到理解組合之后所產(chǎn)生的意義,并且不僅限于規(guī)則性的理解。這就是所謂的“上下文學(xué)習(xí)能力”。

“模型”這個詞本身也很好地說明了大語言模型創(chuàng)造性的實質(zhì)與依據(jù)。在我們所討論的問題領(lǐng)域里,大語言模型的文本翻譯與文本創(chuàng)作主要是基于大規(guī)模參數(shù)的計算。參數(shù)、算法、模型,這些都是當(dāng)代語言學(xué)熟悉的語匯。喬姆斯基闡述他的普遍語法的概念時提到“詞項的屬性包含參數(shù),所以,參數(shù)很可能是詞匯性的,很可能是詞匯的一小部分。除了詞項的問題,還有表達式如何構(gòu)成的問題……你所構(gòu)建的語法體中包含一些和進一步運算相關(guān)的信息”(喬姆斯基,2015: 52)。也就是說,以詞語為單位進行參數(shù)的運算,建立在有效地排除在語言使用上的任選項從而留下必須項的基礎(chǔ)上。大語言模型所謂的創(chuàng)造性就是在必須項之上,增加了任選項的部分。但是大語言模型生成的任選項在某種程度上是沒有“動機”的,它只能夠依據(jù)在海量的數(shù)據(jù)庫中發(fā)現(xiàn)的微弱關(guān)聯(lián)來模仿個人主體通過詞語符號的組合生成其“想象之物”的過程。

在語言的實現(xiàn)過程中,模型是可以想象的。依據(jù)的語料庫越小,模型也就越少。大語言模型的重大飛躍之一就在于不斷突破語料的容量,而不再像以往一樣局限在有限的專業(yè)語料中。語言模型的這一發(fā)展趨勢與文學(xué)發(fā)展變化之間具有雙重關(guān)系。一方面,從參數(shù)有限的專業(yè)語言模型到參數(shù)不斷增加的“大語言”模型的轉(zhuǎn)變讓我們看到了大語言模型完成包括文學(xué)翻譯在內(nèi)的文學(xué)藝術(shù)創(chuàng)作的可能性。文學(xué)是什么?不同的文學(xué)在各自的語言環(huán)境中產(chǎn)生之后,經(jīng)過語內(nèi)與跨語際的翻譯,經(jīng)過不同文學(xué)觀念的錘煉,文學(xué)就是真正意義上的“大語言”。貝爾曼在批評“民族中心主義翻譯”的時候,談到“非韻文翻譯最為尖銳的‘問題’,就是所有的非韻文都具有一個鮮明的特征,那就是都或多或少地將不同的語言疊加在一起”,都具有“多樣的聲音”(Berman, 1999: 66)。非韻文(prose)本身就具有多種體裁,例如隨筆、小說、學(xué)術(shù)寫作等等。然而從20世紀(jì)開始,體裁邊界的模糊、事實敘事與虛構(gòu)敘事的模糊等等使得一切皆成為文學(xué),也使文學(xué)語言離我們?nèi)粘I钪械摹按笳Z言”越來越近。但是另一方面,離“大語言”越來越近,也就意味著需要抽離的“模型”越來越多,因為與算力同步增長的是語言個人使用的不斷積累。就像喬治·斯坦納在《巴別塔之后》中所說的,“語言……是赫拉克利特式流變的最典型例子,它每時每刻都在變化。每次新的語言活動不僅能夠增加語言活動的綜述,還能為其制定標(biāo)準(zhǔn)”(斯坦納,2020: 23)。

我們在使用大語言模型時,對其“模型”的確深有體會。模型的意義在于完成完美的模仿,而非創(chuàng)造。這與文學(xué)的“任務(wù)”恰恰背道而馳。如果撇開翻譯不談,大語言模型最擅長的是對其掌握的知識進行綜合。在霍夫曼的《GPT時代人類再騰飛》中,最令人印象深刻的是該書第九部分“可能的訪談”。作者要求GPT-4代入多個現(xiàn)代社會中的公共知識分子,編造一段他們可能進行的“訪談”,以展示GPT-4在個性化創(chuàng)造上的能力。GPT-4的確能夠在綜合這些公共知識分子的話題、觀點與語言風(fēng)格后,成功地完成代入和對話。然而這一嘗試仍然沒有離開“模型”的基本意義。換句話說,即便是最令我們感到擔(dān)憂的個人情感和風(fēng)格的“創(chuàng)造”,大語言模型做的仍然是模仿。而一個想要在歷史上留下自己作品并且證明自己價值的小說家、詩人或者藝術(shù)家,他們要做的事情則是基于前人已有的創(chuàng)造,完成完全不同的個人創(chuàng)造。前人的創(chuàng)造既是基礎(chǔ),更是他們要避開的“模型”。當(dāng)他們完成了自己的創(chuàng)造之后,他們的作品或者對語言藝術(shù)符號的使用方式也將成為后人需要避開的“模型”。

四、 未來人文研究的新“任務(wù)”

1. 人工智能對人文研究提出的新問題

如果我們能夠同意上述的分析結(jié)果,即大語言模型的創(chuàng)造與文學(xué)藝術(shù)的創(chuàng)造是完全不同的創(chuàng)造,或許我們就不會再為包括文學(xué)翻譯在內(nèi)的文學(xué)藝術(shù)是否會受到人工智能威脅之類的問題所困擾。但是,這并不意味著我們可以安心地告慰自己,奇點時代不會來臨,人類仍然可以憑借其獨特的創(chuàng)造力而繼續(xù)存活下去。

事實上,以大語言模型為標(biāo)志的人工智能的飛躍性發(fā)展的確需要我們重新審視人類在數(shù)智時代的生存境遇。人工智能威脅到的并不是包括語言實踐在內(nèi)的人類實踐活動本身,而是人的思想生產(chǎn)方式。更為具象地說,與其擔(dān)憂或有一天會被大語言模型或是學(xué)習(xí)型翻譯器取代的文學(xué)翻譯的未來,還不如擔(dān)憂為締造人類文明做出無窮貢獻的人文研究——文學(xué)、歷史、哲學(xué)或者語言學(xué)研究等的未來。

不同領(lǐng)域的學(xué)者各自從自身的領(lǐng)域出發(fā),對人工智能為本領(lǐng)域研究帶來的新環(huán)境、提出的新問題以及潛在的負(fù)面影響都有所思考。例如外語學(xué)科的學(xué)者認(rèn)為,大語言模型有可能使得語言學(xué)習(xí)者在新的外語學(xué)習(xí)環(huán)境中“降低跨文化交際環(huán)境”“削弱人與現(xiàn)實的交流和溝通”“阻礙批判性思維發(fā)展”等(張震宇,2023: 41);哲學(xué)領(lǐng)域的學(xué)者則更聚焦于“在人工智能等新科技條件下的人類生存境遇”(藍江,2023: 12)等。而教育學(xué)的專家則在肯定“ChatGPT技術(shù)走向?qū)嵱脼槲覀儷@取知識提供了便利”的同時,也擔(dān)心大語言模型的過度使用“會導(dǎo)致學(xué)生滿足于現(xiàn)成答案,缺乏問題意識和批判精神,助長學(xué)生求知惰性”(鐘秉林等,2023: 5)。歸結(jié)起來,面對ChatGPT這一類的大語言模型,人文學(xué)者的主要擔(dān)憂在于以下三個方面:

首先是批判思維的喪失和因此所導(dǎo)致的思想的日漸貧瘠。事實上,最大的問題不在于大語言模型模仿人類或是替代人類做了什么,或是在未來能夠模仿或者替代人類做什么,而是以“模型”的思維方式對人類思想的產(chǎn)出進行反規(guī)約。藍江(2023: 17)認(rèn)為,“ChatGPT并非客觀中立的產(chǎn)品,意識形態(tài)問題一定會通過某種形式體現(xiàn)其中,即生成式人工智能具有明顯的意識形態(tài)傾向”。ChatGPT的誕生與網(wǎng)絡(luò)環(huán)境密不可分,它所產(chǎn)出的知識綜合未經(jīng)人類的檢驗與反思就已經(jīng)開始傳播,這加劇了人文研究領(lǐng)域動輒變成意識形態(tài)陣地的現(xiàn)實。但是人類文明的進步依靠的是多樣文明彼此間的互相理解與共生,而不是各自所認(rèn)為的唯一真理之間的相互斗爭與替代。對現(xiàn)成的知識綜合,對以“科學(xué)”面目出現(xiàn)的所謂權(quán)威信息不加思考的接受必然導(dǎo)致人類社會集體性的盲從。與我們想象的正相反,科學(xué)技術(shù)的發(fā)展、全球化時代的傳播便利與人類思想的豐富并不見得成正比。

其次是對所謂人工智能“研究成果”與實踐成果的無條件信任所導(dǎo)致的錯誤判斷。大語言模型依靠海量數(shù)據(jù)實現(xiàn)了對于不同項之間微弱關(guān)聯(lián)的發(fā)現(xiàn)以及在此基礎(chǔ)上的生成,但是我們不難發(fā)現(xiàn),數(shù)據(jù)本身的可靠性難以甄別,而且大語言模型所發(fā)現(xiàn)的“微弱關(guān)聯(lián)”具有不可靠性。這種不可靠性更在于大語言模型為了維持?jǐn)⑹碌囊回炦壿嬌踔習(xí)a(chǎn)生捏造事實的行為,其典型表征就是在產(chǎn)出論文時的假文獻現(xiàn)象?;舴蚵?2023: 170)曾經(jīng)提到,“在特定情境下,大語言模型生成非事實性信息的能力可能非常有用”,這種能力與人類的“想象力”類似。這一說法是值得商榷的。這并不是非事實性信息本身的問題,而是非事實性信息會被當(dāng)成事實性信息來接受的問題。人類世界當(dāng)然不是唯一真理的世界,但是人類世界進步的前提是對真理的追求,而不是對“自圓其說”的追求。

另一點則是形式對于內(nèi)容的反作用力所導(dǎo)致的思想生產(chǎn)的單一化、扁平化。教育工作者普遍擔(dān)憂大語言模型的無度使用會影響到教育生態(tài)和評估的公平性,并因此造成學(xué)生的思想惰性。這并非杞人憂天,而且也已經(jīng)有了堅實的土壤。其實早在大語言模型誕生之前,搜索引擎、全民參與編撰的電子百科等工具就已經(jīng)改變了人類思想的生產(chǎn)方式。過于強調(diào)知識而非思想的作用、思想生產(chǎn)的方法體系、由形式帶來的整體性,例如所謂跨學(xué)科研究的形式,從而忽略了真正的整體視野、更傾向于思想的碎片化生產(chǎn)等等,這些都是新世紀(jì)以來人文研究的典型負(fù)面特征。大語言模型依賴的語料特征具有明顯的共時特征,因而基于同時代這些學(xué)術(shù)生產(chǎn)與思想生產(chǎn)的大語言模型生產(chǎn)也在某種程度上排除了思想史在純粹內(nèi)容之外的寶貴遺產(chǎn)。趨于統(tǒng)一的形式必將帶來趨于統(tǒng)一的內(nèi)容。

上述種種并非完全是大語言模型為人文研究造成的新問題,而是大語言模型進一步凸顯了人文研究早已悄然邁入的困境。這也提醒我們?nèi)ニ伎?當(dāng)人文研究面對數(shù)智時代人類的新處境時,究竟應(yīng)該做些什么才能夠不要那么快地落在科技進步為人類布下的陷阱里,才能用好科學(xué)技術(shù)的發(fā)展,讓大語言模型這樣的數(shù)智工具能夠真正成為人類文明進步的助力。

2. 人文研究對時代的回應(yīng): 數(shù)字人文的發(fā)展及其問題

很多人文學(xué)者對“數(shù)智時代人文何為”提出了自己的看法,數(shù)字人文的興起就具體體現(xiàn)了人文研究試圖走出自身困境、面對社會發(fā)展的一種努力。早在上世紀(jì)后半葉,以計算人文為起點的數(shù)字人文就已經(jīng)崛起,其發(fā)展過程中的主要貢獻是通過建設(shè)專門的數(shù)據(jù)庫和語料庫,用于以往更偏重于定性手段的文學(xué)、語言學(xué)、翻譯學(xué)、歷史學(xué)等人文及社會學(xué)科的研究。

當(dāng)然,就目前而言,數(shù)字人文的發(fā)展或許并不盡如人意。如果說數(shù)字人文有三個層面的研究,即數(shù)據(jù)集的建立、數(shù)字工具在人文研究上的使用以及人文對數(shù)智時代的反思,發(fā)展了半個多世紀(jì)的數(shù)字人文仍主要集中在第一個層面,即數(shù)據(jù)集的建立,或是基于數(shù)據(jù)集(語料庫)的文本挖掘與開發(fā)。以翻譯研究為例,在很長的時間里,數(shù)智視域之下的翻譯研究主要停留在“語料庫翻譯學(xué)研究階段和文本數(shù)據(jù)挖掘技術(shù)應(yīng)用階段”,即便是在文本數(shù)據(jù)挖掘技術(shù)應(yīng)用上,也主要是將數(shù)字當(dāng)作一種定量工具來使用,存在著“研究平臺單一、研究方法不夠多樣、理論框架尚未構(gòu)建等問題”(胡開寶,2022: 113)。

不僅是在與語言密切相關(guān)的翻譯領(lǐng)域,在文學(xué)、歷史、哲學(xué)等研究中,數(shù)字人文也存在著類似問題。人文研究領(lǐng)域這些年在數(shù)字人文方面的主要成果在于建立專門的數(shù)據(jù)集,或是基于數(shù)據(jù)集的定量研究,或是將研究結(jié)果從單純的文本呈現(xiàn)轉(zhuǎn)化為可視化的呈現(xiàn)等。相較于傳統(tǒng)的人文研究積累,借助數(shù)字工具所完成的研究還遠(yuǎn)未能揭示出人類在數(shù)智時代的新境遇以及給出人類有可能的應(yīng)對。

當(dāng)然,我們也不能認(rèn)為人文學(xué)者在數(shù)字與技術(shù)發(fā)展面前是一味被動的。莫萊蒂(Moretti)的“遠(yuǎn)讀”理論在很大程度上就是基于數(shù)字人文提出的一種新研究范式和理論視角。雖然“遠(yuǎn)讀”理論本身備受爭議,似乎更像是人文學(xué)者想要擁抱這個數(shù)智時代的徒勞,但就其結(jié)果而言,或許也是數(shù)字人文發(fā)展到今天最受關(guān)注的方向之一。

鑒于此,如果說大語言模型是數(shù)字進入語言世界,從而進入人類思想生產(chǎn)領(lǐng)域的一個具有轉(zhuǎn)折標(biāo)志的事件,我們認(rèn)為,包括外語學(xué)科學(xué)者在內(nèi)的人文學(xué)者在這樣一個數(shù)智時代全面來臨之際,在未來的數(shù)字人文研究中應(yīng)該關(guān)注以下四個方面的問題。

首先,倘若進入20世紀(jì)以來,我們在不自覺中都接受了語言作為人類的“居所”這樣一個前提條件,人類的居所在數(shù)智時代是否已經(jīng)或者將在未來遭遇重大的改變?這個核心問題可能會轉(zhuǎn)化為多個研究的具體問題,例如從文本角度,人類的語言使用是日趨豐富還是日趨貧瘠?而莫萊蒂的研究不僅適用于18或者19世紀(jì)歐美小說在數(shù)量上或者主題上的變化描述,從18世紀(jì)(或者更早)到今天的文學(xué)語言的變化也更應(yīng)該是考察的對象。

第二,數(shù)字人文的研究應(yīng)該具有跨學(xué)科的意識和視野。人文研究中的問題,如果只是單純依賴數(shù)字工具本身,其實并不能夠得到真正有效的回答。即使我們能夠得到一些統(tǒng)計數(shù)據(jù),數(shù)據(jù)本身也不見得就可以代表規(guī)律、趨勢。這就是為什么對于目前數(shù)字人文研究的結(jié)果我們總是覺得有一些牽強,甚至可笑。例如對所謂文本真?zhèn)蔚蔫b定——所有的文本都與其作者,與其產(chǎn)生的社會、歷史與地理不可分割。數(shù)智時代是和(逆)全球化時代、網(wǎng)絡(luò)時代一起到來的,而直到目前為止,或許數(shù)字人文的諸項研究中還未能產(chǎn)生具有范式意義的定量、定性相結(jié)合的標(biāo)識框架,以對如何有效描述目前的世界體系提出自己的思考。

第三,人工智能在某種程度上促使我們重新思考人類的理性。事實上,早在數(shù)字時代來臨之前,人文研究就已經(jīng)破除了線性思維的神話,在人文研究的各個領(lǐng)域都自我革新了范式。我們完全贊同藍江所引述的卡倫·巴拉德對于衍射現(xiàn)象和量子糾纏認(rèn)識論的解釋,在物理學(xué)中,“對衍射(干涉)現(xiàn)象的研究提供了關(guān)于量子態(tài)糾纏本質(zhì)的見解……它們更深刻地突出、展示和證明了世界不斷變化和偶然的本體論的糾纏結(jié)構(gòu),包括認(rèn)識的本體論。事實上,衍射不僅揭示了糾纏的現(xiàn)實,它本身就是一種糾纏現(xiàn)象”(藍江,2023: 16)。雖然可以說人文研究對“糾纏”早就有所感知,但在進入數(shù)智時代的今天,它卻并沒有致力于描述“不斷變化的世界”和歷史主體(人文思想的創(chuàng)造者)“偶然性”之間的關(guān)系。

最后一點,同時也是我們想作為結(jié)論的一點,就是人文研究絕不可以忘記,數(shù)字人文最終的依歸是人文而非數(shù)字。誠然,想象未來的數(shù)智世界可能對人類產(chǎn)生的威脅并不是人文研究——它可能是末世電影或是異托邦文學(xué)的主題——的任務(wù)。但探索人工智能在人文研究、或是人在創(chuàng)造上究竟能走多遠(yuǎn)的實驗也絕非是要在技術(shù)的推動下又倒過來推動技術(shù)越走越遠(yuǎn),直至替代人類的思考。人文是什么?人文是所有(經(jīng)典)文本在一而再、再而三的語內(nèi)與跨語際的翻譯中所累積起來的人類經(jīng)驗,這一經(jīng)驗只能夠通過人的語言實踐來完成。斯坦納(2020: 53)提到,“在談到將中國哲學(xué)概念翻譯成英語的可能時,艾·阿·理查茲說:‘我們所面對的可能真的是迄今為止的宇宙演化中產(chǎn)生的最復(fù)雜的一類事情?!蛟S所言不虛。但語言的這種復(fù)雜度和它的影響范圍,在人類說出第一句話那一刻就已經(jīng)得到顯現(xiàn)了?!?/p>

斯坦納亦是所言不虛。從這個角度上來說,文學(xué)翻譯研究或許是未來數(shù)字人文最可能有所進展并且對描述人類新處境有積極貢獻的領(lǐng)域。為什么我們不能相信,對于外語學(xué)科(或者比較學(xué)科)來說,這是大語言模型在關(guān)掉一般語言服務(wù)的那扇門后為人類的互相理解打開的一扇窗呢?如果說外語學(xué)科以及其他人文學(xué)科多多少少遭逢危機,或許并不是以大語言模型為代表的人工智能造成的,而是人類陶醉在自我的技術(shù)進步中時,漸漸地忘卻了本該是“最珍視的技能”。

猜你喜歡
數(shù)智任務(wù)外語
專題《數(shù)智共生 設(shè)計未來》
包裝工程(2024年8期)2024-04-23 04:03:58
路安炎:按下中國造紙業(yè)“數(shù)智轉(zhuǎn)型”啟動鍵
華人時刊(2023年1期)2023-03-14 06:43:44
網(wǎng)安天下?lián)姑鼣?shù)智引領(lǐng)向未來"雙引擎"驅(qū)動現(xiàn)代警務(wù)創(chuàng)新人才培養(yǎng)(計信系攝影報道)
鄉(xiāng)鄉(xiāng)鎮(zhèn)鎮(zhèn)通5G”建設(shè)助力山西“數(shù)智”轉(zhuǎn)型
外語教育:“高大上”+“接地氣”
海峽姐妹(2018年3期)2018-05-09 08:20:43
任務(wù)型教學(xué)模式應(yīng)用于會計英語詞匯教學(xué)的有效性研究
明確“任務(wù)” 文中有“我”
當(dāng)代教育工作者的任務(wù)——教會學(xué)生做人
教學(xué)秘書在高職教學(xué)管理與實施中的作用及任務(wù)
大山教你學(xué)外語
宁强县| 柳林县| 陵川县| 横峰县| 壶关县| 财经| 册亨县| 若尔盖县| 宁国市| 石棉县| 满城县| 万州区| 乌拉特前旗| 陇川县| 环江| 缙云县| 剑阁县| 湟中县| 保定市| 天镇县| 泗阳县| 新巴尔虎左旗| 罗定市| 白河县| 美姑县| 抚州市| 达拉特旗| 高平市| 苗栗县| 大悟县| 南涧| 陆河县| 太和县| 峨眉山市| 星子县| 县级市| 定襄县| 卓资县| 霍林郭勒市| 乐至县| 平塘县|