国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

GPT型技術賦能數字人文:概念解構、應用前景與現(xiàn)實問題

2024-06-17 03:59:35高翔
知識管理論壇 2024年2期
關鍵詞:數字人文

高翔

摘要:[目的/意義]GPT型技術有望助力數字人文發(fā)展,通過對其在數字人文應用的討論,以期加速數字人文與新興技術融合,促使數字人文與時代接軌,為數字人文的發(fā)展提供全新方向。[方法/過程]通過分析GPT型技術的涵義與發(fā)展歷程、支撐技術,對比傳統(tǒng)數字人文工具,總結GPT型技術在數字人文領域中的應用前景以及當前存在的現(xiàn)實問題。[結果/結論] GPT型技術在數字人文中的前景廣闊,如擔任智能研究助理,進行全量圖文分析,整合碎片知識,翻譯多語種語言以及助推人文項目發(fā)展落地等,但數據泄露安全問題、生成內容的算法倫理和知識版權問題以及人文知識的準確性和知識創(chuàng)新能力等現(xiàn)實問題有待進一步解決。

關鍵詞:GPT;數字人文;人工智能生成內容技術;對話型語言模型

分類號:TP18;G203

引用格式:高翔. GPT型技術賦能數字人文:概念解構、應用前景與現(xiàn)實問題[J/OL]. 知識管理論壇, 2024, 9(2): 109-119 [引用日期]. http://www.kmf.ac.cn/p/381/. (Citation: Gao Xiang. GPT-type Technology Empowers Digital Humanities: Conceptual Deconstruction, Application Prospects and Practical Problems[J/OL]. Knowledge Management Forum, 2024, 9(2): 109-119 [cite date]. http://www.kmf.ac.cn/p/381/.)

1? 引言/Introduction

近年來,人工智能技術蓬勃發(fā)展,在諸多領域的應用均取得了突破性進展。為滿足用戶對于人工智能產品更加綜合化、多樣化、個性化和智能化的新需求,2022年12月1日,美國人工智能公司OpenAI公布了全新一代對話型語言模型——ChatGPT,在其推出短短5天后,該公司CEO山姆·阿爾特曼通過自己的社交賬戶宣布ChatGPT用戶數量突破100萬。兩個月后,據相關報告顯示,ChatGPT活躍用戶數已達1億,并且在上線第二個月內平均每天有超過1 300萬名用戶使用ChatGPT[1]。ChatGPT的出現(xiàn)引發(fā)了社會各界的廣泛討論,并引起以GPT型技術為代表的新一輪人工智能熱潮。2023年3月15日,OpenAI在文本長度、輸入模式等多方面對ChatGPT進行升級,GPT4就此誕生。6個月后,OpenAI宣布ChatGPT推出更多模態(tài)功能,支持語音與圖像輸入[2]。GPT技術迭代如此之快,讓所有人意識到人工智能正在進入我們的生活。

雖然對于同類型產品國內顯得有些“慢熱”,但近些年我國在人工智能領域發(fā)展迅速。早在2017年,國務院就在頒布的《新一代人工智能發(fā)展規(guī)劃》中提出要把握發(fā)展機遇,大力發(fā)展人工智能領域核心技術;2020年,教育部在《關于公布2019年度普通高等學校本科專業(yè)備案和審批結果的通知》中提到,在2019年普通高等院校的本科專業(yè)設置和調整工作中,將有80所高校開設人工智能專業(yè);2021年,《中華人民共和國國民經濟和社會發(fā)展第十四個五年規(guī)劃和2035年遠景目標綱要》明確提出,要瞄準人工智能等前沿領域,聚焦人工智能算法等關鍵領域[3]?,F(xiàn)實中,眾多科技、互聯(lián)網企業(yè)(如百度、騰訊等)都在加緊研發(fā)甚至已經研發(fā)出屬于自己的人工智能平臺與應用。

與人工智能同樣發(fā)展迅速的,是數字人文研究與實踐。數字人文作為傳統(tǒng)人文學科深度應用數字技術之后產生的新形態(tài),是“人文學科”的延伸和發(fā)展,是多門學科共同構成的新領域[4]。其研究對象已從最初的電子文本擴展至超文本、圖像、音頻、視頻、網頁、虛擬現(xiàn)實、3D等多媒體。借助人工智能、大數據等技術能夠進一步實現(xiàn)文本處理、知識探索、數據可視化等[5],從而充實和拓展人文學科的研究領域,推動研究范式的轉型。顯然,GPT作為近期人工智能領域最熱門和功能強大的智能工具代表,將為數字人文的發(fā)展帶來新的機遇。

筆者先探討GPT的概念、發(fā)展歷程以及其支撐關鍵技術,再對GPT工具與傳統(tǒng)數字人文工具進行比較,分析其在數字人文領域的獨特優(yōu)勢,進而提煉總結其在數字人文領域中的應用前景和現(xiàn)實問題,以期為以GPT型技術為代表的人工智能工具更好應用于數字人文領域提供參考與借鑒。

2? GPT型技術概念解構/ Conceptual deconstruction of GPT technology

雖然GPT型技術已經在各行業(yè)掀起話題熱潮,但作為近期出現(xiàn)的新工具,想對其進行深入研究,就必須撥開輿論,從其本身概念、發(fā)展歷程、支撐技術等方面重新解構。另外,GPT型技術是人工智能領域的新產品,筆者通過將其與傳統(tǒng)的數字人文工具進行對比,以期更好地展現(xiàn)其“新”在何處。

2.1? GPT型技術的涵義與發(fā)展歷程

ChatGPT全稱為“Chat Generative Pre-trained Transformer”,即為“預訓練聊天生成轉換器”,是一種基于GPT-3.5架構的大型語言模型(Large Language Model,LLM),該模型是一種機器學習系統(tǒng),它從數據中自主學習,在對大量文本數據集進行訓練后,可以進行復雜且(類)智能的寫作[6]。ChatGPT及之后的GPT模型主要以對話方式進行交互,支持回答問題、承認錯誤、提出質疑并拒絕不適當的請求等情境[7]。GPT模型除了最基礎的聊天功能,還能基于對話的形式為使用者提供文本生成、代碼生成、文本翻譯等功能。

GPT型技術最早可以追溯到2018年的GPT-1。OpenAI使用12層的transformer結構在BooksCorpus數據集上對GPT-1進行訓練[8],GPT-1在有監(jiān)督學習的任務中,多數表現(xiàn)超過SOTA的模型,證明了transformer模型驚人的學習詞向量能力[9]。2019年GPT-2問世,預訓練量從5GB提高至40GB,在生成能力上有了更強的提高。在2020年OpenAI發(fā)布GPT-3,GPT-3通過在擁有3 000億個單詞的語料庫內對擁有1750億參數的模型進行訓練,獲得了語言生成、世界知識以及上下文學習3個重要能力[10]。之后,通過對GPT-3進行指令微調得到instruct-GPT初始版本[11],使其能夠遵循人類的指令;再通過將GitHub上采集到的159GB的Python代碼文件作為數據集重新訓練GPT-3得到Codex初始版本[12],使其擁有代碼理解與生成能力,再通過大量不同版本的指令微調以及基于人類反饋的強化學習(reinforcement learning from human feedback,RLHF)“創(chuàng)造”出火爆全球各界的ChatGPT[13]。ChatGPT的成功并沒有阻擋OpenAI在GPT技術領域的開拓,在2023年3月,GPT-4宣布誕生,相比于ChatGPT,GPT-4在更廣泛的數據集上進行訓練,在生成能力、任務效率、性能優(yōu)化等方面均有較高的提升,并且提高了長文本的處理能力、視覺能力以及推理與邏輯能力,在多方面彌補了ChatGPT的不足。

2023年9月25日,OpenAI宣布ChatGPT支持語音與圖像輸入功能,可以將輸入文本通過語音模型生成類人類語音片段,同時也可通過Whisper開源語音系統(tǒng)將語音轉化為文本[14]。除此之外,還可以選擇與ChatGPT進行對話,并且擁有超高自定義程度,包括但不僅限于語言種類、聲音類型等。同時,通過圖像輸入功能用戶可以將圖片“喂”給ChatGPT,讓其提取關鍵信息、分析圖表甚至討論圖片內容等[15]。這次歷史性的更新意味著GPT型工具已具備文本、圖像及音頻等方式的多模態(tài)功能,將以更直觀、更多元以及更現(xiàn)實的交互方式影響全人類,引領人工智能的未來。

2.2? GPT模型的支撐技術

GPT之所以能夠擁有如此多的功能且能夠出色地實現(xiàn),離不開其中的關鍵技術與相關架構模型的支撐。

第一,在整體架構上,GPT采用Transformer模型構成基本系統(tǒng)架構。Transformer模型是整個GPT系列的基本組成單元,GPT-1有12層transformer,GPT-2升級至48層,而GPT-3有96層,是預訓練模型的核心網絡。Transformer是一種神經網絡架構,能幫助系統(tǒng)分析文本、圖像和音頻等復雜的數據類型。Transformer模型本質上是一個基于多頭注意力機制的模型,通過注意力機制使transformer不需要再額外地遞歸或循環(huán),具有遞歸網絡與卷積網絡所不具有的并行計算、減少訓練時間的優(yōu)勢,再加上本身模型的復雜程度,所以相比于主流機器以往翻譯所使用基于RNN的seq2seq模型框架在精度與性能上都要高出很多[16],也賦予ChatGPT不同于過去同類型模型更強的能力。

第二,在算法層上,GPT采用基于人類反饋的強化學習(RLHF)。它可以分成3個核心步驟:①預訓練一個語言模型(language model,LM),再通過大量的語料去訓練出基礎模型,在這一步驟Open AI選擇了GPT-3。另外,在這一步Open AI使用了額外的條件或文本對GPT-3進行微調。②從第二步開始,整個RLHF與以往范式形成明顯區(qū)別,在這一步需要訓練一個獎勵模型(reward model,RM)。RM接收一系列的文本之后輸出一個數值標量獎勵,以期從人類視角下定量評判模型輸出的回答的質量。③基于強化學習去微調語言模型。RLHF中因為近端策略優(yōu)化(proximal policy optimization,PPO)算法存在時間較長,且相關原理指南較為豐富,因此成為微調初始語言模型參數的最佳選擇[17-18]。

第三,在算力層上,GPT-3.5/4在Azure AI超級計算基礎設施上進行了訓練[7]。GPT型技術能夠達到高度智能化的背后,僅靠一個龐大模型與強大算法是不夠的,還需要巨量算力的支撐。早在2019年,微軟就已經向Open AI投資,雙方達成密切合作,由微軟開發(fā)的云計算服務Azure AI成為Open AI的獨家云供應商,為Open AI提供強大的算力支持與資金[19]。基于此,OpenAI在 Azure 重建了深度學習堆棧,并從頭設計一臺專用超級計算機。以ChatGPT為例,其總算力消耗約為3 640 PF-days,即假設每秒進行1 000萬億次計算,則需要持續(xù)運行3 640天。這樣時間跨度大、持續(xù)時間久的GPU集群訓練,對網絡互聯(lián)底座的各方面都要求嚴苛,但同時Open AI的模型在微軟Azure上的訓練也可以實現(xiàn)對于微軟Azure的AI能力的提升。

2.3? GPT型技術與傳統(tǒng)數字人文工具的比較

數字人文的研究方法其實是“基于數據的研究”[20],通過傳統(tǒng)數字人文的研究工具進行數據檢索、呈現(xiàn)和對數據進行量化結構分析,常表現(xiàn)為將某一研究對象或材料進行數字化或統(tǒng)計收集相關數據,再對數字化材料與數據進行系統(tǒng)性分析或通過可視化技術呈現(xiàn)。學者在使用這些工具與方法進行研究時,需要投入大量的精力并且過程往往復雜枯燥。例如,學者常常需要改變檢索條件與構建不同的檢索式才能檢索到較為完整的數據與內容;歷史材料數字化后,常常通過與語言、歷史和考古等領域學者聯(lián)合進行語料轉換與內容提取;在對統(tǒng)計到的數據進行定量分析前,傳統(tǒng)數字人文工具難以精確篩查質量不好甚至不合格的數據,只能通過預先設定好的判定模式對數據進行簡單過濾,且往往依賴于更費精力的人工過濾。在數字人文領域的研究中還有更多類似的應用場景,因此,傳統(tǒng)數字人文工具在一定程度上使人文學者只能對極少的文本進行挖掘,限制了研究的深度與廣度。

將以GPT型技術為代表的人工智能工具引入數字人文領域,將會為數字人文的發(fā)展帶來顛覆性改變。實際上,在ChatGPT問世之前,有許多相關的技術已經在數字人文領域做出嘗試,如計算機視覺領域內的OCR文字識別技術在古籍圖像文字識別、古籍文本處理等的應用。以人工智能古籍圖像處理為例,其機制與ChatGPT類似,通過人工智能去簡化古籍的影像資料,同時參考過去人工標注的結果,進而辨認該影像是何種類型,再通過概率比對選擇可能性最高的那一項。雖然相關算法本身已較成熟,但對于古籍圖像的應用還較少[21]。

GPT型技術不僅與數字人文非常契合,而且相較于一些傳統(tǒng)數字人文工具,更加便利、先進與智慧。首先,數字人文通過對文本、數據、材料以及內容進行分析研究,而GPT作為一個生成式的預訓練語言模型,能夠為數字人文的研究內容提供原始材料、內容分析與輔助研究等。其次,相較于一些傳統(tǒng)的數字人文工具,GPT型技術能夠讓每個研究人員甚至是普通人都能夠快速獲得想要的服務,可以被迅速應用于數字人文領域研究;將數字人文對內容的分析研究從表面信息組織進化到語義內容組織;將信息檢索模式從用戶單邊檢索轉變?yōu)榻换ナ街R問答以及提高研究分析效率等[22],僅以文獻學視角來看,GPT型技術打破了傳統(tǒng)文獻需要依靠人員去處理的模式,它能夠有效地建立文本之間的深層次關系,對自然語言進行深層次處理,包括但不限于關鍵詞抽取、術語映射、實體識別、實體消歧、實體關系挖掘等[23],大大減少了研究人員在這類繁冗任務上的精力消耗,助推數字人文的研究。

3? GPT型技術賦能數字人文的應用前景/ Application prospect of GPT technology empowering digital humanities

GPT型技術在互聯(lián)網、計算機、辦公以及服務等多個領域都即將或已經落地應用,為各領域注入新生命。部分學者對GPT型技術在信息資源管理[24]、圖書館智能知識服務[25]、科研管理[26]、數字出版[27]、檔案服務[28]等領域的應用進行了初步的研究和應用展望。而GPT型技術在數字人文領域的研究和應用同樣需要進行探索,它能夠為數字人文發(fā)展提供新的動力,改變數字人文領域生態(tài),具有多種應用前景。具體來看,GPT型技術賦能數字人文的應用前景有以下幾個方面:

3.1? 智能研究助理:輔助數字人文學者進行知識生產

GPT型工具可以在知識生產領域為數字人文學者提供定制化服務,充當每個研究人員的私人研究助理。首先,GPT工具對于程序設計與規(guī)范方面的任務可以較為準確地完成,因而可以輔助學者進行較為專業(yè)的數字人文相關資源庫的程序設計等,這使得不擅長計算機領域的數字人文學者也能夠利用GPT工具設計出符合需求的程序。其次,GPT工具可以對學者的知識生產從設想到驗證提出分步指示與初步建議,并輔助他們完成大量重復性的工作(如文章撰寫、內容校驗等),提高學者知識生產效率,甚至可以通過圖像輸入、語音對話等形式與GPT工具討論相關話題以獲得具有支持性的建議。另外,GPT工具不僅可以是建議者,更可以轉化為知識生產者。研究人員可以通過文本、語音及圖像等單一或聯(lián)合形式將關鍵詞、主題等輔助性信息傳遞給GPT工具,GPT工具可以為學者提供一個基于問題需求的文本、語音或可視化創(chuàng)意性內容,進行有針對性的知識生產,在數字人文學者尋求將多學科主題與內容融合突破與創(chuàng)新點時,GPT型工具可以為學者提供一個較好的創(chuàng)意與靈感激發(fā)途徑。

3.2? 全量圖文分析:助力數字人文量化方法分析

GPT型工具可以協(xié)助進行全量文獻基礎上的研究與分析。數字人文的方法在理論上可以實現(xiàn)全量文獻基礎上的研究,但在現(xiàn)實中,傳統(tǒng)數字人文方法在進行量化方法分析時,由于工具不夠智能化等原因的限制,研究人員往往會處于“信息繭房”[29]中,無法判斷自己所掌握與收集的數據是否準確與完全,因此傳統(tǒng)數字人文領域學者的研究更多地局限在某一片段或某一部分進行量化分析,無法充分展示數字人文的長處。而GPT工具對量化的分析與研究,是一個很好的輔助工具。僅以中文古籍為例,全部中文古籍總量已經固定,已經有其極限。而GPT型工具對這類文獻的處理具有很好的作用,只需要將全部文獻“投喂”給GPT工具,它就能迅速精通該領域,為研究者提供服務。同時,使用GPT工具也能幫助研究者快速實現(xiàn)數據分析,包括生成Python代碼、實證分析與數據檢驗等,讓更多沒有數據分析專業(yè)技能的研究者也能擁有數據分析的能力,幫助他們更好地進行研究[30]。另外,學者可以通過GPT工具快速提取音頻、圖像中的主題、標簽甚至轉化成文本內容,實現(xiàn)多種形式的信息轉換;另一方面,研究者可以將自己的想法或文本內容輸入,GPT工具可以根據內容創(chuàng)造出符合主題的視覺與語音文件,快速將研究者的抽象想法轉發(fā)為可視圖像。因此,GPT型工具可以輔助學者完成復雜人文研究過程中的文本整理、資料收集、數據分析、實體抽取等工作,讓研究者能夠在短時間內了解某一研究模塊的重點內容、發(fā)展趨勢等,并提供文本和視覺等多形式的信息數據支持,為研究者進行后續(xù)研究分析提供幫助。

3.3? 碎片知識整合:實現(xiàn)數字人文智能檢索服務

數字人文學科的特殊性,決定了在數字人文領域的研究可能會涉及藝術、歷史、人文與社會等多個學科領域的知識。而就個體研究者或研究團隊而言,其學科研究方向與知識儲備通常較為單一,在研究中對于其他領域的知識往往不了解。而GPT工具則可以根據問題整合碎片化知識,幫助研究者更好地獲取自己了解較少的領域相關知識,有利于數字人文領域的知識獲取和研究方式優(yōu)化,開展數字人文研究與跨學科研究,實現(xiàn)多學科交叉融合。另外, GPT工具不僅能被動地為研究者搜集知識與內容,當研究者所詢問的問題涉及其他領域知識時,GPT工具也可以基于該問題通過文本、語音和圖片形式提供更加豐富和多元的知識內容,為研究者帶來新思考與新問題,有助于實現(xiàn)人文研究從“學科孤島”到“知識共同體”的轉變。GPT工具還可以應用于學術交流與合作中的共享平臺的搭建。利用其海量的數據內容與知識信息,將其植入數字人文學術公共平臺(如圖書館、數字人文網絡論壇等),方便數字人文等領域學者學習計算機、傳媒等不同學科領域專業(yè)知識內容;同時對于不同領域學者的問題輸入也能讓GPT工具不斷學習多領域知識并完善儲備,以更好地去滿足其他學者的需求,真正形成“我回答你,你反哺我”的良性循環(huán),利于跨領域資源的共享和知識交流,利于數字人文學科的發(fā)展與建設。

3.4? 多種語言翻譯:打破數字人文資源語種壁壘

在數字人文跨學科領域的研究中,對不同語言文獻的內容翻譯是一個無法回避的工作。而作為一種通用型機器翻譯模型,GPT型技術能夠協(xié)助研究者處理各方面的語料,并能夠對內容進行轉換,通過對不同語言文本的理解和生成,實現(xiàn)自動翻譯。

以ChatGPT為例首先,由于ChatGPT在問世前經過多次基于人類反饋的強化學習,并加之后續(xù)的指令微調,使其回答具有較好的邏輯性,在保證翻譯內容盡量完整的同時不丟失流暢度。其次,GPT應用可以實現(xiàn)對同一內容進行多語種實時翻譯,快速實現(xiàn)知識與資源的語言轉換,大大加快了翻譯的效率。再次,ChatGPT的翻譯不僅是語種的轉換,更可以實現(xiàn)語料文本的轉換。在數字人文領域,不同學科交叉融合的同時,對不同學科的專業(yè)語言也可能相互難以理解,利用GPT可以實現(xiàn)不同語料之間的轉換,將某些領域相對專業(yè)、生僻的術語轉化為更通俗易懂的語言,方便不同學科領域的學者進行跨學科研究。最后,GPT應用不同于傳統(tǒng)翻譯軟件的單次翻譯,GPT的本質是一個對話機器人,相比于傳統(tǒng)翻譯模式需要人工進行原文比對進行糾錯,研究人員可以通過在與其對話中對翻譯不合適的地方進行更精細要求與重復提問,以獲得更好的輸出內容。總之,GPT型技術的出現(xiàn)能夠打破數字人文資源語種壁壘,為跨語言的知識傳遞與共享提供新工具,有利于數字人文領域內不同學界、不同國家與地區(qū)學者之間的知識交流與資源共享。

3.5? 多元交互體驗:探索數字人文落地全新方向

當前數字人文領域內的項目主要集中在相關的數據、檔案資源收集和整合以及配合前沿技術再利用,如2016年上線的“數字敦煌”項目,即通過將敦煌石窟內的壁畫圖像資源統(tǒng)一上傳至敦煌資源庫中,并配合虛擬現(xiàn)實、增強現(xiàn)實等技術,讓網友可以在網絡平臺全方位欣賞敦煌石窟內的高清壁畫及相關介紹,并進行虛擬漫游[31]。而將GPT技術引入數字人文領域,可以為數字人文項目更好地落地提供全新方向,即數字人文項目可以不僅限于由資源擁有者單方向提供服務。例如,通過GPT為用戶提供定制化的服務,將相關用戶輸出的主題詞、想法等轉化成具有獨特專屬性的創(chuàng)意性內容或實時記錄與用戶的對話交互等。在項目中,用戶通過GPT生成的創(chuàng)意性內容與采集到用戶自身的數據(音頻、圖像等)都可以被錄入數字人文項目中,使每個用戶都能夠參與到數字人文項目的創(chuàng)作、解讀、發(fā)展甚至是建設中,項目也因為更大范圍的資源采集而不斷完善。

雖然現(xiàn)如今有許多數字人文項目鼓勵公眾參與(如“方言保護計劃”項目[32],參與者需要上傳自己的方言音頻參與項目),但多數都是以參與者主動上傳數據等方式參與,缺乏一個像GPT這樣的技術讓用戶在項目觀看、體驗中就能實時參與、記錄的工具。GPT技術的加入,讓數字人文項目更具生命力,增強了用戶對整個項目的參與度與沉浸式體驗,也同時讓數字人文項目研究有了更高、更廣、更深的層次,為數字人文項目未來的發(fā)展與落地提供全新的探索方向。

4? GPT型技術賦能數字人文的現(xiàn)實問題/ Practical problems of GPT technology empowering digital humanities

GPT型技術的出現(xiàn)無疑將賦能數字人文領域的發(fā)展與進步,但同時也需要關注其本身的不足和由其帶來的相關現(xiàn)實問題。只有密切關注GPT型技術的現(xiàn)實問題,并在日后加以改進,才能使其更好地服務于數字人文。

4.1? 無限制語料庫學習數據泄露風險加大

2023年3月23日,ChatGPT在問世不久就出現(xiàn)了數據泄露事件。許多網友指出,自己在使用ChatGPT的過程中可以在網頁左側聊天記錄欄中看到他人聊天記錄,甚至出現(xiàn)了一些敏感隱私信息(如信用卡號、郵件地址等)。同樣,韓國三星公司設備解決方案部門員工在使用ChatGPT進行優(yōu)化測試序列、會議記錄轉換以及修復源代碼等操作時,將機密代碼泄露給ChatGPT。這就意味著其他人在使用ChatGPT這樣一個語言學習模型也可能會得到三星公司的源代碼等機密文件[33]。對于GPT這類需要海量數據訓練作為支撐的大語言模型,大規(guī)模的數據量也將帶來較高數據泄露的風險。

GPT工具數據風險主要來源于3個方面:

(1)用戶將隱私數據信息輸入GPT導致數據泄露。GPT主要通過語言學習來實現(xiàn)超高智能交互體驗,并且學習深度會隨著問答與使用量的增加而不斷加深。這就導致用戶在使用GPT時輸入的數據也會被其學習,當其他人在使用GPT時也可能通過特定具有針對性的問題來獲得你的數據信息。例如,當數字人文學者將某個構想或研究思路輸入GPT以期獲得實質性的研究方案等,那么當其他人通過“數字人文”“研究方案”等關鍵詞進行聯(lián)合檢索就有可能會在GPT內“套取”到你未公開的初期研究并竊取。

(2)服務器受到攻擊。任何人工智能工具的運行都需要服務器的平穩(wěn)支持,而GPT擁有龐大參數的模型抵御攻擊能力比其他中小模型反而更差,并且由于無限學習的特性,其數據量將會越來越大,也就需要配套更強大與安全系數更高的服務器,否則很可能形成“包不住”的局面,一旦被病毒、黑客等攻擊將極容易出現(xiàn)數據安全泄露事件[34]。

(3)GPT開發(fā)人員失誤導致數據泄露。GPT模型需要開發(fā)人員不斷更新與維護,所以如果開發(fā)人員或團隊出現(xiàn)失誤(如誤設數據公開權限等),那么就會讓GPT內的原先非公開數據被公開,導致數據泄露。

4.2? 生成內容的算法倫理和知識版權問題有待厘清

GPT模型生成內容的算法倫理不容忽視。作為一個對話模型,GPT模型以對話形式輸出內容,也因此可能會出現(xiàn)相關的問題。作為一個機器模型,它無法通過自身去鑒別知識庫中內容的準確性,并且對于如此體量龐大的數據集,不可能實現(xiàn)全部人工篩選。即使在GPT模型誕生初期會有人員進行數據集的篩選工作,但這也會因為人員的信息素養(yǎng)與專業(yè)能力而無法保證完全正確,所以其對一個問題的回答也難以保證完全準確。當它遇到現(xiàn)有知識庫中無法直接回答的問題時,很可能為了語法的準確與流暢而選擇拼湊、刪改語句,導致生成的內容意義發(fā)生變形,正確率下降。

另外,數字人文領域常常會涉及多種文化、歷史等方面知識,而在面對涉及不同地區(qū)文化差異、倫理道德等問題時,GPT模型難以分析出其中深層次的差異與意義,所以產出的內容不免會違反某些地區(qū)的文化與社會規(guī)章,也因此會在面對不同地區(qū)同一對象的不同內容(如文化、法律等)時,出現(xiàn)將不同內容雜糅在一起的情況,最后產出的內容看似正確其實毫無意義,因為其本身不能準確識別內在意義的不同,只是一味為了內容盡可能涉及每個對象。例如,當數字人文學者向GPT模型提出“西方國家與東方國家宗教信仰優(yōu)缺點對比”等這些需要同時結合主觀思想、辯證思維以及大量相關宗教人文知識和案例才能勉強“應付”的問題時,GPT就很可能根據問題關鍵詞重合度等硬性檢索指標去某些網站或論壇“拼湊”出一份“看似”靠譜的答案,但這個答案的真實性與全面性也仍需考證。

GPT模型生成內容的版權問題同樣需要關注。ChatGPT在學術圈之所以能引起這么高的討論度,原因在于它被一部分人濫用,如利用其超高內容生成能力去完成作業(yè)、論文等,在這樣的情況下ChatGPT成為助長學術不端風氣的工具。同樣,其所生成的內容也可能并不是完全原創(chuàng),根據語料庫所生成的內容可能是某位學者已經出版的內容。GPT模型在內容生成中的版權風險主要有兩個方面:①沒有獲得在先作品權利人的授權,以及在行使著作權時可能侵犯原作品的著作權。②聊天機器人在不同目的與不同場景下的使用,如對聊天機器人生成的內容進行再出版[35]。對于使用者,由于該內容可能來源于不同國家與地區(qū)的數據集,由于檢驗工具與檢索工具的限制,致使使用者難以檢驗內容的原創(chuàng)性,使用者也許將“被迫”陷入版權爭議;而對于原創(chuàng)者,自己的作品是否通過GPT模型被侵害盜用也難以得知;而對于整個數字人文領域,數字人文領域所產出的知識、作品以及成果都具有很強的跨學科性,因此更可能被更大范圍的學科領域借鑒或使用,如果版權問題沒有被重視或解決,數字人文很有可能會比其他領域更容易陷入版權風波。

4.3? 人文知識的準確性和知識創(chuàng)新能力有待加強

GPT型技術通過對現(xiàn)階段人類的知識結構進行學習構建出自己的知識體系,從而具備根據問題智能生成回答的能力。但GPT的智能,只是基于其強大的算力,使其能夠快速定位,同時基于人類反饋的相關算法,其能夠將相關的知識通過自然語言以一定的邏輯輸出。GPT型技術擅長的并不是知識的生成而是知識的整合,它的知識來源都是已知和已有的知識,所以GPT模型很容易處理極強范式性的內容(如應用文、通知等)以及對知識進行梳理、總結等。但這些大多并不能稱為知識創(chuàng)新,只是對于現(xiàn)有知識的再加工,GPT模型的知識創(chuàng)新能力還有待改善,這也依賴其日后算法的進化。另外,GPT型技術在服務數字人文領域研究中有一個明顯的短板,即人文知識儲備量不足且不夠準確。人文知識的特點是多與雜,內容涵蓋文學、歷史、藝術、社會等多領域,且時間跨度大,特別是每個國家與地區(qū)、甚至是每個學科領域的人文知識都有其獨特性。而數字人文領域的許多研究都與歷史文化、前沿思想以及信息技術融合有關,且人文知識伴隨人類的發(fā)展不斷產生,內容不僅龐大且?guī)缀鯖]有盡頭,如果GPT無法及時同步這些新的知識庫,那么其在數字人文領域發(fā)揮的作用也將很有限。

5? 結語與展望/Conclusion and prospect

GPT型技術的出現(xiàn),讓人工智能不再是空中樓閣,同時也展現(xiàn)了人工智能獨特的優(yōu)勢。數字人文是一門與人文內容以及信息技術密切相關的領域,常常需要將藝術、歷史等內容進行“再生”,GPT型技術通過內容的輸入、檢索、整合以及轉換,將單一形式的內容以多元形式產出,與數字人文領域研究非常契合。GPT型技術為數字人文領域提供了一個更加便利的集成式的內容工具,為數字人文領域研究提供更多的選擇。通過合理運用GPT型工具,能夠滿足領域學者完成翻譯、知識整合、創(chuàng)意激發(fā)、智能檢索等多種研究需求,提高學者工作效率以及研究深度及廣度,同時也為數字人文項目的發(fā)展、應用以及落地提供了更好的方向。但同時也應看到GPT型技術存在的現(xiàn)實問題,GPT型技術在安全、版權、人文、倫理等方面雖然暫時仍有不足,只有更多的人了解它的問題,才能讓用戶更好地使用它,更好地提升其在數字人文領域內的使用價值。相信未來GPT型技術將進一步發(fā)展,在以它為代表的更多人工智能工具的出現(xiàn)與升級下,數字人文發(fā)展將有更廣闊的發(fā)展空間。

參考文獻/References:

智東西 ZeR0. 時間線復盤ChatGPT爆火之路: 改變互聯(lián)網圈的兩個月[EB/OL]. [2023-12-06]. https://www.jiemian.com/article/8893975.html. (WISE THINGS ZeR0. Timeline resumption ChatGPT explosion road: two months to change the internet circle[EB/OL]. [2023-12-06]. https://www.jiemian.com/article/8893975.html.)

OpenAI. ChatGPT can now see, hear, and speak[EB/OL]. [2023-12-06]. https://openai.com/blog/chatgpt-can-now-see-hear-and-speak.

中商產業(yè)研究院. 2022年中國人工智能行業(yè)最新政策匯總一覽(表) [EB/OL]. [2023-12-06]. https://www.askci.com/news/chanye/20220824/0921361966713.shtml. (CHINA COMMERCIAL INDUSTRY RESEARCH INSTITUTE. Summary of the latest policies of artificial intelligence industry in China in 2022 (Table) [EB/OL]. [2023-12-06]. https://www.askci.com/news/chanye/20220824/0921361966713.shtml.)

王麗華, 劉煒, 劉圣嬰. 數字人文的理論化趨勢前瞻[J]. 中國圖書館學報, 2020, 46(3): 17-23. (WANG L H, LIU W, LIU S Y. Perspective research of digital humanities theory[J]. Journal of library science in China, 2020, 46(3): 17-23.)

朱本軍, 聶華. 跨界與融合:全球視野下的數字人文——首屆北京大學“數字人文論壇”會議綜述[J]. 大學圖書館學報, 2016, 34(5): 16-21. (ZHU B J, NIE H. Crossing boundaries and engaging communities: digital humanities in a global perspective [J]. Journal of academic librariese, 2016, 34(5): 16-21.)

DIS E V, BOLLEN J, ZUIDEMA W, et al. ChatGPT: five priorities for research conversational AI is a game-changer for science. heres how to respond[EB/OL]. Nature, 2023, 614(7947): 224-226.

OpenAI. Introducing ChatGPT[EB/OL]. [2023-12-13]. https://openai.com/blog/chatgpt?ref=the-writesonic-blog-making-content-your-superpower.

ZHU Y, KIROS R, ZEMELET R, et al. Aligning books and movies: towards story-like visual explanations by watching movies and reading books[EB/OL]. [2023-12-16]. https://arxiv.org/abs/1506.06724.

知乎大師兄.預訓練語言模型之GPT-1, GPT-2和GPT-3[EB/OL]. [2023-12-16]. https://zhuanlan.zhihu.com/p/350017443.(ZHIHU DA SHI XIONG. GPT-1, GPT-2 and GPT-3 of pre-training language model. [EB/OL]. [2023-12-16]. https://zhuanlan.zhihu.com/p/350017443.)

BROWN T B, MANN B, RYDER N, et al. Language models are few-Shot learners[C]//Proceedings of the 34th international conference on neural information processing systems. New York: ACM, 2020:1877-1901.

OUYANG L, WU J, JIANG X, et al. Training language models to follow instructions with human feedback[EB/OL]. [2023-12-21]. https://arxiv.org/ abs/2203.02155.

CHEN M, TWOREK J, JUN H, et al. Evaluating large language models trained on code[EB/OL]. [2023-12-21]. https://arxiv.org/abs/1706.03762.

FU Y, PENG H, TUSHAR K. How does GPT obtain its ability? Tracing emergent abilities of language models to their sources[EB/OL]. [2023-12-22]. https://yaofu.notion.site/How-does-GPT-Obtain-its-Ability-Tracing-Emergent-Abilities-of-Language-Models-to-their-Sources-b9a57ac0fcf74f30a1ab9e3e36fa1dc1.

程序員蒼何. 【搶先體驗】開通使用 ChatGPT 語音版功能保姆級教程[EB/OL]. [2023-12-22]. https://blog.csdn.net/qq_43270074/article/details/133578491. (PROGRAMMER CANG HE. [Preemptive experience] Open a nanny-level tutorial using ChatGPT voice version[EB/OL]. [2023-10-17]. https://blog.csdn.net/qq_43270074/article/details/133578491.)

智東西. ChatGPT能語音聊天和看圖了, 五種音色選項, 背后模型細節(jié)公開[EB/OL]. [2023-12-25]. https://36kr.com/p/2448933549496450. (SMART THINGS. ChatGPT can voice chat and look at pictures. there are five timbre options, and the details behind the model are open[EB/OL]. [2023-10-17]. https://36kr.com/p/2448933549496450.)

VASWNI A, SHAZEER N, PARMAR N, et al. Attention is all you need[EB/OL]. [2023-12-27]. https://arxiv.org/abs/1706.03762.

LAMBERT N, CASTRICATO L, WERRA L O, et al. Illustrating reinforcement learning from human feedback (RLHF) [EB/OL]. [2023-12-27]. https://huggingface.co/blog/rlhf.

楷文狗. 【科普向】Chat GPT背后的技術: 什么是RLHF(人類反饋強化學習)?[EB/OL]. [2023-12-27]. https://www.bilibili.com/read/cv22006067. (KAIWEN DOG. [Popular science direction] The technology behind Chat GPT: what is RLHF (human feedback reinforcement learning)? [EB/OL]. [2023-12-27]. https://www.bilibili.com/read/cv22006067.)

新浪科技. 微軟向OpenAI投資10億美元 在Azure平臺上開發(fā)AI技術[EB/OL]. [2023-12-27]. https://tech.sina.com.cn/it/2019-07-22/doc-ihytcerm5517562.shtml. (SINA TECHNOLOGY. Microsoft invested $1 billion in OpenAI to develop AI technology on the Azure platform)[EB/OL]. [2023-12-27]. https://tech.sina.com.cn/it/2019-07-22/doc-ihytcerm5517562.shtml.)

劉煒, 葉鷹.數字人文的技術體系與理論結構探討[J]. 中國圖書館學報, 2017, 43(5): 32-41. (LIU W, YE Y. Exploring technical system and theoretical structure of digital humanities[J]. Journal of library science in China, 2017, 43(5): 32-41.)

澎湃新聞. 澎湃圓桌|ChatGPT、人工智能與數字人文: 傳統(tǒng)學問的科技未來?[EB/OL]. [2023-12-27]. https://m.thepaper.cn/newsDetail_forward_21973969. (PENGPAI NEWS. surging round table|ChatGPT, artificial intelligence and digital humanities: the technological future of traditional learning? [EB/OL]. [2023-12-27]. https://m.thepaper.cn/newsDetail_forward_21973969.)

中國科學院文獻情報中心. 《ChatGPT對文獻情報工作的影響》研究報告(簡版)公開發(fā)布[EB/OL]. [2023-12-30]. http://www.las.cas.cn/zhxw/202302/t20230228_6685890.html. (NATIONAL SCIENCE LIBRARY, CHINESE ACADEMY OF SCIENCES. The research report “ChatGPTs influence on literature and information work” (short version) was released to the public[EB/OL]. [2023-12-30]. http://www.las.cas.cn/zhxw/202302/t20230228_6685890.html.)

陳果, 陳晶, 肖璐. 詞匯語義鏈: 領域分析視角下的詞匯語義挖掘理論框架[J]. 情報理論與實踐, 2022, 45(4): 170-176, 183. (CHEN G, CHEN J, XIAO L. Lexical semantic chain: a theoretical framework for lexical semantic mining in the perspective of domain analysis[J]. Information studies: theory & application, 2022, 45(4): 170-176, 183.)

陸偉, 劉家偉, 馬永強, 等. ChatGPT為代表的大模型對信息資源管理的影響[J]. 圖書情報知識, 2023, 40(2): 6-9, 70. (LU W, LIU J W, MA Y Q, et al. The influence of large language models represented by ChatGPT on information resources management[J]. Documentation, information & knowledge, 2023, 40(2): 6-9, 70.)

趙瑞雪, 黃永文, 馬瑋璐, 等. ChatGPT對圖書館智能知識服務的啟示與思考[J]. 農業(yè)圖書情報學報, 2023, 35(1): 29-38. (ZHAO R X, HUANG Y W, MA W L, et al. Insights and reflections of the impact of ChatGPT on intelligent knowledge services in libraries [J]. Journal of library and information science in agriculture, 2023, 35(1): 29-38.)

王樹義, 張慶薇. ChatGPT給科研工作者帶來的機遇與挑戰(zhàn)[J]. 圖書館論壇, 2023, 43(3): 109-118. (WANG S Y, ZHANG Q W. ChatGPTs opportunities and challenges for researchers [J]. Library tribune, 2023, 43(3): 109-118.)

任安麒. 數字出版領域智能語言模型的應用、風險與治理——基于ChatGPT技術特征的分析[J]. 出版科學, 2023, 31(3): 94-102. (REN A Q. Application, challenges and governance of intelligent language models in digital publishing: an analysis based on ChatGPT technology features[J] Publishing journal, 2023, 31(3): 94-102.)

付永華, 張文欣, 司俊勇. ChatGPT影響下的人工智能檔案服務: 突破與挑戰(zhàn)[J]. 檔案管理, 2023(3): 58-61. (FU Y H, ZHANG W X, SI J Y. Artificial intelligence file service under the influence of ChatGPT: breakthrough and challenge[J]. Archives management, 2023(3): 58-61.)

張玥, 莊碧琛, 李青宇, 等. 同質化困境: 信息繭房概念解析與理論框架構建[J]. 中國圖書館學報, 2023, 49(3): 107-122. (ZHANG Y, ZHUANG B C, LI Q Y, et al. Homogenization dilemma: concept analysis and theoretical framework construction of information cocoons[J]. Journal of library science in China, 2023, 49(3): 107-122.)

知乎武幺六. ChatGPT3.5和4.0真的使用差距很大嗎?[EB/OL]. [2023-12-30]. https://www.zhihu.com/question/595517134. (ZHIHU WU YAO LIU. Is there really a big gap between chatgpt-3.5 and 4.0? [EB/OL]. [2023-07-01]. https://www.zhihu.com/question/595517134.)

中國日報中文網. 數字敦煌: 一眼千年, 回首又見畫中人[EB/OL]. [2023-12-30]. https://cn.chinadaily.com.cn/a/202101/25/WS600e84a5a3101e7ce973c929.html. (CHINA DAILY. Digital Dunhuang: looking back at the Millennium, I can see the people in the painting again[EB/OL]. [2023-12-30]. https://cn.chinadaily.com.cn/a/202101/25/WS600e84a5a3101e7ce973c929.html.)

方言保護計劃[EB/OL]. [2023-12-30]. https://fangyan.xunfei.cn/#/. (Dialect protection plan[EB/OL]. [2023-12-30]. https://fangyan.xunfei.cn/#/.)

澎湃新聞. 從ChatGPT數據泄露事件, 看組織安全穩(wěn)定自動化的重要性[EB/OL]. [2023-12-30]. https://www.thepaper.cn/newsDetail_forward_22632495. (PENGPAI NEWS. From the ChatGPT data leakage incident, see the importance of organizational security, stability and automation [EB/OL]. [2023-12-30]. https://www.thepaper.cn/newsDetail_forward_22632495.)

王曉麗, 嚴馳. 生成式AI大模型的風險問題與規(guī)制進路: 以GPT-4為例[J/OL]. 北京航空航天大學學報(社會科學版): 1-11[2023-12-30]. https://doi.org/10.13766/j.bhsk.1008-2204.2023.0535. (WANG X L, YAN C. Risk problem and regulation approach of generative AI foundation models: a case study of GPT-4[J/OL]. Journal of Beijing University of Aeronautics and Astronautics(Social sciences edition): 1-11[2023-12-30]. https://doi.org/10.13766/j.bhsk.1008-2204.2023.0535.)

叢立先, 李泳霖. 聊天機器人生成內容的版權風險及其治理——以ChatGPT的應用場景為視角[J]. 中國出版, 2023(5): 16-21. (CONG L X, LI Y L. Copyright risk of chatbot-generated content and its governance—from the perspective of ChatGPT application scenario[J]. China publishing journal, 2023(5): 16-21.)

GPT-type Technology Empowers Digital Humanities: Conceptual Deconstruction, Application Prospects and Practical Problems

Gao Xiang

School of Cultural Heritage and Information Management, Shanghai University, Shanghai 200444

Abstract: [Purpose/Significance] GPT technology is expected to help the development of digital humanities. By discussing its application in digital humanities, we hope to accelerate the integration of digital humanities and emerging technologies, promote the integration of digital humanities with the times, and provide a new direction for the development of digital humanities. [Method/Process] By analyzing the meaning, development course and supporting technology of GPT technology, and comparing them with traditional digital humanities tools, this paper summarized the application prospects of GPT technology in the field of digital humanities and the existing practical problems. [Result/Conclusion] GPT technology has broad prospects in digital humanities and can be used as an intelligent research assistant, realizing full-scale graphic analysis, integrating fragmented knowledge, multilingual translation, and promoting the development of humanities projects, etc. However, practical problems such as data leakage security, algorithmic ethics and intellectual copyright of generated content, the accuracy of humanistic knowledge, and knowledge innovation ability need to be further resolved.

Keywords: GPT? ? digital humanities? ? ?artificial intelligence generated content technology? ? ?conversational language model

Fund Project(s): This work is supported by the National Social Science Fund Youth Project titled “Research on Evaluation System of Digital Humanities Collaborative Innovation for Memory Engineering” (Grant No. 22CTQ041).

Author(s): Gao Xiang, master candidate, E-mail: goarx1124@foxmail.com.

Received: 2023-09-28? ? Published: 2024-03-13

猜你喜歡
數字人文
數字人文項目合作平臺分析
圖書館未來的技術應用與發(fā)展
圖書與情報(2017年6期)2018-03-12 19:13:41
數據驅動下的高校圖書館數字人文服務研究
圖書與情報(2017年5期)2018-01-02 11:24:34
漢傳佛教文化遺產數字化建設現(xiàn)狀調查與特征分析
數字人文2011—2016年研究綜述
數字人文時代公共圖書館經典閱讀推廣研究
數字人文時代公共圖書館經典閱讀推廣研究
數字人文目標下圖書館信息服務模式研究
數字學術與公眾科學:數字圖書館新生態(tài)
跨界與融合:全球視野下的數字人文
九龙城区| 贺兰县| 仪陇县| 兰考县| 东宁县| 木里| 资阳市| 新余市| 滦南县| 东平县| 靖远县| 固始县| 白水县| 横山县| 察哈| 白山市| 泸州市| 宜阳县| 铜鼓县| 佳木斯市| 宝清县| 乌拉特中旗| 沙坪坝区| 固始县| 密山市| 米脂县| 衡东县| 新河县| 常德市| 体育| 石台县| 贺兰县| 涿州市| 鹤山市| 塔城市| 奉新县| 禹州市| 永福县| 习水县| 三江| 福泉市|