国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

ChatGPT參與知識生產(chǎn)的技術(shù)路徑、應(yīng)用與挑戰(zhàn)

2023-05-30 11:44王仕勇張成琳
教育傳媒研究 2023年3期
關(guān)鍵詞:深度學(xué)習(xí)知識產(chǎn)權(quán)人工智能

王仕勇 張成琳

【內(nèi)容摘要】ChatGPT技術(shù)的崛起給知識生產(chǎn)領(lǐng)域帶來了顛覆性變革,其憑借優(yōu)異的自然語言處理技術(shù)和算法讓知識生產(chǎn)進一步走向智能化、自主化、高質(zhì)化、仿真化和個性化,未來有望在與知識生產(chǎn)密切相關(guān)的教育培訓(xùn)、新聞媒體和學(xué)術(shù)研究等領(lǐng)域充當(dāng)重要角色。但ChatGPT在參與知識生產(chǎn)的過程中,也面臨著真實性和可靠性待評估、學(xué)術(shù)倫理和知識產(chǎn)權(quán)遭遇沖擊,以及人類生產(chǎn)知識的潛能和自主性面臨消解等嚴峻挑戰(zhàn)。由此,本文認為我們需要牢牢把握知識生產(chǎn)以人為本的原則,重新思考強人工智能時代下的人機協(xié)作與融合方式。

【關(guān)鍵詞】ChatGPT;知識生產(chǎn);人工智能;深度學(xué)習(xí);學(xué)術(shù)倫理;知識產(chǎn)權(quán)

近年來,人工智能(AI)在參與知識生產(chǎn)領(lǐng)域的應(yīng)用呈現(xiàn)出多種方式,涉及多個領(lǐng)域,例如自然語言處理、計算機視覺、機器學(xué)習(xí),等等,但總體智能化水平較低、自主性較差,難以擺脫弱人工智能的標(biāo)簽。2022年11月30日,美國人工智能公司OpenAI公司推出了聊天機器人ChatGPT,這款引領(lǐng)自然語言處理技術(shù)革命的機器人迅速在全球范圍內(nèi)引發(fā)現(xiàn)象級關(guān)注,一周內(nèi)其用戶數(shù)量就突破百萬。作為一款基于深度學(xué)習(xí)技術(shù)的自然語言處理工具,ChatGPT具有自動生成、摘要和翻譯等多種任務(wù)的能力,廣泛應(yīng)用于文本自動生成、自然語言處理和知識管理等領(lǐng)域。①ChatGPT的迅猛發(fā)展被譽為“AI時代的二次復(fù)興”②,意味著人類告別弱人工智能時代。③

一、ChatGPT參與知識生產(chǎn)的技術(shù)路徑

人類知識形態(tài)經(jīng)歷了從經(jīng)驗形態(tài)到分科的原理形態(tài)知識,再從原理形態(tài)發(fā)展到在信息技術(shù)平臺上形成的差異化或交疊形態(tài)的知識。④計算機的廣泛應(yīng)用不僅實現(xiàn)了知識的大規(guī)模組合,而且促進了知識層面之間的協(xié)作和互動,顛覆了傳統(tǒng)的知識生產(chǎn)方式。首先接受變革的就是作為知識載體的語言。隨著計算機技術(shù)的進一步發(fā)展,人們希望計算機能夠像人類一樣處理自然語言,NLP (Natural Language Processing, 自然語言處理)技術(shù)應(yīng)運而生。作為一種機器學(xué)習(xí)技術(shù),NLP致力于研究計算機如何理解、分析和生成自然語言。ChatGPT(Generative Pre-trained Transformer)便是一種基于自然語言處理的模型。它依托LLM(Large Language Model, 大型語言模型),通過創(chuàng)新性地利用 transformer 模型和自注意力機制(Self-Attention Mechanism)等技術(shù),同時使用RLHF(Reinforcement Learning with Hindsight Feedback,人類反饋強化學(xué)習(xí))進行訓(xùn)練 ,實現(xiàn)了更加自然化的對話交互,讓知識生產(chǎn)更加智能化、自主化、高質(zhì)化、仿真化和個性化。

(一)依托大型語言模型(LLM)的智能化生成和自主化學(xué)習(xí)

ChatGPT采用預(yù)訓(xùn)練(Pre-training)和微調(diào)(Fine-tuning)的兩階段訓(xùn)練方式進行模型訓(xùn)練,而LLM便是其進行預(yù)訓(xùn)練的基礎(chǔ)。LLM指采用大規(guī)模預(yù)訓(xùn)練的深度學(xué)習(xí)語言模型,通常由數(shù)十億或數(shù)百億的參數(shù)組成,因此需要在大規(guī)模數(shù)據(jù)集上進行預(yù)訓(xùn)練。ChatGPT的模型參數(shù)多達1750億,不僅包括一些公開語料庫,還包含OpenAI自己爬取的超過萬億單詞的人類語言數(shù)據(jù)。⑤在海量數(shù)據(jù)的基礎(chǔ)上,ChatGPT通過MLM(Masked Language Model,掩碼語言模型)和NSP(Next Sentence Prediction,下一句預(yù)測)實現(xiàn)預(yù)訓(xùn)練。MLM可以將輸入文本中的某些單詞隨機替換成掩碼字符,并通過模型對這些單詞進行預(yù)測,NSP可以讓模型預(yù)測兩句話之間是否有邏輯關(guān)系,從而使模型能夠?qū)φZ言結(jié)構(gòu)和語義進行建模,進而模仿訓(xùn)練文本,智能化生成各種語言表達,包括對話、文章、摘要和翻譯等。

依托LLM的ChatGPT還能自主發(fā)現(xiàn)語言模式和規(guī)律,自主調(diào)整模型參數(shù),自主適應(yīng)各種任務(wù)和場景,從而實現(xiàn)高效的自主化學(xué)習(xí)。具體而言,在預(yù)訓(xùn)練階段,ChatGPT依托LLM對大規(guī)模語料進行無監(jiān)督學(xué)習(xí),學(xué)習(xí)語言的基本規(guī)律和語義結(jié)構(gòu)。LLM可以幫助ChatGPT自主地發(fā)現(xiàn)語言中的隱含模式和規(guī)律,從而更好地理解和生成自然語言。在微調(diào)階段,ChatGPT在依托LLM的基礎(chǔ)上,根據(jù)用戶輸入的數(shù)據(jù)進行有監(jiān)督學(xué)習(xí),自主地調(diào)整模型參數(shù),自主學(xué)習(xí)和適應(yīng)各種特定任務(wù)和場景。例如,ChatGPT可以利用LLM對話的歷史信息,在對話生成任務(wù)中自主調(diào)整模型的生成策略和語言表達方式,從而更好地滿足人類更加高效、精準(zhǔn)和個性化的知識生成需求。

(二)基于transformer模型的高質(zhì)量知識表示和推理

知識表示與推理(Knowledge representation and reasoning,KR2)是人工智能領(lǐng)域的一項重要研究課題,是計算機有效處理知識和信息的基礎(chǔ),也是人工智能“弄懂”自然語言并輸出高質(zhì)量知識的關(guān)鍵。人類用自然語言對知識進行表示,但這種表示方法并不能被機器接受,于是發(fā)展出了能夠?qū)⑽谋拘畔⑥D(zhuǎn)化為計算機理解形式的知識表示方法。ChatGPT采用的是向量表示法,即將每一個知識和概念等表示成一個多維向量,便于計算機理解和處理,而其獲取向量的技術(shù)支撐便是transformer 編碼器-解碼器模型。transformer模型是一種基于注意力機制的深度神經(jīng)網(wǎng)絡(luò)模型。多層的 transformer 模型構(gòu)成分層結(jié)構(gòu),每一層都包含多頭自注意力機制和前饋神經(jīng)網(wǎng)絡(luò),能夠更好地捕捉上下文信息和對多層處理輸入文本,并將文本轉(zhuǎn)化為富含語義信息的向量表示,用于后續(xù)的知識推理任務(wù)中。transformer 模型的核心組成部分自注意力機制,能夠在不同層次、不同位置上自適應(yīng)地聚焦不同的語義信息,幫助模型理解文本知識和推理規(guī)則。它可以將已有知識與先驗語言知識有效結(jié)合,推理出新的結(jié)論和概念,以此讓ChatGPT更好地理解復(fù)雜的語言推理任務(wù),實現(xiàn)多輪對話和常識推理。有學(xué)者比較了ChatGPT和GPT-3.5 (textdavinci-003)在不同任務(wù)上的零樣本學(xué)習(xí)性能,研究發(fā)現(xiàn),ChatGPT的確在許多有利于推理能力的任務(wù)上有良好表現(xiàn)。⑥

(三)利用人類反饋強化學(xué)習(xí) (RLHF) 實現(xiàn)知識生產(chǎn)的仿真化和個性化

預(yù)訓(xùn)練階段的自監(jiān)督學(xué)習(xí)算法并不能完全讓ChatGPT實現(xiàn)高度仿真和個性化交互,在進行對話生成任務(wù)時,ChatGPT還需要使用其他算法來進行微調(diào)和訓(xùn)練,其中之一就是RLHF。⑦RLHF的主要步驟為:使用監(jiān)督學(xué)習(xí)訓(xùn)練語言模型、根據(jù)人類偏好收集比較數(shù)據(jù)并訓(xùn)練獎勵模型,以及使用強化學(xué)習(xí)針對獎勵模型優(yōu)化語言模型。⑧在RLHF算法中,ChatGPT 通過強化學(xué)習(xí)框架與環(huán)境進行交互,并在每一輪交互中生成回復(fù),該回復(fù)會發(fā)送給人類評估者,人類評估者將其與期望回復(fù)進行比較后,給出獎勵值,以此代表ChatGPT生成回復(fù)的質(zhì)量。在獎勵值的反饋下,ChatGPT會自主調(diào)整回復(fù)策略,逐漸學(xué)習(xí)人類語言的風(fēng)格、情感、語氣和語境等,最終生成高仿真性的對話文本。有學(xué)者就ChatGPT對教育的影響與ChatGPT進行互動研究 ,發(fā)現(xiàn)ChatGPT有很強的交互性,能夠與人類就廣泛的主題進行非常自然化的對話。⑨此外,RLHF算法還可以利用CER (Counterfactual Experience Replay,反事實經(jīng)驗回放技術(shù)),使ChatGPT更好地適應(yīng)不同用戶的需求。通過運用該技術(shù),ChatGPT會生成多個不同的回復(fù),并根據(jù)用戶的反饋來選擇最優(yōu)回復(fù)作為訓(xùn)練數(shù)據(jù),以此了解不同用戶的不同偏好和需求,從而實現(xiàn)知識的個性化生產(chǎn)。

二、ChatGPT技術(shù)應(yīng)用于知識生產(chǎn)領(lǐng)域的角色展望

ChatGPT技術(shù)應(yīng)用場景非常廣泛,包括聊天機器人、智能客服、語音識別、文本摘要、機器翻譯和內(nèi)容生成等,未來將在知識生產(chǎn)領(lǐng)域充當(dāng)重要角色。

(一)教育培訓(xùn)領(lǐng)域的虛擬助教

ChatGPT給教育界帶來了重大變革,其強大的知識集成和生成能力能夠極大提升教師教學(xué)能力和學(xué)生學(xué)習(xí)效率。首先,ChatGPT可以作為教育輔導(dǎo)工具,幫助教師實現(xiàn)個性化教育和自主化評估。ChatGPT除了能夠幫助教師獲取最新且全面的教學(xué)資源和工具外,還能夠協(xié)助教師監(jiān)測學(xué)生的學(xué)習(xí)進展。例如,ChatGPT可以通過分析學(xué)生提交的作業(yè)和回答,自動評估學(xué)生的學(xué)習(xí)水平和理解程度,自動調(diào)整教學(xué)內(nèi)容和難度,實現(xiàn)智能化因材施教。其次,對于學(xué)生來說,ChatGPT可以作為一種智能對話輔導(dǎo)工具,提供在線答疑、課程安排、學(xué)習(xí)計劃、學(xué)習(xí)資源推薦等服務(wù)。對話本身也是一種教學(xué)實踐,傳統(tǒng)的師生對話多發(fā)生于課堂,受到教學(xué)環(huán)境和人際交往等諸多限制,而ChatGPT具有高度擬人化的知識生成能力,能夠為學(xué)生構(gòu)造仿真化的對話環(huán)境。在與ChatGPT的對話中,學(xué)生能自主探索知識與答案,這不僅突破了教師設(shè)定問題的局限性,更激發(fā)了學(xué)生的學(xué)習(xí)潛能和探索問題的積極性,有利于培養(yǎng)學(xué)生自主獲取知識的能力。有學(xué)者指出,ChatGPT 和其他生成式 AI 技術(shù)已經(jīng)在突破教育界限,并將在現(xiàn)有教育實踐中引發(fā)重大范式轉(zhuǎn)變。⑩

(二)新聞媒體領(lǐng)域的全能記者

融媒體時代要求記者具備多種技能,ChatGPT的智能化生成和個性化交互等優(yōu)勢讓它有望成為媒體領(lǐng)域的機器全能記者。在新聞報道方面,ChatGPT可以通過大批量分析和處理數(shù)據(jù)及信息,發(fā)現(xiàn)新聞線索,并自動生成新聞報道,包括新聞標(biāo)題、正文和圖片等內(nèi)容,大大提升了新聞報道的時效性和準(zhǔn)確性。同時,還可以提取文章的關(guān)鍵信息,生成文章摘要,幫助受眾快速了解文章內(nèi)容。在與受眾互動方面,與傳統(tǒng)的人工智能相比,ChatGPT能夠更好地考慮上下文和語境信息,對受眾的指令、瀏覽記錄和搜索行為等有更準(zhǔn)確的理解,從而真正發(fā)現(xiàn)受眾的興趣和需求,提供多樣化、精準(zhǔn)化的媒體內(nèi)容推薦。此外,ChatGPT還能夠通過與受眾的個性化交互和對話方式,及時跟進受眾的反饋和建議。有學(xué)者就新聞和媒體等相關(guān)知識與ChatGPT進行了問答交流,稱贊其擁有的新聞和媒體知識水平和范圍“令人印象深刻”,并能很好地協(xié)助人類記者提高媒體工作效率和質(zhì)量。

(三)學(xué)術(shù)研究領(lǐng)域的智能專家

ChatGPT對學(xué)術(shù)界的影響無疑是巨大的,它能夠幫助研究人員快速檢索文獻和資料、分析數(shù)據(jù)和交流研究結(jié)果,甚至能夠生成論文提綱和設(shè)計方案等。目前已有研究者開始使用ChatGPT來總結(jié)文獻、撰寫和改進論文。例如,有研究者嘗試使用ChatGPT 撰寫一篇有關(guān)教育方向的學(xué)術(shù)論文,整個過程總共用了2-3個小時,結(jié)果表明,ChatGPT 在幫助研究人員撰寫論文方面表現(xiàn)優(yōu)秀,能夠做到語句連貫、準(zhǔn)確(部分)、信息豐富且系統(tǒng)性強。還有研究者在ChatGPT的協(xié)助下創(chuàng)建了一篇文獻綜述文章,并利用ChatGPT對檢索到的論文摘要進行轉(zhuǎn)述,同時通過與ChatGPT的互動得到了相關(guān)問題的滿意回答,展現(xiàn)了ChatGPT在學(xué)術(shù)研究領(lǐng)域加速知識匯編和知識生成的巨大潛力。ChatGPT后期可能將應(yīng)用到設(shè)計實驗、撰寫手稿、協(xié)助同行評審和稿件錄用。

三、ChatGPT參與知識生產(chǎn)面臨的挑戰(zhàn)

雖然ChatGPT在知識生產(chǎn)領(lǐng)域具有無限的潛力,但其面臨的學(xué)術(shù)倫理、知識產(chǎn)權(quán)、人類生產(chǎn)知識的自主權(quán)等方面的挑戰(zhàn)需要高度重視。

(一)知識生成的真實性和可靠性亟待評估和驗證

多項研究證實,ChatGPT雖然能極大提升知識生產(chǎn)效率,但其存在生成錯誤內(nèi)容、編造文獻等諸多局限性。Van Dis 等人向ChatGPT提出了一系列需要深入了解文獻的問題,但ChatGPT卻通過偽造數(shù)據(jù)和事實,編造了一個讓人看起來信服的回應(yīng)。另一位研究者在應(yīng)用ChatGPT 生成論文參考文獻時發(fā)現(xiàn),ChatGPT 不僅向他提供了一篇不存在的虛構(gòu)文章,還煞有介事地提供了該文章的詳細信息以及一個非功能性 URL。這種“一本正經(jīng)的胡說八道”在ChatGPT參與學(xué)術(shù)的實踐中屢見不鮮,非常容易誤導(dǎo)研究人員和審稿人。如何對ChatGPT生成知識的真實性和可靠性進行評估和驗證,是未來推行ChatGPT技術(shù)參與知識生產(chǎn)的重大挑戰(zhàn)。

(二)學(xué)術(shù)倫理和知識產(chǎn)權(quán)遭遇重大沖擊

ChatGPT的知識生產(chǎn)能力極度依賴海量數(shù)據(jù)、復(fù)雜的算法和流程,這使得其參與知識生產(chǎn)的透明度較低,用戶很難追溯相關(guān)數(shù)據(jù)來源和理解內(nèi)容生成流程,容易引發(fā)學(xué)術(shù)侵權(quán)、學(xué)術(shù)剽竊等學(xué)術(shù)不端行為以及知識產(chǎn)權(quán)糾紛。在目前公開發(fā)表的論文中,部分研究者開始將ChatGPT列為“合著者”。如Pavlik在《與 ChatGPT 合作:考慮生成人工智能對新聞和媒體教育的影響》一文中,明確表示該論文由人類新聞和媒體研究教授與ChatGPT合著。隨著ChatGPT參與學(xué)術(shù)論文寫作的案例增多,一些學(xué)術(shù)期刊社公開發(fā)表聲明,明確禁止或嚴格限制使用ChatGPT進行學(xué)術(shù)論文撰寫。與此同時,教育界也掀起了一股“反ChatGPT”新潮,不少學(xué)校宣布禁止學(xué)生使用ChatGPT完成作業(yè)。然而,如何鑒別ChatGPT是否參與了知識生產(chǎn),目前還存在技術(shù)壁壘,學(xué)術(shù)倫理和知識產(chǎn)權(quán)仍面臨巨大挑戰(zhàn)。

(三)人類生產(chǎn)知識的潛能和自主權(quán)面臨消解危機

對ChatGPT技術(shù)的極端崇拜和過度依賴,會在一定程度上打擊人類從事知識生產(chǎn)的積極性和主動性,扼殺人類的創(chuàng)造性。由于ChatGPT能夠應(yīng)對復(fù)雜場景并在極短時間生成高質(zhì)量知識,知識生產(chǎn)者很容易被自動化生成的知識所折服,放棄主動思考和批判,長此以往可能會喪失知識生產(chǎn)的創(chuàng)造潛能。同時, ChatGPT算法有較強的自主性和深度學(xué)習(xí)能力,雖然現(xiàn)在還存在“胡說八道”的缺陷,但隨著技術(shù)迭代和數(shù)據(jù)更新,未來ChatGPT是否會擁有自主意識依然值得重視。有學(xué)者在談及人工智能的負面效應(yīng)指出,人工智能的異化會使其擺脫人類控制,甚至人工智能可能會獲得自主意識,最終將會導(dǎo)致人工智能取代人類甚至人類被奴役的結(jié)果。

四、結(jié)語

“機器是延伸自我的一種工具”,但自我不能被機器取代。如何平衡人工智能和人的智能之間的關(guān)系,實現(xiàn)人機協(xié)作與融合,將是人工智能時代下知識生產(chǎn)領(lǐng)域亟待解決的一大難題。ChatGPT技術(shù)的崛起雖然極大提升了知識生產(chǎn)的效率和質(zhì)量,給知識生產(chǎn)領(lǐng)域帶來了顛覆性變革,但我們始終要把握的原則是,知識生產(chǎn)的本質(zhì)是以人為本,“類人化”的機器始終不能取代人類的創(chuàng)造價值和意義。因此,人類在追尋用機器分擔(dān)勞動的同時,不僅要對機器產(chǎn)生的各種倫理問題進行反思,更要時刻警惕知識生產(chǎn)的自主權(quán)和批判思維不被消解。

參考文獻:

①Open AI: ChatGPT: Optimizing Language Modelsfor Dialogue,https://openai.com/blog/chatgpt/.

②⑤朱光輝、王喜文:《ChatGPT的運行模式、關(guān)鍵技術(shù)及未來圖景》,《新疆師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2023年第4期。

③令小雄、王鼎民、袁?。骸禖hatGPT 爆火后關(guān)于科技倫理及學(xué)術(shù)倫理的冷思考》,《新疆師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2023年第4期。

④韓震:《知識形態(tài)演進的歷史邏輯》,《中國社會科學(xué)》2021年第6期。

⑥Qin C, Zhang A,Zhang Z,et al. Is ChatGPT a General-Purpose Natural Language Processing Task Solver?. ArXiv. /abs/2302.06476,2023.

⑦Christiano P F, Leike J, Brown T, et al. Deep reinforcement learning from human preferences[J]. Advances in neural information processing systems, 2017,30.

⑧Ouyang L, Wu J, Jiang X, et al. Training language models to follow instructions with human feedback[J/OL]. ArXiv. /abs/2203.02155,2022.

⑨⑩Baidoo-Anu D, Owusu Ansah L. Education in the Era of Generative Artificial Intelligence (AI): Understanding the Potential Benefits of ChatGPT in Promoting Teaching and Learning. SSRN Electronic Journal,2023.

Pavlik J V. Collaborating With ChatGPT: Considering the Implications of Generative Artificial Intelligence for Journalism and Media Education [J]. Journalism & Mass Communication Educator,2023,78(1): 84-93.

Zhai X. ChatGPT User Experience: Implications for Education [J/OL]. SSRN Electronic Journal,2022.

Ayd?n ?, Karaarslan E. OpenAI ChatGPT Generated Literature Review: Digital Twin in Healthcare [J/OL]. SSRN Electronic Journal,2022.

Van Dis E A M, Bollen J, Zuidema W, et al. ChatGPT: Five priorities for Research [J]. Nature,2023,614(7947): 224-226.

Qadir J. Engineering Education in the Era of ChatGPT: Promise and Pitfalls of Generative AI for Education. TechRxiv,2022.

薛峰:《人工智能對勞動的挑戰(zhàn)與馬克思勞動理論的回應(yīng)》,《勞動哲學(xué)研究》2021年第2期。

劉偉:《智能傳播時代的人機融合思考》,《人民論壇》2018年第24期。

Davenport T H, Prusak L. Working knowledge: How organizations manage what they know[M]. Harvard Business Press,1998.

(作者王仕勇系廣西大學(xué)新聞與傳播學(xué)院院長、教授;張成琳系馬來西亞國立大學(xué)人文與社會科學(xué)學(xué)院博士研究生)

【責(zé)任編輯:韓勇】

猜你喜歡
深度學(xué)習(xí)知識產(chǎn)權(quán)人工智能
2019:人工智能
人工智能與就業(yè)
數(shù)讀人工智能
重慶五大舉措打造知識產(chǎn)權(quán)強市
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
關(guān)于知識產(chǎn)權(quán)損害賠償?shù)膸c思考
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
下一幕,人工智能!