国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大語言模型賦能圖書館知識服務(wù):基礎(chǔ)、模式

2024-12-31 00:00:00劉長輝
信息系統(tǒng)工程 2024年7期
關(guān)鍵詞:知識服務(wù)智慧圖書館

摘要:自O(shè)penAI授權(quán)微軟使用GPT-3模型開始,以大語言模型為代表生成式人工智能發(fā)展日新月異,在各行各業(yè)的應(yīng)用隨之展開了討論研究。大語言模型以海量數(shù)據(jù)為基礎(chǔ),通過人類反饋強(qiáng)化學(xué)習(xí)技術(shù)、Transformer、CoT、AIGC等技術(shù)融合應(yīng)用,為圖書館服務(wù)賦能,使圖書館滿足讀者不斷變化的需求。嘗試從數(shù)據(jù)基礎(chǔ)、技術(shù)基礎(chǔ)角度出發(fā)去探討智慧圖書館的新知識服務(wù)模式。

關(guān)鍵詞:大語言模型;智慧圖書館;知識服務(wù)

一、前言

大語言模型是一種可使用大量文本數(shù)據(jù)訓(xùn)練的深度學(xué)習(xí)模型,可以用于生成自然語言文本或理解語言文本的含義。2000年9月,出現(xiàn)了最初的大語言模型應(yīng)用,OpenAI授權(quán)微軟使用GPT-3模型,以此為標(biāo)志,以大語言模型為代表的人工智能領(lǐng)域獲得重大突破。2023年3月,OpenAI發(fā)布了更先進(jìn)的多模態(tài)預(yù)訓(xùn)練大模型GPT4.0。2023年2月,百度正式宣布推出大語言模型“文心一言”,3月上線[1]。

2022年中共中央、國務(wù)院印發(fā)的《關(guān)于推進(jìn)實施國家文化數(shù)字化戰(zhàn)略的意見》強(qiáng)調(diào)要建立具備情感計算、深度學(xué)習(xí)、模式識別的區(qū)域性智能計算中心,構(gòu)建一體化的文化計算服務(wù)體系[2]。隨著科技的進(jìn)步和國家政策的引導(dǎo),大數(shù)據(jù)鏈、人工智能等技術(shù)正融入智慧圖書館的建設(shè)。特別是大語言模型的出現(xiàn),將推動圖書館知識服務(wù)與人工智能技術(shù)的緊密結(jié)合產(chǎn)生全新服務(wù)模式,使知識服務(wù)更加大眾化。

在以ChatGPT為代表的大語言模型問世后,圖情領(lǐng)域?qū)ζ鋸V泛關(guān)注,認(rèn)為在LLM技術(shù)加持下,圖書館將提升知識服務(wù)能力并對其進(jìn)行了初步研究。例如,郭亞軍等學(xué)者深入研究了ChatGPT如何融合咨詢服務(wù)、科研服務(wù)及資源建設(shè)。張曉林研究了大語言模型下技術(shù)與人才面臨的變革。趙瑞雪等人針對圖書館如何有效整合大數(shù)據(jù)與人工智能,以提升知識服務(wù)水平進(jìn)行了深入研究[3]。

針對以上背景,本文從數(shù)據(jù)來源方面分析大語言模型優(yōu)化知識服務(wù)的數(shù)據(jù)基礎(chǔ)。從知識生成式技術(shù)、思維鏈、多層變換器架構(gòu)、人類反饋強(qiáng)化學(xué)習(xí)等技術(shù)層面分析大語言模型賦能圖書館知識服務(wù)的技術(shù)基礎(chǔ)。從參考咨詢系統(tǒng)、資源助手、學(xué)科知識服務(wù)、情報服務(wù)等角度對大語言模型在圖書館知識服務(wù)可能的應(yīng)用模式進(jìn)行探討,如圖1所示。

二、大語言模型賦能圖書館知識服務(wù)的基礎(chǔ)

(一)賦能的技術(shù)基礎(chǔ)

1.強(qiáng)化交互,使其類人化的人類反饋強(qiáng)化學(xué)習(xí)技術(shù)

人類反饋強(qiáng)化學(xué)習(xí)(RLHF)是一種將強(qiáng)化學(xué)習(xí)與人類反饋相結(jié)合的技術(shù),人類的偏好被用作獎勵信號,用于引導(dǎo)模型生成高質(zhì)量的語言輸出。其作用是將人類的反饋原理融入訓(xùn)練中,在互動學(xué)習(xí)中,為機(jī)器營造一個自然且人性化的過程,就像人類從另一個專業(yè)人士身上學(xué)習(xí)專業(yè)知識的方式一樣。RLHF是大語言模型應(yīng)用的基礎(chǔ)核心技術(shù)。人類反饋強(qiáng)化學(xué)習(xí)技術(shù)使大語言模型生成的內(nèi)容越發(fā)貼合自然語言。經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的模型系統(tǒng)能夠更精準(zhǔn)地捕捉用戶的意圖,分析用戶情感。

智慧圖書館中,大語言模型優(yōu)化后的機(jī)器人與虛擬助手服務(wù)已不可或缺[4-5]。在融合人類反饋強(qiáng)化學(xué)習(xí)技術(shù)后,大語言模型在互動、學(xué)習(xí)及技術(shù)應(yīng)用上展現(xiàn)出更強(qiáng)大的能力,不僅提升了對用戶需求的感知與理解,更在情感識別上取得了顯著進(jìn)步。大語言模型在大體掌握用戶輸入自然語言的規(guī)則和偏好下,可以生成符合日常用語習(xí)慣的語義規(guī)則,適應(yīng)多角色、多風(fēng)格的長文本生成,在表述方面呈現(xiàn)出類人化特征。大語言模型不僅反應(yīng)速度遠(yuǎn)超人類,更具備豐富的情感立場,為參考咨詢服務(wù)帶來了創(chuàng)新。

2.語義化資源的多層變換器架構(gòu)技術(shù)

對知識服務(wù)來說,資源的組織至關(guān)重要。2017年,谷歌研究人員提出的多層變換器架構(gòu)模型(Transformer)是大語言模型的基本組件[6]。Transformer架構(gòu)下的預(yù)訓(xùn)練語言模型摒棄了人工標(biāo)注,能深度揭示資料的信息。資源中長距離依賴關(guān)系的精準(zhǔn)捕捉能力,使大語言模型擁有強(qiáng)大的自然語言理解與生成能力。Transformer使大語言模型輕松駕馭大型語料庫,并展現(xiàn)出卓越的計算和資源組織能力。大語言模型對于圖書館海量的數(shù)據(jù)能夠進(jìn)行有效整理和優(yōu)化,為用戶提供更豐富和全面的資源服務(wù)。借助大語言模型技術(shù),圖書館資源從表象化的組織方式,逐漸轉(zhuǎn)變?yōu)橐哉Z義內(nèi)容為核心的組織方式。通過對文本數(shù)據(jù)進(jìn)行深入分析,如實體識別、關(guān)系抽取、知識圖譜構(gòu)建等,實現(xiàn)細(xì)粒度知識對象的組織和揭示。例如,大語言模型能自動化地對圖書的標(biāo)題、關(guān)鍵信息等進(jìn)行提取和分析,自動分類為不同的主題和情感類型[7]。

圖書館可借助其強(qiáng)大功能,從訓(xùn)練中學(xué)習(xí)語言規(guī)律構(gòu)建自已的語言模型。通過微調(diào)、預(yù)訓(xùn)練語言模型以適應(yīng)圖書館的數(shù)據(jù)集,能夠顯著提升館藏數(shù)字資源的數(shù)據(jù)組織水平。Transformer憑借其卓越的技術(shù)適用性,還能有效地預(yù)訓(xùn)練音視頻等多模態(tài)館藏資源,為用戶帶來了全新的服務(wù)體驗。

3.賦能咨詢應(yīng)答的思維鏈技術(shù)

通過讓大模型逐步參與將一個復(fù)雜問題分解為一步一步的子問題,并依次進(jìn)行求解的過程可以顯著提升大模型的性能,這一系列推理的中間步驟就被稱為思維鏈(Chain of Thought,CoT)。強(qiáng)大的邏輯推理是大語言模型“智能涌現(xiàn)”的核心能力之一,好像AI有了人的意識一樣。CoT技術(shù)的引入徹底改變了傳統(tǒng)的“問題-答案”模式,創(chuàng)新性地采用“問題-思維鏈-答案”的方式,讓用戶能夠直觀地了解答案背后的推理過程。這個推理過程從改變語境、調(diào)整句子結(jié)構(gòu)以及替換詞匯等方面增強(qiáng)大語言模型,進(jìn)一步優(yōu)化自然語言模型的性能。這些訓(xùn)練使大型語言模型具有上下文理解能力,準(zhǔn)確領(lǐng)悟并理解自然語言請求,能夠更精確地解答用戶提出的問題。

大語言模型擁有強(qiáng)大的邏輯推理,可以更高效、準(zhǔn)確地理解人類提出的復(fù)雜語義問題。智能問答、文本生成等應(yīng)答對話成為未來咨詢系統(tǒng)重要部分。這種“智能涌現(xiàn)”對話,顛覆了舊信息咨詢的方式。用戶以自然語言的方式輸入需求,系統(tǒng)嘗試自動分析輸入的文本并生成適當(dāng)?shù)捻憫?yīng)。經(jīng)過大量文本數(shù)據(jù)的預(yù)訓(xùn)練,大語言模型已在各種自然語言處理任務(wù)中展現(xiàn)出卓越的性能,支持多種來源、不同類型的知識表達(dá)方式,通過多次交互為用戶提供更智能化的問答體驗。當(dāng)用戶通過接入大語言模型的參考咨詢系統(tǒng)向它提問時,實際上是和一個經(jīng)過深度學(xué)習(xí)訓(xùn)練的“圖書館專家”進(jìn)行對話。

4.讓檢索專業(yè)度大眾化的人工智能生成式技術(shù)

生成式人工智能(AIGC)是一種革命性的技術(shù),它結(jié)合了機(jī)器學(xué)習(xí)模型和深度學(xué)習(xí)技術(shù),通過深入分析歷史數(shù)據(jù)的內(nèi)在規(guī)律,能夠創(chuàng)造出全新的文本、圖像、音頻和視頻內(nèi)容。生成式AI不是根據(jù)給定的規(guī)則或數(shù)據(jù)生成輸出,而是自主生成全新內(nèi)容,類似于人類的創(chuàng)造。大語言模型能夠利用海量數(shù)據(jù)進(jìn)行計算,持續(xù)推動內(nèi)容創(chuàng)新。它融合了“機(jī)械反饋-智能識別-深度學(xué)習(xí)”的核心理念,使得人機(jī)交互方式從被動反饋逐漸演變?yōu)槎嗑S交互,最終實現(xiàn)學(xué)習(xí)交互的飛躍。

通過處理后的資源組織覆蓋了圖書館自有及開放性資源,能為用戶檢索提供有深度和智能的數(shù)據(jù)基礎(chǔ)。檢索是知識服務(wù)的前提,在大語言模型賦能下的生成式信息獲取途徑中,不需要用戶選擇專業(yè)關(guān)鍵詞和根據(jù)檢索結(jié)果進(jìn)行判別,無論是需求明確還是需求不明確的復(fù)雜任務(wù)都被納入簡潔明了的對話交互。用戶通過日?;Z言表述咨詢需求即可。檢索結(jié)果中可能存在大量無關(guān)內(nèi)容,要想對所提供的信息進(jìn)行再檢索,只需用戶輸入新需求再次生成即可,大大地提高了用戶的體驗,并且在創(chuàng)造性生成任務(wù)當(dāng)中展現(xiàn)出深度,滿足用戶查全、查準(zhǔn)的需求。這種語義理解和文本生成的能力為學(xué)科服務(wù)的轉(zhuǎn)變提供了基礎(chǔ)。

(二)賦能的數(shù)據(jù)資源基礎(chǔ)

大語言模型信息獲取的方式加速了圖書館資源建設(shè)智能化。大語言模型在資源建設(shè)方面展現(xiàn)出了顯著的優(yōu)勢,相較于傳統(tǒng)方式,它能夠高效地完成自動化資源采集和處理任務(wù)。該模型能夠從眾多的數(shù)據(jù)源中收集相關(guān)的數(shù)據(jù),并對其進(jìn)行規(guī)范整理和自動化標(biāo)注。學(xué)術(shù)數(shù)據(jù)庫、公文數(shù)據(jù)、開放性數(shù)據(jù)以及業(yè)務(wù)系統(tǒng)數(shù)據(jù)等包含其中。這樣的獲取方式不僅節(jié)省了圖書館人員大量的時間和精力,還提升了資源建設(shè)的效率和準(zhǔn)確性。

大語言模型具備強(qiáng)大的資源整合能力,能夠?qū)D書館內(nèi)的各種非結(jié)構(gòu)化資源進(jìn)行整合利用。它密切關(guān)注用戶的信息行為,深入挖掘用戶的需求,從而進(jìn)行有針對性的研究。模型可以構(gòu)建多功能專屬圖譜,實現(xiàn)圖書館服務(wù)中各場景的協(xié)調(diào)與交互,提升圖書館的高效性、協(xié)調(diào)性和針對性感知功能,為用戶提供更加精準(zhǔn)、個性化的服務(wù)體驗。

三、大語言模型賦能圖書館知識服務(wù)可能的應(yīng)用模式

大語言模型的技術(shù)和理念優(yōu)勢將在圖書館產(chǎn)生新的知識服務(wù)模式。大語言模型將在參考咨詢系統(tǒng)自然語言化、資源助手個性化、學(xué)科服務(wù)精細(xì)化和生成化,情報服務(wù)直觀化和大眾化等方面產(chǎn)生更加積極的影響。

(一)使用自然語言的參考咨詢系統(tǒng)

大語言模型憑借強(qiáng)大的上下文學(xué)習(xí)能力、多輪對話功能以及思維邏輯推理能力,為參考咨詢服務(wù)注入了新的活力。新咨詢系統(tǒng)在自然語言對話匹配和內(nèi)容生成方面展現(xiàn)出卓越的性能,能夠精準(zhǔn)捕捉用戶的提問,并提供滿意的回答。

圖書館可以提供微調(diào)訓(xùn)練好的線上LLM參考咨詢服務(wù)系統(tǒng)或虛擬數(shù)字人館員助手,隨時隨地為用戶提供咨詢服務(wù)。用戶在進(jìn)行問答時只需輸入照自然語言指令即可。LLM參考咨詢服務(wù)系統(tǒng)或虛擬數(shù)字人館員助手在接收到指令時,會根據(jù)上下文進(jìn)行實時分析,識別出用戶的用意,無須用戶從檢索結(jié)果中進(jìn)行判別,直接在檢索結(jié)果中呈現(xiàn)出最準(zhǔn)確的選項,并且可以在連續(xù)的對話中保持上下文理解,借用多輪長對話的方式為用戶提供精準(zhǔn)的智能問答。

(二)新型的資源推廣-個性化的閱讀推廣方式

大語言模型憑借強(qiáng)大的語義化整理能力,能夠深入剖析圖書館資源間的內(nèi)在聯(lián)系,自動生成館內(nèi)資源的摘要,還能協(xié)助用戶對海量信息進(jìn)行有序整理和歸納,從而顯著提升知識獲取的效率。更值得一提的是,大語言模型打造的個性化閱讀助手能夠結(jié)合用戶的興趣偏好,精準(zhǔn)捕捉用戶的潛在需求與情緒、意愿,并自主挖掘知識資源,進(jìn)行推理和自我優(yōu)化。用戶借助自然語言輕松表達(dá)查詢需求,閱讀助手則依據(jù)用戶的個性化喜好和閱讀習(xí)慣進(jìn)行精確檢索與摘要,自動生成多模態(tài)信息以輔助閱讀。當(dāng)用戶鎖定目標(biāo)文獻(xiàn)后,閱讀助手更是憑借文本挖掘、機(jī)器學(xué)習(xí)和文本分類等先進(jìn)技術(shù),協(xié)助用戶迅速提煉和總結(jié)文獻(xiàn)的核心內(nèi)容。此外,它還能對文章進(jìn)行批量深度分析,揭示其中的結(jié)構(gòu)、演變和難點,探索潛藏的現(xiàn)象關(guān)聯(lián)與科學(xué)規(guī)律,為用戶帶來前所未有的閱讀體驗。

(三)精細(xì)化的生成式學(xué)科知識服務(wù)

圖書館的核心目標(biāo)是提供“知識服務(wù)”。技術(shù)的進(jìn)步催生了用戶需求服務(wù)類型的多樣化與個性化趨勢,舊的圖書館學(xué)科知識服務(wù)確實已經(jīng)難以滿足當(dāng)今用戶的復(fù)雜需求。

資源組織語義化后,圖書館資源中的文本、圖像和視頻形成有效鏈接,實現(xiàn)了跨模態(tài)聯(lián)合,自動形成主題化、專題化的分類體系。學(xué)科知識服務(wù)借此完成更高效、精準(zhǔn)且多樣的蛻變。文獻(xiàn)資源的深層內(nèi)容也被大語言模型強(qiáng)大的學(xué)習(xí)能力剖析出來,圖書館資源描述從表面信息組織方式向語義內(nèi)容組織方式轉(zhuǎn)變,知識組織得到精細(xì)化管理。此外,大語言模型還能構(gòu)建內(nèi)容豐富、檢索便捷的知識庫系統(tǒng)。該系統(tǒng)只需自然語言就能進(jìn)行多模態(tài)檢索,自動生成答案并補(bǔ)充相關(guān)材料,可根據(jù)用戶需求進(jìn)行智能推薦,并以對話的形式進(jìn)行交互體驗,從而顯著提升用戶的知識服務(wù)體驗[8]。

(四)直觀化、大眾化的情報服務(wù)

圖書館信息檢索服務(wù)的效率和準(zhǔn)確率對于提升用戶的檢索體驗至關(guān)重要。大語言模型在知識總結(jié)和輸出方面展現(xiàn)出了強(qiáng)大的能力,通過智能創(chuàng)作邏輯結(jié)構(gòu),對情報服務(wù)功能產(chǎn)生了深遠(yuǎn)影響。大語言模型輕松應(yīng)對代碼編寫、語言翻譯、文案撰寫,極大地豐富了情報服務(wù)的內(nèi)容。大語言模型還能夠深入理解輸入內(nèi)容,并精準(zhǔn)反饋信息,有效實現(xiàn)定題服務(wù)的目標(biāo)[9]。

大語言模型以其出色的文本生成創(chuàng)作能力,能夠精準(zhǔn)地理解上下文,并流暢地進(jìn)行多輪對話。圖書館可借助這一強(qiáng)大工具,迅速獲取直觀的答案,不僅提升了效率,還有效提高了圖書館情報服務(wù)的時效,提高了用戶的情報服務(wù)體驗。

四、結(jié)語

目前,以人工智能為代表的信息科技發(fā)日新月異,引入以ChatGPT為代表的大語言模型的科技成果將大大推動智慧圖書館建設(shè)進(jìn)程。圖書館應(yīng)加大科研資金投入,積極探索和研究大語言模型在圖書館服務(wù)中的應(yīng)用,創(chuàng)造圖書館領(lǐng)域?qū)俚拇笳Z言模型應(yīng)用產(chǎn)品,以更好地滿足用戶需求。

事情都有兩面性,面對大語言模型應(yīng)用熱潮,圖書館需要謹(jǐn)慎、準(zhǔn)確定位其在圖書館事業(yè)中的作用,避免圖書館服務(wù)的核心被忽視,失去自身的存在意義。如何避免用戶數(shù)據(jù)泄露、虛假數(shù)據(jù)傳播、知識產(chǎn)權(quán)糾紛等問題是圖書館人使用大語言模型要面臨的挑戰(zhàn)。謹(jǐn)慎面對,直面變化是當(dāng)下應(yīng)對以大語言模型為代表的人工智能發(fā)展的良策。

參考文獻(xiàn)

[1]郭亞軍,郭一若,李帥,等.ChatGPT賦能圖書館智慧服務(wù):特征、場景與路徑[J].圖書館建設(shè),2023(2):30-39+78.

[2]中國政府網(wǎng).中共中央辦公廳國務(wù)院辦公廳印發(fā)《關(guān)于推進(jìn)實施國家文化數(shù)字化戰(zhàn)略的意見》[EB/OL].http://www.gov.cn/xinwen/2022-05/22/content_5691759.htm.

[3]趙瑞雪,黃永文,馬瑋璐,等.ChatGPT對圖書館智能知識服務(wù)的啟示與思考[J].農(nóng)業(yè)圖書情報學(xué)報,2023,35(01):29-38.

[4]郭亞軍,寇旭潁,馮思倩,等.大語言模型賦能圖書館參考咨詢服務(wù):邏輯、場景與體系[J/OL].圖書館論壇.https://link.cnki.net/urlid/44.1306.G2.20240220.0947.004.

[5]郭利敏,付雅明.以大語言模型構(gòu)建智慧圖書館:框架和未來[J].圖書館雜志,2023,42(11):22-30+133.

[6]郭亞軍,馬慧芳,張鑫迪,等.ChatGPT賦能圖書館知識服務(wù):原理、場景與進(jìn)路[J/OL].圖書館建設(shè).http://kns.cnki.net/kcms/detail/23.1331.G2.20230713.1606.004.html.

[7]王翼虎,白海燕,孟旭陽.大語言模型在圖書館參考咨詢服務(wù)中的智能化實踐探索[J].情報理論與實踐,2023(08):96-103.

[8]羅飛,崔濱,辛小江,等.大語言模型嵌入圖書館知識服務(wù)的風(fēng)險范式與管控策略[J].圖書與情報,2023(03):99-106.

[9]王毅,董怡婷.類ChatGPT人工智能在圖書館智慧服務(wù)中的應(yīng)用與思考[J].圖書館理論與實踐,2023(06):129-136.

基金項目:福建商學(xué)院校級項目“高校思政課教學(xué)資源對教學(xué)目標(biāo)達(dá)成研究”(項目編號:2023SJB01)

作者單位:福建商學(xué)院

■ 責(zé)任編輯:王穎振、鄭凱津

猜你喜歡
知識服務(wù)智慧圖書館
基于“互聯(lián)網(wǎng)+”視閾下的智慧圖書館用戶服務(wù)
基于知識服務(wù)的檔案管理模式研究
跨境電商供應(yīng)鏈中的知識服務(wù)供需匹配模型研究
構(gòu)建圖書館知識服務(wù)理論體系的思考
嵌入心理契約的館員知識服務(wù)能力建設(shè)研究
中學(xué)師資培訓(xùn)系統(tǒng)的設(shè)計
商情(2016年39期)2016-11-21 09:55:26
從西方國家保護(hù)消費者權(quán)益政策看用戶信息消費的安全管理
Beacon技術(shù)在圖書館信息服務(wù)中的應(yīng)用研究
智慧圖書館項目建設(shè)的應(yīng)用實踐
論智慧圖書館的三大特點
水富县| 伊春市| 浠水县| 东明县| 彰武县| 昌黎县| 乡宁县| 报价| 个旧市| 盐城市| 阳朔县| 盖州市| 寻乌县| 安陆市| 剑川县| 察隅县| 新乐市| 高安市| 南雄市| 梓潼县| 阳东县| 潮安县| 进贤县| 洪泽县| 宁晋县| 华阴市| 博白县| 溧阳市| 明溪县| 昌图县| 宁强县| 钦州市| 吐鲁番市| 思茅市| 休宁县| 渝中区| 岫岩| 绥中县| 阿拉善盟| 祁阳县| 遂川县|