[摘 要]圖書館具有數(shù)據(jù)海量、類型繁多、價值密度低、處理速度快的數(shù)據(jù)環(huán)境,基于AI的數(shù)據(jù)管理策略可以有效提升圖書館數(shù)據(jù)管理的科學(xué)性、智慧性、經(jīng)濟(jì)性和安全性。研究大數(shù)據(jù)時代圖書館數(shù)據(jù)管理的內(nèi)容與目標(biāo),構(gòu)建圖書館基于AI的數(shù)據(jù)治理體系,提出大數(shù)據(jù)環(huán)境下圖書館基于AI的數(shù)據(jù)管理策略,為構(gòu)建智慧圖書館與讀者個性化服務(wù)定制提供可靠的數(shù)據(jù)決策支持。
[關(guān)鍵詞]人工智能 圖書館 數(shù)據(jù) 管理
[分類號] G250.7
隨著大數(shù)據(jù)、云計算、物聯(lián)網(wǎng)、高速移動傳輸網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,圖書館的數(shù)據(jù)呈現(xiàn)海量(Volume)、高速(Velocity)、多樣(Variety)、高價值(Value)的“4V”數(shù)據(jù)特征,這些大數(shù)據(jù)既是圖書館智慧決策與讀者個性化服務(wù)的科學(xué)依據(jù),也是圖書館智慧服務(wù)體系的重要組成部分。
據(jù)國際數(shù)據(jù)公司(IDC)預(yù)測,中國是世界上數(shù)據(jù)總量增速最快的國家,平均每年的增速比全球平均速度快3%。預(yù)計到2025年將增至48.6ZB,占全球數(shù)據(jù)總量的27.8%,且年均復(fù)合增長率將達(dá)到30.35%[1]。隨著算法應(yīng)用模型、數(shù)據(jù)決策理論和數(shù)據(jù)智慧服務(wù)場景的優(yōu)化與創(chuàng)新,大數(shù)據(jù)的價值、數(shù)據(jù)總量增速、結(jié)構(gòu)復(fù)雜度及數(shù)據(jù)來源多樣性和可用性遠(yuǎn)高于其他行業(yè)的平均水平,因此,如何利用人工智能(AI)技術(shù)實(shí)現(xiàn)數(shù)據(jù)資產(chǎn)的科學(xué)管理,是智慧圖書館建設(shè)的關(guān)鍵要素之一
1 圖書館AI數(shù)據(jù)管理的意義
1.1 提升數(shù)據(jù)決策智慧程度
大數(shù)據(jù)時代雖然為圖書館提供了強(qiáng)大的數(shù)據(jù)采集、傳輸、存儲、分析和決策的信息技術(shù)基礎(chǔ)設(shè)施系統(tǒng)支持,但傳統(tǒng)的數(shù)據(jù)管理與應(yīng)用系統(tǒng)建設(shè)缺乏整體規(guī)劃,各子系統(tǒng)僅能單一、獨(dú)立地處理個性化問題,不能統(tǒng)一、協(xié)調(diào)地實(shí)現(xiàn)大數(shù)據(jù)分析與決策的部署與傳輸,使圖書館內(nèi)部形成多個數(shù)據(jù)孤島和不同的數(shù)據(jù)標(biāo)準(zhǔn)。此外,數(shù)據(jù)與讀者個性化需求的匹配度決定了圖書館服務(wù)智慧水平,AI數(shù)據(jù)管理可為圖書館服務(wù)決策提供海量、精確和高價值密度的訓(xùn)練數(shù)據(jù),實(shí)現(xiàn)讀者個性化智慧服務(wù)的精準(zhǔn)落地[2]。
1.2 提高圖書館智慧服務(wù)質(zhì)量
數(shù)據(jù)治理的科學(xué)性、高效性、經(jīng)濟(jì)性和智慧化程度,直接關(guān)系智慧圖書館決策的科學(xué)性和圖書館讀者智慧服務(wù)推送的有效性,AI數(shù)據(jù)管理能有效提高圖書館智慧服務(wù)質(zhì)量。目前,圖書館數(shù)據(jù)治理涉及數(shù)據(jù)的采集、傳輸、存儲、處理、分析、AI訓(xùn)練、推理、決策和應(yīng)用等步驟,除圖書館IT應(yīng)用系統(tǒng)的數(shù)據(jù)處理能力、數(shù)據(jù)治理工具外,AI人才、AI數(shù)據(jù)治理環(huán)節(jié)的流程化、標(biāo)準(zhǔn)化、體系化和業(yè)務(wù)兼容性程度等,也都是影響圖書館AI大數(shù)據(jù)治理效率和質(zhì)量的關(guān)鍵因素。
1.3 提升大數(shù)據(jù)的價值總量
數(shù)據(jù)資產(chǎn)是圖書館的核心資產(chǎn),基于AI技術(shù)的數(shù)據(jù)管理可以完全挖掘大數(shù)據(jù)價值,提供其價值密度,發(fā)現(xiàn)蘊(yùn)藏其中的知識,實(shí)現(xiàn)數(shù)據(jù)的精細(xì)化管理。受當(dāng)前數(shù)據(jù)的管理、處理、分析和決策技術(shù)限制,雖然非結(jié)構(gòu)化數(shù)據(jù)占圖書館大數(shù)據(jù)總量的85%以上,但其使用率僅占圖書館大數(shù)據(jù)整體使用率的30%,整體處于待發(fā)現(xiàn)、挖掘和智慧決策的狀態(tài)[3]。采用AI技術(shù)對數(shù)據(jù)進(jìn)行自動化智慧管理,實(shí)現(xiàn)數(shù)據(jù)的智慧采集、自動編目、應(yīng)用系統(tǒng)集成、清洗、管理、隱私保護(hù)和共享,是圖書館解決海量、復(fù)雜、碎片化數(shù)據(jù)管理與應(yīng)用的有效方法。
2 圖書館數(shù)據(jù)資產(chǎn)治理的內(nèi)容
數(shù)據(jù)治理是圖書館安全、高效、經(jīng)濟(jì)、可控地管理數(shù)據(jù),完全挖掘數(shù)據(jù)價值,實(shí)現(xiàn)智慧圖書館建設(shè)和讀者個性化智慧服務(wù)的關(guān)鍵環(huán)節(jié)。圖書館數(shù)據(jù)治理涉及數(shù)據(jù)采集、傳輸、清洗、存儲、計算、分析和決策應(yīng)用,這一過程也包含了數(shù)據(jù)從產(chǎn)生到消亡的全生命周期過程[4]。因此,圖書館數(shù)據(jù)治理應(yīng)結(jié)合不同類型數(shù)據(jù)生命周期的結(jié)構(gòu)特點(diǎn),利用相應(yīng)的數(shù)據(jù)治理工具和理論,在圖書館內(nèi)實(shí)現(xiàn)數(shù)據(jù)的全閉環(huán)流程治理,不斷增強(qiáng)數(shù)據(jù)的智慧決策價值。
2.1 基于AI的圖書館數(shù)據(jù)類型劃分
依據(jù)圖書館數(shù)據(jù)生命周期流程特點(diǎn)及數(shù)據(jù)治理內(nèi)容、結(jié)構(gòu)與來源劃分圖書館數(shù)據(jù)類型,如表1所示。
將數(shù)據(jù)按照治理內(nèi)容進(jìn)行劃分,可分為元數(shù)據(jù)、主數(shù)據(jù)和實(shí)時數(shù)據(jù)。依據(jù)圖書館數(shù)據(jù)結(jié)構(gòu)和存儲、查詢、調(diào)試方式的不同,可將數(shù)據(jù)劃分為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并根據(jù)各數(shù)據(jù)的特點(diǎn)實(shí)現(xiàn)數(shù)據(jù)安全、高效和經(jīng)濟(jì)的管理與調(diào)度。半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)占據(jù)圖書館數(shù)據(jù)總量的85%以上,其中蘊(yùn)藏著巨大的數(shù)據(jù)價值,是圖書館智慧決策與智慧服務(wù)所依據(jù)的主要內(nèi)容[5]。此外,伴隨數(shù)據(jù)采集與傳輸技術(shù)的發(fā)展,圖書館外部采集和第三方服務(wù)商共享的數(shù)據(jù),將會成為圖書館個性化智慧服務(wù)定制與推送的關(guān)鍵數(shù)據(jù)。圖書館必須依據(jù)數(shù)據(jù)的來源制定相應(yīng)的安全管理和資源共享策略,才能確保數(shù)據(jù)安全、合法、實(shí)時、可靠地使用。
2.2 AI數(shù)據(jù)治理的內(nèi)容與流程
圖書館數(shù)據(jù)環(huán)境具有數(shù)據(jù)海量、結(jié)構(gòu)復(fù)雜、多數(shù)據(jù)來源、低價值密度和處理高速的特點(diǎn),因此,數(shù)據(jù)治理流程要以數(shù)據(jù)智慧決策需求為依據(jù),包含從數(shù)據(jù)采集到智慧決策的全數(shù)據(jù)生命周期流程,避免全數(shù)據(jù)的治理陷阱,構(gòu)建符合圖書館當(dāng)前數(shù)據(jù)應(yīng)用現(xiàn)狀及未來發(fā)展的安全管理框架,有效保證數(shù)據(jù)全生命周期流程管理的合法、合規(guī)性。此外,還應(yīng)通過AI技術(shù)實(shí)現(xiàn)對多數(shù)據(jù)來源、非結(jié)構(gòu)化數(shù)據(jù)的全流程管理,以數(shù)據(jù)的高價值密度保證、字段多樣性、分布科學(xué)性和決策實(shí)時性等方面為重點(diǎn)?;跀?shù)據(jù)生命周期的AI數(shù)據(jù)管理內(nèi)容與流程,主要由數(shù)據(jù)管理的對象與內(nèi)容、數(shù)據(jù)管理要求和數(shù)據(jù)管理平臺系統(tǒng)三部分組成,涉及數(shù)據(jù)管理全平臺、全生命周期流程、全數(shù)據(jù)科學(xué)決策需求和全智慧決策對象,如圖1所示[6]。
3 圖書館基于AI的數(shù)據(jù)治理體系構(gòu)建
圖書館數(shù)據(jù)治理內(nèi)容包括數(shù)據(jù)的采集、傳輸、清理、存儲、標(biāo)注、處理、訓(xùn)練、部署、決策和銷毀等操作,涉及大數(shù)據(jù)的全生命周期流程。基于AI的數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型管理和應(yīng)用部署等環(huán)節(jié)的科學(xué)性、可操作性,關(guān)系到圖書館數(shù)據(jù)治理的效率、科學(xué)性、可用性、經(jīng)濟(jì)性和安全性,圖書館基于AI的大數(shù)據(jù)管理體系及流程如圖2所示。它是以圖書館大數(shù)據(jù)存儲庫為核心,涉及大數(shù)據(jù)的采集管理、數(shù)據(jù)質(zhì)量的保證與評定標(biāo)準(zhǔn)、大數(shù)據(jù)的質(zhì)量管理體系等環(huán)節(jié)的閉合應(yīng)用數(shù)據(jù)管理體系流程[7]。
3.1 基于AI的圖書館數(shù)據(jù)采集管理
圖書館大數(shù)據(jù)的價值密度、準(zhǔn)確性、時效性和決策科學(xué)性,直接關(guān)系到基于AI的數(shù)據(jù)管理系統(tǒng)模型在AI離線訓(xùn)練和上線推理過程中的精確性[8]。因此,圖書館應(yīng)加強(qiáng)對初始數(shù)據(jù)采集的質(zhì)量管理,通過對數(shù)據(jù)在AI數(shù)據(jù)管理閉環(huán)流通模型中,進(jìn)行噪聲過濾、價值量提升、應(yīng)用相關(guān)性增強(qiáng)和智能標(biāo)注等操作,結(jié)合圖書館數(shù)據(jù)管理AI模型中的離線訓(xùn)練和上線推理過程,使圖書館采集數(shù)據(jù)更加科學(xué)、準(zhǔn)確、實(shí)時和可用。此外,可通過圖書館AI優(yōu)化數(shù)據(jù)的閉環(huán)流通,打造數(shù)據(jù)采集和回饋分析的閉環(huán)式自主學(xué)習(xí)體系,實(shí)現(xiàn)AI模型上線后的持續(xù)迭代優(yōu)化,滿足不同復(fù)雜場景AI應(yīng)用的需求。
3.2 數(shù)據(jù)質(zhì)量的評定與有效性保證
圖書館數(shù)據(jù)質(zhì)量的保證與評定標(biāo)準(zhǔn),是與圖書館大數(shù)據(jù)AI治理與智慧決策的必要需求。圖書館數(shù)據(jù)具有異構(gòu)多源、結(jié)構(gòu)多樣、強(qiáng)實(shí)時性和多噪聲的特點(diǎn),因此,其數(shù)據(jù)質(zhì)量的評定標(biāo)準(zhǔn)主要由有效性、一致性、可用性、唯一性、時序性、完整性、合理性和準(zhǔn)確性8個維度組成,在對圖書館數(shù)據(jù)的質(zhì)量評估和訓(xùn)練中,應(yīng)對數(shù)據(jù)的可用性、唯一性、完整性和準(zhǔn)確性4個維度給予較高的評估影響因子[9]。
此外,圖書館數(shù)據(jù)治理應(yīng)根據(jù)數(shù)據(jù)的類型、結(jié)構(gòu)、用途和作用對象等,動態(tài)調(diào)整評定標(biāo)準(zhǔn)的評估維度和內(nèi)容。比如,讀者閱讀數(shù)據(jù)和圖書館用戶服務(wù)數(shù)據(jù)的AI訓(xùn)練應(yīng)結(jié)合讀者智慧閱讀滿意度和圖書館服務(wù)收益率。而占數(shù)據(jù)總量比較高的讀者個性化閱讀服務(wù)數(shù)據(jù)的評估中,應(yīng)針對性地提高與數(shù)據(jù)時序性相關(guān)的實(shí)時性和時間間隔的影響因子,以增強(qiáng)數(shù)據(jù)管理模型AI訓(xùn)練的科學(xué)性,不斷提升AI數(shù)據(jù)管理系統(tǒng)自動化管理的準(zhǔn)確度、系統(tǒng)效率和智能化水平[10]。
3.3 圖書館AI大數(shù)據(jù)質(zhì)量管理體系的構(gòu)建
3.3.1 數(shù)據(jù)的采集管理與定義
圖書館采取的是實(shí)時、動態(tài)、全對象和360度的全數(shù)據(jù)采集模式,因此,圖書館AI數(shù)據(jù)管理模型只有通過統(tǒng)一的數(shù)據(jù)語言和標(biāo)準(zhǔn),才能實(shí)現(xiàn)多來源、多決策對象和多應(yīng)用系統(tǒng)數(shù)據(jù)的融合、共享與復(fù)用[11]。圖書館在數(shù)據(jù)類型結(jié)構(gòu)與特征定義中,應(yīng)結(jié)合國家、行業(yè)和地方相關(guān)數(shù)據(jù)標(biāo)準(zhǔn),以及自身的數(shù)據(jù)特征環(huán)境和智慧應(yīng)用業(yè)務(wù)實(shí)際,構(gòu)建基礎(chǔ)數(shù)據(jù)標(biāo)準(zhǔn)、指標(biāo)數(shù)據(jù)標(biāo)準(zhǔn)、缺失與異常數(shù)據(jù)標(biāo)準(zhǔn)和數(shù)據(jù)應(yīng)用模型標(biāo)準(zhǔn),以實(shí)現(xiàn)圖書館外部與內(nèi)部多源數(shù)據(jù)的融合互通。
3.3.2 基于AI的數(shù)據(jù)安全管理
在基于AI的數(shù)據(jù)質(zhì)量管理體系中,數(shù)據(jù)的安全性是關(guān)系智慧圖書館安全可靠度和讀者智慧閱讀服務(wù)滿意度的關(guān)鍵因素,安全性管理應(yīng)涉及數(shù)據(jù)全生命周期應(yīng)用流程。具體可通過數(shù)據(jù)安全的監(jiān)控審計、協(xié)作第三方的安全管理、用戶身份與權(quán)限的鑒別、安全風(fēng)險事件防控和應(yīng)急安全事件管理、數(shù)據(jù)加密與防火墻安全系統(tǒng)構(gòu)建等實(shí)現(xiàn)。在安全管理中,圖書館應(yīng)通過AI訓(xùn)練來持續(xù)提升IT系統(tǒng)的數(shù)據(jù)安全事件智能化預(yù)測、識別、分析、判斷和智慧決策能力,保證圖書館數(shù)據(jù)安全管理的智能、高效、自動、實(shí)時和自我優(yōu)化[12]。
3.3.3 基于AI的核心數(shù)據(jù)管理
出于對投資收益的考慮,圖書館應(yīng)將主要系統(tǒng)資源和AI管理策略應(yīng)用于核心數(shù)據(jù)上[13]。核心數(shù)據(jù)主要由圖書館重點(diǎn)業(yè)務(wù)、IT關(guān)鍵應(yīng)用數(shù)據(jù)、核心讀者群個體小數(shù)據(jù)、第三方協(xié)作服務(wù)商關(guān)鍵數(shù)據(jù)、數(shù)據(jù)中心IT系統(tǒng)重要事件生成數(shù)據(jù)、數(shù)據(jù)中心IT系統(tǒng)配置參數(shù)、用戶保密和隱私數(shù)據(jù)等組成,是關(guān)系圖書館服務(wù)安全性、讀者滿意度、系統(tǒng)管理智慧性和服務(wù)收益率的重要數(shù)據(jù)。在基于AI的核心數(shù)據(jù)管理中,圖書館應(yīng)避免核心數(shù)據(jù)采集、存儲、分析和決策流程大而全的思路,依據(jù)核心數(shù)據(jù)對圖書館的IT管理業(yè)務(wù)、服務(wù)收益率、讀者滿意度、決策智慧性和決策科學(xué)性的影響因子數(shù)值大小,調(diào)整數(shù)據(jù)采集與應(yīng)用的投入,確保最優(yōu)服務(wù)收益率[14]。
3.4 圖書館大數(shù)據(jù)庫的AI訓(xùn)練原則
圖書館通過AI對存儲系統(tǒng)的訓(xùn)練與管理,可以有效提升圖書館數(shù)據(jù)存儲的智慧化、自動化和動態(tài)管控能力。第一,海量、高價值和強(qiáng)相關(guān)性數(shù)據(jù)是機(jī)器學(xué)習(xí)模型與算法科學(xué)性驗(yàn)證、優(yōu)化、提升的關(guān)鍵,圖書館必須依據(jù)AI機(jī)器訓(xùn)練需求,為其提供總量為TB甚至PB級別的科學(xué)訓(xùn)練數(shù)據(jù)。第二,圖書館為機(jī)器學(xué)習(xí)模型訓(xùn)練數(shù)據(jù)的輸入/輸出速度、單位時間吞吐量及機(jī)器學(xué)習(xí)模型和AI算法并行處理訓(xùn)練數(shù)據(jù)的能力,也是決定機(jī)器學(xué)習(xí)能力與時效性的關(guān)鍵因素。第三,依據(jù)數(shù)據(jù)的類型、安全存儲需求、用戶訪問頻率和數(shù)據(jù)量大小,將數(shù)據(jù)分別存儲于基于本地超高速網(wǎng)絡(luò)的存儲集群系統(tǒng)和云存儲系統(tǒng),是圖書館目前采取的主要數(shù)據(jù)存儲方式。圖書館必須根據(jù)數(shù)據(jù)存儲網(wǎng)絡(luò)系統(tǒng)的負(fù)荷和數(shù)據(jù)流變化趨勢,根據(jù)AI訓(xùn)練結(jié)果,精確掌握存儲系統(tǒng)傳輸網(wǎng)絡(luò)和數(shù)據(jù)庫系統(tǒng)的存儲瓶頸與動態(tài)負(fù)荷,才能有效進(jìn)行存儲系統(tǒng)資源調(diào)度和負(fù)荷的動態(tài)均衡分配[15]。
4 結(jié)語
當(dāng)前,自然語言處理、知識獲取與表現(xiàn)、機(jī)器學(xué)習(xí)、智能搜索、動態(tài)感知、模式識別和資源智慧組合調(diào)度等技術(shù)已成為智慧圖書館構(gòu)建和讀者個性化閱讀服務(wù)的關(guān)鍵支撐,而圖書館海量、高價值和高相關(guān)性的數(shù)據(jù)恰是這些關(guān)鍵技術(shù)在智慧圖書館構(gòu)建中落地的基礎(chǔ)與依據(jù)。伴隨著圖書館采集數(shù)據(jù)、系統(tǒng)生成數(shù)據(jù)、服務(wù)數(shù)據(jù)和讀者個人數(shù)據(jù)總量的指數(shù)級遞增,數(shù)據(jù)呈現(xiàn)海量、結(jié)構(gòu)類型繁雜、低價值密度和高時效的特點(diǎn),數(shù)據(jù)存儲也呈現(xiàn)出系統(tǒng)管理與服務(wù)終端、本地大數(shù)據(jù)庫、云存儲空間等多種存儲模式共存現(xiàn)象,圖書館的海量小文件數(shù)據(jù)、熱點(diǎn)目錄和讀多寫少的數(shù)據(jù)讀取模式,對大數(shù)據(jù)的存儲管理模式與應(yīng)用決策方法提出了挑戰(zhàn)。因此,圖書館在基于AI技術(shù)的大數(shù)據(jù)智慧、自動化動態(tài)管理中,必須將降低冗余數(shù)據(jù)存儲總量、提升數(shù)據(jù)存儲效率、保證訓(xùn)練數(shù)據(jù)高相關(guān)性和智慧服務(wù)有效性等作為數(shù)據(jù)管理的主要目標(biāo),在數(shù)據(jù)的采集、標(biāo)注、處理、匹配、訓(xùn)練和部署流程中,堅持應(yīng)用海量、安全、精準(zhǔn)和強(qiáng)相關(guān)性的原則,通過機(jī)器學(xué)習(xí)讓數(shù)據(jù)管理系統(tǒng)自動形成最優(yōu)算法,實(shí)現(xiàn)AI數(shù)據(jù)管理系統(tǒng)的自我選擇、優(yōu)化與更新[16]。
參考文獻(xiàn):
[1] 安小米,等.國際標(biāo)準(zhǔn)中的數(shù)據(jù)治理:概念、視角及其標(biāo)標(biāo)準(zhǔn)化協(xié)同路徑[J].中國圖書館學(xué)報,2021(5):59-79.
[2] 李國良,周煊赫.面向AI的數(shù)據(jù)管理技術(shù)綜述[J].軟件學(xué)報,2021(1):21-40.
[3] 梁俊榮.基于大數(shù)據(jù)決策的圖書館信息系統(tǒng)安全分析與管理研究[J].圖書館理論與實(shí)踐,2017(3):93-98.
[4] 葉蘭.高校圖書館科學(xué)數(shù)據(jù)管理服務(wù)能力成熟度模型構(gòu)建與應(yīng)用研究[J].圖書情報工作,2022(6):3-14.
[5] IBM data governance maturity model[EB/OL]. [2022-07-11].https://www.lightsondata.com/?s=IBM+data+governance+maturity+modelamp;tcb_sf_post_type%5B%5D=postamp;tcb_sf_post_type%5B%5D=page.
[6] 徐緒堪,薛夢瑤.面向大數(shù)據(jù)管理與應(yīng)用專業(yè)的數(shù)據(jù)素養(yǎng)能力評價指標(biāo)體系構(gòu)建[J].情報理論與實(shí)踐,2021(9):50-56.
[7] 李冰,賓軍志.數(shù)據(jù)管理能力成熟度模型[J].大數(shù)據(jù),2017(4):29-36.
[8] A guide to creating an effective big data management framework[EB/OL].[2024-01-05].https://journalofbigdata.springeropen.com/articles/10.1186/s40537-023-00801-9.
[9] 陳媛媛.高??蒲袛?shù)據(jù)管理服務(wù)能力研究[J].情報雜志,2020(6):203-207.
[10] 葉蘭.數(shù)據(jù)管理能力成熟度模型比較研究與啟示[J].圖書情報工作,2020(13):51-57.
[11] 崔建偉,趙哲,杜小勇.支撐機(jī)器學(xué)習(xí)的數(shù)據(jù)管理技術(shù)綜述[J].軟件學(xué)報,2021(3):604-621.
[12] 秦小燕,初景利.科學(xué)數(shù)據(jù)素養(yǎng)能力評價指標(biāo)體系構(gòu)建研究[J].圖書與情報,2020(4):56-66.
[13] ICPSR.Data Management amp; Curation[EB/OL].[2022-07-11]. https://www. icp sr. umich.edu/web/pages/data management/index.html.
[14] 孫路明,等.人工智能賦能的數(shù)據(jù)管理技術(shù)研究[J].軟件學(xué)報,2020(3):600-619.
[15] 柴茗珂,范舉,杜小勇.學(xué)習(xí)式數(shù)據(jù)庫系統(tǒng):挑戰(zhàn)與機(jī)遇[J].軟件學(xué)報,2020(3):806-830.
[16] Sadri Z,Gruenwald L, Leal E. Online index selection using deep reinforcement learning for a cluster database[J].ICDEW,2020:158-161.
白忠睿 女,1991年生。碩士,館員。研究方向:閱讀推廣、信息資源管理。
陳 臣 男,1974年生。碩士,教授。研究方向:大數(shù)據(jù)、數(shù)字圖書館建設(shè)。
李若冰 女,1999年生。本科生在讀。研究方向:人工智能。
(收稿日期:2024-01-09;責(zé)編:劉清揚(yáng)。)