近年來,隨著大數(shù)據(jù)技術、云計算技術、傳感器網(wǎng)絡技術與人工智能技術的快速發(fā)展,圖書館已跨入了第三代圖書館時代。第三代圖書館可以全方位、多對象、多角度和不間斷地采集服務系統(tǒng)運營與讀者個性化服務相關大數(shù)據(jù),并通過對所采集大數(shù)據(jù)的完全價值挖掘與知識發(fā)現(xiàn)可大幅提高圖書館服務能力,在服務平臺系統(tǒng)構建、讀者閱讀需求預測、個性化服務定制與推送等方面改善和提升用戶關系管理的智慧化水平
。
大數(shù)據(jù)技術是第三代圖書館的核心技術,大數(shù)據(jù)應用在提高圖書館智慧服務能力與讀者閱讀滿意度的同時,也導致圖書館大數(shù)據(jù)應用場景中被訪問的數(shù)據(jù)總量以指數(shù)級激增,使圖書館大數(shù)據(jù)環(huán)境呈現(xiàn)出海量(Volume)、多類型(Variety )、處理速度快(Velocity)、價值密度低(Value)的“4V”特點??梢哉f當下的大數(shù)據(jù)應用現(xiàn)實狀況對圖書館數(shù)據(jù)管理提出了新的要求。
傳統(tǒng)的第二代圖書館數(shù)據(jù)管理策略與技術已不能滿足第三代圖書館大數(shù)據(jù)智慧決策的需求
。調(diào)研機構Gartner公司也在其2018年4月發(fā)布的名為《數(shù)據(jù)中心即將消亡,數(shù)字基礎設施出現(xiàn)》的調(diào)查報告中表明,到2025年,80%的企業(yè)將關閉其傳統(tǒng)的數(shù)據(jù)中心
。因此,如何利用人工智能技術(AI)強大的機器學習、邏輯推理和系統(tǒng)規(guī)劃能力,來智慧管理復雜數(shù)據(jù)場景下的圖書館大數(shù)據(jù)庫系統(tǒng)與應用,是第三代圖書館提升大數(shù)據(jù)管理效率與智慧化水平,降低大數(shù)據(jù)決策與應用成本,保證圖書館智慧化建設與用戶服務能力的關鍵。
表8列示了經(jīng)過GDP平減指數(shù)調(diào)整與增加經(jīng)濟周期變量后研發(fā)投入的斷點診斷分析結果。筆者發(fā)現(xiàn),企業(yè)研發(fā)投入在供給側改革當年(2013年)就呈現(xiàn)出顯著的結構性調(diào)整效果,斷點跳躍(Lwald)系數(shù)顯著為正的0.366,且達到了最高峰值,2014年跳躍系數(shù)僅為0.148。而相對地,供給側改革前(2012年)企業(yè)研發(fā)投入斷點回歸中卻有一個顯著地向下跳躍的斷點,跳躍系數(shù)顯著地為負的0.113。這表明在排除經(jīng)濟周期性與通貨膨脹等因素后,供給側改革前我國企業(yè)研發(fā)投入是存在一個遞減的趨勢。因此,整體而言,上述斷點檢驗結果佐證了供給側改革結構性調(diào)整的結構性效果,而且政策執(zhí)行效果在2013年底體現(xiàn)出實質(zhì)性調(diào)整效果。
第三代圖書館的概念源于“上海圖書館東館”籌建調(diào)研。為了確保新館20年不落后,調(diào)研組對全球圖書館建筑現(xiàn)狀和發(fā)展趨勢進行了深入分析研究,并結合新中國建立前后兩個時期上海圖書館建筑的特點,提出了作為第三代的上海圖書館東館建設規(guī)劃
。面向未來的第三代圖書館相比第二代圖書館而言,具有促進知識流通、創(chuàng)新交流環(huán)境、注重多元素養(yǎng)、激發(fā)社群活力等4個顯著功能,將更加注重人的需求、可接近性、開放性、生態(tài)環(huán)境和資源融合,致力于促進知識流通、創(chuàng)新交流環(huán)境、注重多元素養(yǎng)和激發(fā)社群活力。在此基礎上,圖書館需要在服務系統(tǒng)構建、運營和讀者服務過程中,加大對相關全數(shù)據(jù)進行有效的收集、存儲、處理和應用,才能滿足其大數(shù)據(jù)智慧管理和用戶服務智慧決策的需求。而隨著圖書館數(shù)據(jù)中心數(shù)據(jù)總量、結構復雜度的不斷增長,以及大數(shù)據(jù)決策的效率、可用性需求和數(shù)據(jù)管理工作量的快速上升,圖書館必須利用人工智能(AI)技術來完成這一任務。
數(shù)據(jù)質(zhì)量保證層接收來自底層數(shù)據(jù)資源層的數(shù)據(jù),通過大數(shù)據(jù)清洗與過濾、數(shù)據(jù)集成提取、數(shù)據(jù)分析處理等流程,實現(xiàn)圖書館大數(shù)據(jù)的噪聲信號過濾和價值提取。清洗后的數(shù)據(jù)交付數(shù)據(jù)價值評估模塊進行數(shù)據(jù)價值總量、信噪比、決策相關性和可用性評估,并依據(jù)評估結果對大數(shù)據(jù)清洗、數(shù)據(jù)集成提?。粩?shù)據(jù)分析處理模塊進行反饋控制與二次優(yōu)化,并將最終達標合格信號交付標準化輸出系統(tǒng)進行數(shù)據(jù)格式、內(nèi)容的轉換與標準化處理,然后傳輸至可用數(shù)據(jù)驗收模塊進行存儲管理
。
此外,基于DL (深度學習)的AI數(shù)據(jù)管理系統(tǒng),也應通過自我學習的威脅檢測和監(jiān)控算法來鑒別被管理數(shù)據(jù)的完整性和安全性,以及實施最優(yōu)化的數(shù)據(jù)管理負載平衡、服務系統(tǒng)電力分配和服務系統(tǒng)資源調(diào)度等工作
。
圖書館主數(shù)據(jù)是用來描述讀者個體特征與閱讀行為、第三方增值服務商業(yè)務、圖書館管理與服務系統(tǒng)、讀者個性化服務內(nèi)容、傳感器采集數(shù)據(jù)、讀者評價與反饋數(shù)據(jù)、閱讀終端采集數(shù)據(jù)的數(shù)據(jù)。這些數(shù)據(jù)具有較高的大數(shù)據(jù)決策價值,可以在圖書館不同業(yè)務部門和不同決策對象中反復使用,并且存在于多個異構的應用系統(tǒng)中。集成、共享、數(shù)據(jù)質(zhì)量、數(shù)據(jù)治理是圖書館主數(shù)據(jù)管理的四大要素,對于圖書館主數(shù)據(jù)管理應堅持高價值總量、高價值密度、精確、完整、一致和權威性的原則,確保主數(shù)據(jù)可支持圖書館不同的業(yè)務部門、業(yè)務系統(tǒng)、業(yè)務流程和業(yè)務對象大數(shù)據(jù)決策的科學性
。
伴隨著圖書館服務模式多樣化和大數(shù)據(jù)應用技術的不斷發(fā)展,圖書館數(shù)據(jù)環(huán)境復雜度快速增長。在讀者個性化閱讀服務中,圖書館服務產(chǎn)生的非結構化數(shù)據(jù)主要有服務系統(tǒng)運營數(shù)據(jù)、傳感器網(wǎng)絡采集數(shù)據(jù)、閱讀終端采集數(shù)據(jù)、讀者閱讀行為數(shù)據(jù)、讀者個體位置與移動路徑數(shù)據(jù)、視頻監(jiān)控數(shù)據(jù)等,且數(shù)據(jù)總量也由GB上升到PB級。這些非結構化數(shù)據(jù)在維度、內(nèi)在關聯(lián)性等方面的復雜度均不斷在大幅提升,將占據(jù)數(shù)據(jù)總量的80%以上,且呈現(xiàn)逐年遞增現(xiàn)象
。從空間維度上來說,這些非結構化數(shù)據(jù)屬于不同的圖書館要素,這些要素之間存在著千絲萬縷的關聯(lián)性,如何完全、實時、準確和經(jīng)濟地發(fā)現(xiàn)他們之間隱匿的知識,對圖書館大數(shù)據(jù)應用提出了嚴峻挑戰(zhàn)。從時間維度上分析,這些非結構化數(shù)據(jù)采集于圖書館各要素不同的歷史時間,在不同的決策對象和決策目的上有著不同的價值
。因此,面對復雜的大數(shù)據(jù)環(huán)境,有必要采取AI技術來解決。
首先,AI主數(shù)據(jù)管理可以在圖書館不同的分散系統(tǒng)中實現(xiàn)主數(shù)據(jù)的集中管理,實現(xiàn)主數(shù)據(jù)的自動合規(guī)檢測、應用決策快速部署、一致性保證和增強決策系統(tǒng)IT結構靈活性,在圖書館大數(shù)據(jù)決策時可以全面、快速、準確地共享主數(shù)據(jù)資源。其次,AI通過增強的計算能力、數(shù)據(jù)自動查錄與輸入,可提升圖書館主數(shù)據(jù)決策的效率與準確性,使主數(shù)據(jù)決策更加高效、精確、快速和經(jīng)濟。再次,將AI引入到圖書館主數(shù)據(jù)的質(zhì)量管理和治理中,可構建適應于主數(shù)據(jù)特征和主數(shù)據(jù)決策需求而動態(tài)變化的主數(shù)據(jù)管理標準,有效降低圖書館員對主數(shù)據(jù)管理的人工干預程度,有利于主數(shù)據(jù)的價值挖掘與知識發(fā)現(xiàn)
。
首先,AI可以輔助圖書館數(shù)據(jù)管理員科學地實現(xiàn)對非結構化大數(shù)據(jù)的有效管理、價值挖掘與知識發(fā)現(xiàn),并依據(jù)圖書館大數(shù)據(jù)決策的對象、內(nèi)容和標準需求,將大數(shù)據(jù)精準、實時和經(jīng)濟地輸出到?jīng)Q策系統(tǒng)來支持圖書館數(shù)據(jù)決策。其次,AI可以通過深度挖掘圖書館復雜大數(shù)據(jù)之間的關聯(lián)性構建知識圖譜,為讀者個性化服務提供科學的大數(shù)據(jù)決策依據(jù)
。
圖書館在基于AI的大數(shù)據(jù)管理平臺業(yè)務架構中,應堅持大數(shù)據(jù)管理平臺業(yè)務系統(tǒng)架構支持智能化的大數(shù)據(jù)應用開發(fā)、統(tǒng)一的業(yè)務語義層結構、一站式數(shù)據(jù)決策服務、智能自動化的系統(tǒng)運維管理原則,確保圖書館數(shù)據(jù)管理員與數(shù)據(jù)管理平臺科學、高效、協(xié)同、彈性伸縮、成本可控地構建人機綜合應用系統(tǒng),滿足復雜大數(shù)據(jù)環(huán)境下圖書館數(shù)據(jù)智慧決策的需求
。本文構建的基于AI的圖書館大數(shù)據(jù)管理平臺業(yè)務架構如圖1所示。
AI數(shù)據(jù)管理涉及大數(shù)據(jù)采集、傳輸、識別、整合、清洗、發(fā)布、監(jiān)控和反饋優(yōu)化等全數(shù)據(jù)生命周期流程。從當前數(shù)據(jù)存儲方式實際看,圖書館可根據(jù)所存儲大數(shù)據(jù)的復雜環(huán)境特點和大數(shù)據(jù)科學決策的需求,采取圖書館自建私有云與租賃公有云相結合的數(shù)據(jù)存儲與管理方式。
首先,圖書館可采用高性能海量數(shù)據(jù)分布式存儲架構的模式來統(tǒng)一數(shù)據(jù)管理平臺,依據(jù)大數(shù)據(jù)的價值、數(shù)據(jù)總量、決策對象和決策標準將數(shù)據(jù)存儲于不同的云空間上,并在多云之間形成統(tǒng)一的全局命名空間,實現(xiàn)數(shù)據(jù)在不同云空間之間的自由傳輸與交換。同時可對不同數(shù)據(jù)訪問接口的交換數(shù)據(jù)進行統(tǒng)一管理,以提升大數(shù)據(jù)管理、讀取的效率
。其次,圖書館數(shù)據(jù)管理系統(tǒng)要堅持構建圖形化數(shù)據(jù)管理界面的原則,支持異構數(shù)據(jù)對象的連接及建模,支持靈活多樣的數(shù)據(jù)交互管理途徑,建立實時數(shù)據(jù)傳遞觸發(fā)的機制,以保障系統(tǒng)之間數(shù)據(jù)的快速交換響應能力。第三,數(shù)據(jù)管理應根據(jù)大數(shù)據(jù)存儲需求與決策對象特點,構建圖書館服務系統(tǒng)運營數(shù)據(jù)域、圖書館管理員域、讀者域、個性化定制服務產(chǎn)品域、第三方合作服務商域、圖書館資產(chǎn)域等多個數(shù)據(jù)業(yè)務模型,實現(xiàn)對數(shù)據(jù)全生命周期管理流程的準確性、一致性、完整性、可用性和可靠性的全程監(jiān)控,并將監(jiān)控結果通知大數(shù)據(jù)管理員,最終保障基于AI的大數(shù)據(jù)質(zhì)量自動化監(jiān)控、評估、反饋控制與優(yōu)化
。
數(shù)據(jù)管理是指通過規(guī)劃、控制與提供數(shù)據(jù)和信息資產(chǎn)職能,來開發(fā)、執(zhí)行和監(jiān)督有關數(shù)據(jù)的計劃、政策、方案、項目、流程、方法和程序,以獲取、控制、保護、交付和提高數(shù)據(jù)與信息資產(chǎn)價值。大數(shù)據(jù)時代的圖書館數(shù)據(jù)管理是著眼于第三代圖書館發(fā)展、職責與讀者服務需要,站在未來圖書館事業(yè)宏觀發(fā)展的全局高度,將所擁有的大數(shù)據(jù)視為有價值的信息資源而進行的貫穿于數(shù)據(jù)全生命周期的管理。2015年,國際數(shù)據(jù)管理協(xié)會在DBMOK2.0知識領域?qū)⑵鋽U展為11個管理職能,分別是數(shù)據(jù)架構、數(shù)據(jù)模型與設計、數(shù)據(jù)存儲與操作、數(shù)據(jù)安全、數(shù)據(jù)集成與互操作性、文件和內(nèi)容、參考數(shù)據(jù)和主數(shù)據(jù)、數(shù)據(jù)倉庫、商務智能、元數(shù)據(jù)、數(shù)據(jù)質(zhì)量等。由此,本研究基于第三代圖書館讀者個性化服務大數(shù)據(jù)智慧決策與大數(shù)據(jù)管理需求,并結合國際數(shù)據(jù)管理協(xié)會在DBMOK2.0知識領域?qū)?shù)據(jù)管理擴展的11個管理職能,我們定義第三代圖書館基于AI大數(shù)據(jù)管理的內(nèi)容與目標,如表1所示
。
宋某的公司在經(jīng)營轉型過程中,選擇在規(guī)模化農(nóng)業(yè)生產(chǎn)方面進行投資,這與其以前所經(jīng)營的農(nóng)業(yè)機械等現(xiàn)代農(nóng)業(yè)生產(chǎn)資料銷售和服務有著密切的關系。宋某的公司經(jīng)營了近40年的農(nóng)機銷售業(yè)務,因而推進農(nóng)業(yè)生產(chǎn)機械化和規(guī)?;c其公司的以往業(yè)務有著內(nèi)在一致性的聯(lián)系。宋某選擇在Y鄉(xiāng)進行土地流轉和規(guī)模農(nóng)業(yè)生產(chǎn)經(jīng)營的投資,主要看中了Y鄉(xiāng)的6000多畝耕地。在這個鄉(xiāng),主要交通公路兩旁的甲村和乙村以及其他幾個村子的耕地面積較為廣闊,且有交通便利的優(yōu)勢(圖1)。按照宋某公司的規(guī)劃,他們希望能在幾年時間里將Y鄉(xiāng)所有耕地全部流轉到公司名下,建立規(guī)模化農(nóng)業(yè)生產(chǎn)的園區(qū)。
圖書館基于AI的大數(shù)據(jù)管理應堅持統(tǒng)一數(shù)據(jù)管理模型、統(tǒng)一數(shù)據(jù)管理標準化體系、統(tǒng)一數(shù)據(jù)管理系統(tǒng)平臺、統(tǒng)一數(shù)據(jù)決策服務標準的原則,才能確保圖書館大數(shù)據(jù)管理適應圖書館大數(shù)據(jù)復雜、異構的環(huán)境特點,才能確保大數(shù)據(jù)管理安全、智能、自動化和動態(tài)可擴展。
百香果、胡蘿卜、白砂糖、奶粉,均為市售;保加利亞乳桿菌、嗜熱鏈球菌,廣東燕塘乳業(yè)有限公司提供;黃原膠、羧甲基纖維素鈉(CMC)、小蘇打,均為食品級。
該平臺業(yè)務架構按照圖書館大數(shù)據(jù)生命周期管理流程與數(shù)據(jù)智慧決策需求設計,共由數(shù)據(jù)資源層、數(shù)據(jù)質(zhì)量保證層、數(shù)據(jù)管理層、AI讀者服務層四部分組成。
數(shù)據(jù)資源層是該平臺的基礎層,負責對圖書館業(yè)務服務數(shù)據(jù)、相關服務系統(tǒng)與監(jiān)控系統(tǒng)數(shù)據(jù)、讀者閱讀活動數(shù)據(jù)、第三方共享數(shù)據(jù)的采集與傳輸管理,數(shù)據(jù)資源層所涉及的數(shù)據(jù)主要是圖書館服務原始數(shù)據(jù),具有數(shù)據(jù)海量、結構復雜、低價值密度、干擾信號多樣和可用性低的特點,不適宜圖書館的大數(shù)據(jù)管理與決策需求。
基于AI的大數(shù)據(jù)管理平臺都是機器通過自主學習而集成的模型。機器結合各種技術在大數(shù)據(jù)管理工作中通過不斷的自我學習而優(yōu)化,進而將數(shù)據(jù)管理工程師和數(shù)據(jù)分析師從繁雜的大數(shù)據(jù)管理常規(guī)工作中解放出來。
A 52-year-old man with compensated alcoholic cirrhosis presented for follow up esophagogastroduodenoscopy and multiple duodenal polyps were found.
再次,圖書館數(shù)據(jù)中心要防止數(shù)據(jù)管理參數(shù)出現(xiàn)漂移和偏差,必須要在正確采集、評估和使用圖書館的大數(shù)據(jù)管理數(shù)據(jù)的基礎上才能科學部署數(shù)據(jù)管理模型,利用ML(機器學習)來訓練、優(yōu)化和測試圖書館的數(shù)據(jù)管理系統(tǒng)性能,實現(xiàn)數(shù)據(jù)管理資源的動態(tài)分配與工作負載優(yōu)化。
讀者服務層基于數(shù)據(jù)管理層提供的科學、正確、高價值和易使用數(shù)據(jù),為圖書館服務系統(tǒng)構建、讀者個性化服務需求定制、用戶服務質(zhì)量保證、圖書館未來宏觀發(fā)展預測等提供科學數(shù)據(jù)決策支持。從決策范圍和對象劃分,圖書館AI決策可分為戰(zhàn)略級別、戰(zhàn)術級別、運營級別三大類
。戰(zhàn)略級別決策主要涉及圖書館戰(zhàn)略發(fā)展宏觀規(guī)劃,重塑經(jīng)營和管理模式、大數(shù)據(jù)智慧管理與優(yōu)化、大數(shù)據(jù)分析與智慧決策、智慧圖書館構建管理等。戰(zhàn)術級別主要是對圖書館服務與讀者閱讀場景的構建做出更精準、實時、科學的決策,進而提升場景的服務效果和價值,主要涉及虛擬化閱讀空間構建、服務質(zhì)量管理與保證等。運營級別決策是提升圖書館綜合服務能力的創(chuàng)造性、運營效率、可持續(xù)發(fā)展和服務收益等,主要涉及全面感知讀者閱讀環(huán)境、讀者資源畫像、讀者生理信息識別、讀者個體定位與位置信息數(shù)據(jù)采集等
。
為滿足復雜大數(shù)據(jù)環(huán)境下圖書館數(shù)據(jù)智慧決策需求,在實施AI數(shù)據(jù)科學管理的過程中,數(shù)據(jù)準備與管理系統(tǒng)自動化是必然的前提條件。
首先,圖書館必須提前采集、存儲與數(shù)據(jù)管理實際高度吻合的管理業(yè)務數(shù)據(jù),并且實現(xiàn)數(shù)據(jù)存儲隨著圖書館數(shù)據(jù)管理業(yè)務活動的變更而動態(tài)變化。因為在基于AI的數(shù)據(jù)管理模型開發(fā)中,訓練數(shù)據(jù)與圖書館大數(shù)據(jù)應用決策服務場景的匹配度至關重要,關系到AI數(shù)據(jù)管理模型是否與服務場景高度一致,是否可以訓練出與圖書館數(shù)據(jù)管理實際超級匹配的AI數(shù)據(jù)管理模型,是否可以實現(xiàn)對現(xiàn)實數(shù)據(jù)安全、科學、動態(tài)和經(jīng)濟的管理。
其次,隨著網(wǎng)絡化、信息化及其新媒體的發(fā)展,圖書館所涉及到的視頻與動態(tài)圖像數(shù)據(jù)將會成為數(shù)據(jù)管理的主流數(shù)據(jù)。這些數(shù)據(jù)具有數(shù)據(jù)總量以指數(shù)級增長、結構復雜和管理難度大的特點,對于圖書館的數(shù)據(jù)管理業(yè)務繁雜度和實時動態(tài)管理需求增加了不少難度。圖書館必須事先通過AI數(shù)據(jù)管理實現(xiàn)數(shù)據(jù)的自動清洗、糾錯和上傳,才能提升數(shù)據(jù)管理的效率。
數(shù)據(jù)管理層的AI訓練與推理開發(fā)平臺基于數(shù)據(jù)質(zhì)量保證層標準化、結構化的可靠數(shù)據(jù)支持,通過可視化建模、大規(guī)模分布式訓練等操作,幫助數(shù)據(jù)管理員對海量大數(shù)據(jù)進行分析、建模和模型訓練,以增強圖書館訓練算法模型的科學性和開展機器學習的能力。同時,利用訓練好的AI模型應用算法對圖像、視頻、文本與音頻數(shù)據(jù)進行分析處理,將最優(yōu)化決策結果部署到數(shù)據(jù)管理的各個層面和模塊,通過監(jiān)控、學習、預測、推薦和實施5個過程,為圖書館數(shù)據(jù)結構管理、數(shù)據(jù)模型與設計管理、數(shù)據(jù)存儲與操作管理、數(shù)據(jù)安全管理、數(shù)據(jù)集成與互操作性管理、文件和內(nèi)容管理、參考數(shù)據(jù)和主數(shù)據(jù)管理、數(shù)據(jù)倉庫管理、商務智能管理、元數(shù)據(jù)與數(shù)據(jù)質(zhì)量管理等不同的數(shù)據(jù)治理場景,提供因果分析、自動參數(shù)調(diào)優(yōu)、安全保證、負載預測和調(diào)度、性能預測和規(guī)劃、IT服務管理等數(shù)據(jù)管理服務
。
首先,AI可以從圖書館海量的數(shù)據(jù)管理歷史數(shù)據(jù)中自主學習規(guī)則、程序,明確這些數(shù)據(jù)所涉及的數(shù)據(jù)管理時間表及其有效性,不斷增強圖書館自動化智能數(shù)據(jù)管理中心的監(jiān)控管理智慧水平,科學、準確和快速地預測與定位數(shù)據(jù)管理系統(tǒng)的故障點,及時監(jiān)控、發(fā)現(xiàn)管理策略是否為整體水平評估最優(yōu),并自動形成智慧決策來提升大數(shù)據(jù)管理的科學性、準確性、可用性和經(jīng)濟性
。其次,對于復雜度、價值和決策對象不同的大數(shù)據(jù),AI大數(shù)據(jù)管理平臺可依據(jù)圖書館大數(shù)據(jù)決策實際,動態(tài)、個性化地定制與執(zhí)行不同的大數(shù)據(jù)管理策略。第三,AI大數(shù)據(jù)管理平臺可依據(jù)圖書館大數(shù)據(jù)環(huán)境和大數(shù)據(jù)決策實際,實現(xiàn)大數(shù)據(jù)管理的無人值守和定期自動巡檢,并自動為管理員反饋數(shù)據(jù)管理的歷史指標參數(shù)和分析報表,提升數(shù)據(jù)管理的安全性與可靠性。
圖書館應規(guī)范ETL(數(shù)據(jù)從來源端經(jīng)過抽取、轉換、加載)標準的流程,實現(xiàn)跨部門、跨業(yè)務的統(tǒng)一數(shù)據(jù)指標口徑、統(tǒng)一對外數(shù)據(jù)服務接口、統(tǒng)一ID(身份標識號)體系等數(shù)據(jù)管理流程,確保被管理數(shù)據(jù)準確、完整、高價值和可用。在此基礎上,圖書館AI數(shù)據(jù)管理應堅持統(tǒng)一數(shù)據(jù)資產(chǎn)管理平臺和統(tǒng)一應用系統(tǒng)開發(fā)平臺的原則,利用統(tǒng)一的數(shù)據(jù)資產(chǎn)管理平臺實現(xiàn)數(shù)據(jù)源管理的統(tǒng)一,使多源數(shù)據(jù)管理、優(yōu)化和決策變?yōu)閷卧吹墓芾恚粩嗵嵘鼳I數(shù)據(jù)管理、決策與服務的效率、安全性和可控性。
系統(tǒng)采用分層監(jiān)控策略,首先設定參數(shù)上下限,對每一個監(jiān)測變量進行單獨監(jiān)測;其次,考慮到部分參變量之間的耦合性和相關性,利用主元分析法(Principle Component Analysis,PCA)[7-8]進行故障診斷,其流程如圖5所示.步驟如下:首先在模型訓練過程中利用歷史樣本選取主元變量,計算得到相應的過程統(tǒng)計量T2和殘差統(tǒng)計量SPE在95%置信度下的控制限;然后計算新樣本的T2和SPE統(tǒng)計量來判定是否存在故障.具體算法可參見文獻[7-8].
此外,圖書館AI數(shù)據(jù)管理平臺應支持所管理數(shù)據(jù)權責可溯源、質(zhì)量可評估、可用性統(tǒng)一評分,將人工智能與機器學習技術應用到大數(shù)據(jù)標示、數(shù)據(jù)智慧決策、智能算法引擎設計、智慧管理策略優(yōu)化、數(shù)據(jù)管理風險的警示與自動排隊、決策結果的可視化展示、數(shù)據(jù)管理系統(tǒng)與其它系統(tǒng)的應用對接中去,構建在統(tǒng)一圖書館AI數(shù)據(jù)管理平臺下跨部門、跨業(yè)務、跨決策對象、跨決策內(nèi)容的高效數(shù)據(jù)管理與知識服務體系。
生物技術是以現(xiàn)代生命科學為基礎,結合其他基礎科學的科學原理,采用先進的科學技術,按照預先的設計改造生物體或加工生物原料,以提供產(chǎn)品為人類社會服務的技術。生物技術包括發(fā)酵工程、酶工程、細胞工程、基因工程和蛋白質(zhì)工程技術等,其中發(fā)酵工程技術、酶工程技術等與人類生活息息相關,被廣泛應用于工業(yè)、農(nóng)業(yè)、環(huán)境和醫(yī)藥等眾多行業(yè)之中。
大數(shù)據(jù)時代的圖書館數(shù)據(jù)不僅呈現(xiàn)指數(shù)級快速增長現(xiàn)象,而且復雜結構化、半結構化和非結構化大數(shù)據(jù)已成為圖書館數(shù)據(jù)的主流,可以說當前數(shù)據(jù)管理系統(tǒng)的規(guī)模和工作負荷能力的增長,對圖書館大數(shù)據(jù)的管理提出了更高的要求。以往傳統(tǒng)的圖書館數(shù)據(jù)管理員憑借個人經(jīng)驗或是啟發(fā)歸納式數(shù)據(jù)管理規(guī)則,來進行數(shù)據(jù)存取與查詢負載預測、數(shù)據(jù)庫配置參數(shù)調(diào)優(yōu)等,已不適應圖書館復雜、海量、多類型和低價值數(shù)據(jù)環(huán)境的數(shù)據(jù)管理需求。數(shù)據(jù)管理員必須基于AI技術實現(xiàn)負載的精準、自動化分配與優(yōu)化,需要基于AI技術數(shù)據(jù)管理來應對查詢負載、系統(tǒng)響應參數(shù)、大數(shù)據(jù)分布、數(shù)據(jù)庫硬件參數(shù)指標、數(shù)據(jù)查詢性能表現(xiàn)、故障與中斷、安全威脅、負載與負荷等歷史數(shù)據(jù),通過數(shù)據(jù)特征抽取、訓練和建模等操作,有針對性的優(yōu)化數(shù)據(jù)庫管理系統(tǒng)、流程和策略,才能確保AI數(shù)據(jù)管理安全、科學、高效與經(jīng)濟
。
首先,為了提升圖書館大數(shù)據(jù)管理與決策的效率,必須增強圖書館數(shù)據(jù)傳輸網(wǎng)絡與數(shù)據(jù)存儲系統(tǒng)的吞吐量,防止因圖書館數(shù)據(jù)網(wǎng)絡傳輸延時和存儲堆棧IOPS(每秒輸入/輸出操作)調(diào)用延遲而產(chǎn)生數(shù)據(jù)管理瓶頸,特別應重點考慮數(shù)據(jù)管理系統(tǒng)在服務峰值時系統(tǒng)資源調(diào)度、分配與優(yōu)化的效率和冗余性問題。
其次,必須利用人工智能的機器學習和數(shù)據(jù)挖掘知識發(fā)現(xiàn)技術,依靠AI數(shù)據(jù)管理技術來確定不同類型和安全級別最高的云存儲空間,以及選擇在哪些列上建立最優(yōu)化的索引,來實現(xiàn)大數(shù)據(jù)的高速檢索、讀取和安全管理。
飛往韓國的班機上,我閉上眼睛,虔誠地哀求上蒼,但愿崔仁浩家庭強大的關系網(wǎng),不要調(diào)查出我的整容記錄。但愿崔仁浩,永遠都不知曉我這個代孕的秘密。我會用一輩子的深愛和忠貞,去換取靈魂的救贖。
安:可能你聽過的都是經(jīng)典版本的“拉三”,但我得說,在很多比賽的決賽里多次聽到讓我?guī)缀跸胍餍潆x場的“拉三”,也正是因為“拉三”在我心里的地位太高,所以我不能忍受演奏者對其機械、麻木、純炫技式的演繹。當然我贊成你的觀點,讓這樣完全無可比性的作品出現(xiàn)在同一輪次本身就不合理,如果我是比賽的藝術總監(jiān),我一定會制止這樣情況的發(fā)生!
元數(shù)據(jù)是描述信息資源或其它數(shù)據(jù)的數(shù)據(jù),其使用目的在于識別資源、評價資源、追蹤資源在使用過程中的變化,以及實現(xiàn)簡單、高效地管理大量網(wǎng)絡化數(shù)據(jù),實現(xiàn)信息資源的有效發(fā)現(xiàn)、查找、一體化組織和對已使用資源的有效管理。而主數(shù)據(jù)是指系統(tǒng)間共享數(shù)據(jù)(諸如不同讀者、圖書館不同部門、閱讀終端和第三方服務商共享的相關數(shù)據(jù))。元數(shù)據(jù)與主數(shù)據(jù)管理的有效性是圖書館AI數(shù)據(jù)科學管理和智慧化決策的前提,因此,必須確保圖書館元數(shù)據(jù)與主數(shù)據(jù)在各子系統(tǒng)之間共享數(shù)據(jù)的一致性、完整性、可控性、通用性和正確性,才能實現(xiàn)圖書館數(shù)據(jù)管理安全、高效,才能為讀者提供科學、動態(tài)和經(jīng)濟的大數(shù)據(jù)決策服務。
元數(shù)據(jù)作為圖書館執(zhí)行全數(shù)據(jù)生命周期管理的應用數(shù)據(jù),主要涉及數(shù)據(jù)分析、數(shù)據(jù)價值評估與保證、數(shù)據(jù)治理、數(shù)據(jù)風險和合規(guī)性管理等內(nèi)容。因此,在元數(shù)據(jù)采集過程中,數(shù)據(jù)管理員應優(yōu)化元數(shù)據(jù)比對算法與入庫邏輯,提高元數(shù)據(jù)采集、存儲的效率。同時,數(shù)據(jù)管理員應新增標簽管理功能來擴展業(yè)務元數(shù)據(jù)管理途徑,通過在標簽管理中維護業(yè)務元數(shù)據(jù)分類、業(yè)務術語等業(yè)務元數(shù)據(jù)信息,建立業(yè)務元數(shù)據(jù)與技術元數(shù)據(jù)的關聯(lián),實現(xiàn)業(yè)務元數(shù)據(jù)與技術元數(shù)據(jù)的統(tǒng)一管理。
主數(shù)據(jù)具有多共享對象、多數(shù)據(jù)類型、多應用系統(tǒng)和多數(shù)據(jù)標準的特點,因此,圖書館必須構建涉及不同讀者、不同圖書館應用服務系統(tǒng)、不同讀者服務內(nèi)容、不同第三方服務商的主數(shù)據(jù)標準化模型,以滿足不同閱讀場景下所需的信息視圖和主數(shù)據(jù)決策環(huán)境。此外,對需要多用戶共享的主數(shù)據(jù)要構建數(shù)據(jù)關系視圖和采取集中存儲的方式管理,提升主數(shù)據(jù)存儲和調(diào)用的效率。同時,提供豐富的數(shù)據(jù)管理接口與主數(shù)據(jù)決策應用業(yè)務平臺快速集成,滿足圖書館不同的數(shù)據(jù)決策系統(tǒng)對主數(shù)據(jù)的個性化需求。
當前,圖書館已進入大數(shù)據(jù)時代,數(shù)據(jù)已成為第三代圖書館發(fā)展與服務質(zhì)量保證的重要戰(zhàn)略資源。圖書館通過對大數(shù)據(jù)的采集、清洗、處理、分析、挖掘與決策,可以為圖書館宏觀發(fā)展戰(zhàn)略設計、讀者服務系統(tǒng)構建、讀者個體畫像、讀者個性化服務內(nèi)容定制與推送、用戶服務質(zhì)量評估與保障等,提供安全、科學、經(jīng)濟和實時的數(shù)據(jù)決策支持。但是,圖書館大數(shù)據(jù)環(huán)境特有的數(shù)據(jù)海量、結構復雜、處理快速和低價值密度的特點,也給大數(shù)據(jù)的管理與決策帶來了許多挑戰(zhàn)。標準不規(guī)范、低可用性、多噪聲和錯誤的數(shù)據(jù)不僅會降低圖書館大數(shù)據(jù)決策的科學性、可用性和經(jīng)濟性,甚至會導致錯誤、失敗的決策。因此,圖書館必須對大數(shù)據(jù)開展全生命周期的管理,而基于AI的大數(shù)據(jù)管理技術能夠在復雜數(shù)據(jù)環(huán)境下,實現(xiàn)大數(shù)據(jù)生命周期全程的安全管理、隱私保護、價值提升、知識發(fā)現(xiàn)和科學決策。
3種類型避雨棚內(nèi)溫度不同,除了半拱式簡易避雨棚溫度略低于對照,差異不顯著,其他2種類型溫度高于對照,標準連棟避雨棚內(nèi)的溫度最高,比對照高10.40%。3種類型避雨棚內(nèi)濕度差異不顯著,標準連棟避雨棚略低于對照。
圖書館在基于AI的大數(shù)據(jù)管理中,應重點關注關系數(shù)據(jù)質(zhì)量和數(shù)據(jù)決策科學性的數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)存儲、數(shù)據(jù)標注、數(shù)據(jù)分析等環(huán)節(jié),堅持統(tǒng)一數(shù)據(jù)標準、兼容開放、彈性管理和科學高效的原則。此外,在大數(shù)據(jù)資源管理系統(tǒng)構建和管理模式選擇上,應堅持管理系統(tǒng)集成化、管理范圍時空化、管理表述知識化、管理流程模塊化和管理結果可視化的原則,充分利用AI技術海量存儲、高性能分布計算、機器學習、邏輯推理與系統(tǒng)自動進化等能力,才能實現(xiàn)數(shù)據(jù)、人員、知識和服務的高度聚合,才能為圖書館讀者個性化定制服務、服務系統(tǒng)運營管理、經(jīng)營策略制定與運行、未來發(fā)展戰(zhàn)略規(guī)劃提供可靠的大數(shù)據(jù)科學決策支持
。
[ 1 ]吳建中.走向第三代圖書館[J].圖書館雜志,2016(6):4-9.
[ 2 ]李娟,張雪蕾,楊峰.基于實證分析的下一代圖書館服務平臺選擇策略:以 ALAM、Kuali OLE、OCLC World Share 和 Sierra 為例 [J].圖書與情報,2017(3):84-92.
[ 3 ]劉煒.關于“下一代圖書館系統(tǒng)”的思考[J].國家圖書館學刊,2015,24(5):7-10.
[ 4 ]劉素清.從電子資源管理視角分析我國高校圖書館服務平臺的發(fā)展[J].大學圖書館學報,2018,36(4):11-17.
[ 5 ]謝蓉,劉煒,朱雯晶.第三代圖書館服務平臺: 新需求與新突破[J].中國圖書館學報,2019,45(3):25-37.
[ 6 ]BREEDING M. Library systems report 2018:new technologies enable an expanded vision of library services[J/OL]. American Libraries,2018(5)[2021-08-10]. https://Americanlibrariesmagazine.org/2018/05/01/library-systems-report- 2018/.
[ 7 ]楊新涯,袁輝,沈敏.向服務平臺轉型的下一代圖書館管理系統(tǒng)實踐研究[J].圖書館雜志,2015(9):23-27.
[ 8 ]周義剛,聶華.新一代圖書館服務平臺調(diào)研及思考:基于北京大學圖書館的需求[J].圖書館雜志,2019(2):69-78.
[ 9 ]許磊,夏翠娟.第三代圖書館服務平臺的元數(shù)據(jù)管理:以FOLIO 的Codex 方案為例[J].中國圖書館學報,2020,46(1):99-113.
[10]張磊,賀晨芝,趙亮. 面向數(shù)據(jù)與知識服務的第三代圖書館服務平臺[J].國家圖書館學刊,2018,27(6):40-47.
[11]BEHARA S.Breaking the monolithic database in your microservices architecture[EB/OL].[2021-08-11].https://dzone.com/articles/breaking-themonolithic-database-in-your-microserv.
[12]康曉丹. 構建第三代圖書館的技術思考:以上海大學圖書館為例[J].大學圖書館學報,2014(1):78-82.
[13]李國良,周煊赫.面向AI 的數(shù)據(jù)管理技術綜述[J].軟件學報,2021,31(1):21-40.
[14]LI GL, ZHOU XH, LI SH. XuanYuan:an AI-native database[J].IEEE Data Engineering Bulletin,2019,42(2):70-81.
[15]許磊.圖書館系統(tǒng)演變及其元數(shù)據(jù)管理[J].圖書館論壇, 2021,(6):1-11.
[16]GREENBERG J. Big metadata, smart metadata,and metadata capital: toward greater synergy between data science and metadata[J].Journal of Data and Information Science, 2017,2(3):19-36.
[17]The codex metadata model[EB/OL].[2021-08-12].https://wiki.folio.org/pages/viewpage.action?pageId=1415393.
[18]張曉林.顛覆性變革與后圖書館時代:推動知識服務的供給側結構性改革[J].中國圖書館學報, 2018, 44(1): 4-16.
[19]初景利,趙艷.圖書館從資源能力到服務能力的轉型變革[J].圖書情報工作,2019,63(1):11-17.