李冬梅
(南通大學(xué) 圖書館,江蘇 南通 226019)
當(dāng)前,隨著新一代信息技術(shù)的不斷發(fā)展,人工智能技術(shù)應(yīng)用得到快速推廣。在人工智能領(lǐng)域,機(jī)器學(xué)習(xí)技術(shù)可以最大程度模擬人類大腦的運(yùn)行機(jī)制,實(shí)現(xiàn)各類知識資源的獲取與關(guān)聯(lián)分析[1]。情境感知主要包括地域情境、內(nèi)心情境的感知,它主要體現(xiàn)的是對現(xiàn)實(shí)世界實(shí)體屬性信息進(jìn)行刻畫。在不同的情境中,人們的個性化反映不盡相同。機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書館情境感知中的應(yīng)用,可以實(shí)現(xiàn)用戶情境信息的全方位采集,了解不同用戶的個性化需求特征,為提高數(shù)字圖書館個性化推薦服務(wù)精準(zhǔn)度和用戶滿意度奠定基礎(chǔ)。
數(shù)字圖書館是人們生產(chǎn)生活的重要場所,其良好的信息服務(wù)功能受到廣大用戶的喜愛和關(guān)注[2]。對于數(shù)字圖書館而言,機(jī)器學(xué)習(xí)技術(shù)通過模擬人類大腦神經(jīng)網(wǎng)絡(luò),可以建立圖書館用戶行為特征數(shù)據(jù)與圖書館館藏資源間的數(shù)據(jù)關(guān)聯(lián),同時實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)資源特征信息的深層次挖掘,使數(shù)字圖書館與用戶信息的關(guān)聯(lián)數(shù)據(jù)資源得到廣泛使用,不僅為圖書館用戶帶來了更為便捷的閱讀服務(wù),而且極大地縮短了數(shù)據(jù)運(yùn)算和傳輸時間,提高了數(shù)字圖書館信息服務(wù)效率。
在特定情境的激發(fā)下,人們身體中的各種感覺細(xì)胞會全方位獲取情境中的信息,并傳輸至大腦進(jìn)行綜合分析判斷,最終形成人們的情緒反應(yīng)。情境感知是通過傳感器、無線接觸通信設(shè)備等,采集用戶在特定情境中的不同信號,并傳輸至計算機(jī)中,計算機(jī)對獲取的用戶個人特征信息、地理位置信息、行為狀態(tài)信息等進(jìn)行綜合分析,為提升個性化推薦服務(wù)水平奠定基礎(chǔ)[3]。機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書館中的應(yīng)用,可以極大提高情境數(shù)據(jù)采集、情境數(shù)據(jù)挖掘和特征提取效率,可以建立情境數(shù)據(jù)與圖書館館藏資源間的數(shù)據(jù)關(guān)聯(lián),從根本上提高了數(shù)字圖書館情境感知數(shù)據(jù)運(yùn)算和智能分析水平。
數(shù)字圖書館智慧化服務(wù)是通過利用多種智能分析技術(shù),采集用戶在不同情境中的需求信息,最終滿足不同用戶的個性化需求服務(wù)。機(jī)器學(xué)習(xí)技術(shù)可以根據(jù)用戶不同興趣愛好,將不同用戶進(jìn)行合理劃分,建立多個用戶群組,使具有相同興趣愛好的用戶聚集起來,營造一個開放、溫馨的學(xué)習(xí)交流環(huán)境[4-5]。機(jī)器學(xué)習(xí)技術(shù)在情境感知推薦服務(wù)中的應(yīng)用可以極大地提高數(shù)字圖書館智慧化分析水平,它通過利用綜合分析計算和智能匹配運(yùn)算,建立數(shù)字圖書館與用戶、不同用戶間的數(shù)據(jù)關(guān)聯(lián),并對數(shù)字圖書館館藏數(shù)據(jù)進(jìn)行實(shí)時檢測,提高了數(shù)字資源的自動識別和控制能力,使各類資源可以得到充分應(yīng)用,為數(shù)字圖書館高層次、全方位服務(wù)奠定基礎(chǔ)。
數(shù)字圖書館情境數(shù)據(jù)融合是情境感知推薦服務(wù)的基礎(chǔ),它主要是對智能感應(yīng)設(shè)備所獲取的全方位用戶情境信息進(jìn)行融合處理?;跈C(jī)器學(xué)習(xí)的數(shù)字圖書館情境數(shù)據(jù)融合是將獲取的用戶情境數(shù)據(jù)進(jìn)行深層次挖掘、特征提取,形成用戶個性化的需求特征,達(dá)到洞察用戶、了解用戶的目的。
用戶情境數(shù)據(jù)采集是情境感知推薦服務(wù)的基礎(chǔ)。數(shù)字圖書館通過利用傳感器、智能終端、無線接觸通信設(shè)備等各種智能設(shè)備,獲取與用戶所處情境相關(guān)的數(shù)據(jù)信息,這些信息包括用戶基本信息、位置信息、空間信息、近期瀏覽信息等[6]。通常來講,這些數(shù)據(jù)可以分為固定數(shù)據(jù)和變化數(shù)據(jù)兩種:固定數(shù)據(jù)包括用戶注冊信息、研究領(lǐng)域、學(xué)科專業(yè)等;變化數(shù)據(jù)包括用戶的興趣愛好、心態(tài)情緒、行為特征、天氣變化、位置信息、空間信息、瀏覽信息等。本文通過利用機(jī)器學(xué)習(xí)技術(shù),對所獲取的用戶情境信息進(jìn)行辨識,利用神經(jīng)網(wǎng)絡(luò)算法建立不同數(shù)據(jù)間的聯(lián)系,建立符合用戶個性化特征的數(shù)據(jù)標(biāo)簽,方便數(shù)字圖書館推薦服務(wù)的使用。
系統(tǒng)所采集的用戶情境數(shù)據(jù)通常為不規(guī)則數(shù)據(jù),一些數(shù)據(jù)甚至?xí)霈F(xiàn)錯誤或者模糊情況。在使用這些數(shù)據(jù)之前,需要對其進(jìn)行數(shù)據(jù)處理。通常來講,用戶情境數(shù)據(jù)處理主要是對數(shù)據(jù)進(jìn)行挖掘、特征提取,發(fā)掘出數(shù)據(jù)本身所隱藏的共性、個性特征信息,通過對這些特征信息的分析,可以實(shí)現(xiàn)數(shù)據(jù)的辨識、歸類。利用機(jī)器學(xué)習(xí)技術(shù)來處理用戶情境特征數(shù)據(jù),可以模擬人類大腦思維方式,分辨情境數(shù)據(jù)的不同特征,同時建立各特征數(shù)據(jù)的關(guān)聯(lián),形成用戶情境數(shù)據(jù)特征單元。該特征單元是對用戶情境的語義描述,它可以是用戶情境的共性數(shù)據(jù)特征描述,也可以是用戶情境的個性數(shù)據(jù)特征描述,不同特征單元的關(guān)聯(lián)就形成了用戶情境的基本模型。在建立用戶情境數(shù)據(jù)特征單元的基礎(chǔ)上,對圖書館館藏數(shù)據(jù)資源進(jìn)行整合,搭建與特征單元一一對應(yīng)的情境實(shí)例庫,最終建立基于機(jī)器學(xué)習(xí)的數(shù)字圖書館用戶情境模型。
用戶個性化需求匹配是數(shù)字圖書館情境感知推薦服務(wù)的核心,它將數(shù)字圖書館館藏資源與用戶情境之間建立對應(yīng)聯(lián)系。用戶情境模型是用戶個性化需求匹配的基礎(chǔ),通過用戶情境模型,可以準(zhǔn)確分離出用戶情境數(shù)據(jù)特征單元,也就是對用戶情境的語義描述,這種語義描述可以直接被計算機(jī)使用。用戶個性化需求匹配過程是以用戶情境語義描述為特征詞,在數(shù)字圖書館館藏資源中開展相似度檢索的過程,對檢索結(jié)果進(jìn)行相似度排序,相似度高的數(shù)據(jù)資源被保留下來并提供給用戶。在整個相似度檢索過程中,機(jī)器學(xué)習(xí)技術(shù)發(fā)揮了重要作用,它以用戶情境語義描述為標(biāo)的物,通過迭代算法、神經(jīng)網(wǎng)絡(luò)算法等對數(shù)字圖書館館藏資源進(jìn)行一一對比,提高了用戶個性化需求匹配的精確度和準(zhǔn)確率。
本文在深入分析基于機(jī)器學(xué)習(xí)的數(shù)字圖書館情境數(shù)據(jù)融合流程后,結(jié)合國內(nèi)外最新研究成果,構(gòu)建了基于機(jī)器學(xué)習(xí)的數(shù)字圖書館情境感知推薦服務(wù)平臺。該服務(wù)平臺由情境數(shù)據(jù)采集層、綜合推理分析層和個性化感知推薦層組成。
情境數(shù)據(jù)采集層是基于機(jī)器學(xué)習(xí)的數(shù)字圖書館情境感知推薦服務(wù)平臺的基礎(chǔ),它的主要作用是提供數(shù)據(jù)支撐。用戶情境數(shù)據(jù)采集包括對用戶固定數(shù)據(jù)信息采集和用戶實(shí)時數(shù)據(jù)信息采集兩個方面。用戶固定數(shù)據(jù)信息主要是用戶注冊信息,包括用戶姓名、聯(lián)系方式、通訊地址、所學(xué)專業(yè)、工作性質(zhì)、家庭住址、借閱記錄、使用權(quán)限等;用戶實(shí)時數(shù)據(jù)信息是情境數(shù)據(jù)采集層的重點(diǎn),包括用戶使用設(shè)備信息、地理位置信息、在線時長、行為舉止、興趣愛好、情緒變化等。情境數(shù)據(jù)采集層通過建立數(shù)字圖書館系統(tǒng)與用戶智能終端設(shè)備間的聯(lián)系,可以實(shí)現(xiàn)多角度、全方位的用戶行為跟蹤,進(jìn)而采集更為全面的用戶情境數(shù)據(jù),該層還可以對采集數(shù)據(jù)進(jìn)行初步過濾和分類。
綜合推理分析層主要是對所采集的數(shù)據(jù)進(jìn)行處理,同時對用戶情境數(shù)據(jù)進(jìn)行綜合分析。該層首先對情境數(shù)據(jù)采集層數(shù)據(jù)進(jìn)行分析,將數(shù)據(jù)中的非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行轉(zhuǎn)化,剔除數(shù)據(jù)標(biāo)識模糊或者錯誤的數(shù)據(jù),保證數(shù)據(jù)的完整性和準(zhǔn)確性。然后,對情境數(shù)據(jù)開展數(shù)據(jù)挖掘和特征提取,發(fā)掘出情境數(shù)據(jù)間的內(nèi)在本質(zhì),提取出情境數(shù)據(jù)特征,并對每組數(shù)據(jù)特征進(jìn)行標(biāo)識,方便數(shù)據(jù)檢索和比對。該層利用機(jī)器學(xué)習(xí)技術(shù)中的螞蟻算法、神經(jīng)網(wǎng)絡(luò)分析法,模擬人類大腦分析模式,對采集到的用戶情境數(shù)據(jù)進(jìn)行綜合分析,建立不同情境數(shù)據(jù)特征間的數(shù)據(jù)關(guān)聯(lián),形成用戶情境數(shù)據(jù)特征單元網(wǎng)絡(luò)。用戶情境數(shù)據(jù)特征單元網(wǎng)絡(luò)的建立使用戶情境數(shù)據(jù)與數(shù)字圖書館館藏資源間形成了對應(yīng)關(guān)系,方便了數(shù)據(jù)綜合分析后的資源檢索。
個性化感知推薦層是以用戶情境數(shù)據(jù)綜合推理分析結(jié)果為基礎(chǔ),在數(shù)字圖書館館藏資源中開展數(shù)據(jù)匹配,并將匹配結(jié)果資源向用戶展示。數(shù)據(jù)匹配的準(zhǔn)確性關(guān)系到個性化感知推薦用戶滿意度,因此在開展數(shù)據(jù)匹配過程中,首先需要注意的是匹配規(guī)則的制定。匹配規(guī)則是由一系列權(quán)重比值組成的,系統(tǒng)通過對用戶情境數(shù)據(jù)特征單元和數(shù)字圖書館館藏資源數(shù)據(jù)標(biāo)識進(jìn)行辨識,得出數(shù)據(jù)特征相似度、數(shù)據(jù)描述吻合度等數(shù)據(jù)。通過對這類數(shù)據(jù)設(shè)定權(quán)重值,開展疊加計算,得出數(shù)據(jù)匹配度,最終將匹配度高的數(shù)據(jù)推薦給用戶。
個性化智能推薦服務(wù)是伴隨著信息技術(shù)、人工智能技術(shù)的不斷發(fā)展而得到深入研究的,是數(shù)字圖書館服務(wù)用戶的核心功能。數(shù)字圖書館通過利用神經(jīng)網(wǎng)絡(luò)技術(shù)對用戶情景數(shù)據(jù)進(jìn)行深入學(xué)習(xí),提取用戶情景個性化特征數(shù)據(jù),建立不同情景群類,劃分不同情景下的用戶需求層次。通過對用戶所屬情景群類和層次特征的綜合計算,得出用戶實(shí)際需求語義表述。機(jī)器學(xué)習(xí)技術(shù)不僅提高了數(shù)字圖書館對用戶的辨識認(rèn)知程度,而且極大地提高了個性化智能推薦服務(wù)水平。個性化智能推薦服務(wù)作為數(shù)字圖書館服務(wù)水平的標(biāo)志化特征,為數(shù)字圖書館知識庫技術(shù)的應(yīng)用及智能綜合服務(wù)平臺的建立奠定了基礎(chǔ),為數(shù)字圖書館服務(wù)科學(xué)化提供了技術(shù)指導(dǎo)。
進(jìn)入數(shù)字化時代,圖書館用戶的使用習(xí)慣、閱讀方式都在發(fā)生較大變化。隨著智能設(shè)備的不斷發(fā)展,智能閱讀設(shè)備逐漸被廣大圖書館用戶接受。智能設(shè)備在圖書館中的應(yīng)用,改變了用戶傳統(tǒng)的圖書閱讀方式和習(xí)慣,對圖書館資源開發(fā)利用提出了挑戰(zhàn)。基于機(jī)器學(xué)習(xí)的數(shù)字圖書館可以充分利用圖像文字、情景等識別技術(shù),打造與圖書館實(shí)際場景相同的虛擬場景,為用戶提供強(qiáng)大的虛擬體驗(yàn)服務(wù)。用戶通過穿戴特定智能裝備,可以身臨其境地感受虛擬圖書館所提供的各項(xiàng)服務(wù)。同時,還可以實(shí)現(xiàn)用戶與虛擬圖書館的互動交流,使用戶真正體會到智能技術(shù)所帶來的各種便利,提升用戶閱讀體驗(yàn)服務(wù)。
語音識別技術(shù)是當(dāng)前各領(lǐng)域研究的重點(diǎn),它作為機(jī)器學(xué)習(xí)技術(shù)之一,應(yīng)用領(lǐng)域越來越廣泛。該技術(shù)可以將人類語音信息轉(zhuǎn)化為能夠被計算機(jī)識別的語言信息,并且在整個信息轉(zhuǎn)化過程中,最大限度地保證了信息的無損性。語音識別技術(shù)在數(shù)字圖書館中的應(yīng)用,將會極大地提升數(shù)字圖書館的智能化水平。數(shù)字圖書館通過利用語音識別技術(shù),將用戶個性化需求語音輸入轉(zhuǎn)化為系統(tǒng)可識別的語言信息,并在數(shù)字圖書館館藏資源中進(jìn)行智能信息匹配,建立了用戶語音信息與數(shù)字圖書館館藏資源間的聯(lián)系,實(shí)現(xiàn)了數(shù)字圖書館語音智能檢索功能。語音智能檢索服務(wù)可以極大地拓寬數(shù)字圖書館服務(wù)群體對象范圍,降低了數(shù)字圖書館使用難度,方便特殊人群使用。
隨著人工智能技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書館領(lǐng)域的應(yīng)用,為其準(zhǔn)確獲取用戶情景數(shù)據(jù)信息提供了便利,有效地提高了數(shù)字圖書館個性化情景感知推薦服務(wù)水平。同時,機(jī)器學(xué)習(xí)技術(shù)可以有效地提升數(shù)字圖書館的情景感知能力,使其可以更為全面地了解用戶的個性化特征,掌握當(dāng)代數(shù)字圖書館用戶的個性化需求。然而,在實(shí)際應(yīng)用過程中,由于用戶智能終端設(shè)備不同,可能會導(dǎo)致用戶情景數(shù)據(jù)采集的不完整。隨著人工智能技術(shù)的不斷發(fā)展,相信機(jī)器學(xué)習(xí)技術(shù)在數(shù)字圖書館領(lǐng)域的應(yīng)用會逐步得到完善,同時數(shù)字圖書館情景感知推薦服務(wù)水平將會得到更大提升。