徐彤陽 鄧穎慧
(1.山西財經大學信息管理學院,太原 030006;2.中國科學院文獻情報中心,北京 100190)
約翰·麥卡錫在1956年第一次將人工智能(Artificial Intelligence,AI)引入學術研究領域,AI被看作21世紀繼基因工程和納米科學之后出現(xiàn)的第三大尖端科技,尤其AlphaGo的出現(xiàn),更是使得AI成為熱點話題,許多國家將AI技術發(fā)展列入國家戰(zhàn)略規(guī)劃[1]。隨著寬帶網絡提速、上網資費降低以及移動智能終端功能的日益完善,手機上網呈現(xiàn)常態(tài)化。越來越多的用戶使用智能手機設備來檢索、加工和處理信息,打破了信息傳播的時空及地域限制,為移動化信息獲取、利用和共享創(chuàng)造了便利條件,且用戶也經逐步養(yǎng)成利用碎片化時間快速獲取信息的閱讀習慣。海量的移動應用(Application,APP)逐漸成為互聯(lián)網連接多媒體信息的觸點[2],同時也將其發(fā)展與信息科學技術緊密關聯(lián),AI技術的快速發(fā)展將會給移動應用帶來巨大的影響,如何將AI與學術期刊自身特點相融合,顯得尤為重要。
學術期刊作為期刊論文和科研成果發(fā)布與交流的平臺,向讀者提供了權威的信息資源,為學術資源的傳播提供方便快捷的傳播途徑和清晰明了的表現(xiàn)形式[3]。學術期刊APP作為傳統(tǒng)的學術期刊延伸到移動終端而創(chuàng)辦的一種新的大眾媒體,在智能手機上提供文獻檢索、過刊瀏覽、論文下載及信息訂閱等服務,以滿足用戶快速獲取相關文獻與學術信息的需求,促使知識成果的轉化,且可快速傳播相關研究領域的發(fā)展前沿動態(tài),促進相關學科的發(fā)展[4],提升學術期刊的服務水平,擴大學科領域的影響范圍。
雖然國內學術期刊APP在近幾年有了突飛猛進的發(fā)展,但相對于國外學術期刊APP而言,我國學術期刊APP應用仍顯得相對匱乏。目前國內學術期刊APP主要存在以下問題:①移動應用雖然對相關數(shù)據(jù)進行了一些處理(包括文本分類、添加標簽等操作),但由于文獻總體數(shù)量較大,分類粒度較粗,導致用戶難以快速定位所需信息[5];②學術期刊APP大多使用的是基于關鍵詞匹配的簡單文本檢索,運用傳統(tǒng)的布爾邏輯檢索和空間向量檢索,根據(jù)文檔表示與相似度算法的匹配程度反饋檢索結果,未充分考慮用戶與系統(tǒng)的交互,當用戶無法完整且明確地表達檢索需求時,其檢索結果無法滿足用戶需求。
本文針對國內學術期刊檢索效率低、交互性差等缺點提出了一種智能交互式檢索模型,該模型檢索界面簡潔明了,方便用戶進行檢索操作,并將用戶的檢索體驗放在首位,著重分析研究用戶需求、用戶偏好、用戶差異分析以及檢索習慣等方面內容,增加用戶、系統(tǒng)或學術資源提供者之間的及時互動和反饋操作,提高用戶的參與度,增強學術期刊檢索的簡便性、易用性以及快捷性。通過實驗發(fā)現(xiàn)智能交互式檢索模型可有效提高檢索效率,為APP用戶提供更準確全面的學術信息資源。
信息檢索主要經歷了基于關鍵詞、基于內容和基于用戶交互的三個階段,研究人員逐漸將注意力從文本數(shù)據(jù)的底層特征信息轉向理解主題或接受者意圖上。交互式檢索是指用戶由于自身學科知識和表達能力的限制,出現(xiàn)不能準確表達自身查詢意圖的情況,檢索系統(tǒng)根據(jù)構建查詢式、查詢式擴展和相關反饋等技術和方式與用戶進行實時的信息交互,系統(tǒng)根據(jù)用戶提供的反饋信息不斷修正查詢式,逐漸接近用戶真實的檢索意圖,為用戶提供更為準確合理的檢索結果[6]。
目前,交互式檢索在多語言/跨語言信息檢索中的應用較為廣泛,相較于面向系統(tǒng)的信息檢索,交互式檢索的優(yōu)勢在于可根據(jù)相關反饋、查詢式構造和查詢結果優(yōu)化等技術實現(xiàn)用戶對檢索的參與和控制,關注用戶在檢索過程中產生的反饋信息,增強用戶和檢索系統(tǒng)的交互性,進而提高檢索準確率和用戶體驗滿意度。多語言/跨語言信息檢索是通過構建一種或多種語言的查詢條件,從多語種信息的信息集合中檢索出所需語種信息,建立用戶與檢索系統(tǒng)間的有機聯(lián)系完成檢索任務的一種信息檢索模式。
國內外多位學者對交互式信息檢索在多語言/跨語言方面做出了相關研究。吳丹[7]針對跨語言信息檢索普遍存在的查詢翻譯歧義性問題,提出了一個英漢交互式跨語言信息檢索系統(tǒng),消除不同語言間的翻譯歧義,將翻譯優(yōu)化和查詢擴展等功能應用在檢索系統(tǒng)中,可明顯提高檢索效果。朱榕等[8]針對數(shù)字圖書館中信息的查全率和查準率較低等問題,提出將語言自動處理技術和智能交互信息檢索技術進行有機結合,加強和改善檢索結果的質量和效率。Salim等[9]旨在識別和分析相關語言本體,以加強精確詞匯表的使用,實現(xiàn)通過多語言搜索門戶同時檢索不同語言的檢索功能。Ruecker等[10]利用多語言敘詞表的語義豐富性,實現(xiàn)搜索、瀏覽導航和結果顯示功能,為不同用戶提供多樣化的檢索結果展示界面。
查詢式的構造、推薦和擴展以及相關反饋技術是交互式檢索發(fā)展的關鍵。吳丹等[11]采用系統(tǒng)日志挖掘法,考察了查詢式關聯(lián)性、查詢重構模式等方面內容,實現(xiàn)通過查詢推薦功能和高級檢索功能等來提高檢全率和檢準率。劉暢等[12]通過對國內外相關文獻的梳理,從查詢式的構建和重構以及質量和效果評估等方面進行分析和總結概括,提出未來可加入語義信息來更深入地理解查詢式的內涵。Yoo等[13]針對文檔檢索效率低等問題,提出基于偽相關反饋(Pseudo Relevance Feedback,PRF)的查詢擴展技術,可有效提高檢索的查準率和查全率。Almasri等[14]提出利用深度學習實現(xiàn)自動查詢擴展,用于從含有數(shù)十億個單詞的大量非結構化文本中學習高質量的詞匯向量表示方法,提高文本檢索性能。Liu等[15]采用PRF算法,提出一種創(chuàng)新的PRF排序方法,將用戶相關反饋與檢索結果相聯(lián)系。
隨著AI技術突飛猛進的發(fā)展,交互式檢索智能化程度較低等問題日益凸顯。可借助深度學習技術,使交互式檢索系統(tǒng)能夠進行自我學習、調整和優(yōu)化,使其更好地與數(shù)據(jù)庫進行對接和信息交互,處理異構化、非結構化和多樣化的海量數(shù)據(jù)。充分考慮用戶的差別性,根據(jù)不同用戶的檢索喜好和需求,為其提供個性化信息服務,將用戶情感融入檢索過程。實現(xiàn)一種友好的人機交互檢索模式,提高檢索系統(tǒng)甄別用戶檢索意圖的能力和檢索的精確度,是交互式檢索發(fā)展的趨勢。
APP用戶在進行智能交互式檢索過程中,首先需登錄學術期刊APP界面,在進行檢索操作前,用戶需構造查詢式,學術期刊檢索系統(tǒng)根據(jù)用戶提交查詢式的內容和期刊論文的頭部信息進行特征提取,構建特征集合,通過用戶特征集合與期刊數(shù)據(jù)庫中的文檔進行查詢匹配,輸出中間結果。若當前結果滿足用戶需求,則將檢索結果返回給用戶。如果返回結果不滿足用戶需求,檢索系統(tǒng)將利用深度學習和相關反饋技術,進一步挖掘用戶的信息需求來修正查詢式,再次學習期刊論文深層內容特征,改變檢索策略,過濾不相關信息,為下一次檢索提供保障。檢索系統(tǒng)通過對期刊論文內容特征和用戶檢索需求的深度挖掘,使檢索結果逐漸接近用戶真實的檢索需求,從而實現(xiàn)學術信息資源的智能檢索。智能交互式檢索模型充分考慮用戶的檢索體驗,為用戶和學術期刊檢索系統(tǒng)建立一種智能交互平臺,可有效提高檢索效率。智能交互式檢索模型如圖1所示。
圖1 智能交互式檢索模型
該模塊的主要任務是學術期刊APP用戶進行構造查詢式操作,包括用戶設計、構建、確定和輸入查詢式的全過程。但用戶在構造查詢式時,大多取決于對檢索內容的認知程度且普遍青睞于構建簡潔的查詢式[16],多采用關鍵詞間的搭配,因而導致檢索結果不準確,傳統(tǒng)的檢索方式需不斷調整查詢式進行二次檢索操作。本文采用互信息值指標考察關鍵詞的內在關聯(lián)性。用戶可根據(jù)自身對檢索內容的相關性判斷,列出關鍵詞構造查詢式。智能交互式檢索系統(tǒng)通過分析用戶提交查詢式的長度、內容和特征學習用戶的檢索行為偏好,優(yōu)勢在于用戶可以隨時進行查詢式重構操作,得到top-ranked文檔信息,選擇符合檢索需求的關鍵詞重新構造查詢式。關鍵詞在構造查詢式中扮演重要的角色[17],簡單的關鍵詞搭配已不能滿足檢索的需要,深度挖掘其間內在聯(lián)系,構建符合檢索用戶需求的查詢式成為智能交互式檢索的關鍵所在。
2.2.1 特征提取
特征提取操作能夠表征期刊論文內容的主要特征,是實現(xiàn)特征集合和查詢匹配的前提條件。本文擬以期刊論文中出現(xiàn)的頭部信息(包括標題、摘要和關鍵詞等文本信息)作為內容特征,提取到的特征越能夠表達期刊論文的內容,查詢匹配的效果也將越好。因此,選擇有效的內容特征是實現(xiàn)查詢匹配的關鍵。本文采用基于概念特征的特征提取方法,先對期刊論文中的頭部信息進行分詞,形成詞語集合;然后進行數(shù)據(jù)清洗操作,即去除停用詞等無意義詞匯;在向量空間模型(Vector Space Model)的基礎上對清洗后的數(shù)據(jù)進行語義分析,將具有相同語義的詞匯聚類,形成特征集合。降低文獻處理的計算量,方便進行查詢匹配操作。
2.2.2 查詢匹配
在查詢匹配階段,對于任意一篇期刊論文,如果其中包含提取到的某特征詞匯,則在該特征上記為“1”,若不包含提取的特征詞匯則記為“0”。但在實際的查詢匹配處理過程中,常出現(xiàn)空結果查詢和多結果查詢。即當用提交的查詢式過于嚴格時,檢索的結果可能為空;當用戶提交的查詢式過于寬松時,檢索的結果又會出現(xiàn)多種組合。在這兩種情況下,查詢匹配操作可以根據(jù)特征標記結果自動選擇排序檢索結果,將最鄰近用戶檢索需求的查詢結果返回給用戶,得到最優(yōu)的查詢匹配結果。
驗證結果模塊功能實現(xiàn)的是用戶主動參與的人機交互機制,主要是驗證用戶第一次構造的查詢式是否可以得到滿意的檢索結果。當系統(tǒng)返回給用戶中間結果后,通過用戶交互來判斷文獻是否相關,如果對檢索結果不滿意,檢索系統(tǒng)通過交互方式引導用戶,結合深度學習和相關反饋技術修正和優(yōu)化查詢式并進行新一輪的檢索。由于檢索算法是既定的,檢索效率的高低主要取決于用戶構造的查詢式,若用戶輸入的查詢式不能有效命中檢索目標,會大幅降低用戶的檢索滿意度。智能交互式檢索系統(tǒng)將根據(jù)用戶第一次提交的查詢式和檢索結果,準確預測數(shù)據(jù),優(yōu)化查詢式,得出更符合用戶檢索需求的集合。
查詢優(yōu)化模塊是整個智能交互式檢索的關鍵,直接影響學術期刊APP檢索的效果。在查詢優(yōu)化過程中,如果第一次查詢結果未能滿足用戶的檢索需求,系統(tǒng)將在深度學習計算基礎上再次識別用戶的需求,挖掘期刊論文潛在的特征信息,細化用戶的興趣偏好[18],并將相關信息及時反饋給用戶,對用戶第一次提交的查詢式進行優(yōu)化。查詢優(yōu)化過程結合用戶需求和期刊論文的特征信息,對原有查詢式進行修改優(yōu)化,再次進行檢索操作,直到檢索出用戶滿意的檢索結果為止[19]。
2.4.1 深度學習
深度學習是機器學習的一個分支,源于人工神經網絡,可通過組合底層特征形成更高層的屬性特征,改善非結構化學術期刊論文數(shù)據(jù)特征表示,從學術期刊數(shù)據(jù)中挖掘出更多的潛在特征。深度學習在某些方面與人類大腦學習機制非常相似,可通過模擬人腦對文本數(shù)據(jù)進行解釋和分析,不再單純依賴人工提取數(shù)據(jù)的文本特征,深度學習可以嘗試主動學習并自動完成文本特征提取操作,甚至還可以處理更加復雜的數(shù)據(jù)。如在文本特征提取操作中,深度學習可以挖掘出文本的底層特征(單純和詞組)、中間特征(短語和句子)以及高層特征(段落和文章),最終模擬人腦對文本信息進行語義理解,為檢索模型的查詢匹配提供前提保障。
本文利用卷積神經網絡的模型訓練深度學習文本類別標注器,對期刊論文信息進行特征標注。首先是卷積層,包括低層次的卷積層和高層次的卷積層,低層次的卷積層提取字、詞和句子等,高層次的卷積層可以提取段落、章節(jié)和語義特征等,層次越高提取到的特征越抽象且越準確;其次是池化層,把具有相同或相似語義特征合并起來,提取到更精準的特征;最后是全連接層,將以上操作得到全部特征進行匯總,對期刊論文信息分類。雖存在耗時長、工作量大等問題,但在很大程度上提升了特征標注的準確率。
此外,深度學習在用戶檢索需求表達方面也發(fā)揮著重要作用。深度學習技術可以根據(jù)用戶提交的查詢示例、瀏覽記錄等信息來確定用戶檢索需求,生成個性化的檢索詞。當用戶在智能交互式檢索平臺輸入檢索詞時,系統(tǒng)會根據(jù)用戶之前的瀏覽記錄自動推薦檢索詞,用戶只需根據(jù)自身需求選擇查詢詞進行檢索即可。當用戶提交檢索詞得出相關檢索信息后,深度學習會為用戶篩選出最符合用戶需求的檢索結果。用戶可以不再受自身學科知識的限制,根據(jù)深度學習提供的檢索詞,在最短的時間內找到所需的期刊論文信息。
2.4.2 相關反饋
采用相關反饋技術可以減少在獲取用戶查詢需求時產生的負面影響,減輕用戶負擔,通過用戶交互來提高檢索效率。由于信息檢索有“以用戶為中心”的服務宗旨,因此用戶交互是跨媒體檢索中很重要的一個環(huán)節(jié)。相關反饋技術的具體過程:當系統(tǒng)將檢索結果返回給用戶后,用戶根據(jù)主觀判斷檢索結果是否符合預期效果,若不符合可再次提交查詢示例和反饋信息,檢索系統(tǒng)根據(jù)反饋信息對查詢示例進行二次檢索。
本文采用的相關反饋算法是經典的Rocchio算法[20],計算方法見公式(1)。將所有文檔和查詢式都表示成特征詞權值向量,應用在空間向量模型中。在進行相關反饋操作時,通常將第一次檢索得到的排序靠前的N項檢索結果作為相關文檔。
設Q0原始檢索向量,Qnew是新的檢索向量,Dr和Dnr分別代表相關和不相關文檔集合,N和n分別表示檢索得到的全部和相關文檔的數(shù)量,N-n則表示不相關文檔的數(shù)量。Di代表相關文檔的特征詞權值向量,Dj代表不相關文檔的特征詞權值向量。其中α、β和γ是可以調整的常量參數(shù),有些系統(tǒng)為計算方便,常將α、β和γ的值設為1。可根據(jù)實際情況對系統(tǒng)變量進行調整,以獲得最佳反饋效果。
實驗數(shù)據(jù)來自中國知網網站上下載的中文期刊數(shù)據(jù)集,由于學術期刊論文的關鍵詞較明確,所以能獲得比較清晰的結果。選定10類相關主題進行對比實驗,它們分別是圖書館、學校圖書館、高校圖書館、公共圖書館、互聯(lián)網+圖書館、圖書館服務、圖書館學、信息服務、讀者服務、閱讀推廣。下載獲取每類主題中的900篇期刊論文作為該類的數(shù)據(jù)樣本,共得到9 000篇期刊論文文檔的實驗數(shù)據(jù)集并存儲于期刊數(shù)據(jù)庫中,將提取到的頭部信息(包括標題、摘要和關鍵詞等文本信息)作為內容特征存放在特征庫。其中7 500條作為訓練樣本,剩余的1 500條為測試樣本。
在比較查詢性能時采用標準的查全率R、查準率P來評價實驗結果。查準率表明返回結果的正確性,查全率表明返回結果的完備性,兩者之間相互制約,其定義為:查全率R即檢索到的正確文檔數(shù)與所有相似文檔數(shù)的百分比;查準率P即檢索到的正確文檔數(shù)與檢索到的相似文檔數(shù)的百分比。
本實驗采用對比實驗法,分別對收集到的測試樣本進行兩組實驗,一組是普通的關鍵詞檢索,另一組是智能交互式檢索,共進行5次迭代,將查準率和查全率作為主要性能評價指標,得到兩組實驗結果(見表1)。兩種檢索方式的查全率對比見圖1,查準率對比見圖2。
實驗對比發(fā)現(xiàn),兩種檢索方式的查全率會隨著查準率的升高而降低。智能交互式檢索的查準率較高,其原因是智能交互式信息檢索采用了深度學習技術,在查詢式重構后的第二階段檢索過程中,能夠使檢索式信息更加準確且全面,可有效提高檢索效率。而基于關鍵詞的檢索方式,用戶對信息的描述都是自然語言的詞語,文檔與查詢的關聯(lián)程度取決于用戶自身的經驗知識和理解能力,且在檢索過程中需要用戶的實時參與,篩選和重新定義關鍵詞,增加了檢索系統(tǒng)的時間開銷,檢索效率難以滿足用戶的需求。
表1 兩種檢索方式檢索結果 %
圖1 兩種檢索方式查全率對比
圖2 兩種檢索方式查準率對比
近年來,國內外交互式檢索的發(fā)展非常迅速,但在學術期刊APP領域仍處于發(fā)展階段,通過研究發(fā)現(xiàn)未來的發(fā)展趨勢可能側重于以下3點。
(1)交互式檢索過程中的用戶體驗。今后交互式檢索研究將更多地引入心理學方法,準確分析用戶檢索行為,為其提供更智能的、全面的檢索結果,開拓更人性化的檢索界面,提高用戶使用滿意度。檢索系統(tǒng)評價方式不再局限于查全率和查準率,成功的交互式檢索系統(tǒng)須考慮用戶的參與度,實現(xiàn)用戶和檢索系統(tǒng)的有機聯(lián)系。
(2)將多媒體技術引入學術期刊APP中。隨著時代的發(fā)展以及用戶日益增長的檢索需求,學術期刊APP會逐漸將文本、圖像、音頻和視頻等多媒體內容引入APP中,為用戶提供更加多元化的信息資源,支持學科發(fā)展和個人學術研究。如VR/AR技術可使得用戶的視覺和聽覺感官體驗更加立體化。
(3)語義信息被廣泛應用于檢索系統(tǒng)中。要想從海量數(shù)據(jù)中快速獲取符合用戶需求的信息,需要挖掘數(shù)據(jù)的高層語義特征,揭示知識之間的區(qū)別和聯(lián)系,形成統(tǒng)一的資源群體,提高系統(tǒng)的檢索性能。
從國內的情況來看,盡管互聯(lián)網技術在學術期刊APP中的應用不斷豐富,但隨著海量數(shù)據(jù)的產生,單一檢索已不能滿足用戶對學術信息的準確檢索要求。針對這一問題,本文提出了一種智能交互式檢索模型,將用戶的檢索體驗放在首位,實現(xiàn)系統(tǒng)、用戶和學術信息資源的實時交互及反饋,提高用戶在檢索系統(tǒng)中的參與度。通過實驗發(fā)現(xiàn)智能交互式檢索模型可有效提高檢索效率,為APP用戶提供更準確全面的學術信息資源。下一階段我們將對檢索模型和相關算法進一步深入研究,以期提高智能交互式檢索系統(tǒng)的性能。