寧琳
(重慶交通大學(xué)圖書館,重慶 400074)
隨著信息技術(shù)的迅猛發(fā)展,數(shù)字圖書館已經(jīng)成為圖書館業(yè)發(fā)展的一個重要方向。如何讓讀者能夠從數(shù)字圖書館海量信息中快速準(zhǔn)確的查找所需信息,更好地利用館藏資源進行自主學(xué)習(xí),這對圖書館服務(wù)模式提出了新的要求。采用智能Agent設(shè)計圖書館個性化服務(wù)模型,以用戶為中心,研究用戶的行為、興趣和習(xí)慣,為用戶搜索、組織、選擇和推薦建立更具針對性、面向用戶的個性化服務(wù)機制,能夠使圖書館從被動為讀者提供資料到主動為讀者尋找知識方向發(fā)展,從而提高圖書館資源的利用率。本文擬對基于智能Agent的數(shù)字圖書館個性化服務(wù)模型進行研究。
個性化定制服務(wù)是有效獲取用戶需求信息的方法之一。它通過用戶定制獲取用戶的個性化信息,從而理解用戶的需求,為用戶提供更為準(zhǔn)確的信息服務(wù)。在個性化信息定制中,用戶可以根據(jù)自己的興趣和需求定制信息,定制的內(nèi)容包括信息資源、界面和服務(wù)等,系統(tǒng)也可以將更新信息及時推送給用戶,提醒用戶及時利用。
個性化信息檢索服務(wù)是圖書館個性化服務(wù)的重要方面,在數(shù)據(jù)庫檢索過程中,由于檢索知識和專業(yè)領(lǐng)域不同,用戶之間的檢索方式大不相同,這就需要在檢索策略、檢索方法和檢索結(jié)果上要支持用戶個性化需求。檢索服務(wù)主要包括以下幾個方面:
1.2.1個人檢索模板
用戶可根據(jù)所需信息的專業(yè)(用分類號或主題詞、關(guān)鍵詞確認(rèn))、應(yīng)用目的(用文獻類型區(qū)別,例如期刊論文、專利、會議文獻等)、而且深度、地域、數(shù)量、時域等進行定制,從而表達自己相對穩(wěn)定的檢索限制條件。
1.2.2 檢索結(jié)果處理
可對檢索結(jié)果的相關(guān)度計算標(biāo)準(zhǔn)、輸出格式、排序方式、分類組織、下載格式、傳送地址等進行約束。
1.2.3 檢索歷史分析
用戶可要求系統(tǒng)動態(tài)追蹤其檢索過程,提取用戶或相近用戶最常用的檢索詞、檢索式、數(shù)據(jù)庫、期刊及網(wǎng)站,用來自動修改用戶的個性化信息。
個性化界面服務(wù)是讓用戶根據(jù)自己的愛好選擇桌面的顯示方式,它包括界面的結(jié)構(gòu)布局、資源類型、表現(xiàn)形式等。例如在網(wǎng)站中,讓用戶輸入個人信息,生成“我的主頁”,“我的圖書館”等服務(wù)。
智能Agent是用戶和資源之間的樞紐和中介,它能代表用戶和其他程序,以主動服務(wù)的方式完成一組工作,幫助用戶準(zhǔn)確獲取信息,實現(xiàn)用戶個性化服務(wù)的需求。
Agent是一個在特定環(huán)境下能感知環(huán)境,并自主運行,代表用戶或設(shè)計者實現(xiàn)一系列目標(biāo)的計算機實體或程序,它主要具有以下特征:
(1)代理性:Agent能以用戶代理者的身份去完成某種特定的任務(wù),它可以引導(dǎo)并代替用戶對信息資源進行訪問,如代替人完成網(wǎng)絡(luò)搜索、進行網(wǎng)上信息交互等。
(2)智能性:Agent能表現(xiàn)出類似于人類的智能特性,例如,理解用戶用自然語言表達對信息的需求,捕捉用戶的偏好和興趣,推測用戶的意圖并為用戶提供建議等。
(3)自主性:Agent具有自我調(diào)控能力,它應(yīng)能在動態(tài)變化的環(huán)境中,獨立規(guī)劃復(fù)雜的操作步驟,在用戶不參與的情況下,獨立發(fā)現(xiàn)和獲取符合用戶需求的資源和服務(wù)。
(1)資源導(dǎo)航:根據(jù)用戶的需求或意圖,尋找網(wǎng)絡(luò)信息,或告訴用戶網(wǎng)絡(luò)資源的具體位置。
(2)信息過濾和篩選:從流向用戶的大量信息中篩選符合條件的信息,并以不同級別(全文、詳細(xì)摘要、簡單摘要、標(biāo)題)呈現(xiàn)給用戶。
(3)信息整理:為用戶把已經(jīng)下載的資源進行分類整理。
(4)知識發(fā)現(xiàn):從大量的公共原始數(shù)據(jù)中篩選和提煉有價值的信息,并向用戶發(fā)布。
(5)問題解惑:根據(jù)網(wǎng)上信息資源回答用戶關(guān)于特定主題的問題。
2.3.1 智能Agent的抽象模型
智能Agent的抽象模型可以表示為:Ag:RE→Ac,其中,外部環(huán)境狀態(tài)集合為:E={e,e',…},Agent動作集合為:Ac={a,a',…},R是E和Ac狀態(tài)變化的執(zhí)行集合,該模型根據(jù)感知環(huán)境狀態(tài)變化,將一次執(zhí)行映射到動作,并將輸出動作作用于環(huán)境,從而實現(xiàn)一次封閉的循環(huán),其具體流程如圖1所示。
Agent從初始內(nèi)部狀態(tài)i0開始,觀察外部環(huán)境狀態(tài)e,產(chǎn)生一個感知函數(shù)see(e),然后通過函數(shù)next更新Agent的內(nèi)部狀態(tài),變成next[i0,see(e)],并與狀態(tài)庫進行對比,Agent通過action{next[i0,see(e)]}選擇一次執(zhí)行動作r,r在環(huán)境狀態(tài)e與主體動作a之間呈交替序列:動作執(zhí)行之后Agent進入下一循環(huán),繼續(xù)通過see感知外部世界,通過next更新狀態(tài),通過action選擇動作執(zhí)行。
2.3.2 智能Agent個性化信息獲取的過程
個性化服務(wù)的關(guān)鍵是用戶動態(tài)信息的獲取。智能Agent信息獲取的方式有兩種:一是定時輪詢Web日志,定期收集用戶使用信息;二是Agent實時的跟蹤,發(fā)現(xiàn)變化及時產(chǎn)生動作,從中分析出用戶的個性化信息。其具體過程如圖2所示。
個性分析Agent根據(jù)用戶需求,與所有可能存放用戶所需信息的數(shù)據(jù)庫Agent聯(lián)系,委托它們查找與模型相匹配信息,通過知識庫相關(guān)規(guī)則進行推理判斷,提取個性化服務(wù)信息,再把查找結(jié)果回送給個性分析Agent,最后將知識庫推理算法的權(quán)值進行調(diào)整,并將查詢結(jié)果整理后反饋給用戶。例如,用戶提交了“數(shù)字圖書館”的查詢請求,個性分析Agent的“檢索類Agent”中就會添加“數(shù)字圖書館”,并賦予一定的權(quán)值,通過知識庫的推理算法構(gòu)造個性信息結(jié)構(gòu),以后的檢索工作都是圍繞這個個性信息結(jié)構(gòu)進行,通過比對分析,提取出個性信息,最后將分析結(jié)果反饋到個性分析Agent,該結(jié)果除包括“數(shù)字圖書館”,還會包括系統(tǒng)預(yù)測的信息,如“數(shù)字圖書館技術(shù)”、“分布式圖書館”、“數(shù)字圖書館建設(shè)”等,檢索完畢之后,調(diào)整知識庫推理算法的相應(yīng)權(quán)值。
實現(xiàn)個性化服務(wù),除了要有友好的用戶界面外,系統(tǒng)還必須具備以下能力:一是構(gòu)建個性化處理模型,即跟蹤用戶行為,學(xué)習(xí)、記憶用戶興趣,根據(jù)用戶的特征來收集處理個性化用戶信息;二是構(gòu)建個性化用戶信息模型,將個性化信息從全局信息空間中分離出來?;贏gent的個性化模型框架結(jié)構(gòu)圖見圖3。用戶通過使用權(quán)限登錄到自己的個性化用戶界面,進入界面之后,用戶界面的接口模塊對用戶使用情況進行實時跟蹤,把數(shù)據(jù)進行簡單分類,過濾掉一些明顯的無關(guān)信息,然后將處理后的信息轉(zhuǎn)交個性化處理模塊,個性化處理模塊主要按照相應(yīng)規(guī)則和算法,通過計算個性結(jié)構(gòu)相似度等方法,分離出個性化信息內(nèi)容,最后由用戶信息模塊對此內(nèi)容進行歸類和存儲。
3.2.1 用戶接口模塊
用戶接口模塊是用戶與系統(tǒng)的接口,它將用戶的請求發(fā)送給系統(tǒng),又將系統(tǒng)提供的服務(wù)以用戶可以識別的方式呈現(xiàn)給用戶。用戶接口模型結(jié)構(gòu)圖見圖4。信息跟蹤Agent主要對用戶行為進行跟蹤,自動捕捉用戶的興趣愛好,搜索可能引起用戶興趣的信息,然后交給信息過濾Agent。信息過濾Agent主要負(fù)責(zé)把跟蹤Agent采集的信息進行處理,按照一定的限定要求,去除一些無關(guān)數(shù)據(jù),減少數(shù)據(jù)的傳輸量。信息呈現(xiàn)Agent主要負(fù)責(zé)呈現(xiàn)界面的作用。管理Agent主要負(fù)責(zé)協(xié)調(diào)和管理其他Agent,對任務(wù)進行分解和分配,平衡其他Agent間的負(fù)荷。
3.2.2 個性化處理模塊
個性化處理模塊是整個系統(tǒng)的核心,負(fù)責(zé)控制整個系統(tǒng)的正常運轉(zhuǎn),主要將用戶的需求進行個性化分析處理,提煉出個性化信息內(nèi)容,并轉(zhuǎn)化為機器可以識別的信息。個性化處理模塊結(jié)構(gòu)圖見圖5。
用戶信息收集Agent主要采集的用戶接口模塊傳來的數(shù)據(jù),并進行簡單的分類,收集信息后,將采集的信息送往個性分析Agent群。個性化分析Agent群是個性化處理模塊的關(guān)鍵部分,主要按照知識庫的相應(yīng)規(guī)則,采用多種推理算法,將最新采集的信息進行分析處理,分離出個性化信息內(nèi)容,如用戶的個人信息、經(jīng)常訪問的期刊網(wǎng)址、使用的關(guān)鍵詞或主題詞、用戶的IP地址、訪問的時間頻率等,處理完成之后,將結(jié)果轉(zhuǎn)入用戶信息庫或傳遞到信息呈現(xiàn)模塊,并更改知識庫。知識庫是一個存儲庫,主要保存Agent運行時所需的數(shù)據(jù)、處理結(jié)果以及處理后發(fā)回用戶的數(shù)據(jù)。同時,知識庫也是一個規(guī)則庫,Agent可根據(jù)這些規(guī)則來進行分析、判斷和推理。信息調(diào)度Agent根據(jù)個性分析處理后的個性參數(shù)來調(diào)度數(shù)據(jù)庫,選擇合適的信息資料呈現(xiàn)給用戶,同時,把用戶的活動信息反饋給個性化分析Agent群,由個性分析Agent群進行再加工。管理Agent主要負(fù)責(zé)協(xié)調(diào)和管理其他Agent。
3.2.3 用戶信息模塊
用戶信息模塊主要用于分析和存放用戶的個性化信息。用戶信息模塊結(jié)構(gòu)圖見圖6。信息分類Agent主要對經(jīng)個性化處理模塊處理過的信息進行分析歸類。個性分析Agent負(fù)責(zé)將分類的信息再次進行篩選比對,提取讀者的個性特點,并存入讀者信息庫。讀者信息庫主要記錄讀者的基本信息、個性習(xí)慣、網(wǎng)絡(luò)記錄等。管理Agent主要負(fù)責(zé)其他Agent的管理和協(xié)調(diào)。
3.2.4 協(xié)調(diào)Agent模塊
協(xié)調(diào)Agent系統(tǒng)模塊主要對各個模塊進行管理和協(xié)調(diào),負(fù)責(zé)它們之間的信息傳輸和解決資源、約束沖突的問題。
目前,數(shù)字圖書館的個性化服務(wù)尚在起步階段,但隨著數(shù)字圖書館不斷向網(wǎng)絡(luò)化、共享化發(fā)展,用戶面對的將不再是一個物理上的圖書館,而是基于若干個圖書館形成龐大的網(wǎng)絡(luò)化圖書館,這對用戶準(zhǔn)確獲取信息造成了很大困難,采用圖書館個性化服務(wù),信息資源發(fā)現(xiàn)和跟蹤由個性化服務(wù)系統(tǒng)自主進行,可以有效解決信息泛濫的問題,實現(xiàn)用戶對信息需求的最優(yōu)化。采用智能Agent設(shè)計圖書館個性化服務(wù)模型,對研究并實現(xiàn)圖書館個性化服務(wù)系統(tǒng)有很高的指導(dǎo)性,是實現(xiàn)數(shù)字圖書館廣域個性化服務(wù)的一種很好的嘗試。
[1]高建清.基于模糊Q學(xué)習(xí)的Agent智能決策研究與實現(xiàn)[D].合肥:合肥工業(yè)大學(xué),2006.
[2]陳自郁.基于代理的遠(yuǎn)程教學(xué)系統(tǒng)及學(xué)生模型的研究[D].重慶:重慶大學(xué),2002.
[3] 高仲慧,林筑英,魏高起.基于多Agent的自適應(yīng)遠(yuǎn)程教學(xué)系統(tǒng)模型[J].貴州師范大學(xué)學(xué)報(自然科學(xué)版),2009(8):96-99.
[4] 莊鵬,張惠惠,夏佩福.代理模式實現(xiàn)數(shù)字圖書館個性化信息服務(wù)模型[J].現(xiàn)代圖書情報技術(shù),2003(5):15-18.