□高昆栓/中國科學技術信息研究所 北京 100038
/ 北京萬方數(shù)據(jù)股份有限公司 北京 100038
文獻資源數(shù)據(jù)庫的個性化服務探析
□高昆栓/中國科學技術信息研究所 北京 100038
/ 北京萬方數(shù)據(jù)股份有限公司 北京 100038
文章從文獻數(shù)據(jù)庫及個性化定義出發(fā),論述了數(shù)據(jù)庫個性化服務的興起和發(fā)展,以及文獻數(shù)據(jù)庫系統(tǒng)開展個性化服務的意義,歸納了文獻數(shù)據(jù)庫系統(tǒng)獲取用戶個性化需求的方法及服務模式,總結(jié)了文獻數(shù)據(jù)庫與個性化服務的未來發(fā)展方向。
文獻數(shù)據(jù)庫,個性化服務,信息推送,定制服務
數(shù)據(jù)庫簡單地說就是一組(某種)海量信息數(shù)據(jù)的集合。文獻數(shù)據(jù)庫就是指以包含文獻信息的海量數(shù)據(jù)集合,并能通過多種檢索手段提取出其中用戶所需文獻信息的倉庫。文獻信息數(shù)據(jù)庫個性化服務就是數(shù)據(jù)庫系統(tǒng)給予用戶針對性的、點對點的信息服務。數(shù)據(jù)庫開發(fā)者利用多種信息技術:數(shù)據(jù)挖掘、智能搜索、智能代理、信息過濾、數(shù)據(jù)推送等手段,在文獻數(shù)據(jù)庫系統(tǒng)中根據(jù)用戶的興趣、愛好、習慣、個性需求或者用戶自己設定的信息內(nèi)容、范圍以及服務方式,主動為用戶及時提供或推送對應信息。從數(shù)據(jù)庫角度看,它是一種推送或存儲服務、一種主動服務;從用戶的角度看它是一種需求定制、一種自主和個性化需求的實現(xiàn)。其實質(zhì)是文獻數(shù)據(jù)庫系統(tǒng)把用戶的個性定制信息自動推送出去的一種智能化服務。具體地講,文獻數(shù)據(jù)庫利用其信息自動化技術把用戶使用該數(shù)據(jù)庫的行為特點,包括用戶名稱、登錄地點、網(wǎng)址、使用的檢索詞以及頻率、學科內(nèi)容、范圍等自動跟蹤并記錄下來,把數(shù)據(jù)庫中的信息進行分類和智能過濾,有選擇地及時保存或推送到用戶在該數(shù)據(jù)庫系統(tǒng)內(nèi)建立的個人門戶中或個人空間,包括用戶的網(wǎng)站、個性化主頁及用戶郵箱等。
自上世紀60年代因特網(wǎng)誕生以來,文獻數(shù)據(jù)庫個性化服務發(fā)展速度迅猛異常。短短數(shù)年間,世界進入網(wǎng)絡時代,人們的信息交流突破了時空的限制,在獲取信息速度快的同時,也出現(xiàn)了信息量的爆炸性膨脹。不要說在浩瀚的因特網(wǎng)中查找需要的信息,就是在專業(yè)化的數(shù)據(jù)庫中查找需要的科研論文、科學數(shù)據(jù),同樣出現(xiàn)信息選擇困難。傳統(tǒng)的“輸入——檢索——選擇”的大眾化服務模式,已經(jīng)無法滿足用戶專指的個性化需求。盡管各種信息檢索技術的日益成熟和優(yōu)化,在不斷地提高用戶檢索信息的專指度,然而,所得到的不一定是用戶心理預期的個性化的信息。面對海量信息而卻難以高效率選擇自己個性化的信息,成為人們信息獲取的主要矛盾,人們選擇信息比獲取信息更加困難。此時,“用戶迫切需要一種能夠根據(jù)用戶的特點自動組織和調(diào)整信息的服務模式”[1],個性化服務開始萌芽,之后,個性化的服務被信息需求者所強烈呼喚和期待,個性化的信息服務越來越被人們提上了“議事日程”。
1995年,美國率先發(fā)表了研究個性化服務的論文;1999年,在美國圖書館界與信息技術聯(lián)合會(LITA)10位著名的數(shù)字圖書館專家在研討會上,把個性化定制服務列為數(shù)字圖書館發(fā)展的7大趨勢之首,提供資金支持個性化服務研究,并出版?zhèn)€性化服務???;同年4月,美國成立了專門的研究機構(gòu)和個性化服務協(xié)會;繼之,美國各大型網(wǎng)站、電子出版商、大學圖書館及研究機構(gòu)推出了以“My Library系統(tǒng)”為代表的個性化服務,較早的有Yahoo!、CNN、康奈爾大學圖書館、北卡羅來納州立大學圖書館、華盛頓大學圖書館等。
與美國比較,我國個性化服務的探索和研究起步較晚,1999年“中國數(shù)字圖書館示范系統(tǒng)”項目中提到了數(shù)字圖書館的個性化服務問題;2000年僅有2篇相關內(nèi)容的文章發(fā)表,及至2005年,360網(wǎng)站、中國國家科學圖書館、浙江大學圖書館、廈門大學圖書館等才相繼開展了“我的圖書館”、“MyLibrary@ZJU”、“個人定制”的個性化服務,國內(nèi)的萬方醫(yī)學網(wǎng)(Wanfang med online)的“個人館”、“機構(gòu)館”、“作者空間”、“機構(gòu)空間”等,在數(shù)據(jù)庫的個性化服務方面也進行了探討。
隨著個性化服務技術日趨成熟,以及個性化服務在廣大用戶中受到青睞,文獻數(shù)據(jù)庫開發(fā)商也把個性化服務技術集成運用到數(shù)據(jù)庫系統(tǒng)中,為文獻數(shù)據(jù)庫贏得了又一次重大商機。可以說,文獻數(shù)據(jù)庫個性化服務,實際就是因特網(wǎng)及各網(wǎng)站的個性化服務功能在文獻數(shù)據(jù)庫中的實現(xiàn),也是個性化服務在文獻數(shù)據(jù)庫中的移植。
傳統(tǒng)的文獻資源數(shù)據(jù)庫服務,都是由用戶輸入檢索詞,然后獲得檢索信息,這種被動式的服務,需要耗費用戶的大量時間,服務效率低下。而個性化服務則由于數(shù)據(jù)庫系統(tǒng)能根據(jù)用戶興趣、愛好或個人的定制,及時主動地向用戶推送或存儲讀者需要的信息,這是數(shù)據(jù)庫服務由被動向主動轉(zhuǎn)變的一個標志。由于其能及時推送和存儲用戶所定制的專指性信息,滿足了用戶的個性化需求,實現(xiàn)了再次檢索和瀏覽的便利,是數(shù)據(jù)庫以數(shù)據(jù)為中心向以用戶需求為中心轉(zhuǎn)變的根本性變化,是服務理念的升華。同時,也提高了用戶獲取信息的時效性,提高了數(shù)據(jù)庫的使用效益。
數(shù)據(jù)庫出現(xiàn)以來,各個數(shù)據(jù)庫商為了獲得最大商機,一直在不斷完善數(shù)據(jù)庫的功能,以便能吸引眾多的用戶。但是,數(shù)據(jù)庫功能的改善多出現(xiàn)在檢索途徑、收錄內(nèi)容、結(jié)果分析、相關性鏈接,以及在收錄時間上更大地延長回溯時間。然而,在服務功能上卻始終未見突破,個性化服務的出現(xiàn),為數(shù)據(jù)庫的功能的完善帶來耳目一新的感覺[4],為數(shù)據(jù)庫添加了附加值,增加了用戶對數(shù)據(jù)庫依附性。所以,主動地、智能化地為用戶提供個性化服務是數(shù)據(jù)庫服務功能的一個重大的擴展和突破。
自從數(shù)據(jù)庫出現(xiàn)以來,圍繞如何購買一個具有權威性、學科覆蓋面廣、針對性強、更新速度快、檢索功能強大的文獻數(shù)據(jù)庫,是每個圖書館、情報所、企事業(yè)單位以及所有為讀者提供文獻服務單位的期望。為此,在圖書情報學術研究中,數(shù)據(jù)庫評價成為一項重要內(nèi)容,為數(shù)據(jù)庫的購買提出了理論上的參考標準。不同的研究者從各自不同的角度出發(fā),提出評價文獻數(shù)據(jù)庫的各項指標,主要包括從內(nèi)容質(zhì)量、權威性、覆蓋面和收錄時間四個方面進行評價,還有的研究者對上述評價的內(nèi)容進行了補充,提出還應從數(shù)據(jù)庫的檢索系統(tǒng)、數(shù)據(jù)庫的使用、數(shù)據(jù)庫的性價比、數(shù)據(jù)庫的服務等這些指標來評價,也還有的文獻作者通過對評價數(shù)據(jù)庫研究論文的調(diào)查,特別補充了數(shù)據(jù)庫使用上“并發(fā)用戶數(shù)”和“用戶不活動時限”兩個指標[3]。然而,隨著數(shù)據(jù)庫的不斷發(fā)展,對數(shù)據(jù)庫評價的研究也在不斷地深化,其評價的指標越來越完善。然而,從目前評價體系來看,在服務評價方面尚缺乏系統(tǒng)全面的指標。所以文獻數(shù)據(jù)庫系統(tǒng)能不能為用戶提供主動的智能化服務——也就是能不能為用戶提供個性化的服務,就成了評價數(shù)據(jù)庫的一個重要的參量,也成為圖書館界選擇購買文獻數(shù)據(jù)庫的一個重要依據(jù)。
文獻數(shù)據(jù)庫系統(tǒng)通過人機交互獲取用戶個性化需求,完成定制·通告·推送服務。用戶根據(jù)數(shù)據(jù)庫系統(tǒng)提供的一個交互界面,填寫自己的個性資料,包括用戶的興趣愛好、專業(yè)特長等,或系統(tǒng)給用戶列出可供選擇的一些表單,用戶根據(jù)自己的愛好、興趣、特長,選定自己需要的內(nèi)容,成為個性化定制。支持這個界面的背后資源就是數(shù)據(jù)庫的全部信息數(shù)據(jù)。在用戶自己的定制中,諸如我的圖書館、My library、我的圖書、我的書架、我的訂閱、我的頻道等,建立起用戶個人檔案。數(shù)據(jù)庫系統(tǒng)根據(jù)用戶的個人檔案資料,采用智能挖掘、知識發(fā)現(xiàn)、知識分析和知識組織技術,把與用戶相匹配的信息或數(shù)據(jù)組織起來,進行篩選、分類擇優(yōu),采用推送技術——以通告、郵件、專門的軟件方式或閱讀器把用戶需要的信息傳遞推送給用戶。這種方法和模式簡單方便,可為用戶提供真實、準確的信息,但主動性差。
文獻數(shù)據(jù)庫系統(tǒng)通過用戶的訪問記錄,跟蹤挖掘用戶信息需求,完成存儲·檢索·瀏覽服務。數(shù)據(jù)庫系統(tǒng)通過跟蹤用戶登錄數(shù)據(jù)庫的行為習慣、查詢數(shù)據(jù)庫的學科類別、提交的關鍵詞、檢索策略等,進行訪問跟蹤,搜尋訪問印記,存儲檢索歷史等。通過智能挖掘、知識過濾、知識發(fā)現(xiàn)、智能分析等技術,提取用戶信息存入數(shù)據(jù)庫系統(tǒng),再把數(shù)據(jù)庫中與用戶(同類用戶)相匹配的信息及時存儲在文獻系統(tǒng)中,以便用戶隨時點擊瀏覽和下次檢索使用,也可主動推送與存儲匹配的信息。此種方法和模式主動及時,但涉嫌侵犯用戶個人隱私。
文獻數(shù)據(jù)庫系統(tǒng)通過用戶門戶建立,可滿足用戶全方位和聚類的專業(yè)化信息需求,是文獻數(shù)據(jù)庫系統(tǒng)個性化集成服務的體現(xiàn)。
門戶技術實際是人機界面技術的一支,可包容目前所有的個性化服務的內(nèi)容與技術,在數(shù)據(jù)庫系統(tǒng)內(nèi)建立的門戶中,用戶可獲得較高的智能化服務,因為門戶技術具有自主性和可擴展性,門戶涉及的領域較廣,通過門戶可以自主設置界面功能和結(jié)構(gòu),可以訪問數(shù)據(jù)庫以外不同結(jié)構(gòu)和內(nèi)容的信息和數(shù)據(jù)。所以在系統(tǒng)門戶內(nèi),通過智能化技術能為用戶提供專業(yè)的聚類信息的垂直門戶服務是文獻數(shù)據(jù)庫系統(tǒng)個性化服務的深化。
由于查詢數(shù)據(jù)庫的用戶一般都對自己的信息需求有明確的專指性,所以,數(shù)據(jù)庫系統(tǒng)通過門戶技術在為用戶建立起一個全面提供個性化服務的人機界面時,要為用戶提供“垂直門戶服務”。要使數(shù)據(jù)庫系統(tǒng)致力于某一特定領域內(nèi)信息的全面和內(nèi)容的深入搜索與算法分析,達到為用戶提供專業(yè)、具體、深入的縱向服務,這才是目前數(shù)據(jù)庫個性化服務的較高水平。這就要求數(shù)據(jù)庫的開發(fā)者能有更寬廣的視角,不僅要為用戶提供自己系統(tǒng)內(nèi)的個性化信息,還能著眼于因特網(wǎng)上的個性化信息。
表1 國內(nèi)外幾個著名文獻數(shù)據(jù)庫個性化服務模式表
隨著信息化時代的到來,人們越來越展現(xiàn)出自主性和個性化的一面。人們不僅在社會生活、文化生活方面突出自身的個性化色彩,同時也在信息需求上,努力展現(xiàn)自己的個性需求。更為重要的是,在從事科學研究的人群中,個性化的研究是突出個人研究成就的必然途徑,個性化越突出,成果也就會更突出,所以數(shù)據(jù)庫的個性化服務就必然成為用戶所期待的重要功能[5]。未來數(shù)據(jù)庫能不能順應信息時代發(fā)展的要求,能不能為用戶所青睞,很大程度上在于數(shù)據(jù)庫系統(tǒng)能否為用戶提供全方位的個性化服務,個性化服務將成為數(shù)據(jù)庫建設優(yōu)化與否的主要方面,提供個性化服務是文獻數(shù)據(jù)庫未來發(fā)展的必然趨勢。
數(shù)據(jù)庫的個性化服務不僅是數(shù)據(jù)庫未來發(fā)展趨勢,而且個性化在其種類上將進一步拓展,在服務功能上將進一步改進,在操作上將進一步智能化、人性化。諸如數(shù)據(jù)庫系統(tǒng)在用戶參數(shù)設置、用戶設置分享、鏈接賬戶設置、鏈接顯示設置等方面,將更加滿足用戶的個性化的心理需求;在檢索組配、智能鏈接、知識篩選上更加符合用戶心理期待;文獻數(shù)據(jù)庫系統(tǒng)還可通過提供過濾器和外部鏈接服務,實現(xiàn)用戶跨系統(tǒng)訪問,再增加檢準設置,在文獻數(shù)據(jù)庫系統(tǒng)的門戶功能上就更加具備了廣度和深度。用戶在一個文獻數(shù)據(jù)庫系統(tǒng)中,所獲得的個性化信息的范圍在拓寬的同時,個性化的專業(yè)信息也更加精準。
通過對中外文獻數(shù)據(jù)庫的調(diào)查,大多數(shù)數(shù)據(jù)庫都開辟了個性化服務,只是服務種類不同、功能強弱各異,無論如何都對數(shù)據(jù)庫的利用起到了促進作用。然而這種優(yōu)化數(shù)據(jù)庫利用的舉措,在圖書館員和用戶當中的認可度還處于低位。鑒于此,一是要加大對文獻數(shù)據(jù)庫個性化服務功能的宣傳,使之充分認識個性化服務的意義和價值;二是要加強對文獻數(shù)據(jù)庫的培訓,既要培訓館員,更要培訓用戶,達到館員和用戶在利用數(shù)據(jù)庫時以個性化功能為首要選擇,如此,數(shù)據(jù)庫的效益才能最大限度地發(fā)揮出來。
[1]段其憲,等.Internet個性化服務簡介[J].情報科學,2002(12).
[2]廖鳳,周靜怡.國內(nèi)外文獻數(shù)據(jù)庫個性化服務研究[J].2010,54(13):67-70,146.
[3]趙春旻.并發(fā)用戶數(shù):一個評價和使用時間的一個重要參量[J].圖書館論壇,2007,(1).
[4]樊國萍.我國個性化服務研究綜述[J].新世紀圖書館,2005(5).
[5]杜文巒.數(shù)字圖書館網(wǎng)絡個性化定制服務現(xiàn)狀分析[J].情報資料工作,2003(1).
On Personalized Service Documentation Resources Database
Gao kunshuan / Institute of Scientific and Technical Information of China, Beijing, 100038
Beginning with the definition of literature databases and personalization, this article discusses the rise and development of personalized service database, and the importance of personalized service of database system. It also summarizes how database system gets the personalized needs of users and its service mode, and sums up the future development direction of literature database and personalized service.
Literature database, Personalized service, Information notification, Custom service
2013-06-26)
10.3772/j.issn.1673—2286.2013.10.014
高昆栓(1964- ),中國科技信息研究所副研究館員,萬方數(shù)據(jù)股份有限公司客戶服務中心主任,研究方向:文獻數(shù)據(jù)庫建設、數(shù)字圖書館資源開發(fā)與市場銷售。E-mail: gaoks@wanfangdata.com.cn