国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

個性化關鍵技術研究綜述

2011-02-14 02:50蘇玉召
圖書與情報 2011年1期
關鍵詞:推薦系統(tǒng)個性化

蘇玉召 趙 妍

摘 要:個性化研究的關鍵技術主要包括有三個方面的內容:用戶建模、推薦系統(tǒng)和評價。首先,用戶建模是收集用戶數據,目的是為推薦系統(tǒng)提供用戶的興趣、偏好等建立模型;其次,推薦系統(tǒng)的作用是根據用戶模型為用戶推薦個性化內容,是個性化的核心內容;最后,評價系統(tǒng)根據用戶對個性化應用的滿意程度,反饋給推薦系統(tǒng)調整建模策略。個性化應用是一個不斷反饋修正的過程。

關鍵詞:個性化 Web挖掘 推薦系統(tǒng) 用戶建模 個性化評價

中圖分類號: G350;TP311文獻標識碼: A 文章編號: 1003-6938(2011)01-0059-07

Survey of Key Technologies in Personalization Application

Su Yuahao (National Science Library, CAS, Beijing, 100190)

Zhao Yan (Zhengzhou Institute of Aeronautical Industry Management, Zhengzhou, Henan, 450015)

Abstract:The key technology of Personalization Application includes three aspects: User Modeling, Recommendation System, and Personalization Evaluation. First, User Modeling collects user personal data, and provides user's interests and preference to Recommendation System. Secondly, Recommendation System is the most important part of Personalization, which recommends personalized content for individual. Finally, Evaluation provides the feedback information of user's evaluation for Recommendation System to help it modulating the strategy of User Modeling. Personalization application is a process with continuous modulating its recommend strategy according to user's feedback.

Key words:personalization; web mining; recommendation system; user modeling; personalization evaluation

CLC number: G350;TP311Document code: AArticle ID: 1003-6938(2011)01-0059-07

1 引言

個性化最初起因于基于Web應用的商務智能(BI)發(fā)展,獲得商業(yè)利潤最大化的需要。電子商務(e-commerce)和客戶關系管理(CRM)網站采用數據挖掘的方法發(fā)現顧客與商品之間的關聯和分析用戶購物行為,銷售更多的商品和吸引顧客而不斷調整營銷策略。隨著數據挖掘理論及其技術進步不斷深化,計算機網絡和網絡信息管理技術的發(fā)展,基于客戶/服務器模式為用戶和網站提供更多的交互機會。于是針對每個用戶的個性化服務便迅速發(fā)展起來。

關于個性化概念,不同的學者和研究人員,在不同的時期對其理解、及其所持觀點也各不盡相同。有些從事IT行業(yè)的專家認為個性化是一種能力,例如,前劍橋福雷斯特研究公司的分析師Paul Hagen在1999年的一次電子商務會議上說,“個性化是一種能力,根據每個用戶的愛好和行為知識,對其提供簡潔的內容和服務?!?長期從事IT行業(yè)實踐和研究的專家Jill Dyche 女士,2002年由艾迪生-韋斯利出版公司出版的“CRM指南”,認為“個性化是一種定制用戶交流的能力,這種能力的實現是借助于用戶進行交流時的愛好和行為知識的獲得。”而有些計算機技術專家認為,個性化是一種服務。例如,前IBM沃森研究中心的研究人員Doug Riecken在2000年美國計算機協會(ACM)通信年會上提出,“個性化是關于通過建立一種有意義的一對一關系,從而建立用戶的忠誠度。同時,通過理解每一個用戶特殊需要的內容,為其提供高效、有價值的服務?!币恍氖聜€性化技術研究的專家學者認為,個性化是一種技術。例如,在2003年的個性化智能技術國際研討會上,各國的學者和研究人員就個性化概念達成共識,認為“個性化是一種技術,這種技術根據用戶的信息定制商業(yè)和每個用戶電子商務的交互。用戶的信息可以是以前獲得的,也可以是實時方式獲得信息。根據可用的用戶信息,商業(yè)不同部門之間進行變更以適應用戶的需求?!?還有的一些從事信息技術研究的專家和學者認為,個性化是一種過程。例如, Kwon分別在2007年和2009年美國信息技術協會(ITAA)年會上分別提出“個性化是一個過程,在電子服務應用方面,是一個應用用戶信息為其發(fā)送目標方案的過程?!?這些關于個性化的概念重點是從個性化是什么和個性化能夠做什么方面定義,但是,這些觀點沒有從系統(tǒng)化、全面性定義個性化。

美國芝加哥德保羅大學的Bamshad Mobasher教授從20世紀90年代就開始個性化的研究,他對個性化的特點、歷史、現狀和未來的發(fā)展趨勢具有全面和獨到的見解。因此,Mobasher對個性化的定義具有重要的參考價值,他認為:“在Web上下文中,個性化意味著動態(tài)內容的發(fā)送,例如文本元素、鏈接、廣告和產品推薦等,這些內容專門為特定用戶或者一部分用戶的需要或者興趣定制的過程”。 [1 ]他把個性化過程看作是一個包含數據挖掘循環(huán)所有階段中的一個典型應用。這些階段包括數據收集、預處理模式發(fā)現、性能評價和在用戶和Web網站之間應用實時發(fā)現的知識。

主要研究個性化的ITWP國際會議重點內容是個性化理論和技術,其每一次會議的成果都體現了當時的研究方法和應用領域。典型的個性化研究代表是Mobasher教授和其他個性化研究的專家學者等研究人員,同時,Mobasher教授一直作為ITWP組委會主席,許多他本人及其合作者的研究成果及文獻可以通過其個人網站獲得。因此,他們的個性化研究成果具有權威性和代表性。研究他們的成果對于我們未來個性化研究具有借鑒意義??偨Y近幾年個性化研究內容,其關鍵技術主要包括推薦系統(tǒng)、用戶建模、評價等三個方面。

2 個性化推薦系統(tǒng)

個性化推薦是Web挖掘結果呈現給用戶的應用,其使用的數據主要來自Web網站與用戶行為交互生成的數據。其依據原理是數據挖掘理論基礎。因此,個性化推薦使用的算法主要來自數據挖掘理論的算法。通常,個性化推薦分為基于規(guī)則過濾、基于內容過濾、基于協作過濾的方法、以及這三種方法混合的推薦方法。根據不同的個性化推薦方法,采用的挖掘算法也各不相同,常用的算法類型包括關聯規(guī)則發(fā)現、聚類分析、序列模式挖掘和回歸分析等。

2.1 Web挖掘

許多學者認為,Etzioni是第一個提出Web挖掘(Web Mining)技術的人,[2 ]他在1996年的描述中認為,Web挖掘是應用數據挖掘技術,從Web文檔和服務內容里自動發(fā)現并抽取有用信息。一般情況,Web挖掘技術可以分為3種類型[3 ]:Web內容挖掘(Web Content Mining)、Web結構挖掘(Web Structure Mining)和Web使用挖掘(Web Usage Mining)(Kosala&Blockeel;,2000)。Srivastava等人對Web使用挖掘的定義是[4 ]:Web使用挖掘是應用數據挖掘技術,為了更好的理解和服務基于Web應用的需要,發(fā)現Web數據的使用模式。

Web內容挖掘包括應用數據挖掘技術從Web對象中抽取模型,Web對象內容包括普通文本、半結構化文檔(如HTML和XML)、結構化文檔(如數字圖書館)、動態(tài)文檔和多媒體文檔。Web結構挖掘的目標是發(fā)現隱藏在Web對象之間相互連接的拓撲結構建模,對Web網站進行分類和分級,以發(fā)現對象之間的相似性。Web使用挖掘是應用數據挖掘技術,從Web數據中發(fā)現用法模式。進行挖掘的數據通常來自用戶與Web對象的交互行為,比如,Web服務器或者代理服務器日志、用戶查詢、注冊數據。Web使用挖掘工具發(fā)現并預測用戶行為,幫助設計者進行統(tǒng)計分析、改進Web網站、吸引訪問者或者為有規(guī)律的用戶提供個性化服務。Web使用挖掘與Web結構挖掘和Web內容挖掘的區(qū)別在于,Web使用挖掘反映的是人與網絡交互的行為,對用戶行為與Web網站交互的分析可以深入理解定制與個性化的用戶Web體驗。

Web使用挖掘使用的數據可能來自Web服務器訪問日志、代理服務器日志、引用頁日志、瀏覽器日志、錯誤日志、用戶資料、注冊數據、用戶會話、用戶交易、cookies、用戶查詢或者是用戶書簽數據(Gunduz,2003)。通過分析這些文件和文檔,我們可以獲得用戶感興趣的使用模式和信息。Web使用挖掘最初在電子商務領域,Web使用挖掘吸引了銷售決策者和電子商務專家的強烈興趣。[5 ]隨著數據挖掘理論和網絡信息管理技術的發(fā)展,個性化研究現在已經滲透到各個行業(yè)和領域,例如,電信行業(yè)、銀行金融機構、移動設備和反恐領域等。

2.2 基于規(guī)則過濾的技術

基于規(guī)則過濾方法的典型例子就是“購物籃”算法,通過查找購買物品之間的聯系為用戶推薦。其特點在于采用關聯規(guī)則、回歸算法,找到用戶對相關聯物品之間的興趣度、發(fā)現用戶偏好,預測用戶未來行為。

Peng 等人提出的一種個性化推薦模型采用apriori 算法和用于統(tǒng)計的tf-idf加權技術,包括三部分:資源描述、用戶偏好抽取和個性化推薦。首先,通過分析挖掘用戶Web訪問日志獲取的資源信息,生成資源文本空間向量;然后,采用apriori 算法對這些向量進行計算,獲得興趣集;最后,根據推薦模型,把推薦過濾和存儲的資源內容推薦給用戶。[6 ]2003年華墨西哥阿卡普爾科舉辦的第2屆個性化智能技術(ITWP2003)研討會上,[7 ]Mobasher等人基于關聯規(guī)則和序列模式的個性化推薦模型對網站的影響進行了研究。[8 ]Forsati 等人提出一種用于個性化基于權重的關聯規(guī)則算法,該算法是對傳統(tǒng)的關聯規(guī)則算法的擴展,允許交易中的每一個項目分配一個權重以反映用戶對該項目的興趣度。在結果關聯規(guī)則集里每一個項目都對應一個權重參數,根據用戶的興趣程度,為每個用戶訪問的Web頁面分配一個時間權重和訪問頻率權重。這種方法能夠客觀地、更有效的表示預測結果,對推薦系統(tǒng)效率有很大改進。[9 ]

2.3 基于內容過濾的技術

基于內容的過濾推薦技術特點是,[10 ]根據用戶過去選擇項目的特點,從項目描述、終端數據庫里的項目屬性關聯抽取項目內容特點,系統(tǒng)為其推薦相似的項目。基于內容的過濾系統(tǒng)最大的缺點是用戶模型的建立過度依賴于用戶以前選擇和點擊的具體項目。此外,基于內容過濾技術要求項目能夠有效代表抽取的文本特點,Web數據異構的特性決定了這種方法并不總是有效。更詳細的基于內容的過濾系統(tǒng)內容參見文獻。[11 ]

2.4 基于協作過濾的技術

維歸約、關聯挖掘、聚類和貝葉斯學習是協作過濾系統(tǒng)采用的一些技術。協作過濾推薦系統(tǒng)利用了用戶的相似性進行推薦,而基于內容過濾的推薦系統(tǒng)根據商品內容的相似性進行推薦。

Amazon是使用協作過濾推薦系統(tǒng)的先驅,作為市場戰(zhàn)略的一部分,提供“針對每位顧客的個性化商店”,這種方法即有益于顧客又有益于公司。公司擁有顧客更準確的模型,可以對顧客的需求有更好的了解。而服務于這些需求則可在產品的交叉銷售、提升銷售、產品親和力、一對一促銷、大購物籃和顧客忠誠度方面獲得更大的成功。2001年美國西雅圖舉辦的第1屆個性化智能技術(ITWP2001)研討會上,[12 ]Mobasher 等人的根據匿名Web使用數據提高協作過濾效率的研究,根據數據挖掘和Web技術實現個性化協作過濾系統(tǒng)。Aghabozorgi 等人提出一種基于Web使用挖掘的離線個性化系統(tǒng)動態(tài)模型,該模型采用聚類算法。其特點是,根據用戶交易,把離線模型周期性地轉變?yōu)閯討B(tài)模型,解決了離線模型隨著時間的流逝,一些新用戶的加入和原有用戶行為的改變引起的個性化用戶行為預測精度下降問題。[13 ]

協作過濾推薦系統(tǒng)[14 ]尋找與目標顧客歷史吻合的顧客群組(稱為近鄰),比如他們購買相似的商品或對某種商品的評價。協作過濾推薦系統(tǒng)面臨兩個主要挑戰(zhàn):可伸縮性和確保對顧客推薦的質量。可伸縮性重要是原因是,電子商務系統(tǒng)必須能夠實時搜索數以百萬計的潛在近鄰。如果網站使用瀏覽模式作為產品偏愛的指示,則對某些顧客可能會有數以千計的數據點。保證推薦質量是贏得顧客信任的基本要素。如果顧客聽從了系統(tǒng)的推薦但是最終并不喜歡這些推薦的商品,那么他們就會對該推薦系統(tǒng)產生懷疑,甚至不用。有些推薦系統(tǒng)采用基于內容過濾和協作過濾的推薦技術,進一步改善系統(tǒng)的推薦。

2.5 基于混合過濾的技術

基于規(guī)則過濾和基于協作過濾技術的缺點是,通常需要離線學習訓練樣本生成關聯規(guī)則或者用戶組的分類,這種方法具有可擴展性差和動態(tài)變化緩慢的特點。因此,不適于在線的迅速響應,尤其不適合實時查詢的響應?;趦热葸^濾技術的優(yōu)點是及時響應快,總是處于在線狀態(tài),但是,其缺點是依賴于用戶的歷史操作記錄,如果用戶的興趣偏好變化或者歷史記錄缺失,推薦給用戶的結果將會產生嚴重的失真。因此,結合這三種方法,將會有較快的響應速度、較好的推薦準確性和較高的預測精度。

當前解決基于內容過濾和協作過濾不足的研究熱點是采用混合推薦算法,目的是提高推薦的精度。Burke提出的方法是混合基于內容和協作過濾技術,通過豐富變量的方法生成推薦系統(tǒng),旨在提高推薦的質量。[15 ]有的混合推薦系統(tǒng),例如,Ardissono 等人的用戶建模和個性化推薦技術研究,[16 ]通過收集多種用戶偏好的信息,采用多種異構推薦技術的方法實現。這種方法越來越多地被用于各種個性化服務中,例如,Nima等人關于Q-learning的Web推薦系統(tǒng)研究,[17 ]Chen等人的手機新聞混合推薦系統(tǒng)的普適訪問研究。[18 ]Mobasher 等人提出一種框架,把在線用戶訪問Web頁面的會話活動過程與在線數據準備和數據挖掘任務分開處理,基于聚類的技術把Web站點使用和內容模型采用統(tǒng)一的表示方法,用于實時的個性化操作。這種方法的優(yōu)點在于Web站點的使用和內容特點集成到Web挖掘框架里,為推薦引擎提供統(tǒng)一的訪問方式,從而提高了個性化的效率。[19 ]2009年美國帕薩迪納舉辦的第7屆個性化智能技術和推薦系統(tǒng)(ITWP2009)研討會上,[20 ]Rosenthal等人的提出的研究旨在提高推薦系統(tǒng)在線預測精度。

3 個性化用戶建模

個性化推薦進行Web使用挖掘的基礎是用戶建模,根據用戶模型進行挖掘,發(fā)現用戶的興趣和偏好,預測其未來的訪問行為,并為其推薦個性化信息。個性化用戶建模需要根據推薦系統(tǒng)的需求收集Web使用數據。所有個性化推薦方法的好壞在很大程度上依賴于收集的數據質量。如果收集到的數據能夠準確地反映出用戶興趣和偏好,則有助于個性化推薦系統(tǒng)性能的提高,否則,個性化系統(tǒng)推薦給用戶的信息不能滿足要求,用戶可能逐漸失去個性化推薦的興趣,也可能有糟糕的推薦會激怒用戶,最終會導致用戶根本不用該個性化推薦系統(tǒng)。

用戶模型與用戶偏好和興趣的數據相關,這些數據的收集不應該過于強調用戶自身數據。收集用戶數據常用的方法有兩個,[21 ]一是顯式詢問他們的偏好,二是隱式監(jiān)測用戶的行為推到他們的偏好。

顯示詢問用戶偏好信息的方法有幾種:具體興趣的調查問卷,例如,喜歡體育新聞或者科技新聞;編輯用戶關鍵詞;或者直接詢問用戶具體的興趣。這些方法都有其局限性,首先,因為這些方法都無法準確地動態(tài)反應用戶興趣和偏好的變化。并且,通過這些方法收集到的數據可能會引起對用戶偏好錯誤的判斷,因為并不是所有的用戶提供可靠的信息。其次,這些方法重點都是依賴于來自用戶的信息,因此,收集的用戶模型數據片不全面。最后,并不是所有的用戶都愿意顯式地提供他們的偏好信息。

隱式收集用戶偏好是通過一種特殊的智能代理監(jiān)測用戶行為,從收集到的用戶信息推導用戶的偏好。用戶行為有幾個方面可以被監(jiān)測到,例如一篇文檔操作的滾動、停留在該文檔上的時間。但是,這些方法可能會引起誤導,因為這些方法并不能反映用戶是否真的感興趣。

建立用戶模型需要的信息可以歸納為三個方面:①用戶個人信息,例如,用戶名、性別、出生日期和地址等人口統(tǒng)計學信息;②用戶歷史記錄,包括過去交易成功的記錄、瀏覽的記錄和收藏的記錄,例如,在電子商務網站上購買喜愛的商品類別或者購買數量等;③用戶定制的興趣偏好,例如,iGoogle定制的音樂盒、谷歌翻譯/字典、背單詞、博客主題訂閱、網站導航、BBS導航等。這些信息大部分包含個性化應用收集到的事實數據,也包括從過去交易中推導出來的事實數據。個性化應用程序收集這些信息完成后,記錄到Web日志文件,可以進行日志清洗、處理,并存儲到數據倉庫中以便進一步為推薦系統(tǒng)進行數據挖掘使用。

如2.1節(jié)所述。在個性化推薦的Web使用挖掘研究中,數據的收集可以在服務器端、客戶端、代理服務器端,或者是集成Web服務器的數據庫進行。Web使用挖掘的數據源主要包括用戶查詢、注冊的數據、Web服務器訪問日志和Web應用服務器日志記錄的服務器日志文件[22] [23 ]。收集Web使用數據,特別是Web日志,對于個性化預測和推薦的精度具有非常重要的作用。Lathia等人對個性化協作過濾算法進行研究,[24 ]發(fā)現數據的質量和數量對推薦系統(tǒng)的精度有重要影響。在他們的自適應信息源的協作過濾研究中,發(fā)現推薦系統(tǒng)關注數據質量而不是算法本身,能提高預測的精度。

近年來,關于個性化用戶建模的研究成果不斷出現。例如,2008年美國芝加哥舉辦的第6屆個性化智能技術和推薦系統(tǒng)(ITWP2008)研討會上,[25 ]Gemmis等人的基于用戶概要的個性化搜索信息抽取模型,[26 ]Hung等人的基于標簽用戶建模的社會媒體推薦系統(tǒng),[27 ]Kirmemis等人的基于內容的用戶模型生成和電影推薦系統(tǒng)優(yōu)化方法,[28 ]這些研究都促進了個性化用戶建模研究的發(fā)展。

當前關于個性化用戶建模不足之處在于,關于Web日志數據需要記錄什么樣的數據缺乏理論研究。因為不同的應用環(huán)境中評價個性化推薦性能的指標不同,所以,Web日志記錄采用的格式也不相同。例如,在線購物網站想發(fā)現商品關聯規(guī)則實現捆綁銷售策略,那么,Web日志記錄顧客在買了書籍之后還買了什么是關鍵因素;對于移動服務供應商來說,要實現增值服務,Web日志記錄顧客對什么類型的資費套餐感興趣是關鍵因素。

4 個性化評價

在個性化應用被部署之前及應用過程中,評價其準確性和效率至關重要,需要不斷的調整個性化策略以實現性能更好的個性化推薦和預測結果。早期的個性化評價研究的重點是推薦系統(tǒng)采用算法的精度提高,但是,好的推薦系統(tǒng)還應該同時采用其它的方法。Franc 等人認為評價方法還包括[29 ]:(1)覆蓋范圍,測量推薦系統(tǒng)數據集為用戶推薦包含內容的廣泛程度;(2)信任值,幫助用戶更有效的決定是否采用推薦的內容;(3)計算時間,測量推薦算法生成好的推薦內容的時間:(4)新穎,測量推薦系統(tǒng)是否采用新技術,具有發(fā)展前途;(5)健壯性,測量在有噪聲干擾和稀疏數據情況下,推薦算法是否做出好的預測;(6)采用協作推薦方法,當前個性化推薦系統(tǒng)研究主要采用多種方法相結合的協作過濾方法。研究結果證明,綜合采用這些方法能實現較好的個性化推薦質量。

許多個性化推薦系統(tǒng)的評價要求用戶參與,對個性化推薦系統(tǒng)提供的產品或者服務質量做出明確評價。這樣的方法的實際效果并不明顯,因為系統(tǒng)提供的信息列表可能占用用戶很多時間,有些用戶可能不耐煩,敷衍了事。所以,個性化評價應該采用盡可能消耗用戶時間少,較少的操作、用戶反饋的信息能夠體現用戶興趣偏好的方法。[30 ]Kwon 等人提出的如何最好體現電子商務個性化特征的方案,[31 ]個性化策略的效果可以通過用戶的滿意度和忠誠度來體現,系統(tǒng)對用戶發(fā)送調查問卷,回答其對個性化的滿意度并判斷其忠誠度。

當前,個性化模型的評價工作面臨諸多挑戰(zhàn)。首先,不同的建模方法和推薦算法可能需要不同的評價因子(如用戶的興趣、偏好、是否選擇推薦的內容、個性化評分等)。其次,個性化活動需求可能在不同的應用領域、特定的應用和數據收集的不同而有很大的區(qū)別。最后,研究者和開發(fā)者對于個性化系統(tǒng)中什么因素對服務質量的影響最大缺乏共識。基于以上原因,個性化評價標準體系還需要進一步深入研究。

5 個性化應用和發(fā)展趨勢

隨著個性化研究理論的不斷深化,個性化應用逐漸發(fā)展到各種行業(yè)和領域。這些行業(yè)和領域包括:(1)電子商務(如Amazon,www.amazon.com);(2)公共服務(如英國的國家健康衛(wèi)生網站,www.nhs.uk);(3)搜索引擎(如iGoogle,www.google.com.hk);(4)圖書館(劍橋雜志在線,journals.combridge.org,美國國家醫(yī)學圖書館,www.ncbi.nlm.nih.gov)等,還有一些網站正在準備建立自己的個性化應用(中國數字圖書館,www.d-library.com.cn,中國科學院國家科學數字圖書館CSDL,159.226.100.28);(5)生物醫(yī)學(5)電子學習(E-learning);(6)移動設備(如3G手機個性化);(7)電子地圖;(8)居家生活等。

近幾年的研究也出現了一些新的研究方向。在2005年蘇格蘭愛丁堡舉辦的第3屆個性化智能技術(ITWP2005)研討會上,[32 ]出現了個性化安全方面的研究,例如,Burke等人的協作過濾系統(tǒng)系統(tǒng)中欺騙攻擊研究。[33 ]

研究發(fā)現,基于記憶的標準協作過濾算法,諸如K最近鄰算法,易于受到入侵攻擊,但是,基于模型的技術比K近鄰算法有較強的健壯性。Sandvig等人采用數據挖掘技術的關聯規(guī)則算法,發(fā)現采用基于模型的Apriori算法在穩(wěn)定性和健壯性方面比K最近鄰算法更好。此外,實驗結果還顯示Apriori算法比K最近鄰算法的推薦精度更高。[34 ]

Mobasher于2005主持,由美國國家科學基金支持的“個性化安全”研究項目在Microsoft的推薦系統(tǒng)上實現[35 ],重點是通過攻擊建模分析對各種推薦算法的影響。研究結果顯示,基于用戶和項目的算法在特定的攻擊模型下很脆弱,但是,采用混合算法的推薦系統(tǒng)具有較強的健壯性。

在2006年美國馬薩諸塞州波士頓舉辦的第4屆個性化智能技術(ITWP2006)研討會上,[36 ]開始出現了語義和本體技術在個性化協作過濾方面的研究。例如,Toivonen等人的本體角色在個性化內容過濾應用需求的研究,[37 ]Symeonidis等人的基于潛在語義標引的可擴展協作過濾研究。[38 ]

在2008年美國芝加哥舉辦的第6屆個性化智能技術和推薦系統(tǒng)(ITWP2008)研討會上,[25 ]個性化研究開始采用社會標簽的社會網絡等新技術。例如,Hung等人的基于標簽用戶建模的社會媒體推薦系統(tǒng),[39 ]Sandvig等人的分析社會標簽系統(tǒng)攻擊的框架研究。[40 ]

移動設備促進了普適計算的發(fā)展,這使得不同的設備在任何時間、任何地點訪問服務成為可能。[41 ]個性化服務的提供也應該根據需要進行定制,特別是應該滿足移動用戶在城市中步行或者開車的特定需要。一些鼓吹者認為,在未來,除了普通人群需要把普適計算集成到服務中,并且普適計算將會在學術和公司的實驗室里發(fā)揮重要作用。這種新環(huán)境要求服務提供者考慮新的策略適應新特點,例如用戶的位置、移動速度、環(huán)境條件(光線、噪音),特別是不同特性的移動設備訪問個性化服務的需求也不一樣。[42 ]

在未來的普適計算環(huán)境中,一些影響服務質量的必要數據可能由于以下兩個原因而無法獲得。一是數據不存在,二是數據雖然存在卻無法獲得。例如,用戶不想泄露私人信息,服務提供者也不想暴露其提供服務功能技巧的數據。因此,個性化服務存在著獲得涉及到個人隱私的數據的風險,尤其是在一些敏感行業(yè),例如銀行金融、移動服務等。Kasai等人進行私有數據保護功能的分布式個性化服務研究,[43 ]在不侵犯用戶隱私的情況下,既能保護用戶的隱私信息,又能保證獲得的有效數據不失真。

6 結語

個性化是一種Web智能技術,在未來幾年的研究中其關鍵技術依然是是推薦系統(tǒng)。[44 ]個性化推薦是基于Web挖掘理論和技術而不斷發(fā)展。Web挖掘是數據挖掘應用的一個分支,涉及到數據挖掘、人工智能、機器學習等多個領域的理論。并且,隨著Web技術和普適計算的發(fā)展,個性化推薦系統(tǒng)采用的挖掘技術越來越復雜,由單一技術向混合技術發(fā)展。例如,個性化推薦系統(tǒng)逐漸趨向于使用混合幾種挖掘算法;由離線或在線狀態(tài)學習趨向于二者的結合,這樣便于個性化推薦的可擴展性。

用于個性化用戶建模的數據收集也不再是單純的顯式或隱式的方法,而是采用更加智能的方法,既保護用戶的隱私,又能夠保證收集到數據的有效性。同時,個性化推薦進行數據挖掘需要的數據源越來越多樣化,綜合了日志數據、歷史交易記錄、用戶搜藏、用戶注冊信息、個人評價反饋信息等。當前,關于Web日志格式的設計原則,還缺乏相關的理論研究。因此,我們可以考慮將來進行Web日志格式設計的研究。

當前關于個性化評價的研究存在的問題比較多。因為個性化評價的因子選擇與推薦系統(tǒng)的精度相關,因此,如何選擇評價因子具有重要的影響作用。一般情況下,影響個性化推薦系統(tǒng)精度的因素有兩個:一是個性化用戶模型建模是否準確的體現了其偏好,這個因素影響推薦系統(tǒng)精度的原因在于收集的用戶數據是否全面、準確;另一個因素是推薦系統(tǒng)算法,一些算法的先進性直接影響著推薦系統(tǒng)的精度。當前,一些研究者為了提高個性化推薦系統(tǒng)的精度,把研究重點放在提高推薦系統(tǒng)的算法優(yōu)化方面。但是,有針對性的定制收集用戶數據進行用戶模型建模,對于個性化推薦系統(tǒng)精度的提高有著根本性的促進作用。因為,這些用戶數據是根據用戶操作定制收集,能夠體現出其實際需求。所以,這些定制收集到的用戶數據能準確的反映出用戶的偏好,并且,用戶模型建模收集到的數據越準確,就越有利于推薦系統(tǒng)的精度提高。同時,經過定制收集到的數據還能夠有助于減輕推薦系統(tǒng)計算冗余數據的負載,從而提高個性化系統(tǒng)整體性能。

簡言之,一個好的個性化應用是一個不斷完善的過程。首先,個性化系統(tǒng)根據搜集到的用戶建模信息,把經過挖掘的推薦結果呈現給用戶;其次,用戶對推薦的內容進行評價,系統(tǒng)收集到這些反饋信息后,調整個性化策略,再次進行用戶建模;最后,把以更滿足用戶需求的挖掘結果再次呈現給用戶。這個過程不斷重復,即保證了系統(tǒng)的性能提高,又吸引了用戶的使用。

參考文獻:

[1]Bamshad mobasher. Data Mining for Web Personalization[C]. The Adaptive Web, Lecture Notes in Computer Science, 2007:90-135.

[2]Resul Das, lbrahim Turkoglu.Creating meaningful data from web logs for improving the impressiveness of a website by using path analysis method[J]. Expert Systems with Applications, 2009, (36):6635-6644.

[3]F. Zhang and H. Chang. “Research and development in web usage mining system- key issues and proposed solutions: a survey”[C]. In First IEEE Int. Conf. on Machine Learning and Cybernetics Proceedings, 2002:986-990.

[4]Jaideep Srivastava, Robert Cooley, Mukund Deshpande, and Pang-Ning Tan, Web usage mining: discovery and applications of usage patterns from web data[C]. SIGKDD Explore, 2000,1(12):12-23.

[5]Z. Markov, and D. T. Larose.Data mining the Web : uncovering patterns in Web content, structure, and usage[M]. Hoboken, N.J.: Wiley-Interscience/John Wiley & Sons, 2007.

[6]Xueping Peng, Yujuan Cao, Zhendong Niu. Mining Web Access Log for the personalization Recommendation[C]. International Conference on MultiMedia and Information Technology, 2008:72-75.

[7]ITWP2003[C/OL]. [2010-09-26]. http://maya.cs.depaul.edu/~mobasher/itwp03/.

[8]Miki Nakagawa and Bamshad Mobasher. Impact of Site Characteristics on Recommendation Models Based On Association Rules and Sequential Patterns[C/OL]. [2010-09-26].http://maya.cs.depaul.edu/~mobasher/itwp0

3/papers/itwp03-06.pdf.

[9]Forsati R., Meybodi M. R., Neiat A.G.. Web Page personalization Based on Weighted Association Rules[C].International Conference on Electronic Computer Technology, 2009:130-135.

[10]Billsus.Pazzani.A personal news agent that talks, learns and explains[C]. Proc. 3rd Int. Conf. on Autonomous Agents (Agents 99), Seattle, WA, 1999:268-275.

[11]Michael J. Pazzani and Daniel Billsus. The Adaptive Web:Content_Based Recommendation Systems[C]. Lecture Notes in Computer Science,2007:325-341.

[12]Bamshad Mobasher, Honghua Dai, Tao Luo, Miki Nakagawa. Improving the Effectiveness of Collaborative Filtering on Anonymous Web Usage Data. Proceedings of the IJCAI 2001 Workshop on Intelligent Techniques for Web Personalization (ITWP01), 2001 [C/OL].[2010-09-26]. http://maya.cs.depaul.edu /~mobasher/itwp01/.

[13]Aghabozorgi, S.R., Teh Yang Wah. Dynamic Modeling by Usage Data for personalization Systems[C]. 13th International Conference Information Visualisation, 2009: 450-455.

[14] (加)Jiawei Han,(加)Micheline Kamber.范明,孟小峰譯. 數據挖掘概念與技術[M].北京:機械工業(yè)出版社.2006.

[15]Burke.Hybrid Web recommender systems[C]. Brusilovsky, P., Kobsa, A., Nejdl, W., eds.: The Adaptive Web: Methods and Strategies of Web Personalization, Lecture Notes in Computer Science, 2007:377-408.

[16]Ardissono, L., Gena, C., Torasso, P., Bellifemine, F., Difino, A., Negro, B. User modeling and recommendation techniques for personalized Electronic Program Guides[C]. Personalized Digital Television. Targeting Programs to Individual Users. Kluwer Academic Publishers , 2004:3-26.

[17]Nima Taghipour, Ahmad Kardan.A hybrid web recommender system based on Q-learning[C]. Proceedings of the 2008 ACM symposium on Applied computing, 2008: 1164-1168.

[18]Wei Chen, Li-jun Zhang, Chun Chen, Jia-jun Bu. A Hybrid Phonic Web News Recommender System for Pervasive Access[C]. International Conference on Communications and Mobile Computing, 2009:122-126.

[19]Bamshad Mobasher, Honghua Dai, Tao Luo, Yuqing Sun, Jiang Zhu. Integrating Web Usage and Content Mining for More Effective Personalization[C]. Lecture Notes in Computer Science , Electronic Commerce and Web Technologies, 2000:165-176.

[20]ITWP2009[C/OL]. [2010-09-27]. http://www.dcs.warwick.ac.uk/~ssanand/itwp09/.

[21]Talia Lavie , MichalSela, IlitOppenheim, OhadInbar, JoachimMeyer. User attitudes towards news content personalization[J]. International Journal of Human-Computer Studies, 2010:483-495.

[22]WWW Committee Web Usage Characterization Activity[EB/OL]. [2010-09-27]. http://www.w3.org/.

[23]M. Baglioni1, U. Ferrara2, A. Romei1, S. Ruggieri1, and F. Turini1. Preprocessing and Mining Web Log Data for Web Personalization[C]. Advances in Artificial Intelligence,Lecture Notes in Computer Science Pages, 2003:237-249.

[24]Neal Lathia,Xavier Amatriain, Josep M. Pujol. Collaborative Filtering With Adaptive Information Sources[C]. The 7th Workshop on Intelligent Techniques for Web Personalization & Recommender Systems (ITWP2009), 2009:63-74.

[25]ITWP2008[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[26]Marco de Gemmis, Giovanni Semeraro, Pasquale Lops,Pierpaolo Basile. A Retrieval Model for Personalized Searching relying on Content-based User Profiles[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[27]Chia-Chuan Hung, Yi-Ching Huang, Jane Yung-jen Hsu. Tagging-Based User Profiling for Social Media Recommendation[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[28]Oznur Kirmemis, Aysenur Birturk. A Content-Based User Model Generation and Optimization Approach for Movie Recommendation[C/OL].[2010-9-27].http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[29]Franc?ois Fouss, Marco Saerens. Evaluating performance of recommender systems: An experimental Comparison[C]. IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, 2008:735-738.

[30]Lorraine Mc Ginty, Barry Smyth. Evaluating Preference-Based Feedback in Recommender Systems[C]. Lecture Notes in Computer Science , Artificial Intelligence and Cognitive Science, 2002:209-214.

[31]Kwiseok Kwon, Jinhyung Cho, Yongtae Park. How to best characterize the personalization construct for e-services[J]. Expert Systems with Applications, 2010, 37(3):2232-2240.

[32]ITWP2005[C/OL]. [2010-09-27]. http://maya.cs.depaul.edu/~mobasher/itwp05/.

[33]Robin Burke, Bamshad Mobasher, Runa Bhaumik. Limited Knowledge Shilling Attacks in Collaborative Filtering Systems[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/~mobasher/itwp05/.

[34]J. J. Sandvig , Bamshad Mobasher , Robin Burke. Robustness of Collaborative Recommendation Based On Association Rule Mining[C]. Proceedings of the 2007 ACM conference on Recommender systems, 2007:105-111.

[35]Bamshad Mobasher, Robin Burke, Runa Bhaumik, Chad Williams. Toward Trustworthy Recommender Systems:An Analysis of Attack Models and Algorithm Robustness[J]. ACM Transactions on Internet Technology, 2007, 7(4):231-269.

[36]ITWP2006[C/OL]. [2010-09-27]. http://maya.cs.depaul.edu/~mobasher/itwp06/.

[37]S. Toivonen, O. Riva. The Necessary But Not Sufficient Role of Ontologies in Applications Requiring Personalized Content Filtering[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/~mobasher/itwp06/.

[38]P. Symeonidis, A. Nanopoulos, A. Papadopoulos, Y. Manolopoulos. Scalable Collaborative Filtering based on Latent Semantic Indexing[C/OL].[2010-09-27]. http://maya.cs.depaul.edu/~mobasher/itwp06/.

[39]Chia-Chuan Hung, Yi-Ching Huang, Jane Yung-jen Hsu. Tagging-Based User Profiling for Social Media Recommendation[C/OL].[2010-09-27].http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[40]J.J Sandvig, Runa Bhaumik, Maryam Ramezani, Robin Burke, Bamshad Mobasher. A Framework for the Analysis of Attacks Against Social Tagging Systems[C/OL]. [2010-09-27]. http://maya.cs.depaul.edu/%7Emobasher/itwp08/program.html.

[41]Sadeh, N. Mobile commerce: new technologies, services and business models[M]. Wiley &Sons;, Ltd. 2002.

[42]Herder, E., van Dijk, B.: Personalized adaptation to device characteristics[C].BerlinHeidelberg New York, Springer-Verlag, 2002,:598-602.

[43]Hiroyuki Kasai, Wataru Uchida, Shoji Kurakake. A service provisioning system for distributed personalizationwith private data protection[J]. The Journal of Systems and Software, 2007, 80:2025?褷2038.

[44]ITWP2010[C]. [2010-09-27]. http://ls13-www.cs.uni-dortmund.de/homepage/ITWP2010/index.shtml.

作者簡介:蘇玉召(1975-),男,中科院國家科學圖書館博士研究生,研究方向:計算機網絡、網絡信息管理技術與信息系統(tǒng)、數據挖掘;趙妍(1979-),女,鄭州航空工業(yè)管理學院助教。

猜你喜歡
推薦系統(tǒng)個性化
基于OBE的Java程序設計個性化教學研究
個性化護理在老年病患者中的應用效果觀察
為小學英語個性化合作學習單做加法
數據挖掘在選課推薦中的研究
基于用戶偏好的信任網絡隨機游走推薦模型
基于個性化的協同過濾圖書推薦算法研究
個性化推薦系統(tǒng)關鍵算法探討
淺談Mahout在個性化推薦系統(tǒng)中的應用
關于協同過濾推薦算法的研究文獻綜述
同桌寶貝
商丘市| 浑源县| 衡东县| 弥渡县| 普定县| 宝山区| 吉木萨尔县| 敦化市| 卓资县| 宝兴县| 永靖县| 依兰县| 鄄城县| 治多县| 沽源县| 永年县| 米泉市| 台中县| 新宾| 且末县| 漠河县| 兴和县| 津南区| 定安县| 南京市| 绿春县| 巴南区| 金乡县| 阿尔山市| 紫阳县| 二连浩特市| 收藏| 英山县| 南皮县| 连江县| 南充市| 志丹县| 乐都县| 昆明市| 陇南市| 栾城县|