【摘要】普適個(gè)性化內(nèi)容推薦是近年來(lái)學(xué)術(shù)界和業(yè)界關(guān)注的熱點(diǎn)問題。本文針對(duì)目前該領(lǐng)域研究缺乏從知識(shí)管理視角構(gòu)建情境偏好關(guān)系方法的問題,在前期研究的基礎(chǔ)上,分析了情境偏好關(guān)聯(lián)構(gòu)建的過程與方法,以內(nèi)容推薦為目標(biāo),給出了上下文感知領(lǐng)域相關(guān)文獻(xiàn)對(duì)于情境模型操作的解釋。最后與相關(guān)方法進(jìn)行了比較分析。
【關(guān)鍵詞】普適個(gè)性化推薦;上下文;情境
一、引言
普適個(gè)性化內(nèi)容推薦是指根據(jù)用戶偏好、行為習(xí)慣和時(shí)空環(huán)境等因素,將相關(guān)內(nèi)容通過各種網(wǎng)絡(luò)終端主動(dòng)推送給用戶的一種動(dòng)態(tài)的個(gè)性化服務(wù)模式。該領(lǐng)域的研究將個(gè)性化服務(wù)、上下文感知計(jì)算和語(yǔ)義網(wǎng)服務(wù)等領(lǐng)域的方法和技術(shù)相結(jié)合,致力于在一種開放、動(dòng)態(tài)和集成的環(huán)境下,給用戶提供隨時(shí)隨地的,更具針對(duì)性和智能化的服務(wù)。這些問題的研究對(duì)于支持內(nèi)容服務(wù)模式的創(chuàng)新和內(nèi)容服務(wù)行業(yè)的發(fā)展具有很大的理論意義和商業(yè)價(jià)值。
目前,該領(lǐng)域的研究仍處于探索階段,成熟的規(guī)?;瘧?yīng)用并不多見。原因在于個(gè)性化、上下文感知計(jì)算等領(lǐng)域的研究并未實(shí)現(xiàn)深度融合,以解決普適推薦領(lǐng)域的一些新問題。本文在前期研究的基礎(chǔ)上,研究情境化用戶偏好知識(shí)庫(kù)的構(gòu)建過程和利用方法,建立情境與服務(wù)之間的關(guān)系,解釋相關(guān)文獻(xiàn)并未給出的情境操作對(duì)于內(nèi)容推薦目標(biāo)的意義。
二、情境化用戶偏好本體模型
本體模型構(gòu)建的主要目的是實(shí)現(xiàn)知識(shí)共享和重用、消除數(shù)據(jù)冗余、克服數(shù)據(jù)稀疏性。利用到的重要本體模型片段如圖2-1所示。
該模型包括用戶偏好、上下文和情境3個(gè)主要概念。用戶偏好描述用戶頻繁訪問的內(nèi)容服務(wù)類目,本文區(qū)分上下文(Context)和情境(Situation)兩個(gè)概念:上下文是情境屬性取值的概念集;而情境是由屬性和取值構(gòu)成的鍵值對(duì)集,形式化表示為:Situation={c1:V1; c2:V2…cn:Vn},其中ci為情境的屬性,其值域定義為相應(yīng)上下文本體中的概念。上下文起著銜接用戶偏好與情境的橋梁作用,偏好并不直接依賴于情境,而是依賴于不同的情境屬性,依賴度描述某類偏好對(duì)不同情境屬性的依賴關(guān)系,用于約減不重要的屬性維度。
三、情境偏好關(guān)聯(lián)規(guī)則構(gòu)建的過程與方法
(一)關(guān)聯(lián)挖掘的過程
本研究通過關(guān)聯(lián)規(guī)則描述偏好與情境的關(guān)系,關(guān)聯(lián)規(guī)則提供的定量參數(shù)利于對(duì)存在沖突的規(guī)則進(jìn)行甄選;結(jié)合形式概念分析理論,利用量化頻繁標(biāo)引格建立用戶偏好與不同粒度情境之間的語(yǔ)義關(guān)聯(lián)。情境偏好關(guān)聯(lián)挖掘的過程主要分為如圖3-1所示的5個(gè)階段。
各個(gè)階段的任務(wù)說明如下:
1、數(shù)據(jù)獲?。菏侵笍姆植嫉母黝悜?yīng)用系統(tǒng)中獲得原始的用戶訪問歷史數(shù)據(jù),這些數(shù)據(jù)記錄了用戶在何時(shí)、何地和怎樣的外部環(huán)境條件下獲取過哪些內(nèi)容。
2、本體映射:將原始數(shù)據(jù)通過映射規(guī)則轉(zhuǎn)化為相應(yīng)的本體概念,映射規(guī)則可用定義或?qū)W習(xí)的方法得到。
3、數(shù)據(jù)熔合:將本體映射階段得到的統(tǒng)一規(guī)范的數(shù)據(jù)整合到集成數(shù)據(jù)庫(kù)中,作為構(gòu)建情境偏好語(yǔ)義關(guān)聯(lián)的輸入。
4、關(guān)聯(lián)挖掘:通過垂直數(shù)據(jù)挖掘的方法挖掘不同粒度情境與偏好之間的關(guān)聯(lián),利用量化頻繁標(biāo)引格結(jié)構(gòu)建立情境偏好知識(shí)庫(kù)。該結(jié)構(gòu)在后續(xù)推薦過程中當(dāng)某些維度的上下文數(shù)據(jù)不可用的情況下仍然具有一定的有效性。情境偏好關(guān)聯(lián)構(gòu)建的方法與具體算法實(shí)現(xiàn)見諸于筆者的前期研究。
5、規(guī)則提取:根據(jù)推薦需求可沿不同路徑提取情境偏好或偏好情境規(guī)則,求解當(dāng)前情境下適宜推薦的內(nèi)容或要推薦某種內(nèi)容的最適宜情境。
(二)情境模型上的操作及解釋
情境模型上的操作是一系列邏輯和時(shí)序操作的集合。上下文感知服務(wù)的目標(biāo)是根據(jù)上下文的變化而采取服務(wù)行動(dòng),研究情境(Situation)的相關(guān)文獻(xiàn)討論了情境模型上的各種操作,如:Weiβenberg提出了情境模型的特化、泛化、比較等操作;Ye分析了情境之間的分解、組合和時(shí)序關(guān)系等。但這些文獻(xiàn)均未分析情境操作與服務(wù)之間的關(guān)系。本文定義的情境形式化描述為:Situation={c1:V1; c2:V2…cn:Vn}。情境之間的基本分類組合關(guān)系如圖3-2所示。
原子情境在本研究中是指能在情境格中搜索到的最細(xì)粒度的情境,如:圖3-3中的第二層結(jié)點(diǎn)(#6,#7,#8,#9)對(duì)應(yīng)的上下文取值描述;組合情境是由原子情境或其自身通過邏輯操作導(dǎo)出的情境。下面根據(jù)形式概念分析理論,給出情境邏輯操作的定義和解釋。
定義3.1:定義Op為情境上的操作集,Op={Generalize, Specialize, Negate, Matching, Sequence},其中各操作依次表示:泛化、特化、取反、匹配和時(shí)序。
1、情境的泛化
Generalize(Situ1…,SituN)=Situ{Intersection(ContextFeature(Situ1),… ContextFeature (SituN))}
上式表示泛化情境的屬性集是被泛化情境屬性特征的交集。例如:Generalize (#6Situ1= {t:T1; l:L1}, #7Situ2= {t:T1; l:L2})=#2Situ {t:T1}
泛化的情境在格中體現(xiàn)為被泛化情境結(jié)點(diǎn)的公共上層結(jié)點(diǎn),標(biāo)引概念對(duì)應(yīng)的服務(wù)內(nèi)容種類增加,說明能夠獲取和利用的上下文數(shù)據(jù)越少,給用戶提供的服務(wù)就會(huì)越粗糙。若被泛化情境的上下文屬性取值沒有交集,則稱之為不相交情境,例如:結(jié)點(diǎn)#6和結(jié)點(diǎn)#9。
2、情境的特化
Specialize(Situ1…,SituN)=Situ{Union(ContextFeature(Situ1) ;…ContextFeature (SituN))}
上式表示特化情境的屬性集是被特化情境屬性特征的并集,例如:Specialize(#2Situ {t:T1}; #4Situ1={ l:L1})=#6Situ {t:T1; l:L1}
特化的情境繼承了被特化情境的共同的屬性特征,對(duì)應(yīng)結(jié)點(diǎn)服務(wù)內(nèi)容的種類會(huì)減少,說明能獲取的上下文數(shù)據(jù)種類越多,提供的服務(wù)內(nèi)容就會(huì)更精準(zhǔn)化。若被特化的情境對(duì)應(yīng)的結(jié)點(diǎn)中沒有構(gòu)成用戶內(nèi)容偏好的記錄集,則稱為無(wú)效情境,在本文情境偏好關(guān)聯(lián)構(gòu)建方法中,該類情境結(jié)點(diǎn)被剪枝。
3、情境的取反
Negate(Situ)=Situ{Complement(ContextFeature(Situ))}
上式表示情境取反操作得到的情境的屬性集是被取反情境屬性集的補(bǔ)集,例如:Negate(#6Situ {t:T1; l:L1})= ComposedSitu{#7Situ={t:T1;l:L2};#8Situ={t:T2; l:L1}; #9 Situ= {t:T2; l:L2}}
情境取反操作用于在該情境下推薦某種內(nèi)容被用戶拒絕等情況,但情境的取反并不意味著對(duì)描述該情境的上下文屬性取值的全盤否定。
4、情境的匹配
Matching(SituX,SituT)=Situ{Matching(ContextFeature(SituT))}
實(shí)際情境與目標(biāo)情境匹配得到的情境屬性集由各種滿足匹配度閾值的上下文構(gòu)成,總的匹配度由各類上下文匹配度的加權(quán)綜合評(píng)價(jià)得到,其權(quán)重可由信息熵等方法衡量。
5、情境的時(shí)序
Sequence(Situ1…,SituN))= SequenceComposedSituation
擬給用戶推薦某種內(nèi)容,在格中搜索到與用戶內(nèi)容偏好匹配的情境集合,利用時(shí)序操作對(duì)情境集合排序,然后利用情境之間的時(shí)間先后關(guān)系逐次與用戶的現(xiàn)實(shí)情境匹配,直到推薦任務(wù)完成。
四、相關(guān)方法比較
Ye等基于粗粒度方法的思想提出情境格的概念,采用單維格結(jié)構(gòu)對(duì)情境建模,在格中集成了情境的名稱、層次、屬性和上下文的層次,未考查情境與用戶偏好之間的關(guān)系,采用該模型不易設(shè)置參數(shù)閾值。Hong采用Appriori算法挖掘多維上下文與用戶偏好之間的關(guān)聯(lián),并通過決策樹模型來(lái)描述。Appriori算法的思想是從頻繁1項(xiàng)集開始,致力于挖掘最大頻繁K項(xiàng)集,那么在本研究中就會(huì)挖掘出大量無(wú)用的上下文維間關(guān)聯(lián),如:L1T2W3等(即情境特征之間的關(guān)系,而非情境特征與服務(wù)之間的關(guān)系);采用經(jīng)典的基于概念格的挖掘方法也會(huì)存在類似問題。本文采用分層建格的思路,在維間上下文連接操作時(shí)若所對(duì)應(yīng)的記錄集中沒有構(gòu)成用戶偏好的內(nèi)容服務(wù)集則進(jìn)行剪枝操作,就不會(huì)有上述問題發(fā)生。決策樹模型在系統(tǒng)工作過程中當(dāng)某維度上下文數(shù)據(jù)無(wú)法有效獲取時(shí)則失效;而頻繁標(biāo)引格結(jié)構(gòu)則可以從多條路徑搜索,在某維上下文數(shù)據(jù)無(wú)法有效獲取時(shí)仍可以提供有用的規(guī)則。
五、總結(jié)
本文針對(duì)目前普適個(gè)性化推薦領(lǐng)域缺乏從知識(shí)管理視角構(gòu)建情境與用戶內(nèi)容偏好關(guān)系的問題,結(jié)合本體和形式概念分析兩種互補(bǔ)的知識(shí)形式化方法,在構(gòu)建情境化偏好本體靜態(tài)模型的基礎(chǔ)上;研究了情境偏好關(guān)聯(lián)規(guī)則挖掘的過程與方法,建立用戶偏好與情境之間的語(yǔ)義關(guān)聯(lián);基于數(shù)據(jù)分析的視角,給出了相關(guān)文獻(xiàn)對(duì)于情境模型操作以內(nèi)容推薦為目標(biāo)的解釋。最后,對(duì)本領(lǐng)域相關(guān)文獻(xiàn)提出的模型和方法進(jìn)行了比較分析。
參考文獻(xiàn)
[1]張宇,夏火松,吳金紅.普適個(gè)性化內(nèi)容推薦的方法與支持技術(shù)評(píng)述[J].情報(bào)科學(xué), 2015,33(6): 155-161.
[2]蔡淑琴,張宇,胡慕海.基于頻繁標(biāo)引格的移動(dòng)內(nèi)容推薦方法研究[J].情報(bào)學(xué)報(bào),2011,30(7):721-729.
[3]Weiβenberg N, Gartmann R, Voisard A. An Ontology-Based Approach to Personalized Situation-Aware Mobile Service Supply[J]. GeoInformatica, 2006, 10(1): 55-90.
[4]Ye J, Coyle L, Dobson S. Representing and manipulating situation hierarchies using situation lattices[J]. Revue dIntelligence Artificielle, 2009, 22(5): 647-667.
[5]Hong J Y, Suh E H, Kim S J. Context-aware system for proactive personalized service based on context history[J]. Expert Systems with Applications, 2009(36): 7448-7457.
作者簡(jiǎn)介
張 宇(1978-),男,湖北武漢人,博士,講師,主要從事普適個(gè)性化服務(wù)、知識(shí)管理等方面的研究。
基金項(xiàng)目
教育部人文社會(huì)科學(xué)青年基金項(xiàng)目(15YJC870031);湖北省普通高校人文社科重點(diǎn)研究基地-企業(yè)決策支持研究中心重點(diǎn)項(xiàng)目(DSS20150103);武漢紡織大學(xué)基金項(xiàng)目(113100)。