李微娜+王雪萍+富春巖+周虹+曲思龍+張競(jìng)達(dá)
摘要:近幾年,隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展、移動(dòng)終端計(jì)算速度的快速提升、移動(dòng)操作系統(tǒng)的逐漸統(tǒng)一,移動(dòng)終端的信息資源數(shù)量正呈爆炸性的增長(zhǎng)。在移動(dòng)網(wǎng)絡(luò)環(huán)境下,分析用戶的瀏覽行為,并從中提取相關(guān)偏好信息,從而實(shí)現(xiàn)向用戶推薦個(gè)性化的信息服務(wù)。
關(guān)鍵詞:移動(dòng)環(huán)境;用戶偏好;挖掘推薦
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)16-0064-02
1 概述
近些年,隨著移動(dòng)網(wǎng)絡(luò)技術(shù)的日益成熟,大量日益增長(zhǎng)的網(wǎng)絡(luò)信息資源涌入移動(dòng)網(wǎng)絡(luò)環(huán)境中,因此信息過載和信息迷失已嚴(yán)重制約了人們對(duì)網(wǎng)絡(luò)信息的使用。隨之而來的是移動(dòng)網(wǎng)絡(luò)客戶在移動(dòng)設(shè)備上想要購(gòu)買商品時(shí)的挫敗感。為了緩解這些問題,搜索引擎和信息檢索技術(shù)應(yīng)運(yùn)而生。但是它們只是將用戶等同處理,其并沒有考慮用戶的特性,沒有針對(duì)不同的用戶反饋有針對(duì)性的資源,所以反饋的信息量很大,用戶很難找到自己真正喜愛的信息。另一方面,這些問題一部分原因是由于受到了手機(jī)的一些特性制約。與電腦相比,手機(jī)具有更小的屏幕、更小巧的輸入按鍵以及相對(duì)單一的瀏覽器。因此,移動(dòng)用戶所使用的移動(dòng)網(wǎng)絡(luò)應(yīng)用界面相對(duì)來說不如傳統(tǒng)網(wǎng)絡(luò)的親切適用。為了更好地滿足移動(dòng)用戶的搜索偏好,一種更有效的搜索輔助功能應(yīng)運(yùn)而生--個(gè)性化推薦服務(wù)。
本文通過移動(dòng)環(huán)境下獲取用戶偏好信息,并將MADM算法結(jié)合OWA算子分析個(gè)性化用戶的偏好信息,進(jìn)而反饋用戶隱性信息需求。
2 基于移動(dòng)環(huán)境下的用戶信息數(shù)據(jù)挖掘
用戶的偏好信息是通過移動(dòng)站點(diǎn)中用戶瀏覽行為的相關(guān)信息獲取,以此建立模型并預(yù)測(cè)用戶偏好。數(shù)據(jù)的來源是移動(dòng)網(wǎng)絡(luò)服務(wù)器內(nèi)的網(wǎng)頁數(shù)據(jù)記錄,這與傳統(tǒng)網(wǎng)絡(luò)有些類似,但移動(dòng)網(wǎng)絡(luò)由于其獨(dú)特的特性更簡(jiǎn)潔更具有優(yōu)勢(shì)。首先,在傳統(tǒng)網(wǎng)絡(luò)中,網(wǎng)頁中含有大量GIF、JPG、SWF文件等無關(guān)元素,并且清除耗時(shí)巨大。然而,在移動(dòng)網(wǎng)絡(luò)中,受流量、屏幕限制,更多的元素是文本,例如。其次,在移動(dòng)網(wǎng)絡(luò)環(huán)境中,所有用戶只能由單一的電話或是電子設(shè)備來接輸送數(shù)據(jù)。這是記錄用戶信息的必要條件,主要用于防止在用戶識(shí)別過程中出現(xiàn)混亂。另外,我們可以利用用戶的這些相關(guān)信息提供更有效的推薦服務(wù)。再次,在移動(dòng)網(wǎng)絡(luò)中,每個(gè)用戶在一定時(shí)間內(nèi)所有頁面的接收,都會(huì)在日志中的特定字段用相同值記錄下來,例如會(huì)話標(biāo)識(shí),并且我們可以用會(huì)話標(biāo)識(shí)字段作為識(shí)別每個(gè)用戶個(gè)體的標(biāo)識(shí)。
因此對(duì)于移動(dòng)環(huán)境下的用戶信息處理可以分三個(gè)步驟:第一階段是規(guī)范化數(shù)據(jù)挖掘,主要任務(wù)是信息選取和信息預(yù)處理,可以將日志、Web內(nèi)容、用戶信息等資源中篩選出能為挖掘算法可用的規(guī)范化數(shù)據(jù),其結(jié)果是后續(xù)數(shù)據(jù)處理的基礎(chǔ),所以必須對(duì)數(shù)據(jù)源數(shù)據(jù)整理并規(guī)范化處理;第二階段是數(shù)據(jù)預(yù)處理,主要任務(wù)是識(shí)別用戶、用戶路徑記錄、識(shí)別會(huì)話、篩選相關(guān)數(shù)據(jù)等;第三階段是建模,主要是根據(jù)先前處理過的數(shù)據(jù)建立推薦模型向用戶提供進(jìn)行推薦服務(wù),這是個(gè)時(shí)時(shí)處理的過程,需要考慮用戶某時(shí)段內(nèi)瀏覽路徑,用戶的瀏覽路徑信息指的就是用戶在某時(shí)間段在網(wǎng)站內(nèi)所瀏覽的不同頁面。
3 用戶訪問偏好興趣挖掘
在移動(dòng)網(wǎng)絡(luò)環(huán)境下,就前面提到,由于移動(dòng)網(wǎng)絡(luò)的特殊性,我們可以借此對(duì)新注冊(cè)用戶和瀏覽用戶這些潛在消費(fèi)群體推薦。通過用戶的瀏覽軌跡獲取偏好,進(jìn)而分析獨(dú)立客戶偏好特性來進(jìn)行有針對(duì)性的推薦服務(wù)。其整個(gè)過程如下圖1所示。
在此假定用戶對(duì)某有限數(shù)量的特定商品感興趣,其中該商品分類中的有限商品中每個(gè)商品是用戶點(diǎn)擊瀏覽過的一個(gè)頁面。用戶瀏覽時(shí)間、點(diǎn)擊率、頁面結(jié)束等信息,我們利用C.Shahabi提出的客戶追蹤機(jī)制原理獲取,所得信息自動(dòng)記錄在用戶行為數(shù)據(jù)庫內(nèi),用來反應(yīng)用戶對(duì)該項(xiàng)目的偏好,從而推測(cè)出用戶的偏好興趣。可根據(jù)用戶當(dāng)前的行為數(shù)據(jù),獲取商品之間的關(guān)系,所要達(dá)到從用戶行為中反饋的不完全偏好信息提取某用戶對(duì)該商品的偏好序列,而后通過MADM方法估算每個(gè)屬性的權(quán)重。
假定用戶偏好程度有如下情況:
a.用戶對(duì)只瀏覽的商品,瀏覽累積時(shí)間越長(zhǎng)用戶越偏好。
b.相比只瀏覽商品,用戶對(duì)放入購(gòu)物籃的商品更偏好。
同時(shí),首先通過最近產(chǎn)生的反饋產(chǎn)生對(duì)偏好判斷的最大數(shù)設(shè)置的約束集,以此類推。假定將某類商品定義成一個(gè)集合A={a1,a2,……,am},設(shè)該類商品集合中每個(gè)商品有同屬性集C={c1,c2,……,cn},PK是瀏覽頁面集合PK={pk|k=1,…,T},pk表示所瀏覽的第k個(gè)頁面,瀏覽某商品al所用時(shí)間是t(al)。
從用戶瀏覽行為中提取興趣項(xiàng)目。
根據(jù)圖1所示,根據(jù)用戶瀏覽行為的偏好獲取的具體過程如表1所示:
4 結(jié)束語
移動(dòng)網(wǎng)絡(luò)服務(wù)的發(fā)展目標(biāo)更多的是體現(xiàn)在用戶在搜索過程中的快速準(zhǔn)確找到目標(biāo),并且因?yàn)橐苿?dòng)網(wǎng)絡(luò)的特殊性,還應(yīng)考慮便利性和效益問題,需要針對(duì)上述問題探討更愉快的用戶購(gòu)物體驗(yàn)。因此本文通過移動(dòng)網(wǎng)絡(luò)環(huán)境數(shù)據(jù)挖掘,提煉用戶反饋的不完全偏好信息,并通過分析用戶的訪問路徑向用戶推薦個(gè)性化的信息服務(wù),以期提高推薦的準(zhǔn)確率和用戶滿意率。
參考文獻(xiàn):
[1] 李微娜,馬小琪,馮艷光.基于MADM方法的個(gè)性化推薦研究[J].現(xiàn)代情報(bào),2011(5).
[2] 查凱萊巴蒂.Web數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2009.
[3] 王繼民,李雷明子,鄭玉鳳.基于日志挖掘的移動(dòng)搜索用戶行為研究綜述[J].情報(bào)理論與實(shí)踐,2014(3).
[4] 李微娜.面向用戶偏好的MADM方法在個(gè)性化推薦中的應(yīng)用[D].哈爾濱:黑龍江大學(xué),2011.