国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)用戶行為分析法和建模法研究綜述*

2015-04-10 06:50:53吳清強
數(shù)字圖書館論壇 2015年11期
關(guān)鍵詞:決策樹關(guān)聯(lián)聚類

吳清強

(廈門大學(xué)軟件學(xué)院,廈門 361000)

網(wǎng)絡(luò)用戶行為分析法和建模法研究綜述*

吳清強

(廈門大學(xué)軟件學(xué)院,廈門 361000)

隨著當(dāng)下互聯(lián)網(wǎng)的發(fā)展與網(wǎng)絡(luò)使用人數(shù)的增多,用戶的行為操作數(shù)據(jù)更加容易獲取和利用。本文主要對網(wǎng)絡(luò)用戶行為研究中的用戶行為分析法和建模法進行理論研究和實踐現(xiàn)狀的綜述。通過對用戶行為數(shù)據(jù)進行不同方式的分析和不同方向的建模,并對行為建模進一步分析,可以發(fā)掘用戶行為模式和聯(lián)系,為下一步互聯(lián)網(wǎng)的發(fā)展提供依據(jù)和指導(dǎo)。

用戶行為分析;數(shù)據(jù)挖掘;用戶行為模型

網(wǎng)絡(luò)用戶行為是指用戶與互聯(lián)網(wǎng)環(huán)境及服務(wù)交互產(chǎn)生的一系列活動[1]。網(wǎng)絡(luò)用戶行為分析則是指在獲得網(wǎng)絡(luò)訪問基本數(shù)據(jù)的情況下,對有關(guān)數(shù)據(jù)進行統(tǒng)計、分析,從中發(fā)現(xiàn)用戶訪問網(wǎng)站的規(guī)律,并將這些規(guī)律與網(wǎng)絡(luò)資源整合、網(wǎng)絡(luò)營銷策略等相結(jié)合,從而發(fā)現(xiàn)目前網(wǎng)絡(luò)資源整合和營銷活動中可能存在的問題,并為進一步修正或重新制定包括數(shù)字圖書館在內(nèi)的網(wǎng)絡(luò)資源和營銷策略提供依據(jù)[2]。通過分析網(wǎng)絡(luò)用戶行為監(jiān)測數(shù)據(jù),可以讓互聯(lián)網(wǎng)服務(wù)的提供者更加詳細(xì)、清楚地了解用戶的行為習(xí)慣,更有針對性地解決相關(guān)問題,提高用戶體驗,更好滿足用戶需求,最終提升互聯(lián)網(wǎng)服務(wù)提供者的效益。鑒于此,研究和實踐領(lǐng)域近年都產(chǎn)生了較多的研究成果,本文對這些研究成果,尤其是其中的用戶行為分析方法、用戶行為模型構(gòu)建方法的相關(guān)內(nèi)容進行系統(tǒng)梳理,有助于更好把握網(wǎng)絡(luò)用戶行為分析的研究和實踐現(xiàn)狀,為下一步進行網(wǎng)絡(luò)用戶可靠性行為識別打下堅實的基礎(chǔ)。

1 網(wǎng)絡(luò)用戶行為分析方法

在利用各種用戶行為記錄工具獲取用戶行為數(shù)據(jù)之后,首先要選擇合適的方法對這些數(shù)據(jù)進行分析?,F(xiàn)有的分析方法主要包括統(tǒng)計分析法、聚類分析法、關(guān)聯(lián)分析法、決策樹法、神經(jīng)網(wǎng)絡(luò)法以及時序數(shù)據(jù)挖掘法等,下面分別進行闡述。

1.1統(tǒng)計分析法

統(tǒng)計分析法是最基本的行為分析方法,主要對用戶行為分解、歸類后進行數(shù)量統(tǒng)計,得出某個類型行為的數(shù)據(jù)總量,并借助于這些數(shù)據(jù)總量分析用戶行為的規(guī)律[3]。國內(nèi)外近年都有一些研究采用了統(tǒng)計分析方法,如Ye Wu等[4]和Jiefei Yu等[5]以統(tǒng)計分析方法研究了論壇(天涯和新浪)上用戶行為的差異,得出用戶帖子的問答分布遵循某一冪率分布,通過函數(shù)的轉(zhuǎn)化和擬合實現(xiàn)對網(wǎng)民的一些回復(fù)及觀點的定量分析,并對比了中國網(wǎng)民與西方網(wǎng)民的異同;程鵬[6]通過收集用戶的點擊流和訪問日志等數(shù)據(jù),利用數(shù)據(jù)統(tǒng)計分析技術(shù)進行用戶行為分析;尤婷[7]和鄧夏瑋[8]同樣也以統(tǒng)計分析的方法對社交網(wǎng)站中用戶行為的特征進行了研究。

1.2聚類分析法

與分類統(tǒng)計分析不同的是,聚類分析是一種探索性的分析,在分類聚類過程中,并沒有事先設(shè)定分類標(biāo)準(zhǔn),而是基于樣本數(shù)據(jù)自動進行分類。鑒于用戶行為數(shù)據(jù)的復(fù)雜性,聚類分析比分類統(tǒng)計法具有更廣的使用范圍,也是用戶行為分析中最為常用的分析方法。Sang Hyun Oh等[9]通過用戶行為建模,提出了一種應(yīng)用于用戶異常行為監(jiān)測的聚類分析方法,重點討論了用于聚類的特征值選擇問題,實驗證明該聚類分析比統(tǒng)計分析更加精確地描述用戶行為。Marcelo Maia等[10]通過抓取大量的Youtube用戶數(shù)據(jù),采用聚類算法聚集相同行為的用戶,從而更好地刻畫不同類別的用戶行為。孫燕花[11]則基于網(wǎng)絡(luò)Netflow流信息進行了IP為源和目的的統(tǒng)計建模,改進了快速聚類K-Medoids算法,設(shè)計了一種異常反選擇標(biāo)準(zhǔn),即密度評估標(biāo)準(zhǔn),對聚類后的異常行為進行識別。劉鵬[12]提出了基于熵對數(shù)據(jù)分組和基于數(shù)據(jù)特點一次合并多個數(shù)據(jù)樣本的快速層次聚類算法,對用戶業(yè)務(wù)偏好變化隨時間變化的規(guī)律進行研究,并利用非齊次泊松過程對網(wǎng)絡(luò)用戶上下線行為進行建模分析。蔡岳等[13]提出一種基于用戶行為聚類的搜索引擎算法,從用戶行為日志中挖掘用戶意圖,并根據(jù)用戶的反饋信息定位用戶意圖信息。陳敏等[14]結(jié)合Web用戶瀏覽行為的特點,引入了粗糙度概念,提出了一種新的路徑相似度計算方法,在計算相似度時不僅把用戶的瀏覽模式作為一種序列模式來考慮,還充分考慮了用戶在網(wǎng)上瀏覽的時間因素,以實現(xiàn)對Web用戶瀏覽行為的聚類。延皓[15]基于流量監(jiān)測提出了一種基于熵的訪問狀態(tài)轉(zhuǎn)移矩陣(CWSTM)聚類算法,用于用戶會話行為統(tǒng)計分析、上網(wǎng)時段喜好分析、Web喜好分析和用戶Web訪問狀態(tài)轉(zhuǎn)移研究。張霞等[16]提出了一種基于用戶查詢意圖的聚類分析算法,通過檢索用戶關(guān)鍵詞,將數(shù)據(jù)信息采用樹狀的形式存儲,從而獲取和樹相鄰接的上下信息,通過關(guān)鍵信息來分析用戶的查詢意圖。李磊等[17]將微博用戶分為一般關(guān)注、主動參與和信息傳播三種類型,提出了一種基于微博主題的用戶聚類算法,用于網(wǎng)絡(luò)輿情的檢測。張萬山等[18]在Web資源個性化推薦中,跟蹤用戶瀏覽和檢索Web資源的行為數(shù)據(jù),提出了基于主題聚類的個性化推薦算法,實現(xiàn)了Web資源的動態(tài)推薦。

1.3關(guān)聯(lián)分析法

在用戶行為分析中,常將用戶行為習(xí)慣和其他行為習(xí)慣借助于Apriori等關(guān)聯(lián)規(guī)則算法進行關(guān)聯(lián)分析,以發(fā)現(xiàn)不同行為習(xí)慣之間的關(guān)系和規(guī)律,從而達(dá)到對用戶行為預(yù)測的目的。王愛平等[19]從寬度優(yōu)先、深度優(yōu)先、數(shù)據(jù)集劃分、采樣、增量式更新、約束關(guān)聯(lián)、多層多維關(guān)聯(lián)等方面對數(shù)據(jù)挖掘中常用的關(guān)聯(lián)規(guī)則挖掘算法進行詳細(xì)系統(tǒng)的介紹。王永利[20]在Web用戶行為挖掘過程中發(fā)現(xiàn)了關(guān)聯(lián)規(guī)則經(jīng)典算法Apriori的不足,并針對這些不足,提出了一種基于Web挖掘的分類關(guān)聯(lián)規(guī)則挖掘算法。一些研究成果應(yīng)用于信息安全檢測中的用戶行為分析,如:潘蕾等[21]針對網(wǎng)絡(luò)監(jiān)聽系統(tǒng)需要解決的提取用戶訪問模式信息中的多維多值關(guān)聯(lián)規(guī)則問題,對傳統(tǒng)的關(guān)聯(lián)規(guī)則算法進行了擴充和改進,提取有效的關(guān)聯(lián)規(guī)則,反映用戶的行為模式。戴臻等[22]針對入侵檢測系統(tǒng)中快捷獲取用戶使用模式的需求,在Apriori算法基礎(chǔ)上提出了一種基于特定模式樹的用戶行為關(guān)聯(lián)規(guī)則挖掘算法,通過遞歸挖掘模式樹獲得最大頻繁集。周云霞等[23]在數(shù)據(jù)庫入侵檢測系統(tǒng)用戶行為挖掘中改進了FP-Growth算法,提高挖掘效率。羅強[24]利用Apriori算法提出了社交網(wǎng)絡(luò)用戶行為關(guān)聯(lián)分析算法以劃分虛擬社團,提高針對虛擬社團用戶信息推送的針對性。數(shù)字圖書館領(lǐng)域近年也有研究成果[25-26]將關(guān)聯(lián)分析應(yīng)用于圖書館用戶借閱行為分析,從而為用戶提供更加個性化的圖書推薦。

1.4決策樹法

決策樹利用信息和數(shù)據(jù)的樹狀圖形向決策人提供后續(xù)問題決策輔助。在網(wǎng)絡(luò)用戶信息行為分析過程中,因為涉及到用戶后續(xù)信息行為的預(yù)測,決策樹也被較多地運用在網(wǎng)絡(luò)用戶信息行為分析中。徐孝娟等[27]利用Ethnographic決策樹分析了科學(xué)網(wǎng)博客用戶的行為,并利用問卷調(diào)查驗證預(yù)測效果。賀露[28]利用決策樹法并結(jié)合線性回歸法分析預(yù)測社交網(wǎng)用戶的性格特征。李賢鵬等[29]對分類預(yù)測中廣泛使用的ID3決策樹算法進行分析,指出了該算法的取值偏向性以及運算效率不高等缺點,在此基礎(chǔ)上提出了一種改進的ID3算法并將其應(yīng)用于某移動通信公司的客戶流失預(yù)測。曾雪等[30]引入代價敏感學(xué)習(xí)理論,將不同的錯分代價納入建模過程,以構(gòu)建一個基于代價敏感的決策樹的電信客戶離網(wǎng)分析模型,有效地提高對流失客戶的預(yù)測性能。鄒競等[31]闡明了決策樹算法是電信行業(yè)提高客戶忠誠度、防止客戶流失的重要手段,介紹了決策樹算法應(yīng)用于電信行業(yè)客戶流失分析中的方法、步驟及具體實現(xiàn)過程。

1.5神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò),也稱連接模型,是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進行分布式并行信息處理的算法數(shù)據(jù)模型。神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)用戶信息行為分析中主要用于預(yù)測用戶接下來的信息行為,動態(tài)調(diào)整相應(yīng)策略,提供更加個性化的服務(wù)。劉蓉等[32]提出手工定制和系統(tǒng)自動建模相結(jié)合的自適應(yīng)神經(jīng)網(wǎng)絡(luò)建模方法,可動態(tài)調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù),修正用戶模型,使神經(jīng)網(wǎng)絡(luò)的輸出能隨用戶的興趣而改變。左琳[33]則將穩(wěn)定轉(zhuǎn)換法應(yīng)用于神經(jīng)網(wǎng)絡(luò)的混沌控制中,基于改進的LPCA神經(jīng)網(wǎng)絡(luò)方法,提出了一種新的網(wǎng)絡(luò)用戶行為分析模型,揭示了用戶區(qū)域?qū)傩詫κ褂媚J胶蛻?yīng)用習(xí)慣的影響。段隆振等[34]根據(jù)Kohonen自組織特征映射神經(jīng)網(wǎng)絡(luò)中學(xué)習(xí)階段的性質(zhì),運用雙Kohonen神經(jīng)網(wǎng)絡(luò)組合成新的自組織訓(xùn)練挖掘模型,改善了聚類效果,為Web用戶訪問模式挖掘提供了一種可行的方法。李宇華[35]將神經(jīng)網(wǎng)絡(luò)應(yīng)用于網(wǎng)絡(luò)安全入侵行為監(jiān)測方面,將神經(jīng)網(wǎng)絡(luò)、模糊系統(tǒng)和減法聚類三者融合,開發(fā)出可有效監(jiān)測攻擊行為的模糊神經(jīng)網(wǎng)絡(luò)用戶行為分析系統(tǒng)。

1.6時序數(shù)據(jù)挖掘

時序數(shù)據(jù)是指與時間相關(guān)或含有時間信息的數(shù)據(jù)或用數(shù)字或符號表示的時間序列,由于相關(guān)數(shù)據(jù)隨著時間連續(xù)變化,能夠反映出某個待觀察過程在一定時間內(nèi)的狀態(tài)或表現(xiàn)[36]。鑒于網(wǎng)絡(luò)用戶信息行為有著明顯的時序特征,采用這種方法可以學(xué)習(xí)網(wǎng)絡(luò)用戶過去的時間特征,并能夠預(yù)測用戶未來的行為。Ron Hutchins[37]從一個美國撥號上網(wǎng)服務(wù)提供商RADIUS服務(wù)器上采集了2000年5月至9月共60多萬不同用戶登錄信息的數(shù)據(jù),首先以1分鐘為間隔對節(jié)日、周末和工作日登錄次數(shù)變化情況進行描述,然后又對用戶不同日期的在線時長分布、用戶的地理分布以及不同地區(qū)平均登錄時間進行了分析,此外還對用戶數(shù)目的變化做出了估計模型。Hutchins[38]采用與Ron Hutchins相同的數(shù)據(jù)源,以5分鐘為間隔對幾個月的登錄次數(shù)變化情況進行描述,以及對幾個月的在線時長分布分別作了對比分析,還研究了單個用戶的登錄間隔時間分布。數(shù)字圖書館領(lǐng)域近年也有一些研究成果[39-40]將時序數(shù)據(jù)挖掘方法應(yīng)用在用戶借閱行為分析方面,跟蹤用戶需求的調(diào)整和變化。

2 網(wǎng)絡(luò)用戶行為模型構(gòu)建方法

模型是對真實世界中問題域內(nèi)的事物的描述。網(wǎng)絡(luò)用戶行為分析大多需要對用戶行為進行建模,即用圖示、文字、符號等組成的流程圖等形式對用戶行為及其規(guī)律進行描述,是用戶行為分析的重要基礎(chǔ)??v觀網(wǎng)絡(luò)用戶行為模型的構(gòu)建方法,主要有兩大類:一類是圖形化構(gòu)建表征方法,一類是語言描述類表征方法。下面分別對相關(guān)情況進行闡述。

2.1圖形化網(wǎng)絡(luò)行為模型構(gòu)建方法

目前用于網(wǎng)絡(luò)行為分析的模型主要有3個:(1)客戶行為模型圖(Customer Behavior Model Graph, CBMG)[41]??蛻粜袨槟P蛨D是一個基于轉(zhuǎn)換概率矩陣的圖形,主要用于描述網(wǎng)絡(luò)用戶如何從一個狀態(tài)轉(zhuǎn)化到另一個狀態(tài)。客戶行為模型圖主要由代表狀態(tài)名的橢圓和代表轉(zhuǎn)換的箭頭符號組成,轉(zhuǎn)換箭頭上標(biāo)明概率,用于表征從用戶進入網(wǎng)站或系統(tǒng)開始到離開網(wǎng)站或系統(tǒng)結(jié)束時的一系列狀態(tài)和改變,可以直接轉(zhuǎn)化為概率矩陣進一步計算[42-43]。(2)客戶訪問模型(Customer Visit Model, CVM)[44]??蛻粼L問模型將多個會話(如檢索、瀏覽、下載、復(fù)制等)表示成一個會話向量集合,每一個會話為該向量集合中的一個向量,用于表征用戶在網(wǎng)站或系統(tǒng)上的所有行為[43-45]。(3)客戶/服務(wù)器交互圖(Client/Server Interaction Diagrams, CSID)[46]。主要用于描述用戶與服務(wù)器之間為實現(xiàn)某一功能而可能產(chǎn)生的系列交互。交互圖主要由代表用戶的方形、代表服務(wù)器的橢圓以及交互箭頭共同組成。通過客戶/服務(wù)器交互圖可以將用戶與服務(wù)器之間所有交互動作表征出來為下一步的計算、規(guī)律分析提供直觀依據(jù)[42-43]。

2.2語言描述類表征方法

網(wǎng)絡(luò)用戶行為的模型構(gòu)建也可以利用規(guī)范的語言進行描述,其中較為典型的就是GOMS(Goals, Operators, Methods and Selection rules)模型,GOMS即目標(biāo)、操作、方法和選擇規(guī)則。模型采用分而治之的思想,將一個任務(wù)進行多層次的細(xì)化,通過目標(biāo)、操作、方法和選擇規(guī)則四個元素來描述人機交互行為,以便進行網(wǎng)絡(luò)用戶行為特征和規(guī)律的分析[47]。目前,包括GOMSED、Qgoms、CogTool在內(nèi)的很多工具都已經(jīng)支持GOMS模型,也衍生出了很多改進的模型,如KLM (Keystroke Level Modeling)[48]、NGOMSL(Natural GOMS Language)[49]和CPM-GOMS(Cognitive Perceptual Motor GOMS)[50]等。另一種語言類表征方法是時序關(guān)系說明語言(Language of Temporal Ordering Specification,LOTOS)[51],該語言用一套形式化和嚴(yán)格的表示法刻畫系統(tǒng)外部可見行為之間的時序關(guān)系,可保證描述不存在二義性,便于分析和一致性測試?yán)碚摰难芯?。用戶行為?biāo)注(User Action Notion,UAN)[52]則是另外一種使用較多的,用于描述用戶的行為序列以及在執(zhí)行任務(wù)時所用界面的簡單符號語言,主要著眼于用戶和界面兩個實體之間的交互。

3 總結(jié)

網(wǎng)絡(luò)用戶行為蘊含著大量有意義的信息和有價值的研究方向。搜集用戶行為數(shù)據(jù),進行數(shù)據(jù)統(tǒng)計分析、用戶行為建模、分析行為模型,對挖掘網(wǎng)絡(luò)用戶行為有著重要意義。根據(jù)不同的目的,采用不同的方式,將會發(fā)掘出不同的用戶行為習(xí)慣。本文通過梳理用戶行為分析方法以及用戶行為建模方法,對網(wǎng)絡(luò)用戶行為分析研究進行歸納。未來的用戶行為分析將主要沿著這些方向展開以及更新改進。

[1] 何苾菲.基于微博用戶行為的興趣模型構(gòu)建和可視化方法研究[D].哈爾濱工業(yè)大學(xué),2013.

[2] 秦超.電子商務(wù)網(wǎng)站訪客行為分析系統(tǒng)[D].上海:上海交通大學(xué),2006.

[3] 網(wǎng)站用戶分析的五大常規(guī)方法[EB/OL]. [2014-12-03]. http://www. admin5.com/article/20100726/254679.shtml.

[4] Wu, Y., Zhou C, Chen M, et al. Human comment dynamics in on-line social systems [J]. Physica A: Statistical Mechanics and its Applications, 2010, 389(24): 5832-5837.

[5] Yu, J., Hu Y., Yu M.,et al. Analyzing netizens' view and reply behaviors on the forum [J]. Physica A: Statistical Mechanics and its Applications, 2010, 389(16): 3267-3273.

[6] 程鵬.中大型互聯(lián)網(wǎng)網(wǎng)站用戶行為分析數(shù)據(jù)平臺[D]. 上海:復(fù)旦大學(xué),2012.

[7] 尤婷.社交網(wǎng)站用戶行為特征及其內(nèi)在機制研究[D]. 北京:北京郵電大學(xué),2012.

[8] 鄧夏瑋.基于社交網(wǎng)絡(luò)的用戶行為研究[D]. 北京:北京交通大學(xué),2012.

[9] Oh S.H., Lee W.S., An anomaly intrusion detection method by clustering normal user behavior[J]. Computers & Security, 2003. 22(7): 596-612.

[10] Maia, M., J. Almeida, V.l. Almeida. Identifying user behavior in online social networks[C]// Association for Computing Machinery. Proceedings of the 1st workshop on Social network systems. New York:2008.

[11] 孫燕花.基于聚類的網(wǎng)絡(luò)用戶行為分析[D].長沙:中南大學(xué),2011.

[12] 劉鵬.網(wǎng)絡(luò)用戶行為分析的若干問題研究[D].北京: 北京郵電大學(xué),2010.

[13] 蔡岳,袁津生.用戶行為聚類的搜索引擎算法與實現(xiàn)[J].計算機系統(tǒng)應(yīng)用,2010,19(4):94-97.

[14] 陳敏,苗奪謙,段其國.基于用戶瀏覽行為聚類Web用戶[J].計算機科學(xué), 2008,35(3):186-187.

[15] 延皓. 基于流量監(jiān)測的網(wǎng)絡(luò)用戶行為分析[D].北京: 北京郵電大學(xué),2011.

[16] 張霞,馬一寧,陳靜汝.一種基于用戶查詢意圖的聚類分析算法[J]. 電腦知識與技術(shù),2012,8(14).

[17] 李磊,劉繼.面向輿情主題的微博用戶行為聚類實證分析[J].情報雜志,2014(3):118-121.

[18] 張萬山, 肖瑤, 梁俊杰,等.基于主題聚類的Web資源個性化推薦研究[J].微電子學(xué)與計算機, 2015(4):35-39.

[19] 王愛平, 王占鳳,陶嗣干,等.數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法[J].計算機技術(shù)與發(fā)展,2010(4):105-108.

[20] 王永利.關(guān)聯(lián)規(guī)則挖掘算法及其在Web挖掘上應(yīng)用的研究[D].哈爾濱:哈爾濱工程大學(xué),2013.

[21] 潘蕾,蘇晶,徐汀榮.網(wǎng)絡(luò)訪問行為關(guān)聯(lián)規(guī)則提取的研究與設(shè)計[J].計算機應(yīng)用與軟件, 2008,25(3): 189-191.

[22] 戴臻, 費洪曉, 李俊, 等.基于特定模式樹的用戶行為關(guān)聯(lián)規(guī)則挖掘算法[J].計算機系統(tǒng)應(yīng)用,2007,5(5): 56-59

[23] 周云霞,栗磊.基于數(shù)據(jù)庫用戶行為分析的改進FP-Growth算法[J].科學(xué)技術(shù)與工程,2011(18):4380-4383.

[24] 羅強.社交網(wǎng)絡(luò)用戶行為關(guān)聯(lián)分析的關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2013.

[25] 陳定權(quán),朱維鳳.關(guān)聯(lián)規(guī)則與圖書館書目推薦[J].情報理論與實踐,2009(6):81-84.

[26] 李欣.基于關(guān)聯(lián)規(guī)則的圖書館圖書智能查詢系統(tǒng)研究[D].長春: 東北師范大學(xué),2012.

[27] 徐孝娟,趙宇翔,朱慶華.民族志決策樹方法在學(xué)術(shù)博客用戶行為中的研究[J].現(xiàn)代圖書情報技術(shù), 2014(1):79-86.

[28] 賀露.基于社交網(wǎng)絡(luò)的用戶性格與行為分析[D].北京:北京郵電大學(xué),2014.

[29] 李賢鵬, 何松華, 趙孝敏,等.改進的ID3算法在客戶流失預(yù)測中的應(yīng)用[J].計算機工程與應(yīng)用,2009, 45(10): 242-244.

[30] 曾雪,胡建華,王清心.基于代價敏感的決策樹的電信離網(wǎng)分析模型[J].計算機與現(xiàn)代化,2009(4): 62-64.

[31] 鄒競,謝鯤. C4.5算法在移動通信行業(yè)客戶流失分析中的應(yīng)用[J].計算技術(shù)與自動化,2009, 28(3): 98-101.

[32] 劉蓉,陳鵬,張興艷.個性化網(wǎng)頁推薦中基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)用戶模型研究[J].電子測量技術(shù), 2007, 30(4):165-168.

[33] 左琳.神經(jīng)網(wǎng)絡(luò)及在網(wǎng)絡(luò)用戶行為分析中的應(yīng)用研究[D].成都:電子科技大學(xué),2011.

[34] 段隆振,朱敏,王靚明.基于雙Kohonen神經(jīng)網(wǎng)絡(luò)的Web用戶訪問模式挖掘算法[J].計算機工程與科學(xué), 2009(9):95-98.

[35] 李宇華.基于模糊神經(jīng)網(wǎng)絡(luò)的用戶行為分析[D].武漢:華中科技大學(xué),2013.

[36] 黃書劍.時序數(shù)據(jù)上的數(shù)據(jù)挖掘[J].軟件學(xué)報,2004(1):1-8.

[37] Hutchins Ron, Zegura Ellen W., Kolesnikov Oleg, et al. Usage characteristics of dial-in Internet users: a national study[J/OL].[2015-02-21]. http://wenku.baidu.com/link?url=mxHKkst01J9UkKxuzAhEGXSIQM4n_TpBh7ZcfetgswcdlETqL8A1L_8WP99Fm3AVWXgEQDaOeN7 _DNEFgOY4T993jqTnHE3cU2z7KLQm4G.

[38] Hutchins, R., Zegura EW., Liashenko A, et al. Internet user access via dial-up networks-traffic characterization and statistics[C]//IEEE. Ninth International Conference. 2001:11-14.

[39] 付沙.基于序列模式挖掘的圖書館用戶借閱行為分析[J].情報理論與實踐,2014(6):103-106.

[40] 陳春穎,熊擁軍.基于序列模式挖掘的讀者借閱行為分析[J].圖書情報知識,2011(2):92-96.

[41] Xu Xiaolin, Jin Hai, Wu Song, et al., URMG: Enhanced CBMGBased Method for Automatically Testing Web Applications in the Cloud [J]. Tsinghua Science and Technology, 2014,19(1):65-75.

[42] User Behavior Modeling: CBMG Creation[EB/OL]. [2015-02-24]. http://www.isot.ece.uvic.ca/projects/Performance-Analyzer/manual/ bm-cbmg.html.

[43] 余肖生,馬費成.網(wǎng)絡(luò)用戶行為模型的構(gòu)建方法研究[J].情報科學(xué), 2011, 29(4): 605-608.

[44] Menasce, D., Abraho, B., Barbará, D., et al. Fractal Characterization of Web Workloads[J/OL]. [2015-02-21]. http://citeseerx.ist.psu.edu/ viewdoc/download?doi=10.1.1.16.3087&rep=rep1&type=pdf.

[45] Wang Xiajun, Huang Song, Fu Song. Characterizing Workload of Web Applications on Virtualized Servers[M]// Big Data Benchmarks, Performance Optimization, and Emerging Hardware. Springer International Publishing, 2014:98-108.

[46] Peiffer, C. , I. L'heureux. System and method for maintaining statefulness during client-server interactions:US, 8,346,848[P/ OL][2015-02-21]. http://www.freepatentsonline.com/8346848.html.

[47] Stanton, N.A., Salmon P.M, Walker G.H.. Human factors methods: a practical guide for engineering and design[M].Farnham: Ashgate Publishing, Ltd,2013.

[48] Karousos, N., et al. Effortless tool-based evaluation of web form filling tasks using keystroke level model and fitts law[C]. CHI'13 Extended Abstracts on Human Factors in Computing Systems. New York: ACM,2013.

[49] Ritter, F.E., Gordon D., Baxter, et al. Foundations for Designing User-Centered Systems[M]// Methodology I: Task Analysis., Springer, 2014:309-333.

[50] Erazo, O., Pino, J.A., Pino R., et al. Magic Mirror for Neurorehabilitation of People with Upper Limb Dysfunction Using Kinect[J]. Hawaii International Conference on System Sciences,2014:2607-2615.

[51] Sebrechts, M Marc. The psychology of human-computer interaction(Book)[J]. American Scientist, 1983,71(6):656.

[52] Hartson, H.R., Gray, P.D.. Temporal aspects of tasks in the User Action Notation[J]. Human-Computer Interaction, 1992,7(1):1-45.

Overview of Network User Behavior Analysis and Modeling

WU QingQiang
(Software School of Xiamen University, Xiamen 361000, China)

With the development of the Internet and numberincrease of Internet users, the access and utilization of the user's behavior of operating data becomes easier. This paper mainly summarizes the research and practice of user behavior analysis and user modeling in the behavior analysis of network users. Through the modeling analysis of different ways and in different directions of user behavior data, the behavior modeling further analysis so as to explore user behavior patterns and associations, to provide basis and direction for the next step of the Internet development.

User Behavior Analysis; Data Mining; User Behavior Model

TP391

10.3772/j.issn.1673-2286.2015.11.006

吳清強,男,博士,廈門大學(xué)軟件學(xué)院副教授,E-mail:553401552@qq.com。

2015-10-13)

* 本研究得到國家社科基金項目“面向檢索的網(wǎng)絡(luò)用戶行為可靠性度量研究”(編號:13CTQ011)資助。

猜你喜歡
決策樹關(guān)聯(lián)聚類
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
“一帶一路”遞進,關(guān)聯(lián)民生更緊
決策樹和隨機森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
奇趣搭配
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
智趣
讀者(2017年5期)2017-02-15 18:04:18
基于決策樹的出租車乘客出行目的識別
基于改進的遺傳算法的模糊聚類算法
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
成武县| 科技| 巴青县| 广西| 宜宾市| 黄龙县| 西峡县| 天气| 甘谷县| 达州市| 林西县| 湘潭县| 阜新市| 福建省| 页游| 连云港市| 卫辉市| 郸城县| 漳浦县| 德州市| 山东省| 罗源县| 顺义区| 乃东县| 吴川市| 四子王旗| 高雄市| 陆良县| 三台县| 盐城市| 合阳县| 乾安县| 武定县| 临猗县| 阿坝县| 观塘区| 常州市| 竹山县| 望江县| 商都县| 区。|