国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)模式下用戶的數(shù)據(jù)挖掘算法研究

2017-11-14 07:06:45李超男
電腦知識(shí)與技術(shù) 2017年29期
關(guān)鍵詞:社交平臺(tái)

李超男

摘要:近來(lái)社交網(wǎng)絡(luò)的研究主要在社會(huì)網(wǎng)絡(luò)分析方面,包括公共關(guān)系、大眾傳播等領(lǐng)域,借鑒并融合了心理學(xué)、傳播學(xué)、社會(huì)學(xué)、信息論等多學(xué)科,逐步演變成為完整化、系統(tǒng)化的理論研究策略。這對(duì)在線社交網(wǎng)絡(luò)的數(shù)據(jù)分析與數(shù)據(jù)挖掘產(chǎn)生了非常大的挑戰(zhàn)。那么,對(duì)于不同的數(shù)據(jù)源,如何用適合的挖掘算法進(jìn)行挖掘分析是數(shù)據(jù)挖掘研究工作者需考慮的重要問(wèn)題。

關(guān)鍵詞:網(wǎng)絡(luò)模式;社交平臺(tái);網(wǎng)絡(luò)用戶;數(shù)據(jù)挖掘算法

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2017)29-0003-03

1 概述

互聯(lián)網(wǎng)高速發(fā)展時(shí)期,不同類型的網(wǎng)絡(luò)社交媒體不斷涌現(xiàn),除微信、微博、博客等熱門(mén)社交媒體外,其他應(yīng)用型軟件也相繼出現(xiàn)網(wǎng)絡(luò)社交媒體的屬性,如百度網(wǎng)盤(pán)、淘寶、京東等。因此如今網(wǎng)絡(luò)模式下,用戶的社交屬性無(wú)處不在的,這也相繼產(chǎn)生了許多社交數(shù)據(jù),如何充分的、有效的挖掘利用此類社交數(shù)據(jù)以及熱門(mén)話題,這成為了很多學(xué)者和公司市場(chǎng)部門(mén)研究的熱點(diǎn)方向。

研究此類數(shù)據(jù)的原因是顯而易見(jiàn)的,利用對(duì)社交媒體數(shù)據(jù)的挖掘和分析,可以增加對(duì)新話題的理解能力,達(dá)到商業(yè)中的人工智能,這也能對(duì)網(wǎng)絡(luò)用戶進(jìn)行更好的服務(wù),同時(shí)發(fā)現(xiàn)新的商機(jī)。如:對(duì)社會(huì)性網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行分析,辨別篩選出在特定的社會(huì)網(wǎng)絡(luò)用戶群體中具有意見(jiàn)領(lǐng)袖特征的人;發(fā)現(xiàn)網(wǎng)絡(luò)中一部分隱性興趣群體,歸類不一樣的興趣群組;找到特定用戶,根據(jù)用戶的某段時(shí)間內(nèi)的主觀情感進(jìn)行主動(dòng)規(guī)劃和推薦信息等。網(wǎng)絡(luò)模式下的社交網(wǎng)絡(luò)數(shù)據(jù)研究,是一個(gè)有活力的研究方向,可以為不同交叉學(xué)科領(lǐng)域帶來(lái)很大貢獻(xiàn)。

2 網(wǎng)絡(luò)模式用戶數(shù)據(jù)

2.1 社交網(wǎng)絡(luò)的分類

網(wǎng)絡(luò)模式下社交媒體多種多樣,在概述部分已經(jīng)進(jìn)行了一些舉例,下文進(jìn)行詳細(xì)的分類,如表1。

2.2 網(wǎng)絡(luò)模式數(shù)據(jù)的特征

傳統(tǒng)的數(shù)據(jù),在分析之前,我們可以預(yù)見(jiàn)到它的趨勢(shì)并制定相應(yīng)的算法進(jìn)行分析,而網(wǎng)絡(luò)社交數(shù)據(jù)卻存在著很大的差異性,網(wǎng)絡(luò)社交數(shù)據(jù)的差異性體現(xiàn)在數(shù)據(jù)量龐大、非結(jié)構(gòu)化、動(dòng)態(tài)且分散[1],因此,這種數(shù)據(jù)類型的數(shù)據(jù)分析,對(duì)高效的數(shù)據(jù)算法的需求很高。

2.3 網(wǎng)絡(luò)模式數(shù)據(jù)的價(jià)值

網(wǎng)絡(luò)數(shù)據(jù)從一些層面上看,體現(xiàn)出了用戶在某個(gè)時(shí)段的特定需求,通過(guò)網(wǎng)絡(luò)社交平臺(tái),直接或間接表達(dá)出了自身的需求,這就會(huì)給我們?nèi)祟愋袨閷W(xué)的問(wèn)題的研究帶來(lái)很多便利,同時(shí)對(duì)商業(yè)平臺(tái)的運(yùn)營(yíng)也會(huì)帶來(lái)很大的幫助,比如:通過(guò)對(duì)社交平臺(tái)的數(shù)據(jù)分析挖掘出潛在的客戶并加以推銷(xiāo),對(duì)高效、新型的數(shù)據(jù)算法的需求也越來(lái)越強(qiáng)烈。

3 網(wǎng)絡(luò)模式下的數(shù)據(jù)研究思路

3.1 社會(huì)性網(wǎng)絡(luò)團(tuán)體檢測(cè)

網(wǎng)絡(luò)社交團(tuán)體與實(shí)際生活中社團(tuán)屬性相似[2] ,同樣是由個(gè)體組成的,并且網(wǎng)絡(luò)社交團(tuán)體中個(gè)體與個(gè)體之間的交流活動(dòng),會(huì)比個(gè)體與外界的交流活動(dòng)要多。在真正意義上網(wǎng)絡(luò)社交團(tuán)體中,又分為顯性的社交網(wǎng)絡(luò)團(tuán)體和隱性的社交網(wǎng)絡(luò)群體。其中,顯性的社交網(wǎng)絡(luò)團(tuán)體,就是一些具有相同愛(ài)好興趣的用戶主動(dòng)聚集起來(lái)的團(tuán)體,而隱性社交網(wǎng)絡(luò)團(tuán)體,則是由一些興趣關(guān)注相同個(gè)體組成,個(gè)體之間的交流不多,但會(huì)在自然的網(wǎng)絡(luò)環(huán)境的交流中逐漸發(fā)展為顯性群體。

由于顯性的社交網(wǎng)絡(luò)團(tuán)體,特征明顯,數(shù)據(jù)直觀,研究的難度并不大,因此,我們所說(shuō)的對(duì)于社交網(wǎng)絡(luò)的社團(tuán)的檢測(cè),一般我們是針對(duì)隱性群體[3]。這些網(wǎng)絡(luò)社團(tuán)的檢測(cè)充滿了挑戰(zhàn),因?yàn)檫@些團(tuán)體的評(píng)估具有多樣化的特征,通常沒(méi)有決定性的正確。比如,在一個(gè)社交平臺(tái)中,兩個(gè)同時(shí)喜歡品茶的人,對(duì)茶的了解都非常深入,當(dāng)我們把它們檢測(cè)為隱性群體時(shí),實(shí)際上兩個(gè)人確實(shí)喜歡的完全不同的茶,一個(gè)喜歡喝綠茶,對(duì)紅茶很反感,而另外一個(gè)人正好相反。

通常在網(wǎng)絡(luò)社團(tuán)的檢測(cè)中,我們使用以下幾種方法:

(1) 使用以層級(jí)關(guān)系建立的社團(tuán)檢測(cè)法。其目標(biāo)是創(chuàng)建出來(lái)一個(gè)社團(tuán)的層級(jí)構(gòu)架??梢圆捎貌幌嗤牟呗詠?lái)分析,比較常用的有合并時(shí)聚類和分裂式聚類。

(2) 使用以節(jié)點(diǎn)為中心的社團(tuán)檢測(cè)。判斷節(jié)點(diǎn)是否符合一些特征,例如相互完整性、內(nèi)外聯(lián)系頻繁性等,數(shù)據(jù)的分析者常用的策略有k-clubs、cliques等。

(3) 使用以網(wǎng)絡(luò)為中心的社團(tuán)檢測(cè)。這一類的檢測(cè)中,數(shù)據(jù)分析者一般將網(wǎng)絡(luò)中一些不相交的子集,組織起來(lái)進(jìn)行區(qū)分歸類而實(shí)現(xiàn),經(jīng)典的有譜聚類和模塊最大化等策略。

本文以微博的社交數(shù)據(jù)的處理方法為研究對(duì)象,選取了基于模塊化的最大值算法。例如:假設(shè)一個(gè)社會(huì)性網(wǎng)絡(luò)被劃分為N個(gè)社團(tuán)Kn,定義模塊化值為M(Kn) 用做分別社交網(wǎng)絡(luò)中社團(tuán)質(zhì)量的度量,表示公式為:

在這里,W=()n×n為權(quán)重值矩陣,A(V′,V″)= ,V為用戶節(jié)點(diǎn)集合為全部與社團(tuán)c中的節(jié)點(diǎn)有聯(lián)系的邊的權(quán)重和,為在社團(tuán)c中全部邊的權(quán)重和,表示整個(gè)社交圖中邊的權(quán)重和。

在社會(huì)網(wǎng)絡(luò)團(tuán)體中,N個(gè)社團(tuán)的構(gòu)造特征越顯著,M(Kn)的值就越大。

3.2 影響力建模

對(duì)于社交網(wǎng)絡(luò)的潛在性分析,有兩個(gè)驅(qū)動(dòng)性的要求需要特別注意,即這種潛在性的社交網(wǎng)絡(luò)是由同質(zhì)性驅(qū)動(dòng)還是影響力驅(qū)動(dòng)的。比如,在商業(yè)領(lǐng)域,若判定出該網(wǎng)絡(luò)社交團(tuán)體是同質(zhì)性驅(qū)動(dòng),也就是相似性驅(qū)動(dòng)的話,就可以直接向一些被作為目標(biāo)的用戶發(fā)送推薦的商品信息;如果判定出該社交網(wǎng)絡(luò)是有影響力驅(qū)動(dòng)的話,那么其中具有影響力的用戶一般被稱做“意見(jiàn)領(lǐng)袖”,辨別出來(lái)意見(jiàn)領(lǐng)袖,就能有償?shù)淖屇切┮庖?jiàn)領(lǐng)袖向網(wǎng)絡(luò)社交用戶推薦商品和服務(wù)[4]。如今網(wǎng)絡(luò)社交團(tuán)體比較多且復(fù)雜,大多團(tuán)體兼顧影響力驅(qū)動(dòng)和同質(zhì)性驅(qū)動(dòng),因此如何準(zhǔn)確的分析社團(tuán)中哪種驅(qū)動(dòng)性為核心主導(dǎo)力是重中之重的工作。如何檢測(cè)出社交團(tuán)體中具有影響力的核心節(jié)點(diǎn),顯得尤為重要,接下來(lái)介紹幾種對(duì)影響力建模的有效實(shí)現(xiàn)途徑。

(1) 社會(huì)網(wǎng)絡(luò)平臺(tái)中的用戶在網(wǎng)絡(luò)中的度數(shù)越大,則他的影響力就越大,具體表示為:

其中,a為某一個(gè)用戶的節(jié)點(diǎn),A為整個(gè)社交網(wǎng)絡(luò)。endprint

(2) 顧及到微博等社交網(wǎng)絡(luò)平臺(tái)的交互活動(dòng),依據(jù)用戶的消息記錄來(lái)計(jì)算出每個(gè)社交消息的平均轉(zhuǎn)發(fā)率,把每條消息引發(fā)的轉(zhuǎn)發(fā)行為視作用戶影響力的衡量指標(biāo):

(3) 基于谷歌的PageRank算法思想,在某一社交網(wǎng)絡(luò)中,如果發(fā)現(xiàn)某一個(gè)用戶的影響力越大,則說(shuō)明他被較多的優(yōu)質(zhì)用戶所關(guān)注,由此為依據(jù)獲得的社交網(wǎng)絡(luò)中的關(guān)注排名影響力算法如下:

在此算法中,K(n)為社交網(wǎng)絡(luò)中用戶n的影響力,B(n)為所有關(guān)注n的社交網(wǎng)絡(luò)用戶的總和,A(m)是用戶m關(guān)注的用戶的總和。

3.3 情感分析與意見(jiàn)挖掘

情感分析與意見(jiàn)挖掘的主要目的是從用戶發(fā)布的信息中自動(dòng)抽取出觀點(diǎn)。由于人們的語(yǔ)言具有多義性,這使得情感分析存在一定的難度。

情感分析的主要步驟為:

(1) 檢索出相應(yīng)的文檔

(2) 從文檔中找到相關(guān)的部分

(3) 從相關(guān)的部分找到所有的感情

(4) 進(jìn)行量化分析每個(gè)感情

(5) 聚集全部感情,并形成一個(gè)概述判斷

意見(jiàn)挖掘的主要組成部分為:

(1) 哪個(gè)用戶是意見(jiàn)表達(dá)的對(duì)象

(2) 對(duì)這個(gè)對(duì)象表達(dá)了什么意見(jiàn)

(3) 意見(jiàn)是誰(shuí)表達(dá)的

4 網(wǎng)絡(luò)數(shù)據(jù)的數(shù)據(jù)挖掘算法分析

上文提到幾種對(duì)于社交網(wǎng)絡(luò)數(shù)據(jù)分析的重點(diǎn)部分,此章節(jié)主要對(duì)數(shù)據(jù)挖掘及處理部分進(jìn)行對(duì)比分析,以求最優(yōu)的方案對(duì)數(shù)據(jù)進(jìn)行有效的分析。

常用的數(shù)據(jù)挖掘算法有數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Databass,KDD)、聚類分析、K-Means聚類算法等,此章節(jié)將對(duì)這幾個(gè)算法進(jìn)行一一的分析。

4.1 數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(數(shù)據(jù)挖掘的常規(guī)步驟)

數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn),一般包括七個(gè)階段,分別是數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)選擇、模式發(fā)現(xiàn)、數(shù)據(jù)變換、知識(shí)表示和模式評(píng)估[5]。其中,數(shù)據(jù)的預(yù)處理階段包括數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)選擇和數(shù)據(jù)變換,這個(gè)階段是決定數(shù)據(jù)挖掘質(zhì)量?jī)?yōu)劣的重要步驟。接著,利用數(shù)據(jù)挖掘的算法在數(shù)據(jù)中提取出有用模式的過(guò)程就是模式發(fā)現(xiàn)。模式評(píng)估與知識(shí)表示是接下來(lái)的處理步驟,通過(guò)采取一定的量規(guī)標(biāo)準(zhǔn),辨別出真正有效的知識(shí),通過(guò)可視化等技術(shù)呈現(xiàn)給用戶。

數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)的流程如圖1所示。

4.2 聚類分析

聚類分析是最經(jīng)常使用的數(shù)據(jù)挖掘的算法之一,并和機(jī)器學(xué)習(xí)的無(wú)監(jiān)督學(xué)習(xí)具有一定的關(guān)聯(lián)。另外聚類還在圖像識(shí)別、Web檢索、人工智能等領(lǐng)域具有廣泛的應(yīng)用,也成為另外一些數(shù)據(jù)挖掘算法的預(yù)處理步驟。通常而言,聚類就是將數(shù)據(jù)劃分成為不同簇的過(guò)程,在不同簇的對(duì)象互相不同,而簇中的對(duì)象則彼此相似。大部分情況下,同一簇內(nèi)的對(duì)象可以被當(dāng)做一個(gè)整體來(lái)看待。

(1) 聚類的劃分標(biāo)準(zhǔn)

依據(jù)聚類分類的不同標(biāo)準(zhǔn),聚類算法通??煞譃閯澐址椒?、層次方法、基于網(wǎng)格的方法和基于密度的方法。

劃分方法:把n個(gè)原始的數(shù)據(jù)對(duì)象劃分成i個(gè)簇(i≤n),每個(gè)簇至少包含一個(gè)對(duì)象。接下來(lái)假設(shè)Dm(1≤m≤k)是聚類劃分后的一個(gè)簇,N表示原始數(shù)據(jù)集合,便有:

經(jīng)典的劃分算法主要有:k-中心點(diǎn)(K-Medoids)和k-均值(K-Means)算法,它們都是采用啟發(fā)式方法來(lái)逐步逼近最優(yōu)聚類結(jié)果,這一類算法適用于發(fā)現(xiàn)中小規(guī)模數(shù)據(jù)庫(kù)中的球狀簇。

層次方法:層次方法分為凝聚的層次聚類和分裂的層次聚類兩種。層次聚類方法可以發(fā)現(xiàn)差異層次上的數(shù)據(jù)聚集模式。BIRCH算法便是一種傳統(tǒng)的層次聚類算法,它通常是用做大規(guī)模數(shù)據(jù)集聚類問(wèn)題的處理;而Chameleon算法則是現(xiàn)階段應(yīng)用良好的動(dòng)態(tài)聚類算法,它能夠發(fā)現(xiàn)任意形狀的聚類簇。

基于密度的方法:這類聚類方法是為了發(fā)現(xiàn)非球狀簇。他的主要思想是:一旦密度超過(guò)某一個(gè)限定的密度閩值,就能夠繼續(xù)擴(kuò)大這個(gè)簇的范圍。通常來(lái)講,基于密度的聚類算法僅考慮互斥的簇,而不考慮模糊集合。DENCLUE和DBSCAN都是基于密度的聚類算法[6]。

基于網(wǎng)格的方法:這種方法首先要形成一個(gè)網(wǎng)格的結(jié)構(gòu),形成網(wǎng)格結(jié)構(gòu)的方法是將數(shù)據(jù)空間分類成特定個(gè)數(shù)的數(shù)據(jù)單元,最終在網(wǎng)格結(jié)構(gòu)上進(jìn)行聚類操作。基于網(wǎng)格的聚類主要有STING,GRIDCLUS 等。

(2) 相似性的度量

主要的相似性度量方法有以下四種:基于概率的度量方法、基于密度的度量、基于連接的度量方法和基于距離的度量方法。

基于距離的相似性度量方法的優(yōu)點(diǎn)是:計(jì)算比較簡(jiǎn)單,易于理解。但缺點(diǎn)也相對(duì)較明顯,對(duì)不相關(guān)的數(shù)據(jù)信息比較敏感。主要的距離度量指標(biāo)有角度的余弦值、曼哈頓距離和歐幾里德距離。基于密度的相似性度量方法有基于密度函數(shù)的方法、基于網(wǎng)格的方法和最近鄰方法。DBSCAN,OPTICS和CLIQUE都是基于密度的相似度量方法?;谶B接的相似性度量方法是建立在數(shù)據(jù)連接圖的基礎(chǔ)上,根據(jù)圖的邊測(cè)信息來(lái)進(jìn)行數(shù)據(jù)聚類,把滿足一定連接數(shù)閩值的數(shù)據(jù)聚合成簇。這種方法的度量標(biāo)準(zhǔn)是數(shù)據(jù)對(duì)象的連接數(shù)量?;诟怕实亩攘糠椒ń⒃诮y(tǒng)計(jì)學(xué)理論基礎(chǔ)上,主要有COBWEB, AutoClass和混合模型等。

(3) 簇的分離性

通常來(lái)說(shuō),按照簇的分離性可將聚類結(jié)果分為模糊簇和互斥簇。一般的聚類篩選是一種硬性的篩選,數(shù)據(jù)集中的每個(gè)數(shù)據(jù)對(duì)象都被硬性地按照某個(gè)規(guī)則劃分到某個(gè)簇中,這樣劃分會(huì)使得簇之間具有明顯的區(qū)別界限。其實(shí)模糊聚類簇不是互斥的,多個(gè)簇與數(shù)據(jù)對(duì)象之間有著不一樣的隸屬關(guān)系,它們之間形成了數(shù)據(jù)對(duì)象和類別的不確定性描述。所以模糊簇相對(duì)于硬性劃分的聚類簇能夠更真實(shí)地反應(yīng)客觀世界。通過(guò)計(jì)算對(duì)應(yīng)目標(biāo)函數(shù)的最小值得到最終的軟化分結(jié)果的模糊C均值(FCM)聚類算法就是一種常見(jiàn)的模糊聚類算法。endprint

4.3 K-Means聚類算法

對(duì)網(wǎng)絡(luò)用戶行為的特征相似程度以及分布情況進(jìn)行分析時(shí),經(jīng)常會(huì)應(yīng)用K-Means聚類算法。此算法是由J.B.MacQueen最早發(fā)現(xiàn)并提出的,以及在醫(yī)學(xué)、生物科學(xué)、文本文檔聚類等領(lǐng)域得到了廣泛應(yīng)用[7]。K-Means聚類算法的目標(biāo)是發(fā)現(xiàn)對(duì)象簇的相似度和分布狀況,從而獲得研究對(duì)象的群體特征。

K-Means算法在網(wǎng)絡(luò)用戶的興趣特征挖掘分析中的應(yīng)用,能夠準(zhǔn)確快速的發(fā)現(xiàn)用戶的興趣,并且,通過(guò)對(duì)網(wǎng)絡(luò)用戶的數(shù)據(jù)挖掘,進(jìn)一步對(duì)群體用戶的興趣特征進(jìn)行聚類分析[8]。這樣便于之后對(duì)用戶進(jìn)行內(nèi)容推送以及興趣的預(yù)測(cè)。

K-Means聚類算法可以簡(jiǎn)單描述為首先任意從數(shù)據(jù)集F中采用k個(gè)數(shù)據(jù)點(diǎn)當(dāng)做初始簇的中心點(diǎn),然后在每個(gè)簇的中心以外的數(shù)據(jù)點(diǎn)依次計(jì)算到各簇以特定為半徑的區(qū)域距離,將數(shù)據(jù)點(diǎn)分類到最近的簇中心所代表的簇中,再?gòu)男掠?jì)算出每個(gè)簇的簇中心。將這個(gè)步驟經(jīng)數(shù)次的重復(fù)迭代,一直迭代到符合中止的條件為止[9]。

K-Means算法簇中心的計(jì)算公式是:

其中,Cj表示第j個(gè)簇,j=1,2,….,k;mj用來(lái)呈現(xiàn)簇Cj的簇的中心區(qū)域(抽象理解為簇中全部數(shù)據(jù)的平均值向量);表示簇Cj中包含的數(shù)據(jù)點(diǎn)數(shù)。數(shù)據(jù)點(diǎn)xi到簇中心mj的距離計(jì)算公式為:

下面任意一個(gè)條件都能夠終止此迭代過(guò)程:

(1) 不再有數(shù)據(jù)點(diǎn)被重新分配

(2) 簇中心沒(méi)有再發(fā)生變化

(3) 誤差平方和(SSE)局部最小

K-Means算法的特征為首先就要確定預(yù)計(jì)將要分類的簇個(gè)數(shù)k,并且聚類的最終效果在較為偏重于依賴選取初始簇的中心。學(xué)者常用的判斷簇個(gè)數(shù)k的方法是選取多個(gè)k的值,實(shí)現(xiàn)盡可能多數(shù)次的聚類,將之前多數(shù)次聚類的值進(jìn)行分析,再依據(jù)分析結(jié)果來(lái)最終判斷簇的個(gè)數(shù)。選擇初始簇中心的方法有很多種,目前大眾普遍接受的方法是“密度法”[10],密度法是按特定的半徑將所有數(shù)據(jù)點(diǎn)進(jìn)行分類,選取分布在數(shù)據(jù)點(diǎn)為中央的以特定長(zhǎng)度為半徑的區(qū)域內(nèi)的數(shù)據(jù)點(diǎn)數(shù)最多的前k個(gè)點(diǎn)為初始簇中心。

5 小結(jié)

對(duì)于網(wǎng)絡(luò)模式下的社交團(tuán)體的數(shù)據(jù)挖掘分析,由于數(shù)據(jù)量龐大、情感因素較多等等原因近年來(lái)一直是此類數(shù)據(jù)挖掘研究的難題。本文就幾種最常用的數(shù)據(jù)挖掘分析算法進(jìn)行了對(duì)比分析,并對(duì)網(wǎng)絡(luò)模式下社交團(tuán)體的數(shù)據(jù)挖掘進(jìn)行詳細(xì)的預(yù)分析。但網(wǎng)絡(luò)社交團(tuán)體的數(shù)據(jù)挖掘分析,依然存在著很多客觀的難題,這也將是我以后研究工作的重要方向。

參考文獻(xiàn):

[1] 周小平,梁循,趙吉超,李志宇,馬躍峰. 面向社會(huì)網(wǎng)絡(luò)融合的關(guān)聯(lián)用戶挖掘方法綜述[J]. 軟件學(xué)報(bào):1-21.

[2] 劉冰,趙君麗. 基于社會(huì)網(wǎng)絡(luò)分析的國(guó)內(nèi)E-learning數(shù)據(jù)挖掘研究述評(píng)[J]. 通化師范學(xué)院學(xué)報(bào),2015(04):127-129.

[3] 宋洋. 基于社會(huì)網(wǎng)絡(luò)分析的Web數(shù)據(jù)挖掘研究[D].山東理工大學(xué),2015.

[4] 肖志軍. 一種面向社會(huì)網(wǎng)絡(luò)的熱點(diǎn)話題數(shù)據(jù)挖掘算法[J]. 計(jì)算機(jī)應(yīng)用與軟件,2014(06):24-28.

[5] 于樂(lè). 社會(huì)網(wǎng)絡(luò)中社團(tuán)發(fā)現(xiàn)及網(wǎng)絡(luò)演化分析[D].北京郵電大學(xué),2014.

[6] 劉行軍. 微博用戶及其信息傳播影響因素研究[D].華中師范大學(xué),2013.

[7] 陳康,朱應(yīng)堅(jiān),向勇. 面向社交網(wǎng)絡(luò)的用戶數(shù)據(jù)挖掘技術(shù)研究[J]. 電信科學(xué),2013(S1):94-101.

[8] 王千,王成,馮振元,葉金鳳. K-means聚類算法研究綜述[J]. 電子設(shè)計(jì)工程,2012(07):21-24.

[9] 周志勇. 聚類分析算法研究[D].河北大學(xué),2007.

[10] 邢留偉. K-Means算法在客戶細(xì)分中的應(yīng)用研究[D].西南財(cái)經(jīng)大學(xué),2007.endprint

猜你喜歡
社交平臺(tái)
面向ACG的動(dòng)漫平臺(tái)APP分析與設(shè)計(jì)
淺析網(wǎng)絡(luò)時(shí)代思政輔導(dǎo)員的角色新定位與工作新途徑
基于移動(dòng)社交平臺(tái)的用戶信任度分析研究
社交網(wǎng)絡(luò)中的蒸發(fā)冷卻效應(yīng)研究
新媒體研究(2017年9期)2017-07-26 22:19:57
激情打車(chē)
網(wǎng)絡(luò)時(shí)代下的粉絲經(jīng)濟(jì)與體育新媒體探究
“社交平臺(tái)+傳統(tǒng)媒體”發(fā)展模式的研究
聲屏世界(2017年1期)2017-03-20 16:21:36
微博對(duì)中職思想政治教育的影響及利用對(duì)策
社交平臺(tái)下電子商務(wù)盈利模式創(chuàng)新研究
網(wǎng)絡(luò)視頻直播熱潮下傳統(tǒng)電視媒體的突圍
出版廣角(2016年21期)2017-01-07 21:30:05
福清市| 武宣县| 神木县| 宣城市| 马关县| 松溪县| 庆阳市| 尖扎县| 延安市| 商河县| 渑池县| 白河县| 页游| 那坡县| 通州区| 西青区| 辽宁省| 恩施市| 连州市| 宜宾县| 茂名市| 洪雅县| 湘乡市| 福建省| 沙田区| 定日县| 米泉市| 水城县| 福清市| 铜川市| 株洲县| 子洲县| 蚌埠市| 岳池县| 青铜峡市| 伊川县| 白河县| 西贡区| 类乌齐县| 宝应县| 赣州市|