徐正巧 高江錦 趙德偉
摘要:隨著復雜網(wǎng)絡(luò)研究的深入,網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)的研究逐漸成為學者們研究的熱點,該文將復雜網(wǎng)絡(luò)社區(qū)檢測技術(shù)進入對推薦系統(tǒng)中,同時利用動態(tài)社區(qū)檢測算法進行演化社區(qū)結(jié)構(gòu)和用戶偏好研究,有效的設(shè)計和實現(xiàn)個性化推薦,為社區(qū)提供更優(yōu)質(zhì),更適合的服務(wù),以此來促進用戶和社區(qū)共同發(fā)展。
關(guān)鍵詞:復雜網(wǎng)絡(luò);社區(qū)檢測;個性化推薦;推薦系統(tǒng)
1概述
隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,推薦技術(shù)的研究已經(jīng)成為很多交叉領(lǐng)域的熱點,其理論和應用的價值和意義非常重大。而推薦系統(tǒng)近些年來越來越受人們的關(guān)注,呈現(xiàn)出欣欣向榮的發(fā)展趨勢,包括電影、音樂、新聞、著作、科研論文等都非常普及,逐漸成為我們生活中必不可少的一部分。推薦系統(tǒng)是指根據(jù)用戶的喜好,來為用戶中的成員提供個性化推薦的系統(tǒng)?,F(xiàn)實生活中這樣的系統(tǒng)比較多,如豆瓣讀書中的“豆瓣猜”功能,它就是根據(jù)你看過書和讀后評價,與整個豆瓣社區(qū)其他會員看過的書與評價,就可以給你推薦你沒讀過但感興趣的書;淘寶等購物網(wǎng)站通過用戶瀏覽記錄、登錄信息和購買信息等數(shù)據(jù)分析用戶的偏好、購買能力找到用戶感興趣的東西,提高網(wǎng)絡(luò)交叉銷售能力等。
隨著博客、微博、微信、QQ等各種網(wǎng)絡(luò)社交平臺的涌現(xiàn)和發(fā)展,學術(shù)界對網(wǎng)絡(luò)結(jié)構(gòu)及其演化的研究有了更廣泛的關(guān)注,將單一對網(wǎng)絡(luò)的研究擴展到移動互聯(lián)網(wǎng)應用、生物醫(yī)學、科技等商業(yè)應用中。個性化推薦技術(shù)是在信息檢索的基礎(chǔ)上發(fā)展起來的,它是經(jīng)過分析用戶的行為特征,挖掘每個用戶特有的偏好,然后再根據(jù)用戶的喜好從海量數(shù)據(jù)中挖掘用戶最可能感興趣的信息,推薦給用戶。
基于社區(qū)的推薦技術(shù)也逐漸成為推薦技術(shù)研究的一個熱點,研究者們利用網(wǎng)絡(luò)分析、鏈路預測等對網(wǎng)絡(luò)中的個體用戶的屬性進行分析,記錄其個性化偏好,為其進行最合適、最有價值的和最感興趣的推薦,雖然目前這些技術(shù)已經(jīng)有了很大的關(guān)注,也取得了一定的成果,但是這些研究也只是針對靜態(tài)網(wǎng)絡(luò),而網(wǎng)絡(luò)實際上是動態(tài)演化的,因此,個性化推薦系統(tǒng)中社區(qū)用戶也是動態(tài)變化的,不僅如此,社區(qū)中用戶的偏好也是可能發(fā)生變化的,所以,我們需要基于動態(tài)演化網(wǎng)絡(luò)來進行個性化推薦技術(shù)的研究,以此來提供更好的服務(wù),更合適的推薦。
2復雜網(wǎng)絡(luò)
復雜網(wǎng)絡(luò)的相關(guān)研究進入中國已經(jīng)十年,在過去的十年中,很多研究方向受到來自不同研究領(lǐng)域?qū)W者們的廣泛關(guān)注,并極大地推動了復雜網(wǎng)絡(luò)和復雜性科學的發(fā)展?,F(xiàn)代網(wǎng)絡(luò)科學對我們學習和理解復雜網(wǎng)絡(luò)有非常重要的作用,復雜網(wǎng)絡(luò)是研究復雜系統(tǒng)地一個角度和方法,研究和挖掘出了各種各樣的具有一定普適性的網(wǎng)絡(luò)特征,如無標度現(xiàn)象、小世界效應、社團性等。而進行社團結(jié)構(gòu)的研究和分析有助于我們更好的理解復雜網(wǎng)絡(luò)結(jié)構(gòu)及其演化機制。
復雜網(wǎng)絡(luò)可用來表示眾多的社會、生物和通信系統(tǒng),其中節(jié)點表示個體或者組織,邊表示節(jié)點之間的交互關(guān)系。通過對復雜網(wǎng)絡(luò)的研究,人們可以對模糊世界進行量化和預測,目前只有基于復雜網(wǎng)絡(luò)的研究成果,能夠在一定的范圍內(nèi)對事物的發(fā)展和運行進行簡單預測,并且能夠?qū)W(wǎng)絡(luò)崩潰進行一定的預告。
3動態(tài)社區(qū)檢測
網(wǎng)絡(luò)中的社團就是指一組內(nèi)部節(jié)點聯(lián)系緊密與網(wǎng)絡(luò)中其他節(jié)點鏈接稀疏的節(jié)點的集合,也就是說社團內(nèi)部節(jié)點的聯(lián)系是非常緊密的,而社團間的節(jié)點聯(lián)系相對而言聯(lián)系就比較稀疏,社團也可以被稱為“簇”,通常社團中的節(jié)點擁有相似性。
近些年來,不同領(lǐng)域的學者們從不同角度使用不同方法對社區(qū)結(jié)構(gòu)進行了深入的研究和探討,提出了許多經(jīng)典的社區(qū)檢測算法,如基于模塊化的算法,隨機游走算法,聚類算法和基于矩陣分解算法,社區(qū)檢測算法在許多方面與聚類分析很相似,許多聚類算法(k-means、DBSCAN)可以很容易改變成社區(qū)檢測算法?,F(xiàn)有的社團結(jié)構(gòu)的檢測方法大多只適用于靜態(tài)網(wǎng)絡(luò),然而大多數(shù)復雜網(wǎng)絡(luò)例如生物網(wǎng)絡(luò)、社交網(wǎng)絡(luò)、電力網(wǎng)絡(luò)等都不是靜態(tài)的,其拓撲結(jié)構(gòu)隨著時間的推移在不斷發(fā)生變化,因此網(wǎng)絡(luò)中的社團也不是靜態(tài)的,是一個消亡,新生,收縮,擴張,分裂和融合的過程,近些年了,研究著相繼提出了一些新的動態(tài)社區(qū)發(fā)現(xiàn)算法。
4個性化推薦系統(tǒng)
復雜網(wǎng)絡(luò)和社會網(wǎng)絡(luò)分析理論的研究,將社區(qū)擴展到了虛擬的社會網(wǎng)絡(luò)中,網(wǎng)絡(luò)不斷的演化,社區(qū)結(jié)構(gòu)也在隨之發(fā)生著變化,社區(qū)中的用戶以及用戶的興趣也隨著時間和環(huán)境的不斷變化而出現(xiàn)變化,社區(qū)結(jié)構(gòu)和用戶興趣模型也是一個隨著時間不斷動態(tài)變化的過程。