◆周 濤◆
推薦、預(yù)測(cè)、排序構(gòu)成了網(wǎng)絡(luò)信息挖掘三個(gè)主要的問題。在對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的功能重要性進(jìn)行排序的時(shí)候,節(jié)點(diǎn)的度和介數(shù)——這也是最廣為人知的兩種中心性指標(biāo)——被認(rèn)為是最恰當(dāng)?shù)闹笜?biāo)。2010年的時(shí)候,Kitsak等人在《自然物理》上撰文指出,度中心性僅僅刻畫了節(jié)點(diǎn)的局部性質(zhì),對(duì)于網(wǎng)絡(luò)傳播問題而言,節(jié)點(diǎn)的影響力大小主要取決于它們所在的位置,用 k-核分解的方法可以得到更準(zhǔn)確的排序。該文發(fā)表之后,節(jié)點(diǎn)排序問題變成了復(fù)雜網(wǎng)絡(luò)研究的一個(gè)熱點(diǎn)問題,呂琳媛等人2014年在《科學(xué)通報(bào)》上總結(jié)了網(wǎng)絡(luò)節(jié)點(diǎn)排序方面德爾主要進(jìn)展,并且提出了很多未解決的挑戰(zhàn)。李靜茹等人的文章討論了含權(quán)網(wǎng)絡(luò)中的節(jié)點(diǎn)排序問題,并將主分量中心性指標(biāo)推廣到了含權(quán)的情況,得到了比較好的結(jié)果。由于權(quán)重是很多網(wǎng)絡(luò)不可分割的特征之一,且權(quán)重本身和網(wǎng)絡(luò)上包括傳播在內(nèi)的若干動(dòng)力學(xué)都存在復(fù)雜的相互作用,李靜茹等人的工作對(duì)于探索權(quán)重網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性有很好的意義。當(dāng)然,針對(duì)不同權(quán)重的意義,不同的權(quán)重組織和分布形式以及不同的動(dòng)力學(xué)規(guī)則,如何設(shè)計(jì)快速、準(zhǔn)確的節(jié)點(diǎn)排序算法,依然是個(gè)遠(yuǎn)沒有解決的問題。希望本文成為這方面研究能夠被記住的起點(diǎn)之一。
針對(duì)復(fù)雜網(wǎng)絡(luò)的算法研究,包括網(wǎng)絡(luò)結(jié)構(gòu)和動(dòng)力學(xué)的基本分析工具、社區(qū)挖掘問題、圖的匹配問題、有向圖的特定子圖識(shí)別問題等,最近都受到越來越多的關(guān)注。其中,社區(qū)挖掘一直是最受關(guān)注的問題,這和本文所討論的聚簇問題其內(nèi)核是完全一致的。湯蓉等人提出了分兩步走的自動(dòng)迭代算法,先計(jì)算局部簇,再把這些局部的簇整合成一個(gè)全局的簇。我認(rèn)為這是一種很好的思路,并且可以應(yīng)用到很多復(fù)雜網(wǎng)絡(luò)算法的其他問題中,舉個(gè)例子,在估算超大規(guī)模網(wǎng)絡(luò)最短路徑的時(shí)候,就可以采用這種兩步走辦法,先在主干結(jié)構(gòu)或者說以社區(qū)為節(jié)點(diǎn)的網(wǎng)絡(luò)中尋一次路,然后再在局部尋一次路。湯蓉等人的方法中還蘊(yùn)含了重整化群的思路,在某種程度上可以看做先把一些局部簇看成節(jié)點(diǎn),然后再討論怎么把這些節(jié)點(diǎn)聚成局部簇,這樣的話,全局聚簇就可以轉(zhuǎn)變?yōu)榫植烤鄞氐膯栴}。這是一個(gè)很有潛力的方法論,我覺得這篇文章的方法如果在細(xì)節(jié)上更多考慮,還能得到遠(yuǎn)遠(yuǎn)超過現(xiàn)在的結(jié)果。
2013年《復(fù)雜性科學(xué)專欄》推出了“網(wǎng)絡(luò)科學(xué)熱點(diǎn)問題薈萃”,其中一個(gè)熱點(diǎn)就是網(wǎng)絡(luò)大數(shù)據(jù)。拋開數(shù)萬億計(jì)的萬維網(wǎng)不談,現(xiàn)在的在線社交網(wǎng)絡(luò),動(dòng)輒就有數(shù)千萬甚至數(shù)億用戶,對(duì)于超大規(guī)模網(wǎng)絡(luò)進(jìn)行深度分析是每一位學(xué)者都能看到的熱點(diǎn)。然而,張愷等人的這篇文章走向了另外一個(gè)極端,通過調(diào)查問卷,分析一個(gè)僅有31人的朋友社交網(wǎng)絡(luò)。張愷等人通過問卷,把朋友關(guān)系區(qū)分為“普通朋友”、“比較好的朋友”、“很好的朋友”和“最好的朋友”四類,進(jìn)行拓?fù)浣Y(jié)構(gòu)的比較分析。盡管我個(gè)人比較懷疑在這么小的網(wǎng)絡(luò)中討論小世界效應(yīng)是否有價(jià)值,但是這種集中力量分析小網(wǎng)絡(luò)的思路和方法在我們這個(gè)“大數(shù)據(jù)時(shí)代”也不應(yīng)該放棄,因?yàn)槭聦?shí)上現(xiàn)在絕大多數(shù)社交網(wǎng)絡(luò)的基本理論認(rèn)知都是來源于深入分析很小規(guī)模的網(wǎng)絡(luò)。當(dāng)然,我希望未來這方面的研究不僅僅是探討一些大家都知道的拓?fù)涮卣?,或者給出一個(gè)顯而易見的結(jié)論——譬如朋友關(guān)系越親密網(wǎng)絡(luò)連通性越差,而是能夠在社會(huì)心理層面給出一些深刻的洞見,回答一些不那么顯然的問題,例如大家心目中的交際花和好好先生,是否會(huì)有更多的特別鐵的朋友?