国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網絡空間測繪技術研究

2016-11-03 08:01趙帆羅向陽劉粉林
網絡與信息安全學報 2016年9期
關鍵詞:網絡空間繪制實體

趙帆,羅向陽,劉粉林

(1. 解放軍信息工程大學網絡空間安全學院,河南 鄭州 450001;2. 解放軍信息工程大學數學工程與先進計算國家重點實驗室,河南 鄭州 450001)

網絡空間測繪技術研究

趙帆1,2,羅向陽1,2,劉粉林1,2

(1. 解放軍信息工程大學網絡空間安全學院,河南 鄭州 450001;2. 解放軍信息工程大學數學工程與先進計算國家重點實驗室,河南 鄭州 450001)

網絡空間測繪技術是一種網絡共性基礎與應用技術,對網絡空間測繪相關技術的研究進展進行了綜述和討論。首先,闡述了網絡空間測繪的內涵,給出了網絡空間測繪一般技術框架;然后,從探測層、映射層和繪制層分別闡述了網絡空間測繪相關技術的研究進展;最后,指出了網絡空間測繪亟待解決的一些關鍵問題。

網絡空間測繪;探測;映射;繪制;地理空間;社會空間

1 引言

隨著計算機技術的發(fā)展,網絡已經成為國家政治、經濟、軍事等社會系統(tǒng)存在和發(fā)展的重要基礎,網絡空間已經成為人類生產生活的“第二類生存空間”,網絡一旦受損,幾乎所有的社會系統(tǒng)都將無法運行或發(fā)揮作用。因此,亟需對網絡空間實施高效的管理、合理的資源分配以及有效的安全監(jiān)測和防護。

地圖是描繪地理空間信息的重要載體,自古以來就是運籌帷幄、指揮作戰(zhàn)的重要工具,是指揮員的“眼睛”“行軍的無聲向導”“協(xié)同作戰(zhàn)的共同語言”。隨著互聯(lián)網的發(fā)展,地圖的應用越來越廣,已成為面向位置的服務(LBS)的核心基礎。然而,網絡空間尚缺乏類似地理空間地圖的、可全面描述和展示網絡空間信息的“網絡地圖”。類似于地理空間測繪,構建網絡空間地圖的技術稱為“網絡空間測繪”。

網絡空間測繪技術通過網絡探測、采集、處理、分析等方式,獲得網絡空間基礎設施、用戶及服務等網絡資源在網絡空間、地理空間以及社會空間的相關屬性,并將這些屬性以邏輯圖和地理信息圖的形式繪制出來,從而直觀實時地反映出當前網絡空間資源各個屬性的狀態(tài)、發(fā)展趨勢等。

當前,與網絡空間測繪技術相關的研究工作已經開展,如美國國防部國防高級研究計劃局于2012年9月啟動的網絡戰(zhàn)發(fā)展項目“X計劃”[1],目的是生成網絡空間作戰(zhàn)態(tài)勢圖、制定作戰(zhàn)方案、實施網絡作戰(zhàn)行動等;美國國家安全局和英國國家通信總局(GCHQ)聯(lián)合開展的研究項目“藏寶圖(treasure map)”計劃,聚焦于邏輯層捕獲路由及自治系統(tǒng)的數據,試圖繪制出一張“近乎實時的、交互式的全球互聯(lián)網地圖”[2]。上述研究的主要技術均屬網絡空間測繪研究范疇,可見,網絡空間測繪技術在國家安全和軍事領域具有十分廣泛的應用前景。

本文首先闡述網絡空間測繪概念的基本內涵,然后從探測層、映射層和繪制層3個層次分別介紹網絡空間測繪相關的關鍵技術及研究現(xiàn)狀,最后指出網絡空間測繪技術亟待解決的一些關鍵問題。

2 網絡空間測繪基本概念

2.1 網絡空間測繪技術的定義

目前,尚未見正式的公開文獻對網絡空間測繪技術進行嚴格定義。本文從狹義和廣義2個角度分別闡述網絡空間測繪技術的基本內涵。

從狹義上講,網絡空間測繪技術主要指在互聯(lián)網環(huán)境下,利用網絡探測、采集或挖掘等技術,獲取網絡設備等實體資源、用戶和服務等虛擬資源的網絡屬性,通過設計有效的定位算法和關聯(lián)分析方法,將實體資源映射到地理空間,將虛擬資源映射到社會空間,并將探測結果和映射結果繪制出來。

從廣義上講,網絡空間測繪的研究范圍包括互聯(lián)網、電信網、工業(yè)控制網等各種類型的網絡,探測對象除互聯(lián)網資源外,還包括其他各種網絡上的資源。

本文討論的主要是狹義的網絡空間測繪技術。

2.2 網絡空間測繪主要研究內容

網絡空間測繪技術研究的對象包括實體資源和虛擬資源兩類。實體資源根據設備用途可分為網絡基礎設施和接入設備,也可根據有無IP分為有IP化的實體網元和無IP化的基礎資源;虛擬資源包括網絡虛擬人物,網絡虛擬社區(qū),以及文本信息內容、音視頻、網站等網絡服務等。

網絡空間測繪技術的目標是實現(xiàn)對來源眾多、類型各異的互聯(lián)網資源的全面測繪,涉及的技術較多。本文從探測層、映射層和繪制層3個層次分別給出網絡空間測繪技術的相關研究內容,總體框架如圖1所示。

圖1 網絡空間測繪技術總體框架

其中,探測層是網絡空間測繪技術的基礎層,為映射層提供探測基礎數據,主要研究實體資源的拓撲探測技術,組件識別技術和對文本信息內容、音視頻、網站等的探測分析技術,可簡要歸納為探測通道與平臺技術、多種探測技術和探測結果分析技術;映射層是網絡空間測繪技術的核心層,主要研究實體資源向地理空間映射技術和網絡虛擬人物、虛擬社區(qū)等虛擬資源向社會空間映射技術,并將映射結果提供給繪制層;繪制層將探測結果和映射結果可視化,主要研究邏輯圖繪制技術和地理信息圖繪制技術。

下面分別介紹網絡空間測繪中探測層、映射層和繪制層主要相關技術基本原理及研究進展。

3 網絡空間測繪探測層關鍵技術與研究進展

3.1 探測層技術框架

探測層是網絡空間測繪技術的基礎層,主要作用是基于統(tǒng)一的高效探測通道和平臺,利用針對特定對象的探測技術,分別獲取網絡實體資源和虛擬資源的相關網絡屬性,并對探測結果進行分析。圖2為探測層的總體技術框架。

圖2 探測層技術框架

如圖2所示,探測層研究的主要內容包括網絡探測通道與平臺技術、探測技術和探測結果分析技術。其中,根據探測對象的不同,探測技術分為實體資源探測技術和虛擬資源探測技術兩類。下面分別簡要介紹這3種技術。

3.2 探測通道與平臺技術

網絡空間資源多樣、規(guī)模龐大,為了能夠高效、迅速地對網絡空間資源發(fā)起探測,且不影響網絡的正常運行,需要構建統(tǒng)一的網絡探測通道與平臺。探測通道與平臺技術通過構建統(tǒng)一的分布式網絡探測平臺,實現(xiàn)廣泛分布式部署的探測終端統(tǒng)一化管理和高效持續(xù)探測,為發(fā)起可靠探測提供探測環(huán)境和技術保障。目前,分布式探測系統(tǒng)已成為研究人員了解網絡狀態(tài)的首選工具。比較有代表性的分布式探測系統(tǒng)有塞浦路斯大學的IPMicra[3]、比爾肯大學的SE4SEE[4]、佐治亞理工學院的Apoidea[5]等。Spring等[6]的RocketFuel項目首次全面探測了大型ISP拓撲。Katz-Bassett[7]實現(xiàn)了reverse-traceroute,利用時間戳和記錄路由選項來識別反向路徑。在掃描工具方面有業(yè)內常用的功能強大的Nmap[8],也有最近出現(xiàn)的以快著稱、45 min掃描整個IPv4空間的Zmap[9]。

3.3 探測技術

根據探測的對象不同,網絡空間探測技術可分為實體資源探測技術和虛擬資源探測技術兩類,根據探測的方式不同,網絡空間探測技術還可分為主動探測和被動探測兩類,本文主要根據前者分類進行介紹。

3.3.1 實體資源探測技術

實體資源探測技術的探測目標包括網絡基礎設施和各種接入設備,涉及的技術主要包括網絡拓撲發(fā)現(xiàn)技術和網絡設備組件識別技術等。

網絡層拓撲發(fā)現(xiàn)一般可分為4個層次:IP接口級拓撲發(fā)現(xiàn)、路由器級拓撲發(fā)現(xiàn)、入網點(PoP,point of presence)級拓撲發(fā)現(xiàn)和AS(自治系統(tǒng))級拓撲發(fā)現(xiàn)。對網絡空間測繪而言,通常更關注前3個層次。在IP接口級拓撲測量方面,現(xiàn)有主要方法包括基于簡單網絡管理協(xié)議(SNMP,simple network management protocol)[10,11]、基于網際組管理協(xié)議(IGMP, Internet group management protocol)[12~14]、基于Traceroute工具等拓撲測量方法。在路由器級網絡拓撲測量方面,研究的重點是解決路由器別名問題,即別名解析[15]。近年來,研究者們主要利用IP時間戳選項來解決別名歸并的問題。Sherry等[16]提出了基于IP時間戳選項的別名判別方法,Marchetta等[17]提出了基于時間戳選項和UDP的Pythia算法來用于別名解析。在PoP級網絡拓撲測量方面,首次嘗試探索PoP級網絡拓撲的是Spring等[18],提出了基于DNS解析的PoP提取算法,通過對大量探測結果進行分析,以網絡服務提供商(ISP)的命名慣例提取合并不同的PoP。Madhyastha等[19]提出iPlane方法,利用Mercator方法對各個IP進行別名歸并,并通過Rocketfuel和Sarangworld這2個數據源,將DNS域名指定到盡可能多的網絡接口。Feldman等[20]提出的PoP提取算法通過延遲進行初步劃分,接著采取一種結構性的方法進一步劃分,在初步劃分的結果中尋找具有特定結構的二分子圖,進而完成PoP的劃分提取。Shavitt等[21,22]提出了基于IP地理位置數據庫和時延測量提高PoP級的網絡拓撲定位準確性的算法。經過多年研究,網絡拓撲探測與分析技術研究已取得很大進展。然而,如何得到完整準確的網絡拓撲結構仍存在一些亟待研究的問題,探測路徑中的匿名路由器、路由器的別名歸并等仍是研究的難點。對網絡空間測繪技術而言,探測分析區(qū)域性的網絡,得到探測目標所在區(qū)域的網絡拓撲結構更具針對性,也是需解決的關鍵問題之一。

網絡設備組件的探測識別技術能夠為網絡空間測繪提供更詳細的設備信息,如設備類型、操作系統(tǒng)等。該技術通常通過設備在通信過程中攜帶的某種信息對其進行認證和辨識,實現(xiàn)的方式主要包括主動和被動2種。其中,主動式主要是從探測源將構造的信息發(fā)送給待識別的目標設備,目的是通過觸發(fā)某些期望的設備回應來對設備進行辨識;被動式不主動向目標發(fā)送信息,而是根據設備向外發(fā)送請求時,從其中攜帶的信息來分析判斷。被動的識別方式對應用環(huán)境的要求較低,對網絡狀態(tài)影響較小,但其能夠提供的信息量和可靠性不如主動式。目前,針對設備識別的研究通常是被動式的。Kohno 等在文獻[23]中提出了根據設備時鐘的偏移值對遠程網絡設備進行識別的方法,F(xiàn)ink[24]對該方法進行了改進,引入線性回歸的統(tǒng)計方法來判斷時鐘偏移,并給出了需要某種程度的準確度時樣本數量的計算公式,使這種設備識別的準確度可控。

3.3.2 虛擬資源探測技術

在網絡空間測繪技術的相關研究中,開展虛擬資源探測,涉及的現(xiàn)有技術主要包括特定信息內容快速探測和話題發(fā)現(xiàn)技術、音視頻內容探測技術、網站自動探測技術等。目前,對上述技術的研究已取得了一定進展。

在文本資源探測方面,主要包括內容分析、關聯(lián)分析、社會信息網絡挖掘等問題。向量空間模型(VSM, vector space model)、潛在語義模型(LSI, latent semantic indexing)等都試圖在語法甚至語義層面給2個文本一個相似性度量[25~27]。在特定信息內容快速探測和話題發(fā)現(xiàn)方面,文獻[28]提出利用概念性動態(tài)隱含狄利克雷(CDLDA,conceptual dynamic latent dirichlet allocation)模型對文本中的動詞和名詞的比例分析,來對會話內容中的話題進行檢測和追蹤;文獻[29]提出利用增量聚類框架,并應用一系列內容和時間相關的特點來探測新的熱門話題。特定音頻內容快速探測分析包括多語言識別和固定音頻檢索。2006年,Hinton等[30]將深度神經網絡技術應用于語音識別領域并取得良好效果。音頻檢索包括基于直方圖統(tǒng)計階段和基于音頻指紋DNA的散列檢索階段。特定視頻內容的探測分析主要包括視頻的特征表示、語義屬性分析以及多模融合識別等內容。遞歸神經網絡已經應用于視頻的時空特征提取上。語義的屬性分析也同樣依賴于近期圖像物體識別與目標檢索方面的進展來進行特定人物、標志、物體等的分析與識別。

3.4 探測結果分析技術

3.4.1 實體資源探測結果分析

對主機、路由器、服務器等實體資源的定位而言,獲取可靠的網絡拓撲十分重要,網絡安全防護、路由器負載均衡、匿名路由等多種因素嚴重影響了探測結果的可用性,因此,需要對網絡探測的結果進行融合分析,以獲得高可靠性可用的網絡拓撲結果。下面簡要介紹網絡設備拓撲結構融合分析涉及的主要技術。

1) 網絡路徑重構技術

網絡路徑重構技術主要用于解決目標網絡拓撲探測結果中由于路由器多個別名導致的路徑冗余、目標所在子網的判別等問題。

2) 拓撲分析技術

在將實體資源映射到地理空間時,通常需要獲取目標實體資源與周邊區(qū)域網絡節(jié)點的連接情況,如時延、跳數等。區(qū)域性拓撲分析技術能夠從海量的拓撲探測結果中,分析得到目標相關的可用拓撲信息,為后期的實體資源地理位置映射提供數據基礎。面向網絡可達性與起源變化的拓撲分析技術能夠從探測結果中分析得到不同源與不同目標之間的連通性和可達性,可為后期定位算法的設計提供幫助。

3) 拓撲語義標注技術

對網絡設備類型、操作系統(tǒng)、性能、重要性等多種屬性的準確了解能夠為全面掌握網絡狀態(tài)提供幫助,網絡拓撲語義標注技術能夠根據需求,從不同的層面對網絡拓撲進行準確的描述。

3.4.2 虛擬資源探測結果分析

網絡空間虛擬資源探測結果分析技術主要圍繞文本內容、音視頻網站、博客論壇以及其他互聯(lián)網平臺上的特定內容資源,開展快速發(fā)現(xiàn)、關聯(lián)分析、內容分析與理解等方面的研究,主要技術如下。

1) 特定信息內容快速發(fā)現(xiàn)和關聯(lián)分析技術

特定信息內容快速發(fā)現(xiàn)和關聯(lián)分析技術主要用于快速發(fā)現(xiàn)多個網絡平臺上的特定信息內容,并對其進行重要性與話題特征的標注或多語種的翻譯等。通過對發(fā)現(xiàn)的信息內容的關聯(lián)分析,可以從中挖掘到潛在的信息,得到特定信息內容的傳播規(guī)律和分布特點等。

2) 特定音頻內容的檢索與識別技術

特定音頻內容的檢索與識別技術主要對復雜多變聲學環(huán)境下的音頻進行處理,對海量多語言網絡音頻數據中的特定語種、說話人和特定內容進行檢測,對音頻的語種進行識別,以及對互聯(lián)網海量數據下的音頻模板進行匹配,最終實現(xiàn)對包含特定信息的音頻檢索與識別。

3) 特定視頻內容的檢測和識別技術

特定視頻內容的檢測和識別技術通過對視頻中的人、物等關鍵元素的提取,形成針對視頻內容的結構化描述,利用有效的視頻識別算法,實現(xiàn)對視頻中特定場景的檢測和識別,并能夠根據給定的樣例檢索出相關視頻。

4 網絡空間測繪映射層關鍵技術與研究進展

4.1 映射層技術框架

映射層的主要目的是利用探測層提供的相關數據,將網絡實體資源映射到地理空間,將網絡虛擬資源映射到社會空間。映射層的技術框架如圖3所示。

圖3 映射層技術框架

其中,實體資源向地理空間映射技術主要包括地標挖掘與采集技術、目標網絡結構分析技術、網絡實體定位技術等,虛擬資源向社會空間映射技術主要包括虛擬人畫像技術和虛擬社區(qū)發(fā)現(xiàn)技術等。

4.2 實體資源向地理空間映射技術

4.2.1 基本概念和主要步驟

在實體資源向地理空間映射技術中,本文重點討論具有IP的網絡實體資源的地理位置定位技術,涉及的基本概念主要如下。

目標:待定位的IP地址,通常假設其有一個固定的地理位置。

探測源:給目標發(fā)送探測分組的主機,一般自身地理位置已知。

地標:自身地理位置已知的IP地址,與探測點不同的是,它不能主動發(fā)送與定位有關的數據分組,只能響應探測分組。

定位服務器:用于向探測源發(fā)送測量等命令,收集、處理探測源提交的測量數據,執(zhí)行定位算法,并將最終的定位結果反饋給用戶。

實體資源的定位過程如圖4所示,可簡要概括為:首先,定位服務器在收到待定位目標的IP地址后,根據定位精度需求和定位算法的需要部署探測源,并向各探測源發(fā)送相應的測量或查詢指令;其次,探測源根據收到的定位服務器的指令,執(zhí)行相應的操作,如測量與目標或地標的時延或拓撲連接關系等,并將測量的結果提交給定位服務器;最后,定位服務器將探測源提交的信息進行處理后,執(zhí)行定位算法,將定位的結果存入地標庫并輸出。

圖4 實體資源定位過程

4.2.2 主要相關技術

1) 實體地標獲取與評估技術

地標是實現(xiàn)將網絡實體映射到地理位置的基準點。在一個區(qū)域內數量較大且分布均勻的地標點,既可為該區(qū)域內的目標實體定位提供支撐,也可用于驗證定位算法的有效性?,F(xiàn)有地標獲取方法主要有兩類:基于Web挖掘的地標獲取方法和基于IP定位數據庫的地標獲取方法。

在基于Web挖掘的地標獲取研究方面,文獻[31]通過對特定互聯(lián)網論壇的挖掘來獲得大量的城市級可靠地標,文獻[32]提出的方法首先向地圖服務發(fā)送指定區(qū)域的查詢請求,地圖服務會將該區(qū)域內或附近的公司、學術機構及政府機關等組織機構以列表的形式返回,列表中包含這些組織機構詳細的地理位置及其主頁域名;然后由域名解析出其IP地址,從而得到<域名、IP地址、地理地址>映射關系。該方法可以有效地在Web服務發(fā)達的地區(qū)獲取街道級地標,文獻[32,33]等都采用此方法采集街道級地標。

在基于IP定位數據庫的地標獲取方面,目前有很多公司在維護和發(fā)布將IP地址映射到地理位置的數據庫,如MaxMind[34]、IP2Location[35]及Quova[36]等。此外,WHOIS數據庫[37]中也有IP地址塊的地理位置信息,即利用Whois查詢可得到一個IP地址所在地址塊在WHOIS數據庫中記錄的位置。基于IP定位數據庫的地標獲取方法,通常選取多個定位數據庫中地理位置一致的IP用于實驗研究。

2) 網絡實體定位技術

網絡實體定位技術是實現(xiàn)將實體資源映射到地理空間的核心技術。從公開的文獻來看,國際上關于網絡實體定位技術的研究已經開展了十余年,取得了一些優(yōu)秀的研究成果;國內的解放軍信息工程大學網絡空間測繪課題組率先開展了網絡空間測繪相關研究,并提出了一些新的網絡實體定位方法。現(xiàn)有網絡實體定位方法大致可分為3類:基于數據庫查詢的定位、基于數據挖掘的定位和基于網絡測量的定位。

基于數據庫查詢的定位方法由于不需要大量測量,且定位速度快、計算開銷小而得到廣泛應用。當前互聯(lián)網上已有多種對外提供查詢的IP定位數據庫,如Maxmind[34]、IP2location[35]、Quoval[36]、Whois數據庫[37]等。這些數據庫包含IP地址及其地理位置的映射關系,并對外提供查詢接口。用戶只需提交要查詢的IP地址,通常能夠很快獲得查詢結果。此外,文獻[38]通過引入IP Number的概念,自主構建了IPMapping數據庫,文獻[39]利用分布式爬蟲等技術提高了IP2location數據庫的覆蓋范圍和城市級定位準確率。

基于數據挖掘的定位算法試圖從具有組織機構和用戶地理位置信息的網站、手機應用等數據來源中,挖掘地理位置與IP地址之間的關系。典型的定位方法主要包括Structon[33]、Checkin—Geo[40]等。Structon算法首先使用網絡爬蟲從互聯(lián)網上抓取機構等的主頁信息,從中提取電話區(qū)號、聯(lián)系地址等能夠表達地理位置的信息,然后通過查詢域名將URL轉化為IP,從而將IP地址與地理位置關聯(lián)起來,最后將IP按照地址段進行迭代推導,擴大可定位的IP地址范圍,該方法的準確性依賴于所抽取的主頁位置信息與IP地址的映射關系是否準確,易受服務器托管等情況的影響。Checkin—Geo算法首先從某種手機端應用獲取“用戶ID—地理位置”關系數據,再從對應的PC端應用程序中獲取“用戶ID—LOG信息—IP地址”關系數據,最后利用機器學習等方法掌握用戶活動規(guī)律,建立起“IP地址—地理位置”關系以實現(xiàn)目標IP定位。該方法可對用戶所處的位置進行較為可靠的分析,將用戶定位至家庭、工作場所或特定的區(qū)域,但需要從手機服務提供商和網絡服務提供商處獲得關于目標的大量歷史數據,因此難以適用于非協(xié)作環(huán)境。

基于網絡測量的定位方法通過測量探測源與目標節(jié)點之間的時延(或在此基礎上結合拓撲信息),用不同的方法將時延轉換為地理距離,以不同的方式對目標節(jié)點產生距離約束,然后估計出目標節(jié)點的位置。根據產生距離約束的方式不同,可進一步分為基于時延的定位算法、基于概率估計的定位算法和基于拓撲的定位算法3類。

基于時延的定位算法主要包括Shortest Ping[41]、GeoPing[41]、CBG (constraint-based geolocation)[42]、SPRG(segmented polynomial regression approach)[43]、Geo-RX[44]、GeoWeight[45]等,這些方法直接根據時延的特點判斷目標距離探測源(地標)的遠近,或將時延以某種關系轉換為距離約束(通常為目標距離探測源的最遠距離),進而估計出目標的可能位置,算法的原理較為簡單,但容易受到時延測量不準確的影響,定位精度不高。基于概率估計的典型定位算法主要包括:LBG(learning-based geolocation)[46]、ELC (enhanced learning classifier)[47]、MLE-based Approach(maximum likelihood estimation based approach)[48]、Spotter[49]、GBLC[50]等,這些算法不假設時延和地理距離符合某種線性關系,而是通過對大量的時延—距離數據進行統(tǒng)計,得出時延大小與地理距離的概率統(tǒng)計關系,能夠降低單次時延測量不準確的影響,但往往定位精度較低,通常僅能夠給出城市級定位?;谕負涞牡湫投ㄎ凰惴ㄖ饕蠸LG(street-level geolocation)[32]、GeoTrack[41]、TBG(topology-based geolocation)[51]、Octant[52]、GBRF[53]、GBPF[54]等,這些算法使用目標的路徑或地標的拓撲信息,或在時延基礎上結合拓撲信息,然后進行交互驗證來實現(xiàn)對目標的定位,定位精度較高,但容易受到匿名路由的影響。

圖5 虛擬資源向社會空間映射技術框架

表1 典型定位算法的誤差比較

現(xiàn)有典型定位算法在測試算法性能時,通常是在理想的實驗網絡(如PlanetLab)或連通性較好的網絡環(huán)境下進行的,部分算法的定位誤差如表1所示。由表1可知,現(xiàn)有定位算法通常只能實現(xiàn)區(qū)域級或城市級的定位精度,僅有少量的算法(如表1中的SLG算法)能夠實現(xiàn)較高精度的定位。

4.3 虛擬資源向社會空間映射技術

4.3.1 技術框架

虛擬資源向社會空間映射技術框架如圖5所示。

虛擬資源向社會空間映射技術實現(xiàn)將網絡社會成員映射到現(xiàn)實社會成員?;具^程可簡要概括為:首先,利用3.3.2節(jié)中的虛擬資源探測技術對網絡上與用戶相關的多源海量網絡日志發(fā)起探測或采集,對得到的來源不同、結構各異的基礎信息進行處理,實現(xiàn)一體化表達;其次,利用虛擬人物活動地點推斷方法、虛擬群體關系挖掘方法、虛擬群體軌跡發(fā)現(xiàn)方法等將網絡社會成員與現(xiàn)實社會成員相關聯(lián),實現(xiàn)將網絡社會成員向社會成員的映射;最后,將映射結果存入虛擬人畫像知識庫。

4.3.2 主要相關技術

實現(xiàn)虛擬資源向社會空間映射涉及的技術主要包括虛擬人物活動地點推斷、虛擬群體關系挖掘和虛擬群體軌跡發(fā)現(xiàn)等技術。其中,虛擬人物活動地點推斷技術從采集到的數據中綜合分析與位置相關的信息,以推斷虛擬人物的活動地點,尤其在社交網絡環(huán)境下,人們常常有意或無意地通過交互內容來透露自己的地理信息和短期活動計劃,因此,從原始用戶產生文本中檢索虛擬人物在其中涉及的地理興趣點(POI)詞條,通過設計有效的消歧義算法確定真實的POI,結合POI資源庫和用戶行為模式,可推斷POI的具體地理位置,最終實現(xiàn)對特定人物位置信息的挖掘,如Rae等[55]提出了一個基于線性條件隨機場CRF模型的POI抽取算法,實現(xiàn)了對常規(guī)文本中的POI抽取。

虛擬群體關系挖掘技術通過挖掘不同虛擬人物之間的關聯(lián)關系,實現(xiàn)對虛擬群體的有效描述。

虛擬群體軌跡發(fā)現(xiàn)技術通過對群體中虛擬人的活動規(guī)律、活動軌跡的關聯(lián)分析,來獲取整個群體的行為特點、活動方式,實現(xiàn)對特定虛擬群體軌跡模式的發(fā)現(xiàn)。

5 網絡空間測繪繪制層關鍵技術與研究進展

5.1 繪制層技術框架

網絡空間繪制技術在探測結果和映射結果的基礎上,將多維的網絡空間資源及其關聯(lián)關系投影到一個低維的可視化空間,構建網絡空間的分層次、可變粒度的網絡地圖,實現(xiàn)對多變量時變型網絡資源的可視化。繪制層的技術框架如圖6所示。

圖6 繪制層技術框架

網絡空間的繪制主要包括邏輯圖繪制和地理信息圖繪制,其中邏輯圖繪制主要是通過構建拓撲可視化模型,利用二維、三維等空間布局方法將探測得到的網絡拓撲可視化,地理信息圖繪制技術利用數據同化技術、集成可視化技術、輔助分析技術等將網絡空間資源的網絡屬性和地理空間屬性進行可視化。

5.2 邏輯圖繪制技術

網絡空間邏輯圖的繪制主要指對網絡拓撲圖的繪制,主要目標是將網絡中的節(jié)點和連接狀況以符合其內在特性的方式完整清晰地展現(xiàn)在用戶眼前,從而為人們了解和分析網絡空間的整體狀況提供直觀素材和操作平臺。在繪制邏輯圖時,往往要求將其性質、度量及模型等體現(xiàn)在可視化結果中,研究重點通常為解決可視區(qū)域和邏輯圖規(guī)模之間的矛盾,以及便于理解的可視化策略的選擇或設計。

5.3 地理信息圖繪制技術

網絡空間地理信息圖繪制技術主要實現(xiàn)基于地理空間基礎數據的網絡空間測繪數據可視化表達,在繪制網絡空間地理信息圖時,涉及的技術主要包括地理空間和網絡空間數據的同化技術、網絡空間信息和地理空間信息的集成可視化技術、網絡節(jié)點輔助分析技術等。其中,地理空間和網絡空間數據的同化技術是一種數據處理技術,用于將來自網絡空間和地理空間的不同格式、不同性質、不同模型的數據進行融合處理,為可視化提供可用的基礎數據;網絡空間信息和地理空間信息的集成可視化技術用于集成同化后的網絡數據和地理數據,以便于用戶理解和后期查詢、預測等應用方式進行展示;網絡節(jié)點輔助分析技術通過對映射結果周邊的網絡環(huán)境和地理環(huán)境的分析,來評估映射結果的合理性、可信度和可用性,為修正映射結果提供依據。

6 有待進一步研究的問題

通過上述對網絡空間測繪技術研究進展的梳理可知,當前關于網絡空間測繪技術的研究已經取得了一定進展,但是,實現(xiàn)對網絡空間資源的精確測繪,仍有一些問題亟待解決,具體如下。

1) 如何實現(xiàn)對內網和暗網資源的探測?

分布或存儲在內網和暗網中的資源豐富,是網絡空間資源態(tài)勢的重要組成部分。但是,內網中的資源或特定目標往往處于防火墻、VPN等多種技術保護之下,暗網中的資源無法通過標準的搜索引擎進行查找,如何在不影響設備正常工作、不侵犯用戶個人隱私的情況下,全面掌握內網資源或快速發(fā)現(xiàn)內網和暗網中的特定目標是網絡空間探測技術亟待解決的問題之一。

2) 如何實現(xiàn)對實體資源的高精度地理位置映射?

服務器、路由器、網絡主機等網絡實體資源是網絡空間資源的重要組成部分,是網絡空間測繪技術關注的重要對象之一。但上述網絡實體資源自身通常不具備定位功能,且無法向外界通告自身位置,其網絡唯一標識IP地址也不包含位置信息?,F(xiàn)有基于IP的網絡實體定位方法雖然取得了很大進展,但大多僅能給出城市級的位置信息,且可靠性難以保證,因此,定位精度和定位結果的可靠性仍有待提高。

3) 如何利用大數據分析技術實現(xiàn)對網絡虛擬人物/社團的精確畫像?

大數據時代已然來臨,網絡上與虛擬人物相關的信息規(guī)模龐大,但這些數據往往類型多樣,既包含結構化的數據,又包含非結構化數據,且數據的真?zhèn)坞y辨。如何從海量數據中挖掘、分析與虛擬人物/社團相關的信息,進而將網絡虛擬人物與其社會身份準確關聯(lián)起來,是網絡空間映射技術需要解決的問題之一。

4) 如何將海量數據進行可視化?

網絡空間資源類型多樣,規(guī)模龐大,地理空間數據同樣多源異構,如何將2種空間數據進行格式轉換、時空基準統(tǒng)一及信息融合,實現(xiàn)對網絡空間數據和地理空間數據的一體化實時動態(tài)可視化表達,并能夠基于地理空間基礎數據對網絡節(jié)點的地理位置映射精度和可靠性進行分析,是網絡空間繪制技術需要解決的問題之一。

7 結束語

本文對網絡空間測繪技術研究進展進行了綜述。首先,給出了網絡空間測繪技術的定義和主要研究內容,提出了網絡空間測繪技術框架,主要包括探測層、映射層和繪制層3個層次;其次,分別介紹了3個層次涉及的相關技術及其研究進展,其中,探測層主要包括探測通道與平臺技術、多種探測技術和探測結果分析技術,映射層主要包括實體資源向地理空間映射技術和虛擬資源向社會空間映射技術,繪制層主要包括邏輯圖繪制技術和地理信息圖繪制技術;最后,給出了網絡空間測繪技術目前亟待解決的幾個關鍵問題。網絡空間測繪作為網絡空間安全和應用的重大共性關鍵基礎技術,必將越來越多地受到學術界和產業(yè)界的關注。

[1] [EB/OL]. https://en.wikipedia.org/wiki/Plan_X.

[2] [EB/OL].http://mobile.businessinsider.com/nsa-treasure-map-project-2014-9.

[3] PAPAPETROU O, SAMARAS G. Ipmicra: toward a distributed and adaptable location aware Web crawler[C]//The 8th East European Conference on Advances in Databases and Information Systems. 2004.

[4] CAMBAZOGLU B B, TURK A, KARACA E, et al. SE4SEE: a grid-enabled search engine for south-east Europe[C]//The International Conference on Hypermedia and Grid Systems. 2005: 223-227.

[5] SINGH A, SRIVATSA M, LIU L, et al. Apoidea: a decentralized peer-to-peer architecture for crawling the world wide Web[C]//International Workshop on Distributed Information Retrieval. 2003: 126-142.

[6] SPRING N, MAHAJAN R, WETHERALL D. Measuring ISP topologies with rocketfuel[J]. ACM Sigcomm Computer Communication Review, 2002, 32(4): 133-145.

[7] KATZ-BASSETT E, MADHYASTHA H, ADHIKARI V, et al. Reverse traceroute[C]//The 7th Usenix Symposium on Networked Systems Design and Implementations (NSDI). 2010: 219-234.

[8] Nmap: a free network mapping and security scanning tool[EB/OL]. http://nmap.org/.

[9] DURUMERIC Z, WUSTROW E, HALDERMAN J A. ZMap: fast internet wide scanning and its security applications[C]//The 22nd Usenix Security Symposium. 2013: 605-620.

[10] LI J. Network topology discovery based on SNMP[C]//The 9th International Conference on Computational Intelligence and Security(CIS). 2013: 194-199.

[11] YIN J B, LI Y M, WANG Q, et al. SNMP-based network topology discovery algorithm and implementation[C]//The International Conference on Fuzzy Systems and Knowledge Discovery(FSKD). 2012: 2241-2244.

[12] MARCHETTA P, MéRINDOL P, DONNET B, et al. Topology discovery at the router level: a new hybrid tool targeting ISP networks[J]. Selected Areas in Communications, 2011, 29(9):1776-1787.

[13] MARCHETTA P, Mérindol P, DONNET B, et al. Quantifying and mitigating IGMP filtering in topology discovery[C]//The Conference on Global Communications (GLOBECOM). 2012: 1871-1876.

[14] MARCHETTA P, PESCAPE A. DRAGO: detecting, quantifying and locating hidden routers in traceroute IP paths[C]//The 32nd IEEE International Conference on Computer Communications(INFOCOM). 2013: 3237-3242.

[15] GUNES M H, SARAC K. Resolving IP aliases in building traceroute-based Internet maps[J]. IEEE/ACM Transactions on Networking (ToN), 2009, 17(6): 1738-1751.

[16] SHERRY J, KATZ-BASSETT E, PIMENOVA M, et al. Resolving IP aliases with prespecified timestamps [C]//The 10th ACM Sigcomm Conference on Internet Measurement. 2010: 172-178.

[17] MARCHETTA P, PERSICO V, PESCAPè A. Pythia: yet another active probing technique for alias resolution [C]//The 9th ACM Conference on Emerging Networking Experiments and Technologies. 2013: 229-234.

[18] SPRING N, MAHAJAN R, WETHERALL D, et al. Measuring ISP topologies with rocketfuel[J]. IEEE/ACM Transactions on Networking, 2004, 12(1): 2-16.

[19] MADHYASTHA H V, ISDAL T, PIATEK M, et al. iPlane: an information plane for distributed services[C]//The 7th Symposium on Operating Systems Design and Implementation. 2006: 367-380.

[20] FELDMAN D, SHAVITT Y. Automatic large scale generation of internet pop level maps[C]//The Conference on Global Communications (GLOBECOM). 2008: 1-6.

[21] SHAVITT Y, ZILBERMAN N. Geographical internet pop level maps[C]//The International Conference on Traffic Monitoring & Analysis. 2012: 121-124.

[22] SHAVITT Y, ZILBERMAN N. Improving IP geolocation by crawling the Internet PoP level graph[C]//The Conference on IFIP Networking. 2013: 1-9.

[23] KOHNO T, BROIDO A, CLAFFY K C. Remote physical device fingerprinting[J]. IEEE Transactions on Dependable and Secure Computing, 2005, 2(2): 93-108.

[24] FINK R. A statistical approach to remote physical device fingerprinting[C]//The Conference on Military Communications. 2007:1-7.

[25] DANISMAN T, ALPKOCAK A. Feeler: emotion classification of text using vector space model[C]//The AISB Convention on Communication, Interaction and Social Intelligence. 2008: 53-59.

[26] TANG B, WU Y, JIANG M, et al. Recognizing and encoding discorder concepts in clinical text using machine learning and vector space model[C]//Working Notes for CLEF 2013 Conference. 2013:23-26.

[27] ALSALLAL M, IQBAL R, AMIN S, et al. Intrinsic plagiarism detection using latent semantic indexing and stylometry[C]//The 6th International Conference on Developments in eSystems Engineering (DeSE). 2013: 145-150.

[28] YEH J F, TAN Y S, LEE C H. Topic detection and tracking for conversational content by using conceptual dynamic latent dirichlet allocation[J]. Neurocomputing, 2016.

[29] CHEN Y, AMIRI H, LI Z, et al. Emerging topic detection for organizations from microblogs[C]//The 36th International ACM Sigir Conference on Research and Development in Information Retrieval. 2013: 43-52.

[30] HINTON G E, SALAKHUTDINOV R R. Reducing the dimensionality of data with neural networks[J]. Science, 2006, 313(5786):504-507.

[31] ZHU G, LUO X, LIU F, et al. An algorithm of city-level landmark mining based on Internet forum[C]//The 18th International Conference on Network-Based Information Systems(NBiS). 2015: 294-301.

[32] WANG Y, BURGENER D, FLORES M, et al. Towards street-level client-independent IP geolocation[C]//The 8th Conference on Networked Systems Design and Implementation (NSDI). 2011: 27-27.

[33] GUO C, LIU Y, SHEN W, et al. Mining the web and the Internet for accurate IP address geolocations[C]//The 28th IEEE Conference on Computer Communications (INFOCOM). 2009: 2841-2845.

[34] [EB/OL]. https://www.maxmind.com/zh/home.

[35] [EB/OL]. http://www.ip2location.com.

[36] [EB/OL]. https://www.neustar.biz/services/ip-intelligence.

[37] [EB/OL]. https://www.whois.net.

[38] 陳鵬. 網絡實體地理定位IP Mapping系統(tǒng)設計與實現(xiàn)[D]. 長沙:國防科學技術大學, 2008. CHEN P. Design and implementation of network entity geo- location IP Mapping system[D]. Changsha: National University of Defense Technology, 2008 .

[39] 李威. 基于 IP 地址的網絡實體地理位置定位技術研究與實現(xiàn)[D].北京: 北京交通大學, 2008. LI W. Research and implementation of the network entities location positioning technology based on the IP address[D]. Beijing: Beijing Jiaotong University, 2008.

[40] LIU H, ZHANG Y, ZHOU Y, et al. Mining checkins from location-sharing services for client-independent IP geolocation[C]//The 33th IEEE Conference on Computer Communications (INFOCOM). 2014: 619-627.

[41] PADMANABHAN V N, SUBRAMANIAN L. An investigation of geographic mapping techniques for internet hosts[J]. ACM Sigcomm Computer Communication Review, 2001, 31(4): 173-185.

[42] GUEYE B, ZIVIANI A, CROVELLA M, et al. Constraint-based geolocation of internet hosts[J]. IEEE/ACM Transactions on Networking, 2006, 14(6): 1219-1232.

[43] DONG Z, PERERA R D W, CHANDRAMOULI R, et al. Network measurement based modeling and optimization for IP geolocation[J]. Computer Networks, 2012, 56(1): 85-98.

[44] LAKI S, MáTRAY P, HáGA P, et al. A model based approach for improving router geolocation[J]. Computer Networks, 2010, 54(9):1490-1501.

[45] ARIF M J, KARUNASEKERA S, KULKARNI S. GeoWeight:Internet host geolocation based on a probability model for latency measurements[C]//The 33rd Australasian Conference on Computer Science. 2010: 89-98.

[46] ERIKSSON B, BARFORD P, SOMMERSY J, et al. A learning-based approach for IP geolocation[C]//The 11th InternationalConference on Passive and Active Measurement. 2010: 171-180.

[47] MAZIKU, HELLEN, SHETTY, et al. Enhancing the classification accuracy of IP geolocation[C]//The Conference on Military Communications. 2012: 1-6.

[48] ARIF M J, KARUNASEKERA S, KULKARNI S, et al. Internet host geolocation using maximum likelihood estimation technique[C]//The 24th IEEE International Conference on Advanced Information Networking and Applications. 2010: 422-429.

[49] LAKI S, MáTRAY P, HáGA P, et al. Spotter: a model based active geolocation service[C]//The 30th IEEE Conference on Computer Communications (INFOCOM). 2011: 3173-3181.

[50] ZHU G, LUO X, LIU F, et al. City-level geolocation algorithm of network entities based on landmark clustering[C]//The 18th International Conference on Advanced Communication Technology(ICACT). 2016: 306-309.

[51] KATZ-BASSETT E, JOHN J P, KRISHNAMURTHY A, et al. Towards IP geolocation using delay and topology measurements[C]//The 6th ACM Sigcomm Conference on Internet Measurement. 2006: 71-84.

[52] WONG B, STOYANOV I, SIRER E G. Octant: a comprehensive framework for the geolocalization of Internet hosts[C]//The 4th Usenix Symposium on Networked Systems Design & Implementation. 2007: 313-326.

[53] ZHAO F, SONG Y, LIU F, et al. City-level geolocationbased on routing feature[C]//The 29th International Conference on Advanced Information Networking and Applications. 2015: 414-419.

[54] CHEN J, LIU F, WANG T, et al. Towards region-level IP geolocation based on the path feature[C]//The 17th International Conference on Advanced Communication Technology (ICACT). 2015:468-471.

[55] RAE A, MURDOCK V, POPESCU A, et al. Mining the web for points of interest[C]//The 35th International ACM Sigir Conference on Research and Development in Information Retrieval. 2012:711-720.

趙帆(1989-),男,江蘇徐州人,解放軍信息工程大學博士生,主要研究方向為網絡空間測繪與實體定位。

羅向陽(1978-),男,湖北荊門人,解放軍信息工程大學副教授、博士生導師,主要研究方向為網絡空間測繪與實體定位、多媒體安全。

劉粉林(1964-),男,江蘇溧陽人,解放軍信息工程大學教授、博士生導師,主要研究方向為網絡與信息安全。

Research on cyberspace surveying and mapping technology

ZHAO Fan1,2, LUO Xiang-yang1,2, LIU Fen-lin1,2
(1. School of Cyberspace Security, Zhengzhou Science and Technology Institute, Zhengzhou 450001, China;2. State Key Laboratory of Mathematical Engineering and Advanced Computing,Zhengzhou Science and Technology Institute, Zhengzhou 450001, China)

Cyberspace surveying and mapping technology is a network common foundation and application technology. The research progress of cyberspace surveying and mapping technology was reviewed and discussed. Firstly, the connotation and principle framework of cyberspace surveying and mapping technology was described. Secondly, relevant technologies were introduced in probing layer, mapping layer and drawing layer. Finally, some open problems in this field were discussed, and some interesting directions that may be worth researching in the future were indicated.

cyberspace surveying and mapping, probing, mapping, drawing, geographic space, social space

s: The National Natural Science Foundation of China (No.61379151, No.61272489, No.61302159,No.61401512, No.61572052), The Technology Innovation Excellent Youth Foundation of Henan Province (No. 144100510001)

TP393

A

10.11959/j.issn.2096-109x.2016.00097

2016-06-17;

2016-08-06。通信作者:羅向陽,xiangyangluo@126.com

國家自然科學基金資助項目(No.61379151, No.61272489, No.61302159, No.61401512, No.61572052);河南省科技創(chuàng)新杰出青年基金資助項目(No. 144100510001)

猜你喜歡
網絡空間繪制實體
共建誠實守信網絡空間
前海自貿區(qū):金融服務實體
超萌小鹿課程表
網絡空間并非“烏托邦”
放學后
軍地聯(lián)動共治涉軍輿情 打造清朗網絡空間
實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
兩會進行時:緊扣實體經濟“釘釘子”
振興實體經濟地方如何“釘釘子”
在轉變中繪制新藍圖