韋澤鯤, 夏靖波, 張曉燕, 付 凱, 申 健
(1.空軍工程大學(xué) 信息與導(dǎo)航學(xué)院,陜西 西安710077;2.廈門大學(xué) 嘉庚學(xué)院,福建 廈門 363105)
?
基于隨機(jī)森林的流量多特征提取與分類研究*
韋澤鯤1, 夏靖波2, 張曉燕1, 付 凱1, 申 健1
(1.空軍工程大學(xué) 信息與導(dǎo)航學(xué)院,陜西 西安710077;2.廈門大學(xué) 嘉庚學(xué)院,福建 廈門 363105)
網(wǎng)絡(luò)流量的多樣化和復(fù)雜化以及高實(shí)時(shí)性要求對流量識別技術(shù)帶來了巨大挑戰(zhàn),而通過基于機(jī)器學(xué)習(xí)的網(wǎng)絡(luò)流量分類中,流量統(tǒng)計(jì)特征選擇能夠快速準(zhǔn)確對流量進(jìn)行識別,具有重要的研究意義。隨機(jī)森林(RF)作為近年較熱門的灰盒算法,對當(dāng)前的網(wǎng)絡(luò)流量具有較好的識別能力。通過隨機(jī)森林的節(jié)點(diǎn)選擇算法,對流量特征進(jìn)行選擇,并結(jié)合物理意義進(jìn)行優(yōu)化,進(jìn)行多次特征提取。實(shí)驗(yàn)結(jié)果表明:提出的算法在識別模型構(gòu)建上性能更加優(yōu)越,耗費(fèi)時(shí)間大大減小,同時(shí)準(zhǔn)確度等指標(biāo)得到提高。
流量統(tǒng)計(jì)特征; 隨機(jī)森林; 灰盒模型; 特征提取
隨著網(wǎng)絡(luò)規(guī)模日益增大、5G等更高帶寬技術(shù)的高速發(fā)展、云計(jì)算與大數(shù)據(jù)的應(yīng)用呈爆發(fā)式增長,同時(shí)高附加值業(yè)務(wù)與用戶行為的日趨復(fù)雜,尤其是移動(dòng)終端和去中心化、異構(gòu)網(wǎng)絡(luò)的普遍性,導(dǎo)致需要更加高效地進(jìn)行網(wǎng)絡(luò)管理和數(shù)據(jù)流量控制。對網(wǎng)絡(luò)資源的有效分配利用,對用戶資源的分析引導(dǎo),流量入侵檢測和網(wǎng)絡(luò)規(guī)劃架構(gòu),是當(dāng)今網(wǎng)絡(luò)監(jiān)管和互聯(lián)網(wǎng)服務(wù)提供商(Internet service providers,ISPs)亟需處理的關(guān)鍵問題。
流量分類則是對不同應(yīng)用類型流量進(jìn)行分類,保證解析出適合用戶群的業(yè)務(wù)模式,保證較高的服務(wù)質(zhì)量(quality of service,QoS),為解決上述問題提供可靠的技術(shù)支持。通過采集流量的外部統(tǒng)計(jì)特征并應(yīng)用機(jī)器學(xué)習(xí)算法分類是最常用的流量識別方法[1,2]。因此,機(jī)器學(xué)習(xí)流量分類技術(shù)是目前任何形式流量分類的主流技術(shù)。
近10年來,流量分類技術(shù)幾近處于瓶頸階段。各種機(jī)器學(xué)習(xí)技術(shù)準(zhǔn)確率皆到達(dá)90 %以上,甚至超過99 %,技術(shù)的創(chuàng)新遭遇到了前所未有的挑戰(zhàn)。Bernaille和Nguyen T提出采用網(wǎng)絡(luò)子流的統(tǒng)計(jì)特征作為流量分類的研究對象,不僅克服網(wǎng)絡(luò)應(yīng)用的規(guī)避檢測技術(shù),大大提高分類的準(zhǔn)確性,同時(shí)滿足實(shí)時(shí)性的要求。柏駿、夏靖波等人[2]詳細(xì)綜述2006年~2012年國內(nèi)外實(shí)時(shí)流量分類識別技術(shù),提出以準(zhǔn)確性與實(shí)時(shí)性作為兩大指標(biāo),對流量分類方法進(jìn)行研究的評價(jià)指標(biāo)。Kalaiselvi T和Shanmugaraja P[3]結(jié)合機(jī)器學(xué)習(xí)中的有監(jiān)督和無監(jiān)督分類算法,提出了一種C4.5與k-means混合算法,且選取了極少量的流統(tǒng)計(jì)特征數(shù)據(jù),并實(shí)驗(yàn)得到了較高的準(zhǔn)確率。李平紅、王勇等人[4]針對未識別流量,提出了一種基于成對約束擴(kuò)展的半監(jiān)督特征選擇方法,該算法在較少成對約束條件下得到了更好的分類性能。文獻(xiàn)[5]的特征提取實(shí)驗(yàn),法國De Lorraine大學(xué)的Jerome Francois分析客戶端向服務(wù)器發(fā)送通信數(shù)據(jù)的業(yè)務(wù)節(jié)點(diǎn)接口(service node interface,SNI)擴(kuò)展碼,提出多級框架去識別HTTPS服務(wù)的流量,必將識別的特征數(shù)量大大減少,實(shí)時(shí)流識別準(zhǔn)確率高達(dá)93.10 %。
在IP網(wǎng)絡(luò)中,網(wǎng)絡(luò)流量定義為源和目的計(jì)算機(jī)之間基于特定端口(如傳輸控制協(xié)議(transmission control protocol,TCP),用戶數(shù)據(jù)報(bào)協(xié)議(user datagram protocol,UDP),互聯(lián)網(wǎng)控制報(bào)文協(xié)議(Internet control message protocol,ICMP)等)的一個(gè)或者多個(gè)數(shù)據(jù)包。這些數(shù)據(jù)包中存在流的五元組信息〈源IP地址,源端口,目的IP,目的端口,傳輸層協(xié)議〉[6],相同流的五元組信息是相同的。
基于機(jī)器學(xué)習(xí)的流量分類方法是近年來熱門的研究領(lǐng)域,流量分類模型可表述為:f:X→T,X={X1,X2,…,Xm}為類型未知的網(wǎng)絡(luò)流集合,T={T1,T2,…,Tn}為已知網(wǎng)絡(luò)流集合,f為特定的機(jī)器學(xué)習(xí)算法,如何通過特定的算法對普遍或特殊流量問題進(jìn)行分類,是該領(lǐng)域研究的重點(diǎn)[7]。主要有有監(jiān)督的機(jī)器學(xué)習(xí)和無監(jiān)督的機(jī)器學(xué)習(xí)[7,8]構(gòu)成;有監(jiān)督的分類方法是將N-分類問題轉(zhuǎn)化為N個(gè)二分類問題,即為每種流量類型單獨(dú)訓(xùn)練一個(gè)分類模型,常見的有樸素貝葉斯Naive Bayes,支持向量機(jī)(support vector machine,SVM)和決策樹算法。無監(jiān)督的分類方法則無需考慮單獨(dú)處理每個(gè)流量類型,常見的如聚類k-means聚類算法等。結(jié)合文獻(xiàn)[6~8,10]本文中用于特征選擇的物理特征如表1。
表1 常用流量識別特征
隨機(jī)森林(random forest,RF)[11]是由一系列決策樹{h(X,Θk),k=1,2,…,K}所組成,其中{Θk}是服從獨(dú)立分布的隨機(jī)向量,k為決策樹的個(gè)數(shù)。訓(xùn)練數(shù)據(jù)集被隨機(jī)指派到多種決策樹上獨(dú)立處理,且每一個(gè)節(jié)點(diǎn)上的優(yōu)化策略是一致的。這些樹得出判決或預(yù)測值后停止生長,所有樹的結(jié)果將歸入一個(gè)集合,并根據(jù)最多數(shù)的判決計(jì)算出最終結(jié)果。RF產(chǎn)生的最終分類決策為
(1)
式中 H(x)為組合模型,hi為單個(gè)決策樹分類模型,Y為目標(biāo)變量。
近年來,我國應(yīng)用型本科院校發(fā)展取得了一些成績。在教育部的指導(dǎo)下,以應(yīng)用技術(shù)大學(xué)為辦學(xué)定位的地方本科院校發(fā)起并成立了應(yīng)用技術(shù)大學(xué)(學(xué)院)聯(lián)盟。截止到2018年6月,已有172所高校加入了該聯(lián)盟。
就屬性特征而言,特征的選擇因樹的不同而不同,因而產(chǎn)生的樹更具有普遍性,RF因此能夠平衡一些屬性權(quán)重帶來的偏差或者誤差。當(dāng)樹的數(shù)量變得龐大時(shí),帶有缺失或者統(tǒng)計(jì)錯(cuò)誤的屬性數(shù)據(jù)就會(huì)聚合,因此,對于噪聲,RF具有魯棒性。
RF模型具有很好的收斂性,通過余量函數(shù)(marginfunction)定量地描述
(2)
余量函數(shù)表示平均正確分類數(shù)超過平均錯(cuò)誤分類數(shù)的程度,mg(X,Y)越大,分類的準(zhǔn)確性就越高。由余量函數(shù)可推得泛化誤差,公式為
PE*=Px,y,mg(X,Y)<0
(3)
3.1 流量特征的選取
特征選擇是指從原始特征集中提取出一個(gè)特征子集,使得此特征集在特定的分類評價(jià)標(biāo)準(zhǔn)下達(dá)到最優(yōu)。目前較多的特征選擇方法為過濾方法和包裝方法[12]。在本實(shí)驗(yàn)中,采用的是RF灰盒算法和人工選取的方法,在不斷迭代的RF算法中,利用RF算法的變量重要性度量對特征進(jìn)行排序,并尋找較大影響因子的葉子節(jié)點(diǎn)給予保留,多次迭代進(jìn)行比較,目的剔除掉流量數(shù)據(jù)中無關(guān)的、冗余的特征,最終得到高準(zhǔn)確率,低時(shí)間消耗的特征選擇結(jié)果。迭代公式:Xt=Dt-1αT(Xt∈Rm×k,Dt-1∈Rm×n,α∈Rn×k),其中,Xt為第t次迭代的生成k維數(shù)據(jù)集,D0為原始數(shù)據(jù)集,Dt-1為第t-1次迭代的數(shù)據(jù)集(t≥1)。αT為迭代矩陣(α中只有0和1),且每迭代一次,迭代矩陣會(huì)發(fā)生變化。
在決策樹中,無論對于連續(xù)或非連續(xù)變量,分裂屬性節(jié)點(diǎn)的選擇直接影響到?jīng)Q策樹分類和預(yù)測的性能。常用的決策樹中,C4.5的信息增益率,分類回歸樹(classification and regression tree,CART)的Gini純度指標(biāo),都有較好的性能。RF作為一個(gè)多種決策樹分類器集成的模型,集成了多種分裂與剪枝模型。
實(shí)驗(yàn)中將采用Gin指標(biāo)和信息增益率對訓(xùn)練數(shù)據(jù)集進(jìn)行屬性篩選,對特征的選取提供理論依據(jù)和可選擇方案。Gini指標(biāo)相關(guān)公式如下
(4)
(5)
信息增益率相關(guān)公式如下
(6)
分裂信息熵為
(7)
信息增益率為
(8)
Gain(An)=Entropy(S)-Entropy(SA)
(9)
特征選擇流程圖如圖1所示 。
圖1 流量多特征選擇模型流程圖Fig 1 Flow chart of flow multi-feature selection model
3.2 數(shù)據(jù)集
倫敦瑪麗女王大學(xué)(Queen Mary,University of London)的Moore A等人[13]于2003年從1 000個(gè)與互聯(lián)網(wǎng)相連的校園網(wǎng)用戶上,以24 h為一個(gè)采集周期,采集了10個(gè)時(shí)段的10個(gè)TCP流量數(shù)據(jù),對流數(shù)據(jù)的持續(xù)時(shí)間、分組大小、時(shí)間間隔、往返時(shí)延等的數(shù)學(xué)統(tǒng)計(jì)特征(包括最大、最小、平均大小、方差等度量)以及標(biāo)志位字段、端口號等做了詳細(xì)的記錄。
Moore_Set總共包含377 526個(gè)網(wǎng)絡(luò)流量樣本,每條TCP雙向數(shù)據(jù)流都是以完整的三次握手同步—確認(rèn)字段(synchronous-acknowledge character,SYN-ACK)開始,以結(jié)束—確認(rèn)字段(finished-acknowledge charater,FIN-ACK)結(jié)束,并抽象得到249項(xiàng)屬性,且最后一項(xiàng)為目標(biāo)流量的類別,詳細(xì)描述可參考文獻(xiàn)[13]。
3.3 實(shí)驗(yàn)結(jié)果分析
在實(shí)驗(yàn)中,工具采用新西蘭懷卡托大學(xué)的Weka—3.7.13,實(shí)驗(yàn)主機(jī)為CPU為Inter i5—3470,主頻為3.20G Hz和3.19 GHz,內(nèi)存為3.48GB的搭載winXP系統(tǒng)的PC主機(jī)。本文的實(shí)驗(yàn)研究對象為Moore_Set的前4個(gè)數(shù)據(jù)集,即Moore_Set 1~4總共93 881個(gè)樣本,在不進(jìn)行任何特征選擇的情況下,采用RF對其進(jìn)行分類,袋外誤差為0.003 6,準(zhǔn)確率為99.658 1 %,平均建模時(shí)間為128.38 s。
本文選取Gain Ratio Attribute Eval(GRAE)和Info Gain Attribute Eval(IGAE)兩種評估器對流量進(jìn)行第一次選擇排序,即RF決策樹的分裂點(diǎn)選擇法則[14],并且閾值T=22,選取特征排序后結(jié)果如表2。
表2 第一次特征選取
經(jīng)過選取特征集按照排序依次遞減,得出的正確率如圖2所示。實(shí)驗(yàn)中,通過上述兩種方式,依次將特征值按照特征排序,不斷提高閾值,刪除掉后幾項(xiàng),分別得到特征值數(shù)目為22,18,12,9,6的五種情況。IGAE算法中,準(zhǔn)確率最高99.742 2 %,最低99.730 5 %;GRAE算法中,準(zhǔn)確率在99.651 7 %~99.477 %,兩種算法準(zhǔn)確率都比特征選擇前的99.658 1 %高,而整體IGAE算法比GRAE算法準(zhǔn)確率高。隨著特征數(shù)目的減少, IGAE算法準(zhǔn)確率沒有太大變化,甚至出現(xiàn)升高的情況,而GRAE算法的準(zhǔn)確率雖逐漸小幅度降低,但也出現(xiàn)了不降反升的現(xiàn)象(如9特征和6特征時(shí))。由此說明,當(dāng)剔除冗余分類特征后,準(zhǔn)確率不僅不會(huì)減小,反而保持不變甚至提高。對比這兩種算法,選取IGAE+Rank的特征排序方法。不同特征數(shù)目時(shí)RF建模消耗時(shí)間對比如圖3所示。
圖2 兩種特征選取算法準(zhǔn)確率對比圖Fig 2 Comparison of accuracy of two algorithms on feature selection
圖3 RF建模時(shí)間消耗對比圖Fig 3 Comparison of modeling time consumption of RF
重新改變閾值 ,結(jié)合上文常用于特征選擇的物理特征與文獻(xiàn)[15],引入{8,43,44,47,48,91,93,94,95,96,109,110,119,120,213,227,230}具有物理意義的特征屬性,其中8:Client Port;43,44:total_packets;47,48:pure_acks_sent;91,93,94,95,96:mss_requested和segm_size;109,110:initial_window-packets;119,120:data_xmit_time;213:inter-arrival time;227,230:bulk。結(jié)合之前的排序,總結(jié)出26個(gè)特征屬性{4,8,43,44,47,48,91,93,94,95,96,98,107,108,109,110,119,120,193,198,200,201,213,227,230}。經(jīng)過不斷剔除物理屬性相近的值,并不斷迭代RF分類器,得出如圖4的準(zhǔn)確率變化圖。
圖4 不同特征準(zhǔn)確率對比Fig 4 Comparison of different characteristic accuracy
圖4中,同一橫坐標(biāo)下,造成不同準(zhǔn)確率的關(guān)鍵原因在于剔除特征屬性的不同。經(jīng)過不斷比較迭代,最終確定了7個(gè)特征屬性值:{4,8,98,107,193,198,200},在該數(shù)據(jù)集下,準(zhǔn)確率到達(dá)了99.780 6 %。
將數(shù)據(jù)集重新選取特征,采用優(yōu)先搜索+基于相關(guān)性的特征選擇(best first+correlation-based feature selection,BF+CFS)算法對數(shù)據(jù)子集分別進(jìn)行特征選擇,并對生成的特征集進(jìn)行二次特征選擇;采用分治投票(divide-conquer and voting,DV )[16]算法進(jìn)行分治投票選擇,可得出表3,下文中本實(shí)驗(yàn)的特征子集提取算法用RF排序(RF+rank)表示。
采用以上不同算法提取出的特征子集對Moore_set1~4
表3 不同算法提取的特征子集比較
數(shù)據(jù)集進(jìn)行識別,評估驗(yàn)證采用十折交叉方法對數(shù)據(jù)進(jìn)行交叉驗(yàn)證,每次實(shí)驗(yàn)重復(fù)10次,實(shí)驗(yàn)結(jié)果取10次重復(fù)實(shí)驗(yàn)的平均值,并比較Accuracy,Precision,Recall,F-Measure 4個(gè)指標(biāo)。
圖5 不同特征提取模型性能指標(biāo)比較Fig 5 Comparison of performance indexes of different feature extraction models
通過對圖5的結(jié)果分析可知,經(jīng)過RF模型的識別,不同特征算法表現(xiàn)各異,總體上BF+CFS,DV與RF+Rank算法在度量指標(biāo)上差距較小,RF+Fank的指標(biāo)性能最好,在準(zhǔn)確率上,比BF+CFS與DV分別提高了0.132 1 %,0.063 9 %。由于RF的算法的優(yōu)異分類特性,三種算法各自的Precision,Recall和F-Measure三項(xiàng)指標(biāo)相同,RF+Rank比BF+CFS和DV分別提高0.2 %和0.1 %。因此說明本實(shí)驗(yàn)選取的流量特征子集更優(yōu)越。通過與原始數(shù)據(jù)分類整體準(zhǔn)確率99.658 1 %的對比,本實(shí)驗(yàn)的算法為99.780 6 %,總體提高0.122 5 %,且時(shí)間上由128.38 s降低為34.63 s,耗費(fèi)時(shí)間大大降低,減少了73 %。盡管準(zhǔn)確率提高幅度不大,但是在當(dāng)今準(zhǔn)確率趨于99 %,甚至更高的分類模型下,性能指標(biāo)的微小提升,對于海量數(shù)據(jù)來說也是大的進(jìn)步。
上述實(shí)驗(yàn)都是基于RF進(jìn)行流量分類的,圖6通過對比4種分類器的性能:SVM,NaiveBayes,C4.5決策樹,RF,結(jié)果決策樹類分類器明顯優(yōu)于SVM和NaiveBayes,其中SVM準(zhǔn)確率、精確率等指標(biāo)最低,在決策樹類中,RF略微優(yōu)于C4.5算法。
圖6 不同分類模型性能指標(biāo)比較Fig 6 Comparison of performance indexes of different classification models
經(jīng)過實(shí)驗(yàn)驗(yàn)證,本文提出的RF+Rank迭代算法,通過RF模型的分類,在消耗時(shí)間上比原始數(shù)據(jù)集減少了73 %,整體分類準(zhǔn)確率增加了0.122 5 %,且特征選擇算法性能指標(biāo)優(yōu)于其它同類算法,RF模型也優(yōu)于其它識別分類模型。未來工作重點(diǎn)將在實(shí)時(shí)性上,對實(shí)時(shí)流量數(shù)據(jù)進(jìn)行分類;同時(shí)針對有較大比例不屬于已知類的異常的數(shù)據(jù)集,將改進(jìn)流量預(yù)處理準(zhǔn)則,如通過Hellinger距離排除掉異常數(shù)據(jù)。隨著網(wǎng)絡(luò)規(guī)模日益增大、云計(jì)算與大數(shù)據(jù)的普及,本文提出的特征選擇算法將使得云計(jì)算技術(shù)和數(shù)據(jù)中心網(wǎng)絡(luò)在現(xiàn)有大規(guī)模流量識別中發(fā)揮重要作用,提升網(wǎng)絡(luò)管理效率和服務(wù)質(zhì)量,具有較高的理論研究與實(shí)際應(yīng)用價(jià)值。
[1] Ding L,Yu F,Peng S,et al.A classification algorithm for network traffic based on improved support vector machine[J].Journal of Computer,2013,8(4):1090-1096.
[2] 柏 駿,夏靖波,吳吉祥,等.實(shí)時(shí)網(wǎng)絡(luò)流量分類研究綜述[J].計(jì)算機(jī)科學(xué),2013,40(9):8-15.
[3] Kalaiselvi T,Shanmugaraja P.Hybrid alforithm for the classification of traffic flows[J].International Journal of Emerging Technology in Computer Science & Electronics (IJETCSE),2016,21(2): 340-343.
[4] 李平紅,王 勇,陶曉玲.基于成對約束擴(kuò)展的半監(jiān)督網(wǎng)絡(luò)流量特征選擇算法[J].傳感器與微系統(tǒng),2013,32(5):146-149.
[5] de Donato W,Pescape A,Dainotti A.Traffic identification engine:
An open platform for traffic classification[J].Network,IEEE,2014,28(2):56-64.
[6] 朱文波.流統(tǒng)計(jì)特征在網(wǎng)絡(luò)流量分類中的應(yīng)用研究[D].杭州:杭州電子科技大學(xué),2015.
[7] 王怡萱.網(wǎng)絡(luò)流量分類方法研究及流量特征分析[D].北京:北京郵電大學(xué),2013.
[8] 周劍峰,陽愛民,劉吉財(cái).基于改進(jìn)的C4.5算法的網(wǎng)絡(luò)流量分類方法[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(5):71-74.
[9] 陳中杰,蔣 剛,蔡 勇.基于SVM一對一多分類算法的二次細(xì)分法研究[J].傳感器與微系統(tǒng),2013,32(4):44-47.
[10] 趙樹鵬,陳貞翔,彭立志.基于流中前5個(gè)包的在線流量分類特征[J].濟(jì)南大學(xué)學(xué)報(bào):自然科學(xué)版,2012,26(2):156-160.
[11] 張 建,武東英,劉慧生.基于隨機(jī)森林的流量分類方法[J].信息工程大學(xué)學(xué)報(bào),2012,13(5):621-625.
[12] 侯大軍,朱偉興.基于改進(jìn)粒子群算法的最優(yōu)特征子集研究[J].傳感器與微系統(tǒng),2010,29(9):64-66.
[13] Moore A,Zue V ,Crogan M.Discriminators for use in flow-based classification[D].London:Queen Mary and Westfield College,2005.
[14] 姚登舉,楊 靜,詹曉娟.基于隨機(jī)森林的特征選擇算法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2014,44(1):137-141.
[15] 葉春明,王 珍,陳 思,等.基于節(jié)點(diǎn)行為特征分析的網(wǎng)絡(luò)分類方法[J].電子與信息學(xué)報(bào),2014,36(9):2158-2165.
[16] 高 文,錢亞冠,吳春明.網(wǎng)絡(luò)流量特征選擇方法中的分治投票策略研究[J].電子學(xué)報(bào),2015,43(4):795-799.
Research on traffic multi-feature extraction and classification based on random forest*
WEI Ze-kun1, XIA Jing-bo2, ZHANG Xiao-yan1, FU Kai1, SHEN Jian1
(1.College of Information and Navigation,Air Force Engineering University,Xi’an,710077,China;2.Tan Kah Kee College,Xiamen University,Xiamen 363105,China)
Diversity and complexity of network traffic and the high real-time requirement has brought great challenges,meanwhile by the network traffic classification based on machine learning ,the selection of flow statistics feature can quickly and accurately identify traffic,which is of great significance.As a gray box model,random forest(RF) is popular in recent years,which has good recognition ability of the current network traffic.By the algorithm of RF node selection,flow characteristics are selected,and combined with the physical significance to carry out optimization and a number of feature extraction.Experimental results show that the proposed algorithm is superior to the model construction,time-consumption is greatly reduced,meanwhile the accuracy is improved.
traffic statistic feature; random forest(RF); gray box model; feature extraction
10.13873/J.1000—9787(2016)12—0055—05
2016—10—08
陜西省科技計(jì)劃基金資助重點(diǎn)項(xiàng)目(2012JZ8005); 航空科學(xué)基金資助項(xiàng)目(20141996018)
TP 393
A
1000—9787(2016)12—0055—05
韋澤鯤(1992-),男,陜西西安人,碩士研究生,主要研究方向?yàn)榇髷?shù)據(jù)挖掘和網(wǎng)絡(luò)態(tài)勢感知。