国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于內(nèi)容過(guò)濾的網(wǎng)絡(luò)監(jiān)控技術(shù)分析

2013-04-29 03:43:54趙軍
無(wú)線互聯(lián)科技 2013年7期
關(guān)鍵詞:監(jiān)控特征文本

趙軍

摘 要:隨著科學(xué)技術(shù)的進(jìn)步和互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)信息資源的共享規(guī)模不斷擴(kuò)大,互聯(lián)網(wǎng)已經(jīng)成為了全球最重要的信息交流載體和主要的交流方式,網(wǎng)絡(luò)安全問(wèn)題也日益突出。針對(duì)當(dāng)前基于網(wǎng)絡(luò)內(nèi)容過(guò)濾的網(wǎng)絡(luò)信息安全監(jiān)控現(xiàn)狀,對(duì)基于內(nèi)容過(guò)濾的網(wǎng)絡(luò)監(jiān)控技術(shù)中的關(guān)鍵工作以及基本原理和未來(lái)的發(fā)展進(jìn)行了探討。

關(guān)鍵詞:內(nèi)容過(guò)濾;網(wǎng)絡(luò)監(jiān)控技術(shù)

1 引言

進(jìn)入新的世紀(jì),網(wǎng)絡(luò)化和信息化不斷地改變著我們這個(gè)時(shí)代,也深刻地影響著我們的生活。信息化發(fā)展到現(xiàn)在,它的觸角已經(jīng)伸向了各個(gè)領(lǐng)域。網(wǎng)絡(luò)信息資源的共享規(guī)模不斷擴(kuò)大,互聯(lián)網(wǎng)已經(jīng)成為了全球最重要的信息交流載體和主要的交流方式,網(wǎng)絡(luò)信息安全問(wèn)題也越來(lái)越突出。一般的網(wǎng)絡(luò)都是安裝了網(wǎng)絡(luò)防火墻等保障網(wǎng)絡(luò)信息安全的設(shè)施,但是這些安全措施不能夠檢查關(guān)于信息內(nèi)容涉密問(wèn)題,因此基于內(nèi)容過(guò)濾的網(wǎng)絡(luò)監(jiān)控技術(shù)就顯得非常重要,這對(duì)網(wǎng)絡(luò)的建設(shè)和發(fā)展將會(huì)產(chǎn)生重大的影響。

2 基于內(nèi)容過(guò)濾的網(wǎng)絡(luò)監(jiān)控技術(shù)介紹

過(guò)濾的幾個(gè)基本的步驟對(duì)于任何過(guò)濾技術(shù)都是相同的:首先要知道想要過(guò)濾掉什么內(nèi)容,然后用不同的方法對(duì)比要過(guò)濾的內(nèi)容和監(jiān)控內(nèi)容,最后把與要過(guò)濾內(nèi)容相同的部分過(guò)濾掉。第一步中的過(guò)濾內(nèi)容由人為設(shè)定。其中最難實(shí)現(xiàn)的是第二步。首先是獲取要監(jiān)控的信息,目前最新的基于內(nèi)容的網(wǎng)絡(luò)監(jiān)控系統(tǒng)DFNMS的架構(gòu)如圖1,其中的七個(gè)模塊分別對(duì)應(yīng)七種不同形式的信息。它的原理是:首先,偽造一個(gè)虛擬服務(wù)器,截獲信息并向發(fā)送者反饋信息發(fā)送成功的提示,然后對(duì)信息進(jìn)行比對(duì)分析,把不合格的信息過(guò)濾掉,把合格的信息發(fā)送到目的地以達(dá)到過(guò)濾的效果。其次是信息的比對(duì)和分析。隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)中出現(xiàn)了大量良莠不齊的內(nèi)容,這些內(nèi)容形式多樣,再加上漢語(yǔ)表達(dá)博大精深的特點(diǎn),使得要判斷監(jiān)測(cè)內(nèi)容是否是要過(guò)濾掉的不良信息非常困難[1]。而且,網(wǎng)絡(luò)信息數(shù)量龐大,這就要就過(guò)濾技術(shù)既能準(zhǔn)確的識(shí)別出要過(guò)濾的信息,又能快速高效地完成這個(gè)過(guò)程。識(shí)別不良信息的方法也是各種過(guò)濾技術(shù)的區(qū)別所在。目前國(guó)內(nèi)外的過(guò)濾技術(shù)主要有四種:基于因特網(wǎng)內(nèi)容分級(jí)平臺(tái)過(guò)濾(PICS)、數(shù)據(jù)庫(kù)過(guò)濾、關(guān)鍵字過(guò)濾以及基于內(nèi)容理解的過(guò)濾。

3 文本內(nèi)容理解的過(guò)濾技術(shù)

文本內(nèi)容的過(guò)濾技術(shù)主要是在關(guān)鍵字詞檢索方法的基礎(chǔ)上,通過(guò)各種語(yǔ)言處理的方法以及數(shù)據(jù)分析技術(shù)通過(guò)對(duì)文章的內(nèi)容及語(yǔ)境等要素理解文本的內(nèi)容,然后發(fā)現(xiàn)目標(biāo)信息的過(guò)濾技術(shù)。例如我們檢查的文本中有“槍支”這個(gè)詞匯,如果不對(duì)其文本的結(jié)構(gòu)和語(yǔ)境就將它過(guò)濾掉,就會(huì)錯(cuò)誤地過(guò)濾掉軍事理論教材或者軍事科普知識(shí)等信息。所以文本內(nèi)容理解的過(guò)濾技術(shù)在基于內(nèi)容過(guò)濾的網(wǎng)絡(luò)監(jiān)控中得到廣泛運(yùn)用[2]。

3.1 文本內(nèi)容的預(yù)處理

文本內(nèi)容的預(yù)處理主要是將信息源中無(wú)關(guān)的文本剔除,保留和敏感詞匯有關(guān)聯(lián)的文本部分,并按照一定的量化指標(biāo)對(duì)文本信息的特征描述字詞進(jìn)行量化分析,然后將對(duì)文本具有識(shí)別性特征的信息提取出來(lái)。這些具有識(shí)別性特征的信息能夠?qū)π枰^(guò)濾的文本內(nèi)容進(jìn)行有效表達(dá)。

3.2 文本內(nèi)容的匹配算法

文本內(nèi)容的匹配算法影響著對(duì)信息進(jìn)行過(guò)濾的速度,一般情況下它由匹配算法模型來(lái)決定。目前在實(shí)際操作中常用到的理論模型有向量空間模型和貝葉斯決策模型。向量空間決策模型是將文檔用它的特征識(shí)別項(xiàng)按照所占的權(quán)重來(lái)分析的一個(gè)高維向量表示,在對(duì)文本的過(guò)濾分析中就可以運(yùn)用向量的計(jì)算原則,可以極大地降低了工作的復(fù)雜性。但是該方法也有缺點(diǎn),因?yàn)樵趯?duì)文本特征識(shí)別項(xiàng)的權(quán)重確定方面很難做到精確,所以對(duì)文章的計(jì)算量較大。而貝葉斯決策模型是依托貝葉斯理論而建立的。在文檔識(shí)別的時(shí)候,它首先是對(duì)文檔的所屬類別進(jìn)行分類。文章分類的概率等于有識(shí)別性特征的信息所屬概率的綜合表達(dá),最后根據(jù)總和概率的計(jì)算選出概率最大的類別文檔作為需要過(guò)濾的內(nèi)容。

4 圖像內(nèi)容分析的過(guò)濾技術(shù)

所謂圖像內(nèi)容分析過(guò)濾技術(shù)是指,基于圖像所顯現(xiàn)的色彩、紋理、形狀以及圖像內(nèi)容的空間關(guān)系等顯性特征作為索引,利用圖像的這些外觀特征的相似度和匹配程度進(jìn)行過(guò)濾的技術(shù)。圖像內(nèi)容分析過(guò)濾技術(shù)還被廣泛地應(yīng)用其他圖像特征和語(yǔ)義特征的圖像內(nèi)容進(jìn)行判定。目前為止,圖像內(nèi)容分析過(guò)濾技術(shù)的最主要研究手段就是機(jī)器學(xué)習(xí),從豐富而復(fù)雜的圖像信息中找到規(guī)律性的特征,然而,很多時(shí)候計(jì)算機(jī)無(wú)法從海量的圖片信息和千變?nèi)f化的圖像中準(zhǔn)確地識(shí)別需要過(guò)濾的圖像,尤其是在全局視覺(jué)內(nèi)容不能很好地表現(xiàn)圖像語(yǔ)義的時(shí)候,計(jì)算機(jī)對(duì)圖像的區(qū)分就顯得比較困難。影響這項(xiàng)技術(shù)發(fā)展的因素主要有圖像的內(nèi)容過(guò)于豐富或者圖像處理復(fù)雜,要解決這樣的問(wèn)題,還需要從以下幾個(gè)方面努力[3],首先,是敘述問(wèn)題的數(shù)學(xué)建模;其次,是敘述語(yǔ)義特征和圖像內(nèi)容;然后是規(guī)律和標(biāo)準(zhǔn)的建立;最后是圖像相似度的標(biāo)準(zhǔn)以及索引的技術(shù)。隨著最近幾年來(lái)科學(xué)知識(shí)和計(jì)算機(jī)技術(shù)的高速發(fā)展,很多技術(shù)都得到了相應(yīng)的進(jìn)步,圖像內(nèi)容分析過(guò)濾技術(shù)也同樣獲得了可喜的進(jìn)展。

[參考文獻(xiàn)]

[1]彭昱忠,元昌安,王艷,等.基于內(nèi)容理解的不良信息過(guò)濾技術(shù)研究[J].計(jì)算機(jī)應(yīng)用研究,2009(02):33-36.

[2]李振星,陸大玨,任繼成,等.基于潛在語(yǔ)義索引的WEB信息預(yù)測(cè)采集過(guò)濾方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2012,16(01):147.

[3]孫莉娜.企業(yè)網(wǎng)絡(luò)監(jiān)控技術(shù)初探[J].煤炭技術(shù)(Coal Technology),2013(02):34—36.

猜你喜歡
監(jiān)控特征文本
The Great Barrier Reef shows coral comeback
如何表達(dá)“特征”
在808DA上文本顯示的改善
你被監(jiān)控了嗎?
不忠誠(chéng)的四個(gè)特征
Zabbix在ATS系統(tǒng)集中監(jiān)控中的應(yīng)用
基于doc2vec和TF-IDF的相似文本識(shí)別
電子制作(2018年18期)2018-11-14 01:48:06
看監(jiān)控?cái)z像機(jī)的4K之道
抓住特征巧觀察
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
平遥县| 通城县| 叶城县| 固安县| 皮山县| 石阡县| 连江县| 普定县| 长治市| 广东省| 伊宁市| 翼城县| 德化县| 南岸区| 五华县| 荣昌县| 麻栗坡县| 陵水| 吉水县| 无锡市| 中牟县| 三明市| 敦化市| 宁都县| 乌拉特中旗| 修武县| 芜湖县| 顺昌县| 舟曲县| 高陵县| 泰顺县| 邻水| 宣化县| 许昌市| 佛坪县| 江源县| 夏津县| 襄城县| 修武县| 盱眙县| 克山县|