龍飛 徐昊
摘要: 當(dāng)前互聯(lián)網(wǎng)飛速發(fā)展,在社會(huì)的各個(gè)層面為全人類提供便利。虛擬社會(huì)與現(xiàn)實(shí)社會(huì)的聯(lián)系更加緊密,使得虛擬社會(huì)管理的復(fù)雜性日益突出?;ヂ?lián)網(wǎng)不良信息泛濫影響著人們的正常生活。如何對(duì)互聯(lián)網(wǎng)不良信息進(jìn)行實(shí)時(shí)監(jiān)控已成為一些部門和機(jī)構(gòu)熱切關(guān)注的問題。本文對(duì)互聯(lián)網(wǎng)不良信息現(xiàn)狀及其產(chǎn)生的原因做詳細(xì)的分析,研究針對(duì)互聯(lián)網(wǎng)不良信息的監(jiān)控技術(shù)方案,使其能夠高速有效地檢測出網(wǎng)站中的不良信息,對(duì)于檢出的不良信息,能夠根據(jù)要求,進(jìn)行屏蔽、替換,并且向管理人員提供報(bào)警信息及統(tǒng)計(jì)信息。
關(guān)鍵詞: 互聯(lián)網(wǎng)不良信息過濾監(jiān)控
一、前言
互聯(lián)網(wǎng)是人類智慧的結(jié)晶,20世紀(jì)的重大科技發(fā)明,當(dāng)代先進(jìn)生產(chǎn)力的重要標(biāo)志。電子郵件、即時(shí)信息、視頻會(huì)議、網(wǎng)絡(luò)日志、網(wǎng)上購物等已經(jīng)成為越來越多人的一種生活方式;而基于B2B、B2C等平臺(tái)的電子商務(wù),跨越洲際的商務(wù)會(huì)議及電子政務(wù)等為商業(yè)與政府辦公創(chuàng)造了更加安全、更加快捷的環(huán)境。但是隨之而來的垃圾郵件、網(wǎng)絡(luò)蠕蟲病毒、惡意代碼、惡意軟件等也影響著人們的正常生活。各類違法不良信息泛濫,影響了社會(huì)穩(wěn)定,毒害了青少年的健康成長,侵害了部分網(wǎng)民的合法權(quán)益。[2]
據(jù)中國互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心數(shù)據(jù)顯示,2011年1月至10月,全國各類網(wǎng)絡(luò)不良信息舉報(bào)數(shù)量達(dá)到605692件次,同比增長76.7%。2011年上半年,遇到過病毒或木馬攻擊的網(wǎng)民為2.17億人,占網(wǎng)民的 44.7%;有過賬號(hào)或密碼被盜經(jīng)歷的網(wǎng)民達(dá)到1.21億人,占24.9%,較2010年底增加3.1個(gè)百分點(diǎn);有8%的網(wǎng)民在網(wǎng)上遇到通過消費(fèi)欺詐,該群體規(guī)模達(dá)到3880萬人。僅2011年6月份,我國不良信息與垃圾信息舉報(bào)數(shù)量達(dá)77571件次 ,提取各類域名的釣魚類網(wǎng)站56件次,6月份舉報(bào)涉嫌淫穢色情及低俗信息網(wǎng)站4077件次,詐騙等違法類網(wǎng)站1993件次。
目前,互聯(lián)網(wǎng)治理立足于國家相關(guān)法律法規(guī)政策,依托九部門整治互聯(lián)網(wǎng)和手機(jī)媒體淫穢色情及低俗信息專項(xiàng)行動(dòng),堅(jiān)決鏟除整治互聯(lián)網(wǎng)和手機(jī)媒體淫穢色情及低俗信息,全面凈化互聯(lián)網(wǎng)和手機(jī)媒體環(huán)境,努力建立良好的網(wǎng)絡(luò)文明風(fēng)尚。因此切實(shí)加強(qiáng)互聯(lián)網(wǎng)的信息監(jiān)控管理勢在必行。
二、互聯(lián)網(wǎng)不良信息的分析
早期互聯(lián)網(wǎng)上的不良信息以“知識(shí)型”信息為主。隨著互聯(lián)網(wǎng)的普及,不良信息從單純的“知識(shí)型”信息向“謀利型”轉(zhuǎn)變,而且手段多樣、形式復(fù)雜。在利益的驅(qū)使下大量違反法律、違反道德的不良信息泛濫于網(wǎng)絡(luò)。
(一)不良信息泛濫的主要原因[1]
1.不良信息的賺錢魔力。互聯(lián)網(wǎng)是“眼球”經(jīng)濟(jì),在殘酷的商業(yè)競爭中,不少網(wǎng)站經(jīng)營者利用不良信息吸引網(wǎng)民的“眼球”,達(dá)到賺錢的目的。
2.互聯(lián)網(wǎng)信息的制造和訪問缺乏監(jiān)管:網(wǎng)民既是信息的閱讀者又是制造者,但是面對(duì)不良信息,他們既成了受害人,又成了違法人。
3.非民主力量的“別有用心”。一些反人類、反民主的力量也同樣存在于互聯(lián)網(wǎng)上,他們通過不斷傳播不良信息達(dá)到不可告人的目的。
(二)不良信息的分類
根據(jù)產(chǎn)生的社會(huì)效應(yīng)和不良后果,一般可以將不良信息分為三大類。
1.“違反法律”類信息。違背《中華人民共和國憲法》和《全國人大常委會(huì)關(guān)于維護(hù)互聯(lián)網(wǎng)安全的決定》、《互聯(lián)網(wǎng)信息服務(wù)管理辦法》所明文嚴(yán)禁的信息,以及其他法律法規(guī)明文禁止傳播的各類信息。
2.“違反道德”類信息。違背社會(huì)主義精神文明建設(shè)要求,違背中華民族優(yōu)良文化傳統(tǒng)與習(xí)慣,以及其他違背社會(huì)公德的各類信息,包括文字、圖片、音視頻等。
3.破壞信息安全類信息。含有病毒、木馬、后門的高風(fēng)險(xiǎn)類信息,對(duì)訪問者電腦及數(shù)據(jù)構(gòu)成安全威脅的信息。目前,病毒制造、傳播、牟利的流程完全互聯(lián)網(wǎng)化,從挖掘漏洞、制造病毒、傳播病毒到出售竊取來的賬號(hào),都成了一個(gè)巨大無比的黑色產(chǎn)業(yè),這對(duì)個(gè)人及企業(yè)的信息安全造成很大威脅。[1]
針對(duì)不同形式的不良信息,可以從網(wǎng)絡(luò)垃圾電子郵件治理、建立非法IP地址“黑名單”數(shù)據(jù)庫;淫穢色情類、詐騙類、攻擊黨和政府危害社會(huì)穩(wěn)定類、違反社會(huì)公德等不良信息監(jiān)控三個(gè)方面入手進(jìn)行互聯(lián)網(wǎng)不良信息監(jiān)控的研究。
三、互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)研究的主要內(nèi)容
(一)網(wǎng)絡(luò)處理協(xié)議及體系結(jié)構(gòu)研究
目前相關(guān)的研究大多集中在網(wǎng)關(guān)或用戶端的信息過濾與自動(dòng)屏蔽上,通常基于信息過濾技術(shù)。信息過濾系統(tǒng)中對(duì)信息源數(shù)據(jù)的獲取往往采用網(wǎng)絡(luò)監(jiān)聽的方法。網(wǎng)絡(luò)底層信息監(jiān)聽可以采取兩種方法:一是利用以太網(wǎng)的廣播特性實(shí)現(xiàn),二是通過設(shè)置路由器的監(jiān)聽端口實(shí)現(xiàn)。網(wǎng)絡(luò)監(jiān)聽作為信息監(jiān)測領(lǐng)域一個(gè)較成熟的手段,目前這方面的研究仍然占很大比重。但是,采用網(wǎng)絡(luò)底層的監(jiān)聽技術(shù),需要對(duì)已有網(wǎng)絡(luò)進(jìn)行較大規(guī)模的改動(dòng),成本高,靈活性差,對(duì)監(jiān)測點(diǎn)的選擇提出了較高的要求,很難有效地應(yīng)對(duì)不良信息傳播者的“游擊”策略。同時(shí),該方法對(duì)于在網(wǎng)絡(luò)用戶端進(jìn)行信息過濾有較大優(yōu)勢。
(二)面向不良信息的文本分類研究
文本分類是實(shí)現(xiàn)不良信息監(jiān)測的關(guān)鍵技術(shù),目前在這方面的研究較多,這是互聯(lián)網(wǎng)不良信息監(jiān)控關(guān)注的一個(gè)重點(diǎn)。其力求在服務(wù)器端實(shí)現(xiàn)網(wǎng)絡(luò)信息實(shí)時(shí)過濾機(jī)制。
(三)不良信息特征提取研究
目前比較流行的互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)中還有文本特征的表示與特征提取技術(shù)。由于不同領(lǐng)域信息的形式特殊性,可以基于不良信息所具有的特殊詞形,進(jìn)行特征提取,該方法有效改善了傳統(tǒng)以詞為特征的聚類算法的性能。
(四)實(shí)現(xiàn)網(wǎng)頁信息獲取的爬蟲算法研究
網(wǎng)頁信息獲取是信息監(jiān)測的前提步驟,除網(wǎng)絡(luò)底層分析的研究以外,通常都采用爬蟲來實(shí)現(xiàn)。目前很多研究機(jī)構(gòu)正在研究適合于中小型網(wǎng)站網(wǎng)頁下載的爬蟲算法,使其信息監(jiān)控具有良好的性能。
(五)字符串匹配監(jiān)控的研究
字符串匹配是計(jì)算機(jī)科學(xué)中最古老、研究最廣泛的問題之一,在信息檢索領(lǐng)域和計(jì)算生物學(xué)領(lǐng)域,其應(yīng)用尤為突出。不良信息監(jiān)測在本質(zhì)上是文本模式的匹配問題,通過互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)可以提高文本模式的匹配速度,達(dá)到實(shí)時(shí)監(jiān)控。
四、 互聯(lián)網(wǎng)不良信息監(jiān)控技術(shù)關(guān)鍵點(diǎn)
(一)針對(duì)邪教等重復(fù)串不良信息的監(jiān)測方法
此類信息頻繁出現(xiàn)且普通基于特征提取方法的過濾技術(shù)不易于實(shí)現(xiàn)對(duì)其監(jiān)控,需要對(duì)此類信息作重點(diǎn)防范。對(duì)于此問題,需要深入研究不良信息的形式化表示,研究不良信息形式規(guī)則,借助相關(guān)理論探索不良信息監(jiān)測的途徑。分析不良信息語法結(jié)構(gòu),從語義的角度探索機(jī)器識(shí)別不良信息的方法,在監(jiān)控服務(wù)器端定制針對(duì)性模塊,制定有針對(duì)性的不良信息監(jiān)控方案。
(二)多類別不良信息識(shí)別
通常的互聯(lián)網(wǎng)不良信息監(jiān)控只是針對(duì)單一類別的不良信息進(jìn)行監(jiān)測。然而,在真實(shí)的互聯(lián)網(wǎng)上,許多種類的不良信息往往是混雜在一起的,并沒有哪個(gè)不良網(wǎng)站會(huì)貼上“色情”或“邪教”的標(biāo)簽,表明不良信息的單一性。同時(shí),多個(gè)特征庫共同應(yīng)用會(huì)增強(qiáng)不良信息監(jiān)測的效率。隨著網(wǎng)絡(luò)規(guī)模的擴(kuò)大,不良信息的單類別搜索越來越難,實(shí)現(xiàn)分布式搜索是進(jìn)行不良信息監(jiān)控研究一個(gè)關(guān)鍵點(diǎn)。當(dāng)面向全網(wǎng)的搜索需求日益迫切起來之后,為提高搜索效率,分布式集群搜索的研究勢在必行,應(yīng)用于面向全網(wǎng)的不良信息監(jiān)測是一個(gè)必然的趨勢。
五、結(jié)語
互聯(lián)網(wǎng)治理是一個(gè)全球性課題。維護(hù)互聯(lián)網(wǎng)的純潔和干凈是所有人共同的責(zé)任,也是人類長期奮斗的目標(biāo)。適應(yīng)新技術(shù)發(fā)展,不斷提高從用戶網(wǎng)到接入網(wǎng)、從IP承載網(wǎng)到核心業(yè)務(wù)網(wǎng)的監(jiān)控技術(shù),完善新網(wǎng)絡(luò)環(huán)境下的信息安全制度制定,強(qiáng)化信息安全和等級(jí)保護(hù)意識(shí),“遏制信息源頭,監(jiān)管信息傳播,控制信息訪問”,經(jīng)濟(jì)、法律與技術(shù)手段并用,才能還網(wǎng)絡(luò)一片凈土。
參考文獻(xiàn):
[1]中國互聯(lián)網(wǎng)不良信息研究報(bào)告(2008)http://www.netentsec.com/Report/20090218.html.
[2]冀強(qiáng).基層公安BBS輿情及有害信息監(jiān)控研究[J].才智,2009,22:148-149.
[3]葉昭暉,曾瓊,李強(qiáng).基于搜索引擎的網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].廣西大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,36(10):303-309.
[4]陳祥潘,樂文斌.TIPTOP涉密文檔違規(guī)處理系統(tǒng)的解決案例[J].信息安全與通信保密,2011,1:132-135.
[5]石國巖,李冰.互聯(lián)網(wǎng)安全技術(shù)淺談[J].信息與電腦(理論版),2011,1:47-49.