錢文彬
1. 引言
校園網(wǎng)絡(luò)作為學(xué)校重要的基礎(chǔ)設(shè)施,擔(dān)當(dāng)著學(xué)校教學(xué)、科研、管理和對外交流等許多角色。教育信息化、校園網(wǎng)絡(luò)化已經(jīng)成為教育發(fā)展的方向。校園網(wǎng)是一個要求高可靠性和安全性的網(wǎng)絡(luò)系統(tǒng),校園里學(xué)生都是通過校園網(wǎng)來訪問Internet。由于Internet的開放性、動態(tài)性和異構(gòu)性的特點,不可避免的使校園網(wǎng)。
面臨著主動信息服務(wù)帶來的諸多不安全的因素,如缺乏對信息發(fā)布的有效控制、不良信息的泛濫等。若不對校園網(wǎng)進行安全控制,學(xué)生通過校園網(wǎng)也可以訪問一些不良網(wǎng)站、非法信息等。如何在這樣的網(wǎng)絡(luò)環(huán)境下為校園網(wǎng)用戶提供更好的服務(wù)、并有效控制網(wǎng)絡(luò)信息的傳播,保障網(wǎng)絡(luò)信息的內(nèi)容安全,就成為了現(xiàn)在亟待解決的問題。
2. 安全過濾技術(shù)研究
安全過濾(Security Filtering, SF) 也就是所謂的信息的選擇性傳播。它是通過監(jiān)控動態(tài)的信息源以找到滿足用戶需求的信息或剔除用戶不需要的信息。它的任務(wù)就是從動態(tài)的信息源中過濾掉在一段時間內(nèi)比較固定的非需求信息或非法信息,并阻斷有害信息的進一步傳播。
2.1 安全過濾的特點。
從安全過濾技術(shù)的概念以及它的應(yīng)用環(huán)境,可以歸納出安全過濾的特點如下:
2.1.1 非法信息的特征描述與表達在一段時間內(nèi)是相對固定的;
2.1.2 安全過濾直接阻斷或刪除過濾出的有關(guān)信息,并將其記入日志文件,當(dāng)用戶下一次瀏覽相關(guān)信息時,過濾的準(zhǔn)確性和自主性將會更高;
2.1.3 安全過濾的實現(xiàn)對用戶是透明的,實時的;
2.2 安全過濾的主要方法。
2.2.1 名單過濾(URL/IP過濾)。
建立不良網(wǎng)站的URL或者IP地址列表數(shù)據(jù)庫,并對該數(shù)據(jù)庫進行定期的數(shù)據(jù)更新。當(dāng)用戶訪問這些站點時,將訪問站點的URL或者IP地址與數(shù)據(jù)庫列表中的進行匹配,如果能夠正確匹配,則給予阻斷或封鎖。核心問題是如何對列表數(shù)據(jù)庫進行更新,讓列表數(shù)據(jù)庫智能化,即具備自學(xué)習(xí)能力,使列表數(shù)據(jù)庫能自動加入不良網(wǎng)站的URL或者IP地址并去除已經(jīng)整改的項目。
2.2.2 分級過濾。
根據(jù)網(wǎng)頁的內(nèi)容屬性或其它特征,按照一定的分級標(biāo)準(zhǔn),建立網(wǎng)站的分級標(biāo)記,分級標(biāo)記可以附在網(wǎng)頁上,也可以保存在文件或數(shù)據(jù)庫中,使用時以分級標(biāo)記為過濾的依據(jù),與過濾模板進行比較,或通過瀏覽器的安全設(shè)置選項實現(xiàn)分級過濾。
2.2.3 關(guān)鍵詞過濾。
該種方法是對文本內(nèi)容、文檔的元數(shù)據(jù)等進行關(guān)鍵詞簡單匹配或者布爾邏輯運算,對滿足匹配條件的網(wǎng)頁或網(wǎng)站進行的過濾。在進行關(guān)鍵詞過濾時,時常還會出現(xiàn)關(guān)鍵詞變形的情況,如同音字詞、字詞順序顛倒、字詞中插入其它字符串等,這些變形后的關(guān)鍵詞是不能通過簡單的匹配或者邏輯運算來實現(xiàn)有效過濾的,因此,可以采用計算關(guān)鍵詞的匹配相關(guān)度、計算關(guān)鍵詞中字之間的位置差等方法來完成對變形后的關(guān)鍵詞的過濾。
2.3 基于內(nèi)容的多層次安全過濾技術(shù)。
內(nèi)容過濾技術(shù)主要采用了自然語言處理、人工智能、概率統(tǒng)計和機器學(xué)習(xí)等技術(shù)進行過濾。非法的信息需求可以表示成非法信息模型,即表示成向量空間中的非法向量,并通過對待過濾文本進行分詞、去除停用詞、文本特征提取以及特征項權(quán)重計算等預(yù)處理過程生成文本向量,然后計算文本向量和非法向量之間的相似度,將相似度低于過濾閾值的待過濾文本發(fā)送給該用戶。
內(nèi)容過濾的關(guān)鍵在于對文本的理解,而文本理解的關(guān)鍵在于對文本的結(jié)構(gòu)分析,只有充分了解文本的各個組成部分,才能夠切實地了解文本表達的主題,從而抽取出代表文本主題的特征詞集。文本過濾的另外一個關(guān)鍵是用戶興趣模型的構(gòu)造,即用戶模板構(gòu)建技術(shù),只有準(zhǔn)確地表達出用戶的信息需求,才能提供更好的過濾效果?;趦?nèi)容的安全過濾技術(shù)包括文本的表示、文本預(yù)處理、文本特征提取、文本特征項權(quán)重計算以及過濾反饋等內(nèi)容過濾關(guān)鍵技術(shù)。
當(dāng)擁有多個分校區(qū)分布在不同城市希望在本部大方向的安全策略下,給予不同分校區(qū)某種程度的權(quán)限修改其適合的安全策略時,就需要采用分層管理功能。
多層次管理功能應(yīng)包含全球管理員、群組管理員、最低過濾級別、群組、子群組、檢測范圍、特別帳戶、同步集中控制管理等方面。其中,全球管理員(Global Administrator)是一個擁有所有過濾設(shè)備絕對控制權(quán)的帳戶。全球管理員能夠根據(jù)公司安全策略,在Web內(nèi)容安全過濾設(shè)備上建立不同的群組,并且再為每個群組建立一個小組。全球管理員能夠無限制地控制所有Web內(nèi)容安全過濾設(shè)備的功能。
群組管理員由全球管理員建立。在全球管理員授權(quán)修改的安全策略范圍內(nèi),群組管理員帳戶可以針對群組的需求修改適合的安全策略。群組管理員所修改的安全策略僅能影響到這個帳戶所管理群組。每一個群組,可以只設(shè)立一個小組管理員賬戶。
最低過濾級別(Minimum Filtering Level, MFL)是由全球管理員制定的過濾級別,最低過濾級別是整個校園網(wǎng)無論哪一個群組必須一致執(zhí)行的最低標(biāo)準(zhǔn)策略。
群組的定義是由全球管理員設(shè)定的一群使用者。特別帳戶是一個用戶名/密碼,由全球管理員或群組管理員創(chuàng)建。其目的是要允許某其帳戶可以不受安全使用策略的限制,造訪任何網(wǎng)站。全球管理員可以選擇允許特別帳戶繞過最低過濾級別,也可以選擇特別帳戶僅受最低過濾級別限制。
3. 結(jié)語
不良信息的識別與過濾是阻斷校園網(wǎng)上不良信息傳播的有效手段,本文將內(nèi)容過濾與多層次管理技術(shù)相結(jié)合,提出基于內(nèi)容的多層次安全過濾技術(shù)。利用這種技術(shù)可以阻斷學(xué)生對不良網(wǎng)站的訪問,提高校園網(wǎng)利用率。
收稿日期:2009-09-16