国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

信息隱藏技術(shù)在HTML標(biāo)簽中的應(yīng)用

2011-01-29 02:26陳莉莉
關(guān)鍵詞:奇偶性空格首字母

陳莉莉

(蘇州工業(yè)職業(yè)技術(shù)學(xué)院 信息工程系,江蘇 蘇州 215104)

1 研究現(xiàn)狀及意義

信息隱藏是信息安全領(lǐng)域,一個(gè)新興的也是非常重要的研究領(lǐng)域.信息隱藏技術(shù)是一種“隱匿秘密通信存在”的信息安全保護(hù)方式.在網(wǎng)絡(luò)飛速發(fā)展的今天,信息隱藏技術(shù)的研究更具有現(xiàn)實(shí)性.它的應(yīng)用范圍包括:電子商務(wù)中的電子交易保護(hù)、版權(quán)保護(hù)、保密通信、拷貝控制和操作跟蹤、簽名和認(rèn)證等各個(gè)方面[1].自從20世紀(jì)90年代以來(lái),世界各地開(kāi)始研究數(shù)字媒體信息隱藏技術(shù),至今已有相當(dāng)數(shù)量的研究成果問(wèn)世.在網(wǎng)絡(luò)飛速發(fā)展的今天,信息隱藏技術(shù)的研究更具有現(xiàn)實(shí)意義.在隱藏技術(shù)方面,由于圖像、聲音等數(shù)字載體自身具有信息冗余度高、隱藏容量大等特點(diǎn),目前的研究也主要是利用圖像、聲音等載體來(lái)進(jìn)行隱藏.不過(guò),近年來(lái)人們也著手研究秘密信息在文字?jǐn)?shù)據(jù)(如文本、超文本等)中的隱藏.

網(wǎng)頁(yè)信息隱藏技術(shù)是將網(wǎng)頁(yè)作為載體的信息隱藏,在其中加載秘密信息可以更方便地通過(guò)因特網(wǎng)進(jìn)行傳遞.與圖像、視頻、音頻信息隱藏方法相比,網(wǎng)頁(yè)信息隱藏所用的算法截然不同.

HTML信息隱藏模型[2]可用圖1來(lái)表示.待隱藏的信息M稱為隱秘信息,它可以是秘密數(shù)據(jù)或版權(quán)信息,也可以是一個(gè)序列號(hào);而公開(kāi)信息H則稱為載體信息,這里采用HTML文檔.這種信息的隱藏過(guò)程一般由密鑰來(lái)控制,即通過(guò)嵌入算法將秘密信息隱遞,然后檢測(cè)器利用提取算法及密鑰從隱秘載體中檢測(cè)/提取出藏于公開(kāi)信息中的隱秘信息,而隱秘載體則通過(guò)Internet傳遞信息.

圖1 基于HTML標(biāo)簽的網(wǎng)頁(yè)信息隱藏模型

2 基于HTML標(biāo)簽信息隱藏方法的分析

網(wǎng)頁(yè)信息隱藏技術(shù)是將信息隱藏到網(wǎng)頁(yè)文件中,隱藏的信息與網(wǎng)頁(yè)原始文件數(shù)據(jù)緊密結(jié)合,同時(shí)要求隱藏的信息不破壞原始文件的結(jié)構(gòu)及質(zhì)量,不使文件的表征內(nèi)容的視覺(jué)特性產(chǎn)生異常[3].

基于HTML標(biāo)簽的網(wǎng)頁(yè)信息隱藏方法主要?dú)w結(jié)為以下3種:

1) 基于不可見(jiàn)字符的方法:早在2001年,就有研究人員提出通過(guò)在每行行末加入不可見(jiàn)字符如Space鍵和Tab鍵,可以將信息隱藏在網(wǎng)頁(yè)中而又不影響網(wǎng)頁(yè)在瀏覽器中的顯示效果,如已經(jīng)商品化的網(wǎng)頁(yè)信息隱藏軟件Invisible Secret、Wbstego、FFencode[3]等都是利用這種方法來(lái)隱藏信息的.

2) 基于標(biāo)記中字母大小寫(xiě)變化的方法:Zhao和Lu[4]提出了基于主成分分析的網(wǎng)頁(yè)信息隱藏方案,他們首先使用主成分分析方法提取出網(wǎng)頁(yè)的摘要信息,然后利用網(wǎng)頁(yè)中標(biāo)簽的大小寫(xiě)無(wú)關(guān)字符插入隱藏信息.

3) 基于屬性對(duì)順序的方法:孫星明[5]等人提出了一種基于等價(jià)標(biāo)記的網(wǎng)頁(yè)信息隱藏算法.該方法將待隱藏的秘密信息轉(zhuǎn)變?yōu)橐粋€(gè)大整數(shù),按照嵌入規(guī)則,采用等價(jià)標(biāo)記置換原標(biāo)記的方法將大整數(shù)隱藏在網(wǎng)頁(yè)中.該算法沒(méi)有增加網(wǎng)頁(yè)文件的長(zhǎng)度,能夠隱藏較大的秘密信息,且具有較高的隱蔽性和安全性.

通過(guò)大量的實(shí)驗(yàn),表1給出了基于不可見(jiàn)字符方法、標(biāo)記大小寫(xiě)方法、屬性對(duì)順序的3種方法的性能參數(shù),主要從隱蔽性和魯棒性兩方面對(duì)上述3種方法進(jìn)行比較.

表1 現(xiàn)有網(wǎng)頁(yè)信息隱藏技術(shù)優(yōu)缺點(diǎn)分析

2.1 基于不可見(jiàn)字符和字母大小寫(xiě)的信息隱藏方法

常用的基于HTML標(biāo)簽的信息隱藏方法,比較適合隱藏量較少的情況,由于算法相對(duì)簡(jiǎn)單,所以比較容易遭到攻擊和破解.因此,提出一種基于不可見(jiàn)字符和字母大小寫(xiě)相結(jié)合的信息隱藏方法.該方法是結(jié)合兩種信息隱藏的思路而實(shí)現(xiàn)的,解決了目前已有的一些算法簡(jiǎn)單和信息隱藏量較少的問(wèn)題.

2.1.1 算法思想

經(jīng)過(guò)對(duì)HTML4.0的深入研究發(fā)現(xiàn):標(biāo)簽、屬性、屬性值三者之間可有多個(gè)空格;右界定符“>”左邊可增加若干空格;屬性值引號(hào)前后可增加若干空格;標(biāo)簽、屬性、屬性值等字符不區(qū)分大小寫(xiě).

本信息隱藏方法,主要是基于上述HTML的特點(diǎn)形成的.通過(guò)對(duì)已有的一些算法的分析,發(fā)現(xiàn)存在一些不足,因此對(duì)本算法有如下要求:保證HTML文檔的顯示效果不變;提高隱匿性;提高信息的隱藏量.

為了使對(duì)HTML文檔的修改具有更好的隱匿性以及提取隱藏信息的便利性,主要選擇標(biāo)簽名、屬性名、屬性值這些位置作為嵌入點(diǎn)來(lái)隱藏信息.因?yàn)镠TML文檔主要是由標(biāo)簽、屬性和屬性值組成的,這樣可以充分利用這些標(biāo)簽和屬性來(lái)增加信息隱藏的容量.

本文的隱藏算法主要是判斷每個(gè)標(biāo)簽字符個(gè)數(shù)的奇偶性、屬性字符個(gè)數(shù)的奇偶性和屬性值字符個(gè)數(shù)奇偶性以及檢測(cè)標(biāo)簽、屬性和屬性值首字母的大小寫(xiě)情況.由于檢測(cè)的指標(biāo)有兩個(gè),一個(gè)是字符個(gè)數(shù)的奇偶性,還有一個(gè)是嵌入點(diǎn)位置字符的首字母大小寫(xiě),因此可以組合成4種情況.根據(jù)這個(gè)特點(diǎn),以兩個(gè)bit作為隱藏的最小單位,也就是說(shuō)每個(gè)標(biāo)簽里可以隱藏2 bit的信息,每次隱藏的信息有以下4種情況:00,01,10,11.

根據(jù)隱藏對(duì)象的不同,可分成以下3種情況:①標(biāo)簽字符個(gè)數(shù)的奇偶性;②屬性字符個(gè)數(shù)的奇偶性;③屬性值字符個(gè)數(shù)奇偶性(如果屬性值上有引號(hào),引號(hào)也包含在內(nèi)).

為了便于說(shuō)明,設(shè)定以下函數(shù):LetterSum(ch)用于統(tǒng)計(jì)上述3種情況的字符總數(shù),函數(shù)IsCapital(ch)用于判斷標(biāo)簽、屬性或?qū)傩灾档氖鬃帜甘欠翊髮?xiě).其中“ch”表示某一個(gè)標(biāo)簽、屬性或?qū)傩灾?

因此需檢測(cè)以下信息:①上述3種情況的字符個(gè)數(shù)為奇數(shù)還是偶數(shù).②標(biāo)簽、屬性或?qū)傩灾凳鬃帜甘欠翊髮?xiě).

根據(jù)前面的分析,約定隱藏信息的規(guī)則為

規(guī)則1:LetterSum(ch)為奇數(shù),并且Is Capital(ch)為大寫(xiě),可以隱藏00.

規(guī)則2:LetterSum(ch)為奇數(shù),并且Is Capital(ch)為小寫(xiě),可以隱藏01.

規(guī)則3:LetterSum(ch)為偶數(shù),并且Is Capital(ch)為大寫(xiě),可以隱藏10.

規(guī)則4:LetterSum(ch)為偶數(shù),并且Is Capital(ch)為小寫(xiě),可以隱藏11.

表達(dá)式為

式(1)—式(4)分別對(duì)應(yīng)于上述的規(guī)則1—規(guī)則4.

2.1.2 算法描述

根據(jù)隱藏的bit信息分別為00、01、10、11四種情況,根據(jù)嵌入規(guī)則,需要針對(duì)上述4種情況作不同的處理.以隱藏00為例來(lái)描述本算法.

檢測(cè)HTML文檔中標(biāo)簽名、屬性名、屬性值位置字符個(gè)數(shù)的奇偶性和首字母大小寫(xiě)情況:

1)如果當(dāng)前檢測(cè)到的HTML標(biāo)簽或者屬性、屬性值滿足式(1),即LetterSum(ch)%2=1 Is Capital(ch)=True,則完全符合隱藏規(guī)則,不需要作任何處理,就可以將00隱藏到嵌入點(diǎn)位置,因?yàn)槭?1)就是隱藏00的條件.

2) 如果當(dāng)前檢測(cè)到的HTML標(biāo)簽或者屬性、屬性值滿足LetterSum(ch)%2=1 Is Capital(ch)=False由于隱藏00的要求是式(1),所以只需要將標(biāo)簽、屬性、屬性值的首字母改成大寫(xiě)字母,便可以滿足嵌入規(guī)則.

3) 如果當(dāng)前檢測(cè)到的HTML標(biāo)簽或者屬性、屬性值滿足LetterSum(ch)%2=0 Is Capital(ch)=Talse由于隱藏00的要求是式(1),所以需要將改成奇數(shù),也就是需要在合適的位置添加空格.而根據(jù)隱藏對(duì)象的不同,對(duì)以下3種情況進(jìn)行討論.

情況1:修改標(biāo)簽字符個(gè)數(shù)的奇偶性.在標(biāo)簽的右側(cè)添加一個(gè)空格,如〈table〉改成〈table○〉(○表示增加的空格),這樣既可以使其變成奇數(shù),而且也不會(huì)改變頁(yè)面在瀏覽器中的顯示效果.

情況2:修改屬性字符個(gè)數(shù)的奇偶性.在屬性和“=”之間添加一個(gè)空格,這樣便可以使其變成奇數(shù).如〈table align=”center”〉改成〈table align○=”center”〉.

情況3:修改屬性值字符個(gè)數(shù)奇偶性.如果屬性值上有引號(hào),引號(hào)也包含在內(nèi);如果屬性值是數(shù)值,或者有多個(gè)屬性值,則跳過(guò)該嵌入點(diǎn).在屬性值的右側(cè)增加一個(gè)空格,這樣便可以使LetterSum(ch)變成奇數(shù).如〈table align=”center”〉改成〈table align=”center”○〉.

4) 如果當(dāng)前檢測(cè)到的HTML標(biāo)簽或者屬性、屬性值滿足LetterSum(ch)%2=0 Is Capital(ch)=False.由于隱藏00的要求是式(1),即嵌入點(diǎn)位置的字符個(gè)數(shù)是奇數(shù)且首字母為大寫(xiě)字母,而當(dāng)前檢測(cè)的嵌入點(diǎn)位置的字符個(gè)數(shù)為偶數(shù)且首字母為小寫(xiě)字母,所以需要把嵌入點(diǎn)位置的字符個(gè)數(shù)變成奇數(shù),且將首字母變成大寫(xiě).因此需要參照上文2.1.2算法描述提到的2)和3)兩個(gè)操作完成.

至于隱藏信息01、10、11,方法與此大體相同,不再贅述.

2.1.3 算法實(shí)施過(guò)程

一般而言,信息隱藏分為4個(gè)階段:預(yù)處理階段、嵌入階段、傳輸階段和提取階段.為了使每個(gè)階段都比較安全,所以必須在預(yù)處理階段引入加密術(shù)中的加密算法.嵌入和提取流程如圖2所示.

圖2 嵌入和提取流程圖

如果容量夠的話,在嵌入之前,要復(fù)制1份糾錯(cuò)編碼后的數(shù)據(jù),即使得最后嵌入的數(shù)據(jù)是2份.在嵌入階段,使用隱藏信息的算法;在傳輸階段,進(jìn)行隱蔽通信,從而使傳輸階段也是安全的.所以這套信息隱藏的處理方案,將形成一個(gè)安全的體系,既能夠隱藏秘密信息的內(nèi)容,也能隱蔽通信的接收方和發(fā)送方,從而建立隱藏通信.

為了便于實(shí)施和描述嵌入規(guī)則,定義如下幾個(gè)比較重要的函數(shù).

1) 嵌入點(diǎn)選擇函數(shù)FindPosition(P) 就是基于HTML文檔特點(diǎn)構(gòu)造的函數(shù),用于尋找HTML文檔中可隱藏信息的位置.從中提取隱藏信息準(zhǔn)確方便的角度出發(fā),約定:對(duì)于標(biāo)簽只提取起始標(biāo)簽作為嵌入點(diǎn)位置;如果屬性值是數(shù)字,則跳過(guò)該位置.

2) 字符個(gè)數(shù)統(tǒng)計(jì)函數(shù)LetterSum(ch)用來(lái)統(tǒng)計(jì)每個(gè)嵌入點(diǎn)位置的字符的個(gè)數(shù).

3) 判斷字符首字母大小寫(xiě)函數(shù)IsCapital(ch)來(lái)判斷嵌入點(diǎn)位置的首字母大小寫(xiě)情況.

4) 更改首字母大小寫(xiě)函數(shù)ChgCapital(ch),當(dāng)通過(guò)FindPosition(P)函數(shù)找到嵌入點(diǎn)位置后,結(jié)合嵌入規(guī)則,在適當(dāng)?shù)臅r(shí)候利用ChgCapital(ch)更改首字母大小寫(xiě).

5) SpaceSum(ch)函數(shù)用于計(jì)算嵌入點(diǎn)位置增加的空格.

6) 隱藏信息編碼函數(shù)EnCode(I).

為了保證只有合法接收者能夠提取到隱藏信息,可以根據(jù)安全性的需求選用經(jīng)典的或目前廣泛使用的加密技術(shù)對(duì)待隱藏信息進(jìn)行加密處理.

實(shí)施的過(guò)程描述如下:

Step1:初始化.將HTML頁(yè)面文檔H中所有的非默認(rèn)狀態(tài)下的空格去除.特別是標(biāo)簽和屬性之間的空格、屬性和“=”之間的空格,以及屬性值右側(cè)的空格.初始化的目的是保證隱藏信息和提取信息的正確性.因此這一步至關(guān)重要,是實(shí)施嵌入規(guī)則的前提條件.

Step2:利用隱藏信息編碼函數(shù)EnCode(I)對(duì)待隱藏信息進(jìn)行編碼,若編碼后的長(zhǎng)度大于嵌入點(diǎn)的最大數(shù)n-5(n表示最大嵌入點(diǎn)數(shù))則報(bào)錯(cuò).減去5的原因是,至少要預(yù)留5個(gè)嵌入點(diǎn)來(lái)隱藏結(jié)束標(biāo)識(shí)位.

Step3:用FindPosition(P)函數(shù)找出HTML文檔中所有可隱藏信息的嵌入點(diǎn)位置,得到位置序列T,即t1,t2,t3,…,tn.n為可嵌入位置的最大數(shù).

Step4:從第一個(gè)嵌入位置開(kāi)始,根據(jù)前面的嵌入規(guī)則的描述,對(duì)隱藏信息I'逐兩位的進(jìn)行隱藏.具體的嵌入方法,前面有詳細(xì)的描述,不再贅述.

Step5:嵌入結(jié)束后,進(jìn)行隱藏信息的結(jié)束標(biāo)識(shí)位的處理.處理的方法是:把緊跟著最后一個(gè)隱藏信息位置后面的標(biāo)簽、屬性或?qū)傩灾档氖鬃帜负湍┳帜溉扛某纱髮?xiě).為了確保結(jié)束標(biāo)識(shí)的準(zhǔn)確性,將連續(xù)改變3個(gè)標(biāo)簽或?qū)傩?、屬性值的大小?xiě).為了確保結(jié)束標(biāo)識(shí)的隱蔽性,這3個(gè)被修改的標(biāo)簽或?qū)傩?、屬性值是一隔一地修?之所以要進(jìn)行結(jié)束標(biāo)識(shí)位的處理,主要是為了能夠進(jìn)行隱藏信息的提取.

2.1.4 算法實(shí)現(xiàn)與應(yīng)用

根據(jù)以上提出的嵌入算法,將一個(gè)比特流01100011嵌入到以下HTML代碼中,圖3是隱藏信息嵌入前后的HTML代碼和預(yù)覽結(jié)果.信息隱藏前后的瀏覽器預(yù)覽效果如圖4所示.

經(jīng)實(shí)驗(yàn)發(fā)現(xiàn)信息隱藏前后的頁(yè)面顯示效果沒(méi)有任何的改變,瀏覽器也沒(méi)有報(bào)任何的錯(cuò)誤.在使用記事本等軟件打開(kāi)標(biāo)記HTML代碼時(shí),由于對(duì)標(biāo)記、屬性和屬性值只是做了很小的改變,很不容易察覺(jué)異常,具有較好的隱蔽性.而且一般來(lái)講,標(biāo)記屬性和標(biāo)記屬性值的修改比標(biāo)記名稱的修改較不容易引起注意.另外由于本算法是在HTML文檔的標(biāo)簽、屬性、屬性值之間嵌入信息的,而標(biāo)簽、屬性和屬性值又是網(wǎng)頁(yè)中使用頻率最高的信息,因此本算法的信息隱藏容量較高.

3 結(jié) 論

本算法對(duì)現(xiàn)有的基于不可見(jiàn)字符的算法進(jìn)行了改進(jìn),主要利用在合適的位置添加空格以及修改標(biāo)簽或者屬性的大小寫(xiě)不影響網(wǎng)頁(yè)的顯示效果來(lái)隱藏信息.在本文中,通過(guò)給出具體的嵌入規(guī)則,經(jīng)實(shí)例證實(shí)了本算法的可行性和較強(qiáng)的可操作性,保證HTML文檔的顯示效果不變的基礎(chǔ)上.較強(qiáng)的可操作性的基礎(chǔ)上能夠順利地隱藏給出的隱藏信息.

目前信息隱藏技術(shù)的研究主要還集中于圖形圖像、音頻和普通文本上面,對(duì)基于網(wǎng)頁(yè)的信息隱藏研究還很少,還處于起步的階段,盡管本文提出的基于不可見(jiàn)字符和字母大小寫(xiě)的信息隱藏方法具有較好的隱蔽性和較大的信息隱藏容量,但仍有很多值得改進(jìn)的地方.

[1] 張學(xué)鋒.淺析數(shù)字水印在電子商務(wù)環(huán)境中的應(yīng)用[J].計(jì)算機(jī)安全,2009(3):76-78.

[2] 王長(zhǎng)征,劉建輝.基于網(wǎng)頁(yè)標(biāo)記的信息隱藏技術(shù)研究與實(shí)現(xiàn)[J].科技廣場(chǎng),2007(5):104-105.

[3] 胡嵐,尤新剛.現(xiàn)有的超文本(HTML)信息隱藏技術(shù)分析[C]//全國(guó)第三屆信息隱藏學(xué)術(shù)會(huì)議論文集.西安:西安電子科技大學(xué)出版社,2001:62-67.

[4] 姜楠,王健,楊義先.新的唯秘密載體信息隱藏分析方法[J].北京郵電大學(xué)學(xué)報(bào):自然科學(xué)版,2006,29(2):1-4.

[5] 張彤,王育民.信息隱藏技術(shù)及其在信息安全中的應(yīng)用[J].中興通信,2002,8(2):42-45.

猜你喜歡
奇偶性空格首字母
函數(shù)的圖象、單調(diào)性和奇偶性
趣填成語(yǔ)
空格填數(shù)
函數(shù)的單調(diào)性和奇偶性
你來(lái)補(bǔ)缺的數(shù)
函數(shù)的奇偶性常見(jiàn)形式及應(yīng)用
例析函數(shù)奇偶性的應(yīng)用
新目標(biāo)英語(yǔ)八年級(jí)(上)Unit5 STEP BY STEP隨堂通
新目標(biāo)英語(yǔ)八年級(jí)(上)Unit4 STEP BY STEP隨堂通
Unit 12 STEP BY STEP 隨堂通