国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于可信Web服務(wù)的信息查詢技術(shù)的研究

2016-07-31 21:10孟奇
數(shù)碼世界 2016年3期
關(guān)鍵詞:搜索引擎密鑰頁(yè)面

基于可信Web服務(wù)的信息查詢技術(shù)的研究

在Internet網(wǎng)絡(luò)中,對(duì)Web站點(diǎn)中的信息進(jìn)行查詢是非常頻繁的操作,但面對(duì)海量的網(wǎng)絡(luò)信息我們的查詢存在著很多安全隱患和查詢效率低下的煩惱。導(dǎo)致查詢效率低下的原因主要有兩個(gè):一是Internet網(wǎng)絡(luò)中的信息浩瀚無(wú)邊且與日俱增,Web信息沒(méi)有統(tǒng)一的模式結(jié)構(gòu)。二是Internet網(wǎng)絡(luò)中目前還沒(méi)有非常完善的查詢技術(shù)來(lái)有效的幫助用戶查詢符合用戶需求的信息。查詢效率的高低與查詢算法設(shè)計(jì)的好壞是密切相關(guān)的。本文主要討論:可信Web服務(wù),Web服務(wù)的安全性和Web查詢技術(shù)。

1 可信Web服務(wù)

由于互聯(lián)網(wǎng)的開(kāi)放性和不完善性,目前的互聯(lián)網(wǎng)中存在著很多不安全的因素,而Web服務(wù)的靈活性在一定程度上也潛在著安全缺陷,所以確保Web服務(wù)的安全性是一個(gè)非常重要的問(wèn)題,這就要求能夠采取各種有效措施來(lái)抵御各種攻擊。應(yīng)用安全模型、安全機(jī)制等可以確保Web服務(wù)的完整性、私密性和安全性。

1.1 Web服務(wù)的安全通信

Web服務(wù)是采用SOAP協(xié)議標(biāo)準(zhǔn)來(lái)交換消息的,提高Web服務(wù)的可信性也就是提高SOAP消息的可信度。我們可以對(duì)SOAP消息的傳送的三步驟:信息序列化?傳送?反序列化進(jìn)行改進(jìn):

1)服務(wù)請(qǐng)求者向服務(wù)提供者發(fā)送ClientHello消息;

2)服務(wù)提供者對(duì)收到ClientHello消息進(jìn)行簽名,再發(fā)送給服務(wù)請(qǐng)求者;

3)服務(wù)請(qǐng)求者對(duì)服務(wù)提供者進(jìn)行身份認(rèn)證,若通過(guò),則生成會(huì)話密鑰和進(jìn)一步的請(qǐng)求,對(duì)請(qǐng)求消息進(jìn)行安全處理,并連同自己的證書一起發(fā)送給服務(wù)提供者。

4)服務(wù)提供者收到請(qǐng)求消息后,首先對(duì)服務(wù)請(qǐng)求者進(jìn)行驗(yàn)證,若通過(guò),則建立會(huì)話,完成對(duì)請(qǐng)求消息的后續(xù)處理,并對(duì)處理結(jié)果進(jìn)行MAC計(jì)算;

5)服務(wù)請(qǐng)求者收到響應(yīng)消息后,進(jìn)行簽名、加密等處理,并使用會(huì)話密鑰對(duì)處理結(jié)果進(jìn)行MAC計(jì)算;

6)服務(wù)提供者收到上一步的請(qǐng)求消息后,驗(yàn)證會(huì)話的有效性,若通過(guò),則驗(yàn)證MAC的有效性,并對(duì)請(qǐng)求消息進(jìn)行后續(xù)處理,否則,若會(huì)話標(biāo)識(shí)符無(wú)效或MAC驗(yàn)證無(wú)效,則向服務(wù)請(qǐng)求者發(fā)出錯(cuò)誤消息。

這一會(huì)話過(guò)程是有時(shí)間限制的,若會(huì)話未超時(shí),則重復(fù)步驟5、6,否則重復(fù)步驟1~6。若通信發(fā)生較嚴(yán)重的錯(cuò)誤時(shí),則會(huì)導(dǎo)致會(huì)話終止,通信失敗,發(fā)送錯(cuò)誤信息。

1.2 Web服務(wù)的安全機(jī)制

1.2.1 加密機(jī)制

目前用于網(wǎng)絡(luò)通信安全的密碼技術(shù)主要有對(duì)稱加密、非對(duì)稱加密。

對(duì)稱加密:發(fā)送者和接收者都使用相同的密鑰對(duì)數(shù)據(jù)進(jìn)行加密和解密,一般用于加密大量數(shù)據(jù)。對(duì)稱密鑰技術(shù)的常用算法有DES、IDEA、RC2、RC4、SKIPJACK。對(duì)稱加密算法的加密處理簡(jiǎn)單,加密解密速度快。但密鑰管理困難。

非對(duì)稱加密:發(fā)送者和接收者使用不同的密鑰對(duì)數(shù)據(jù)進(jìn)行加密和解密。非對(duì)稱密鑰技術(shù)的典型算法有RSA、DSA。非對(duì)稱加密算法解決了密鑰管理的困難,密鑰是事先分配的無(wú)需在通信過(guò)程中傳輸,所以安全性很高,且具有很高的加密強(qiáng)度,但非對(duì)稱加密系統(tǒng)的加密和解密速度慢。

1.2.2 安全認(rèn)證機(jī)制

為了確保信息的安全、真實(shí)、可靠,我們必須有一種機(jī)制來(lái)驗(yàn)證信息傳遞中各方的真實(shí)身份,安全認(rèn)證包括安全管理、加密處理、PKI和認(rèn)證管理等問(wèn)題。目前常用的安全認(rèn)證機(jī)制有:數(shù)字摘要、數(shù)字時(shí)間戳、數(shù)字簽名、數(shù)字證書等。

1.2.3 訪問(wèn)控制策略

訪問(wèn)控制是維護(hù)網(wǎng)絡(luò)系統(tǒng)安全、保護(hù)網(wǎng)絡(luò)資源的最重要的核心策略之一,有效的訪問(wèn)控制可以保證網(wǎng)絡(luò)資源不被非法使用和非法訪問(wèn)。目前常用的訪問(wèn)控制策略有:入網(wǎng)訪問(wèn)控制、操作權(quán)限控制、目錄安全控制。

2 信息查詢技術(shù)

信息查詢一般都是借助搜索引擎頁(yè)面來(lái)實(shí)現(xiàn),即輸入關(guān)鍵詞利用搜索引擎在索引數(shù)據(jù)庫(kù)中進(jìn)行相關(guān)信息的查找,并將結(jié)果返回給用戶。除了根據(jù)需要選擇不同的搜索引擎之外,我們可以根據(jù)不同的查詢需求采用不同的查詢技術(shù)來(lái)提高查詢效率。

2.1 盲目查詢

盲目查詢又叫做無(wú)信息查詢,即按照預(yù)定的控制策略實(shí)行查詢,在查詢過(guò)程中獲取的中間信息不用來(lái)改進(jìn)控制策略。盲目查詢方法有寬度優(yōu)先、深度優(yōu)先、代價(jià)優(yōu)先、混合、向前、向后、雙向等等。

2.2 啟發(fā)式查詢

把求解問(wèn)題的具體領(lǐng)域的知識(shí)加入查詢算法中,控制整個(gè)查詢過(guò)程,以提高算法效率的查詢方法叫做啟發(fā)式查詢。啟發(fā)式查詢過(guò)程中最重要的事件就是尋找和決定要擴(kuò)展的下一個(gè)節(jié)點(diǎn),用來(lái)估算節(jié)點(diǎn)希望程度的量度,叫做估價(jià)函數(shù)。一個(gè)節(jié)點(diǎn)的“希望度”在狀態(tài)空間問(wèn)題中,可以估算目標(biāo)節(jié)點(diǎn)到此節(jié)點(diǎn)的距離或者解答路徑包括被估價(jià)過(guò)的節(jié)點(diǎn),并計(jì)算全條路徑的長(zhǎng)度或難度。每個(gè)不同的衡量標(biāo)準(zhǔn)只能考慮該問(wèn)題中這個(gè)節(jié)點(diǎn)的某些決定性特性,所以我們可以對(duì)給定節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)進(jìn)行比較,以決定相關(guān)特性。

2.3 多元搜索查詢技術(shù)

網(wǎng)絡(luò)中信息的種類繁復(fù),單一的搜索工具根本無(wú)法滿足用戶的需求。多元搜索引擎是一種集合式的搜索引擎,它可以將多個(gè)搜索引擎集成在一起,并提供一個(gè)統(tǒng)一的檢索界面,且能將一個(gè)檢索提問(wèn)同時(shí)發(fā)送給多個(gè)搜索引擎,達(dá)到同時(shí)檢索多個(gè)數(shù)據(jù)庫(kù),再經(jīng)過(guò)聚合、去除重復(fù)項(xiàng)之后輸出檢索結(jié)果。多元搜索引擎可以大大節(jié)省檢索時(shí)間。多元搜索引擎適合查詢一些較模糊的提問(wèn),或就某一課題的網(wǎng)絡(luò)資源進(jìn)行快速調(diào)查、摸底、綜覽。

2.4 常用的查詢算法

實(shí)現(xiàn)搜索引擎最關(guān)鍵的就是搜索算法的實(shí)現(xiàn),PageRank和HITS都是典型的網(wǎng)絡(luò)搜索查詢算法,我們可以把這兩種算法應(yīng)用到可信Web服務(wù)的查詢技術(shù)中來(lái)。

2.4.1 PageRank算法

PageRank算法主要基于重要性平均分配的思想進(jìn)行設(shè)計(jì)的。

假定Nu是頁(yè)面u的出度,Rank(u)是u的重要性。PageRank假設(shè)u通過(guò)指向v的直接鏈接將一部分重要性(量化為Rank(u)/Nu)傳遞給了v頁(yè)面。同樣,v頁(yè)面的重要性是所有直接鏈接到v的頁(yè)面累積起來(lái)的。(Ranki(u)÷Nu)

注:Bv代表直接對(duì)v鏈接的所有頁(yè)面的集合。

基于這個(gè)思想,通過(guò)迭代算法,我們可以得到所有頁(yè)面的重要性。

2.4.2 HITS算法

HITS(Hyperlink-Induced Topic Search,超鏈接誘導(dǎo)的主題搜索)算法是Kleinberg在90年代末提出的基于鏈接分析的網(wǎng)頁(yè)排名算法。

HITS算法的基本思想:HITS由用戶的檢索主題得到一個(gè)初始結(jié)果,構(gòu)成一個(gè)算法的根集。設(shè)置非負(fù)權(quán)威權(quán)重ap和非負(fù)中心權(quán) 重h與數(shù)據(jù)庫(kù)基本集中的每一個(gè)頁(yè)面p相關(guān),將所有的a和h值都初始化為相同的常數(shù)。權(quán)重規(guī)范處理,維護(hù)所有權(quán)重的平方和為1。權(quán)威與中心的權(quán)重可按如下公式更新:

第一個(gè)公式表明,如果一個(gè)頁(yè)面被很多好的中心所指向,則其權(quán)威權(quán)重應(yīng)當(dāng)增加(即,它為所有指向它的頁(yè)面的當(dāng)前中心權(quán)重之和)。第二個(gè)公式表明,如果一個(gè)頁(yè)面指向許多好的權(quán)威頁(yè)面,則其中心權(quán)重應(yīng)當(dāng)增加(即,它為該頁(yè)面指向的所有頁(yè)面的權(quán)威權(quán)重之和)。

我們用{1,2,…,n}對(duì)頁(yè)面編號(hào),定義它們的鄰接矩陣A為n×n矩陣,如果頁(yè)面i鏈接到頁(yè)面就j,則A(i,j)為1,否則為0。類似地,定義權(quán)威權(quán)重向量a=(a1,a2,…,an),和中心權(quán)重向量h=(h1,h2,…h(huán)n)??傻?/p>

h=A·a a=AT·h

注:AT是A的轉(zhuǎn)置矩陣。對(duì)兩公式展開(kāi)k次,就有h=A·a=AATh=(AAT)h=(AAT)2h=…=(AAT)kh a=AT·h=ATAa=(ATA) a=(ATA)2a=…=(ATA)

根據(jù)線性代數(shù),當(dāng)規(guī)范化后,這兩個(gè)迭代序列分別收斂于主本真向量AAT和ATA,這就證明了權(quán)威和中心權(quán)重是所收集的鏈接頁(yè)面的固有特征,并且不受初始權(quán)重設(shè)置的影響。而在實(shí)際應(yīng)用中HITS算法的查詢也具有非常好的搜索結(jié)果。

2.4.3 查詢算法的改進(jìn)

PageRank算法和HITS算法雖然都是鏈接分析算法,但都存在著不足。PageRank算法會(huì)忽略了網(wǎng)頁(yè)的內(nèi)容,他的authority值只是相對(duì)于某個(gè)檢索主題的權(quán)重,而HITS算法存在著“主題漂移”的現(xiàn)象。下面對(duì)兩種算法進(jìn)行改進(jìn),以便解決他們的不足。

首先利用HITS的方法構(gòu)造出算法的基本集,用戶的查詢請(qǐng)求來(lái)了之后,我們首先用一個(gè)現(xiàn)有的商業(yè)搜索引擎進(jìn)行查詢,從得到的查詢結(jié)果中取出一定量的信息作為算法的根集,將該根集進(jìn)行擴(kuò)充,將根集中的所有頁(yè)面的出度和入度網(wǎng)頁(yè)都補(bǔ)充進(jìn)來(lái),形成新的基本集。然后再利用PageRank算法。

PageRank算法原先是對(duì)萬(wàn)維網(wǎng)的整體分析,可以對(duì)用戶的要求進(jìn)行快速的響應(yīng)。而HITS算法是對(duì)萬(wàn)維網(wǎng)的部分進(jìn)行分析,依賴于用戶查詢,實(shí)時(shí)性差。改進(jìn)后的算法主要是通過(guò)把HITS生成查詢基本集的方法應(yīng)用到PageRank算法中,這樣就彌補(bǔ)了PageR? ank算法中頁(yè)面內(nèi)容無(wú)關(guān)性的缺點(diǎn)。新算法中引用了PageRank算法中的排序機(jī)制,也笑容削弱了HITS算法中的“主題漂移”的缺點(diǎn)。

3結(jié)束語(yǔ)

利用Internet進(jìn)行信息查詢已經(jīng)成為人們生活、工作、娛樂(lè)中必不可少的一部分。目前我們用得比較多的還是關(guān)鍵詞查詢,隨著XML語(yǔ)言的廣泛應(yīng)用和Web搜索技術(shù)的發(fā)展,專業(yè)、快捷、有效的查詢技術(shù)將越來(lái)越被人們所研究和使用。

[1]Papazoglou M P.Web Services Principles and Technology[M].北京:機(jī)械工業(yè)出版社,2010.

[2]Han Jiawei,Kamber M.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社.2007

[3]孟小峰.Web數(shù)據(jù)管理研究綜述[J].計(jì)算機(jī)研究與發(fā)展,2001(4).

[4]顧寧,劉家茂,柴曉路.Web Services原理與研發(fā)實(shí)踐[M].北京:機(jī)械工業(yè)出版社,2006.

猜你喜歡
搜索引擎密鑰頁(yè)面
刷新生活的頁(yè)面
幻中邂逅之金色密鑰
密碼系統(tǒng)中密鑰的狀態(tài)與保護(hù)*
TPM 2.0密鑰遷移協(xié)議研究
一種對(duì)稱密鑰的密鑰管理方法及系統(tǒng)
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
基于Lucene搜索引擎的研究
Web安全問(wèn)答(3)
網(wǎng)站結(jié)構(gòu)在SEO中的研究與應(yīng)用