国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

XML文檔近似檢索系統(tǒng)設(shè)計(jì)

2014-02-19 19:20張碩石成
科技創(chuàng)新與應(yīng)用 2014年6期

張碩 石成

摘 要:本系統(tǒng)主要是實(shí)現(xiàn)了一種找尋近似結(jié)果的方式,它是一種使用基于代價(jià)的查詢(xún)轉(zhuǎn)換的樹(shù)型查詢(xún)方法,通過(guò)調(diào)節(jié)轉(zhuǎn)化的代價(jià),能適應(yīng)不同類(lèi)型的XML文檔。

關(guān)鍵詞:MSXML;DOM;XML;近似檢索

前言

今天,XML語(yǔ)言的使用已經(jīng)覆蓋了各行各業(yè),其內(nèi)容的龐大和結(jié)構(gòu)的復(fù)雜使用戶不能輕易的全面掌握整個(gè)文檔。了解到XML文檔的異構(gòu)性和復(fù)雜性,發(fā)現(xiàn)現(xiàn)有的XML文檔檢索系統(tǒng)已不能夠滿足用戶需求,急需更進(jìn)步更人性化的文檔檢索系統(tǒng)。本系統(tǒng)就是在XML文檔精確檢索的基礎(chǔ)上發(fā)展起來(lái)的近似檢索系統(tǒng),通過(guò)引入XML文檔,實(shí)現(xiàn)查詢(xún)條件的模糊查找,為用戶提供相似度最大的查詢(xún)結(jié)果。

1 系統(tǒng)簡(jiǎn)介

本系統(tǒng)避免了一般XML文檔檢索系統(tǒng)給用戶造成的使用上的困難性,形成了方便實(shí)用,為用戶提供最大便捷性的文檔近似檢索系統(tǒng)。它采用VC++開(kāi)發(fā)工具,設(shè)計(jì)了方便快捷的用戶使用界面,用戶使用用戶名和密碼登錄本系統(tǒng),可以對(duì)本系統(tǒng)進(jìn)行各項(xiàng)操作。系統(tǒng)具有友好的使用界面,能夠讓用戶引入用戶希望查詢(xún)的XML文檔,為了減輕用戶的使用負(fù)擔(dān),不需要用戶對(duì)整個(gè)XML文檔了解,只需要清楚要查詢(xún)的那部分結(jié)構(gòu)信息,在查詢(xún)命令輸入界面內(nèi)輸入查詢(xún)命令。為了能夠?qū)崿F(xiàn)近似的檢索,需要用戶輸入相應(yīng)節(jié)點(diǎn)的插入,刪除,更名代價(jià)值。這樣,將用戶輸入的查詢(xún)表達(dá)式進(jìn)行適當(dāng)?shù)牟迦牍?jié)點(diǎn)或刪除節(jié)點(diǎn)或?qū)⒐?jié)點(diǎn)更名等轉(zhuǎn)化后,變?yōu)榕c引入的XML文檔內(nèi)的某一段內(nèi)容相符。通過(guò)不同的轉(zhuǎn)換,能夠得到不同的結(jié)果,將最小代價(jià)和也就是系統(tǒng)認(rèn)為最相近的查詢(xún)結(jié)果返回給用戶。這樣實(shí)現(xiàn)了文檔的近似檢索。

關(guān)于XML文檔的近似性,其主旨是如果沒(méi)有精確匹配文件被找出, 根據(jù)他們的相似性應(yīng)當(dāng)將其查詢(xún)的最相似結(jié)果應(yīng)該找出.

關(guān)于用戶輸入的查詢(xún)命令,例如:\cd[title["piano" and "concerto"] and composer["rachmaninov"]],在設(shè)計(jì)時(shí),將屬性名和屬性值同樣對(duì)待,作為元素節(jié)點(diǎn)。將其與用戶添加的XML文本進(jìn)行對(duì)照,找到相似的那部分。如圖1所示。

圖1 嵌入樹(shù)模型

在轉(zhuǎn)化的過(guò)程中,有時(shí)候不可能正好一一對(duì)照。有可能多一個(gè)節(jié)點(diǎn),少一個(gè)節(jié)點(diǎn)或者有一個(gè)節(jié)點(diǎn)的名稱(chēng)不相符。這就要求系統(tǒng)能對(duì)不相符的節(jié)點(diǎn)進(jìn)行近似轉(zhuǎn)化。如圖2所示。

添加節(jié)點(diǎn)、刪除節(jié)點(diǎn)、更名節(jié)點(diǎn)對(duì)系統(tǒng)來(lái)說(shuō)是有代價(jià)大小的,不同的節(jié)點(diǎn)的代價(jià)值也是不相同的。例如:將cd轉(zhuǎn)化為dvd這就是針對(duì)cd節(jié)點(diǎn)的更名,用戶需要輸入相對(duì)節(jié)點(diǎn)的代價(jià)值。如果設(shè)計(jì)這種代價(jià)很小,那么對(duì)于系統(tǒng)來(lái)說(shuō)將其更名是非常容易的,更名后的轉(zhuǎn)化結(jié)果與原文件的相似度是最大的。相反,如果設(shè)置這個(gè)代價(jià)值為無(wú)限大,那么就是告訴系統(tǒng)這個(gè)節(jié)點(diǎn)不能被更名。同樣對(duì)于節(jié)點(diǎn)的添加、刪除有一樣的意義。用戶將自定義節(jié)點(diǎn)及對(duì)應(yīng)的代價(jià)值,系統(tǒng)把輸入的這些數(shù)據(jù)系統(tǒng)進(jìn)行后臺(tái)計(jì)算。系統(tǒng)設(shè)定所有沒(méi)有在表中列出的刪除和更名代價(jià)都是無(wú)限大,所有更名的插入代價(jià)都是1。如表1所示。

表1 代價(jià)輸入表

2 系統(tǒng)功能

2.1 系統(tǒng)提供了新建工程、打開(kāi)工程和保存工程的功能。用戶在第一次使用此系統(tǒng)時(shí),需要新建工程;對(duì)XML文件檢索完畢后如果用戶想要在以后查詢(xún)此次檢索結(jié)果,可以將此次的檢索工程進(jìn)行保存,需要輸入保存工程的工程名;在今后需要調(diào)用以前保存過(guò)的工程時(shí),要打開(kāi)用戶所需的工程。

2.2 系統(tǒng)提供了對(duì)XML的管理功能。用戶可以通過(guò)系統(tǒng)對(duì)需要檢索的XML文件進(jìn)行添加或刪除操作,并且提供了友好的文本顯示界面,對(duì)添加的XML文件系統(tǒng)會(huì)自動(dòng)對(duì)其進(jìn)行遍歷以文本形式將每個(gè)節(jié)點(diǎn)顯示給用戶,其方便簡(jiǎn)潔性供用戶可以很快對(duì)新添加的XML文件有一個(gè)整體的了解。

2.3 為了實(shí)現(xiàn)用戶的近似查詢(xún),系統(tǒng)除了提供查詢(xún)語(yǔ)句輸入功能外還提供了節(jié)點(diǎn)的代價(jià)值輸入功能。實(shí)現(xiàn)近似查詢(xún)關(guān)鍵在代價(jià)值的定義,通過(guò)用戶定義不同節(jié)點(diǎn)的插入代價(jià)、刪除代價(jià)或更名代價(jià),能夠?qū)⒂脩糨斎氲牟樵?xún)語(yǔ)句進(jìn)行有代價(jià)的轉(zhuǎn)化,適當(dāng)?shù)霓D(zhuǎn)化能夠使原輸入語(yǔ)句變?yōu)榕c引入XML文檔中的一部分內(nèi)容相符的結(jié)果,這就實(shí)現(xiàn)了用戶的近似查詢(xún)。不需要用戶非要清楚的記住精確的路徑表達(dá)式,也能夠通過(guò)不同節(jié)點(diǎn)的轉(zhuǎn)化達(dá)到成功查詢(xún)的目的。

2.4 隨著用戶的要求不斷增多,系統(tǒng)提供了功能的擴(kuò)展,可以及時(shí)將用戶的要求加進(jìn)系統(tǒng)中。其雖然增加了新的功能,但并不影響系統(tǒng)原有的功能。系統(tǒng)將每一個(gè)功能做成一個(gè)功能模塊,新增加的功能變成了新的功能模塊,各個(gè)功能模塊之間由主框架進(jìn)行連接,使系統(tǒng)具有良好的擴(kuò)展性。

2.5 由于本系統(tǒng)能夠直接對(duì)數(shù)據(jù)庫(kù)進(jìn)行添加修改操作,不良的操作可能對(duì)數(shù)據(jù)庫(kù)造成不良的后果。因此,需要對(duì)用戶進(jìn)行身份驗(yàn)證,只有獲得用戶名和密碼的用戶才能夠?qū)ο到y(tǒng)進(jìn)行操作。沒(méi)有輸入正確的用戶名和密碼的用戶將無(wú)權(quán)使用本系統(tǒng),系統(tǒng)將自動(dòng)關(guān)閉。另外,由于在編寫(xiě)程序的時(shí)候,各個(gè)功能被做成了對(duì)應(yīng)的功能模塊,各個(gè)功能模塊之間沒(méi)有直接的關(guān)聯(lián)關(guān)系,一個(gè)功能模塊出了問(wèn)題,不會(huì)影響其它的功能模塊。每個(gè)功能模塊提供了容錯(cuò)能力,避免了因?yàn)殄e(cuò)誤操作造成系統(tǒng)或服務(wù)的不正常運(yùn)行。

3 結(jié)束語(yǔ)

本系統(tǒng)可以在Windows XP操作系統(tǒng)以上環(huán)境中運(yùn)行,通過(guò)用多類(lèi)不同行業(yè)定義的XML文檔結(jié)構(gòu)進(jìn)行測(cè)試,能夠快速將用戶輸入節(jié)點(diǎn)的代價(jià)和檢索命令進(jìn)行轉(zhuǎn)化形成五元組,系統(tǒng)再將五元組進(jìn)行轉(zhuǎn)化與用戶引入的XML文檔進(jìn)行比較,得到最相近的一段XML文本,在顯示對(duì)話框中顯示出來(lái),實(shí)現(xiàn)XML文檔近似檢索的設(shè)計(jì)目的,為用戶的快速查找提供了方便性與時(shí)效性。

參考文獻(xiàn)

[1]余宏,萬(wàn)常選.面向XML的語(yǔ)義近似檢索模型[J].情報(bào),2007(10).

[2]張曉琳.面向?qū)ο蟮腦ML數(shù)據(jù)管理技術(shù)研究[D].東北大學(xué),2006.