林杰
摘要:現(xiàn)階段,我國的信息資源庫仍存在某些劣勢,如可復(fù)用性、共享性、知識查詢的準確率和百分率等,為了解決目前查詢系統(tǒng)中相關(guān)屬性查找困難以及同義詞難以識別等問題,該文把方法論引入到信息資源庫研究中,并提出了基于領(lǐng)域的語義智能查詢系統(tǒng)的架構(gòu),本系統(tǒng)是針對特定領(lǐng)域知識信息的語義分析基礎(chǔ)上,得出了相對足夠的語義知識的信息查詢系統(tǒng)。該文的重點是基于領(lǐng)域的信息資源的描述,建設(shè)一個特定領(lǐng)域知識本體及基于內(nèi)容的查詢的系統(tǒng)。
關(guān)鍵詞:本體;檢索;語義
中圖分類號:TP399 文獻標識碼:A 文章編號:1009-3044(2014)34-8268-03
傳統(tǒng)信息檢索技術(shù)主要是基于語法的關(guān)鍵詞匹配和全文檢索技術(shù)的基礎(chǔ)上,主要通過索引、關(guān)鍵詞和列表的方法來實現(xiàn)?,F(xiàn)有的主要缺點是:計算機文獻信息檢索已經(jīng)不能滿足信息檢索的需求。計算機信息檢索過程中,計算機不具有人類的思維能力。因此,搜索查詢的符號輸入檢索系統(tǒng),就不能與明確的用戶信息需求相適應(yīng),和不能修改用戶的搜索查詢的標記。在計算機信息檢索系統(tǒng)的檢索問題的同時,搜索需求與文獻標識的匹配是一個完全基于字面的匹配。那就是,計算機將兩個“標志”完全當做是“字符串”的模擬計算。因此,必須要求搜索查詢的標記和文獻標識特征一致,才可以匹配。這種文字的組合,使檢索出的文件只是在字面意義上的查詢和檢索標志保持不變,并在內(nèi)容或概念不一定能滿足用戶的信息需求。
1 基于本體的信息查詢的可行性
針對上述問題最新的查詢工具融入了一些新的方法和技術(shù),大幅度的提升了信息查詢的效果和效率。如在對結(jié)果進行排序時,會將將引用大量的檢索結(jié)果往前排,以讓用戶可以盡量縮短時間來處理結(jié)果。使用XML和RDF的知識,可以描述萬維網(wǎng)的信息內(nèi)容,使信息不僅是以人為本的信息,并可以使計算機可以理解信息的內(nèi)涵。傳統(tǒng)的搜索引擎依賴與關(guān)鍵詞匹配的字符檢索,簡單的方法沒有充分利用的潛在的信息內(nèi)容?;跈C器理解的內(nèi)容信息,應(yīng)用程序可以更智能的完成推理查詢?;谡Z義的檢索是基于知識(概念)的層面檢索,描述概念和概念之間的內(nèi)在聯(lián)系,可以挖掘出一些模糊的概念,在檢索準確率方面能更好地滿足用戶的要求。基于知識查詢和基于關(guān)鍵詞查詢是不同的,它是由包括知識之間的類和子類,類和實例等的關(guān)系來查詢,這樣可以有效地控制檢索范圍,同時不僅可以提高搜索的準確率,而且可以大大提高查詢速度。有效的使用本體和語義信息來取代傳統(tǒng)的關(guān)鍵詞匹配是一個重要的促進智能檢索的方法。知識網(wǎng)格的結(jié)構(gòu)是由人的本體論和認識論組成的。領(lǐng)域本體定義了主題詞匯的基本屬性和關(guān)系,以及和術(shù)語之間的關(guān)系組合規(guī)則,定義了詞匯擴展的概念,以及抽象對象,關(guān)系和類,詞匯。運用這些定義,可以對領(lǐng)域知識進行描述。結(jié)合知識查詢和本體是一個在當前信息檢索領(lǐng)域的研究熱點。
2 基于本體的檢索模型架構(gòu)
下圖為基于本體的智能化的知識檢索結(jié)構(gòu)模型。顯示了本體技術(shù)在檢索結(jié)構(gòu)中的應(yīng)用。該系統(tǒng)有以下幾個模塊: 查詢轉(zhuǎn)換模塊、領(lǐng)域本體服務(wù)器、文檔處理器、檢索代理、定制處理模塊。相互之間的結(jié)構(gòu)關(guān)系如圖1所示。
該系統(tǒng)由兩部分組成:基于領(lǐng)域本體的知識預(yù)處理(包括信息庫、文檔處理器、領(lǐng)域本體服務(wù)器和數(shù)據(jù)源)和基于領(lǐng)域本體的智能檢索(包括領(lǐng)域本體服務(wù)器、查詢轉(zhuǎn)換模塊、定制處理模塊、檢索代理和信息庫)。與傳統(tǒng)的信息查詢系統(tǒng)不同的地方在于,查詢過程和知識處理過程中都加入了本體論的知識。
3 基于本體的教育資源庫系統(tǒng)的設(shè)計
信息資源是網(wǎng)絡(luò)教育的基礎(chǔ)?,F(xiàn)階段,呈指數(shù)增長的網(wǎng)絡(luò)信息資源,伴隨著大量的、明顯的缺點,如信息資源的復(fù)用性差,個性化和參與式教學(xué)的缺乏等,阻礙了網(wǎng)絡(luò)在教育中的應(yīng)用、發(fā)展和普及。其主要問題為:1)信息資源的智能化查詢;2)信息資源的自動獲??;3)個性化學(xué)習(xí)路徑的動態(tài)生成;4)基于語義的互操作。經(jīng)過綜合考慮分析,資源庫的系統(tǒng)設(shè)計目標如下圖所示。
根據(jù)提出的問題,設(shè)計一種基于領(lǐng)域本體的信息資源庫的系統(tǒng)架構(gòu),從知識層面和語義層面去表示教育資源,所以它可以被電腦所理解和處理,以達到網(wǎng)絡(luò)教育資源的智能查詢和優(yōu)化整合,提高教育資源的檢索準確率,從而支持教育活動,提供更加個性化、自主化的教育活動。資源庫體系結(jié)構(gòu)如圖3所示。
4 領(lǐng)域本體的設(shè)計
描述知識本體是一個五元集合,可以用O=描述.其中,I是概念的集合,指收集反映事物本質(zhì)的定義;P是屬性的集合,用于表現(xiàn)對事物的本質(zhì)特性;N是關(guān)系的集合,用于描述事物之間的關(guān)系的性質(zhì);E是實例的集合;R是概念集和實例集之間的映射關(guān)系,這種映射為每個實例對應(yīng)到其所屬的概念中去。知識本體定義描述圖如下所示。圓圈代表概念,箭頭指示關(guān)系。把相關(guān)概念的關(guān)系聯(lián)系在一起,實例對應(yīng)于查詢信息的概念,在概念和實例上建立聯(lián)系。
核心領(lǐng)域本體構(gòu)建不需要盲目的完美,只要該領(lǐng)域內(nèi)最重要的概念和關(guān)系,作為以后不斷發(fā)展的種子。該文以電子政務(wù)學(xué)科為例,簡單介紹領(lǐng)域本體的構(gòu)建。電子政務(wù)學(xué)科如何進行知識的分類,確定關(guān)鍵的概念,是其中一個迫切需要解決的問題。在這個階段不求大而全,電子政務(wù)領(lǐng)域本體的初步構(gòu)建如圖5所示。
定義了基本概念和知識點屬性后,它們可以用來描述一些基本的信息之間的關(guān)系。例如TCP/IP和IPX/SPX都是網(wǎng)絡(luò)協(xié)議的子類,TCP/IP的同義詞是傳輸控制協(xié)議/因特網(wǎng)互聯(lián)協(xié)議。知識關(guān)系描述如下圖所示。在圖中,橢圓型節(jié)點表示概念,如TCP/IP,IPX/SPX等。
5 主要開發(fā)工具
6 結(jié)束語
作為一個相對較新的知識表示方法,本體越來越多的廣泛應(yīng)用在信息檢索領(lǐng)域中?,F(xiàn)在本體研究中也有許多分支,該文主要根據(jù)在大規(guī)模數(shù)據(jù)資源的存儲,管理,檢索所遇到的許多困難,結(jié)合領(lǐng)域本體和語義信息檢索領(lǐng)域中的優(yōu)勢,解決機器對知識點的語義理解問題的關(guān)鍵。因為本體的應(yīng)用,計算機可以解析出類之間的層次關(guān)系的描述,并分析類和其他的相互制約關(guān)系的,進而進行智能化推理,從而有效地輔助機器理解用戶輸入的檢索隱含的語義信息。
參考文獻:
[1] 郭廣軍,周顯光,陳代武.基于本體和Lucene的網(wǎng)絡(luò)教育資源管理檢索系統(tǒng)[J].計算機應(yīng)用與軟件,2012,29(7):115-118.
[2] 林麗姝,林珍,劉露思.基于本體與粗糙集的教育資源檢索模型的關(guān)鍵技術(shù)研究[J].實驗技術(shù)與管理,2012,29(10):123-125.
[3] 孫瑜,徐天偉,陳娟娟.民族教育資源本體構(gòu)建方法及應(yīng)用[J].云南師范大學(xué)學(xué)報:自然科學(xué)版,2013,33(6):6-11.
[4] 郭廣軍,王劍波,游新娥,等.基于本體和語義網(wǎng)的網(wǎng)絡(luò)教育資源檢索研究[J].華中師范大學(xué)學(xué)報:自然科學(xué)版,2011,45(4):551-556.
[5] 王志華,趙偉. 基于本體的語義網(wǎng)檢索模型及關(guān)鍵技術(shù)研究[J].計算機工程與設(shè)計,2011(1):145-148.
[6] 鮑文燕,沈岑誠,劉博.云環(huán)境下的語義本體構(gòu)建及其在語義檢索中的應(yīng)用[J].微電子學(xué)與計算機,2012(11):66-69.
[7] 吳振忠,王曼,宋婧文,等.一種基于領(lǐng)域本體的論文檢索方法的研究與應(yīng)用[J].計算機應(yīng)用與軟件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知識檢索系統(tǒng)功能要素分析[J].情報雜志,2007(4):116-118.
[9] 欒艷,丁二玉,駱斌.基于ontology的語義檢索技術(shù)[J].計算機工程與應(yīng)用,2005(28):156-159.
[10] 羅偉,李陶深.一種基于本體的個性化搜索引擎模型[J].廣西科學(xué)院學(xué)報,2006,22(4):256-259.
[11] 趙寧,呂鵬.基于本體的語義信息集成中的查詢轉(zhuǎn)換[J].科技信息,2007(24):386-387.
[12] 胡楊,萬健,余日泰.一種基于本體的具有語義搜索功能的E-learning模型[J].計算機與現(xiàn)代化,2006(11):21-24.
[13] 王梅文.本體在元搜索引擎查詢結(jié)果自動分類中的應(yīng)用[J].開發(fā)研究與設(shè)計技術(shù),2007,2(2):441-443.
[14] 高建軍,呂振國,曹三省,等.基于語義本體的媒體內(nèi)容搜索引擎的構(gòu)建[J].中國傳媒大學(xué)學(xué)報:自然科學(xué)版,2007,14(4):40-42.endprint
參考文獻:
[1] 郭廣軍,周顯光,陳代武.基于本體和Lucene的網(wǎng)絡(luò)教育資源管理檢索系統(tǒng)[J].計算機應(yīng)用與軟件,2012,29(7):115-118.
[2] 林麗姝,林珍,劉露思.基于本體與粗糙集的教育資源檢索模型的關(guān)鍵技術(shù)研究[J].實驗技術(shù)與管理,2012,29(10):123-125.
[3] 孫瑜,徐天偉,陳娟娟.民族教育資源本體構(gòu)建方法及應(yīng)用[J].云南師范大學(xué)學(xué)報:自然科學(xué)版,2013,33(6):6-11.
[4] 郭廣軍,王劍波,游新娥,等.基于本體和語義網(wǎng)的網(wǎng)絡(luò)教育資源檢索研究[J].華中師范大學(xué)學(xué)報:自然科學(xué)版,2011,45(4):551-556.
[5] 王志華,趙偉. 基于本體的語義網(wǎng)檢索模型及關(guān)鍵技術(shù)研究[J].計算機工程與設(shè)計,2011(1):145-148.
[6] 鮑文燕,沈岑誠,劉博.云環(huán)境下的語義本體構(gòu)建及其在語義檢索中的應(yīng)用[J].微電子學(xué)與計算機,2012(11):66-69.
[7] 吳振忠,王曼,宋婧文,等.一種基于領(lǐng)域本體的論文檢索方法的研究與應(yīng)用[J].計算機應(yīng)用與軟件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知識檢索系統(tǒng)功能要素分析[J].情報雜志,2007(4):116-118.
[9] 欒艷,丁二玉,駱斌.基于ontology的語義檢索技術(shù)[J].計算機工程與應(yīng)用,2005(28):156-159.
[10] 羅偉,李陶深.一種基于本體的個性化搜索引擎模型[J].廣西科學(xué)院學(xué)報,2006,22(4):256-259.
[11] 趙寧,呂鵬.基于本體的語義信息集成中的查詢轉(zhuǎn)換[J].科技信息,2007(24):386-387.
[12] 胡楊,萬健,余日泰.一種基于本體的具有語義搜索功能的E-learning模型[J].計算機與現(xiàn)代化,2006(11):21-24.
[13] 王梅文.本體在元搜索引擎查詢結(jié)果自動分類中的應(yīng)用[J].開發(fā)研究與設(shè)計技術(shù),2007,2(2):441-443.
[14] 高建軍,呂振國,曹三省,等.基于語義本體的媒體內(nèi)容搜索引擎的構(gòu)建[J].中國傳媒大學(xué)學(xué)報:自然科學(xué)版,2007,14(4):40-42.endprint
參考文獻:
[1] 郭廣軍,周顯光,陳代武.基于本體和Lucene的網(wǎng)絡(luò)教育資源管理檢索系統(tǒng)[J].計算機應(yīng)用與軟件,2012,29(7):115-118.
[2] 林麗姝,林珍,劉露思.基于本體與粗糙集的教育資源檢索模型的關(guān)鍵技術(shù)研究[J].實驗技術(shù)與管理,2012,29(10):123-125.
[3] 孫瑜,徐天偉,陳娟娟.民族教育資源本體構(gòu)建方法及應(yīng)用[J].云南師范大學(xué)學(xué)報:自然科學(xué)版,2013,33(6):6-11.
[4] 郭廣軍,王劍波,游新娥,等.基于本體和語義網(wǎng)的網(wǎng)絡(luò)教育資源檢索研究[J].華中師范大學(xué)學(xué)報:自然科學(xué)版,2011,45(4):551-556.
[5] 王志華,趙偉. 基于本體的語義網(wǎng)檢索模型及關(guān)鍵技術(shù)研究[J].計算機工程與設(shè)計,2011(1):145-148.
[6] 鮑文燕,沈岑誠,劉博.云環(huán)境下的語義本體構(gòu)建及其在語義檢索中的應(yīng)用[J].微電子學(xué)與計算機,2012(11):66-69.
[7] 吳振忠,王曼,宋婧文,等.一種基于領(lǐng)域本體的論文檢索方法的研究與應(yīng)用[J].計算機應(yīng)用與軟件,2013(10):177-180.
[8] 石建,石苗茜.基于Ontology的知識檢索系統(tǒng)功能要素分析[J].情報雜志,2007(4):116-118.
[9] 欒艷,丁二玉,駱斌.基于ontology的語義檢索技術(shù)[J].計算機工程與應(yīng)用,2005(28):156-159.
[10] 羅偉,李陶深.一種基于本體的個性化搜索引擎模型[J].廣西科學(xué)院學(xué)報,2006,22(4):256-259.
[11] 趙寧,呂鵬.基于本體的語義信息集成中的查詢轉(zhuǎn)換[J].科技信息,2007(24):386-387.
[12] 胡楊,萬健,余日泰.一種基于本體的具有語義搜索功能的E-learning模型[J].計算機與現(xiàn)代化,2006(11):21-24.
[13] 王梅文.本體在元搜索引擎查詢結(jié)果自動分類中的應(yīng)用[J].開發(fā)研究與設(shè)計技術(shù),2007,2(2):441-443.
[14] 高建軍,呂振國,曹三省,等.基于語義本體的媒體內(nèi)容搜索引擎的構(gòu)建[J].中國傳媒大學(xué)學(xué)報:自然科學(xué)版,2007,14(4):40-42.endprint