郭旦雄 郭曉珍 郭曉梫 唐強
摘 要:信息檢索服務是當前時代中一項重要的服務類型,通過對于信息檢索服務做出細化分析,隨后將其應用到知識產權信息檢索服務提供系統(tǒng)中,便可以構建起一個完整的知識產權信息檢索服務提供系統(tǒng),繼而使我國的信息檢索服務的質量得到全方位提升。
關鍵詞:知識產權;信息檢索;服務提供系統(tǒng)
當前,伴隨著信息化時代的到來,我國社會也開始逐漸進入信息化時代,在信息化時代中,面對著網(wǎng)絡數(shù)據(jù)庫當中的眾多信息,如何才能夠在第一時間找到自己想要的信息便成了一項重要內容,而信息檢索的方式則是挖掘有效信息的重要途徑。在我國,知識產權是我國每個公平都享有的一項權利,若是想要及時地了解到知識產權信息,便需要通過信息查詢的方式,在此期間,將信息檢索的理念應用到其中,便能夠快速查找到產權信息。下面本文將針對知識產權信息檢索服務提供系統(tǒng)的構建做出系統(tǒng)性的分析闡述。
一、 知識產權信息檢索系統(tǒng)構成
在知識產權信息檢索系統(tǒng)中,為了有效實現(xiàn)該系統(tǒng)的既定功能,便需要對于系統(tǒng)工作做出系統(tǒng)考量,在一般情況下,知識產權信息檢索系統(tǒng)主要包含以下幾個模塊:網(wǎng)頁模塊、信息收集與處理模塊、文檔模塊、索引策略模塊、索引模塊、檢索模型模塊、查詢模塊、查詢結果模塊,通過以上模塊之間的相互組合,能夠有效地實現(xiàn)知識產權信息檢索功能,同時也能夠為訪客提供知識產權信息檢索服務,下圖1-1為知識產權信息檢索系統(tǒng)構成示意圖。在圖1中,信息的收集與預處理主要便是有爬行器來讀取網(wǎng)上的網(wǎng)頁,隨后將其中的數(shù)據(jù)處理轉換為文檔的形式。
圖1 知識產權信息檢索系統(tǒng)構成示意圖
(一) 索引策略
在儲存文檔期間,可以采用索引策略,在其中包含字、詞以及二元文法等。例如:在實際應用中要對“知識產權信息檢索服務”進行儲存,通過詞索引策略,便要用“知識”“產權”“信息”“檢索”“服務”與等方式進行信息儲存,在字索引策略下,還要以“知”“識”“產”“權”“信”“息”“檢”“索”“服”“務”的方式進行儲存,同時在二元文法索引策略下,要以:“知識”“識產”“產權”“權信”“信息”“息檢”“檢索”“索服”“服務”的方式來進行文檔儲存。
(二) 檢索模型
在知識產權信息檢索期間,訪客將自身所要查詢的信息輸入到檢索系統(tǒng)中,隨后系統(tǒng)便可以對查詢以及索引相似度做出計算,之后還可以自動完成結果文檔集的查詢以及排序,并且將查詢信息與檢索信息相似度較高的內容排列在最上面,之后便可以將查詢的結果反饋給訪客。通過以上過程便能夠完成整個信息檢索的過程,從而為訪客提供相應的知識產權信息檢索服務。
二、 知識產權信息檢索服務提供系統(tǒng)總框架設計
(一) 信息的收集以及處理
在知識產權信息檢索系統(tǒng)中,信息的收集工作是一項重要的工作,同時也是系統(tǒng)能夠實現(xiàn)其既定功能的核心保障。基于此,在信息收集期間,首先要做的便是要確保信息的真實性、準確性,這樣才能夠令知識產權信息檢索服務提供系統(tǒng)受到更多人的青睞,在一般情況下,知識產權信息檢索系統(tǒng)中的數(shù)據(jù)來源主要便是知識產權局所提供,在其中還包括國家知識產權局以及地方知識產權局,需要依照系統(tǒng)服務的范圍來定制信息數(shù)據(jù)的來源。
(二) 索引策略選擇
通過研究與實踐證明,在中文檢索系統(tǒng)中,采用二元文法索引策略的檢索系統(tǒng)所取得的效果更佳,所以在知識產權信息檢索服務提供系統(tǒng)中同樣要選擇二元文法索引策略。
(三) 數(shù)據(jù)庫設計
在知識產權信息檢索系統(tǒng)中,需要構建數(shù)據(jù)庫才能夠保證其實現(xiàn)既定功能,在一般情況下,知識產權信息檢索系統(tǒng)中需要存儲以下方面信息:①總詞匯數(shù)量;②單詞匯總表,在其中主要包括單詞以及其出現(xiàn)次數(shù)等;③文檔索引:在其中主要包括文檔編號、單詞等;④文檔表:在其中主要包括文檔編號以及文檔總詞數(shù)。在知識產權信息檢索系統(tǒng)工作期間,需要構建起倒排索引,同時利用B+樹等方面結構來完成數(shù)據(jù)儲存。隨后在信息檢索期間,系統(tǒng)便可以到數(shù)據(jù)庫當中調用數(shù)據(jù)文檔,隨后經過排序將數(shù)據(jù)文檔呈現(xiàn)在訪客界面。
(四) 存儲過程分析
知識產權信息檢索服務提供系統(tǒng)中還要經過存儲過程才能夠完成數(shù)據(jù)庫的存儲功能,在實際存儲過程中,主要包含以下方面在步驟:①文檔表的生成:在此期間,系統(tǒng)可以對于原始文檔做出計算,同時統(tǒng)計出在每天文檔當中所包含的單詞以及每個文檔中單詞所出現(xiàn)的次數(shù)。②文檔索引表的生成:在該步驟當中,主要便是對于原始文檔中的每篇文章做出分析,同時統(tǒng)計出每篇文檔的總詞數(shù),隨后做出相應的記錄。③總詞數(shù)表的生成:在此期間的主要工作便是對于整個文檔的總詞數(shù)做出統(tǒng)計與記錄。④單詞匯總表的生成:需要對于整個文檔集中的每個單詞總計出現(xiàn)的次數(shù)做出統(tǒng)計。⑤查詢以及儲存過程的實現(xiàn):首先要將查詢表中的查詢處理,之后將結果保存到查詢結果表當中。
三、 結束語
綜上所述,在我國信息化程度逐年提高的背景下,信息檢索服務是一項重要的服務,同時該項服務也能夠有效提升人們查詢到有效信息的效率。所以便需要將該項技術應用到知識產權信息檢索服務中,著力構建其專門的知識產權信息檢索服務提供系統(tǒng),這樣才能夠確保知識產權信息檢索需求被更加優(yōu)質的完成,完善我國社會發(fā)展期間的信息檢索服務體系。
參考文獻:
[1]谷參.基于分布式結構的圖書館信息檢索服務系統(tǒng)研究[J].現(xiàn)代電子技術,2017,40(1):83-85.
[2]劉銳.基于大數(shù)據(jù)和云盾技術的地方專利信息檢索系統(tǒng)研究[J].電腦知識與技術,2019,15(2):7-8.
作者簡介:
郭旦雄,郭曉珍,郭曉梫,唐強,四川省成都市,成都行曦知識產權服務有限公司。