張 華
摘要根據(jù)用戶的需求和本館的特色,自建了許多各具特色的數(shù)據(jù)庫,并通過WEB頁面動態(tài)交互或靜態(tài)的提供給讀者,采取統(tǒng)一友好的檢索界面不失為方便讀者有效利用信息資源的一種重要服務(wù)手段。
關(guān)鍵詞Web;數(shù)據(jù)檢索;數(shù)據(jù)庫
中圖分類號TP3文獻(xiàn)標(biāo)識碼A文章編號1673-9671-(2009)112-0026-01
1信息檢索工作原理
信息檢索過程:包括存貯和檢索兩個過程。存貯過程就是按照主題詞表或分類表及使用原則對原始信息進(jìn)行處理,形成信息標(biāo)識,為檢索提供經(jīng)過整序(即形成檢索途徑)的信息集合的過程。檢索過程則是按照同樣的主題詞表或分類表及組配原則分析課題,形成檢索提問標(biāo)識,根據(jù)存貯所提供的檢索途徑,從信息集合中查得與檢索提問標(biāo)識相符的信息特征標(biāo)識的過程。
信息檢索的實質(zhì):檢索提問標(biāo)識與存儲在檢索工具中的標(biāo)引標(biāo)識進(jìn)行比較,兩者一致或信息標(biāo)引的標(biāo)識包含檢索提問標(biāo)識,則具有該標(biāo)識的信息就從檢索工具中輸出,輸出的信息就是檢索命中的信息。
信息檢索系統(tǒng)的基本要素:(1)檢索文檔。即文獻(xiàn)檢索標(biāo)識的有機(jī)集合。如手工檢索系統(tǒng)中書目、索引和文摘中由文獻(xiàn)款目組成的正文、工具書由條目或短文組成的主體。計算機(jī)系統(tǒng)中以一定形式存儲的書目信息或事實、數(shù)據(jù)等。(2)技術(shù)設(shè)備。能存儲信息及其標(biāo)識,并實現(xiàn)存儲和檢索操作的各種技術(shù)設(shè)備,如手工檢索系統(tǒng)的卡片目錄或檢索刊物,計算機(jī)檢索系統(tǒng)的裝入設(shè)備、運(yùn)算器、存儲器、控制器、輸出設(shè)備等,聯(lián)機(jī)時還需要調(diào)制解調(diào)器、通信線路、通信裝置、終端設(shè)備及其相應(yīng)的軟件等。(3)作用于系統(tǒng)的人。文獻(xiàn)加工者、用戶、系統(tǒng)維護(hù)人員、管理人員。(4)檢索工具。檢索語言、文獻(xiàn)標(biāo)引規(guī)則、輸入輸出標(biāo)準(zhǔn)等如圖1。
2檢索系統(tǒng)的設(shè)計步驟
2.1選擇檢索系統(tǒng)和數(shù)據(jù)庫
根據(jù)課題分析結(jié)果、信息需求的要求,選擇適當(dāng)?shù)臄?shù)據(jù)庫。不同的數(shù)據(jù)庫學(xué)科范圍不同,檢索指令不同,收費(fèi)標(biāo)準(zhǔn)也不同。所以在檢索之前要閱讀有關(guān)數(shù)據(jù)庫的使用介紹,在做聯(lián)機(jī)檢索時,還可通過總索引文檔了解與檢索課題有關(guān)的每一個文檔中的文獻(xiàn)篇數(shù),選擇文獻(xiàn)量大的一個或幾個文檔作為檢索文檔。
數(shù)據(jù)庫選擇原則:(1)按照課題的檢索要求和目的,選擇收錄文獻(xiàn)種類、專業(yè)覆蓋面、年代跨度對口的數(shù)據(jù)庫。(2)當(dāng)需要查找最新文獻(xiàn)信息時,選擇數(shù)據(jù)更新周期短的數(shù)據(jù)庫。(3)當(dāng)需要獲取原文時,選取原文獲取較容易和數(shù)據(jù)庫。(4)要選好數(shù)據(jù)庫,就要弄清所選數(shù)據(jù)庫的標(biāo)引特征、不同檢索特點等。
2.2確定檢索詞和檢索途徑
檢索詞是構(gòu)成檢索式的基本單元,是文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)識,可以是反映文獻(xiàn)內(nèi)容特征的主題詞、自由詞,也可以是反映文獻(xiàn)外表特征的作者、篇名等。檢索詞的選擇要滿足匹配的要求,即形式的匹配和內(nèi)容的匹配。
形式匹配。是指用戶檢索使用的語言應(yīng)和檢索系統(tǒng)中使用的語言一致,才能被系統(tǒng)“識別”。內(nèi)容匹配。是指所確定的檢索詞要能準(zhǔn)確、完整地表達(dá)檢索課題的主題內(nèi)容。
檢索詞選擇的質(zhì)量直接影響到檢索效果,一定要參考有關(guān)檢索工具的使用手冊和指南,查閱大型數(shù)據(jù)庫的專用詞表以及專業(yè)詞典。
2.3制定檢索策略
檢索策略,又稱提問邏輯,就是對多個檢索詞之間的相互關(guān)系和檢索順序作出的某種安排。
檢索式是檢索策略的具體表述,是通過邏輯算符、位置算符、截詞算符等把表達(dá)主題要領(lǐng)的各檢索單元組配連接起來的命令形式,它既能表達(dá)主題內(nèi)容,又能被機(jī)器識別和執(zhí)行,是決定檢索策略質(zhì)量和檢索效果的重要因素。
3數(shù)據(jù)庫檢索舉例
創(chuàng)建數(shù)據(jù)庫鏈接(Connection)。通過服務(wù)器對象的CreateObject方法,可以創(chuàng)建Connection對象和使用變量接受對象引用。一旦連接對象創(chuàng)建之后,它就可用來打開到任何ODBC數(shù)據(jù)源的連接。
/加載驅(qū)動程序
//下面的代碼為加載JDBD-ODBC驅(qū)動程序
Class.forName("sun.jdbc.odbc.JdbcOdbcDriver");
//建立連接
//第二步是用適當(dāng)?shù)尿?qū)動程序連接到DBMS,看下面的代碼:
String url="jdbc:odbc:test";
//"test"是系統(tǒng)DNS名,ODBC里面設(shè)置的
Connection sqlCon=DriverManager.getConnection(url, "sa", "");
//"sa",""是SQL server的用戶名和密碼
//創(chuàng)建一個JDBC聲明
Statement st = "select * from jspdemo";
//執(zhí)行該存儲過程并返回結(jié)果集
Rs = st.executeQuery();
Rs.next();
//把指針指向第一條記錄
//獲取來自結(jié)果集中的數(shù)據(jù)1,2各表示第一和第二列記錄的數(shù)據(jù)
out.println(Rs.getString(1));
out.println(Rs.getString(2));
}
catch (Exception e) {}
//輸出確認(rèn)信息
out.println("數(shù)據(jù)庫訪問成功!");
以下是一個全文索引的數(shù)據(jù)庫檢索部分代碼:
Set doc = sess.DocumentContext
下列循環(huán)從數(shù)組ArrNsf中取得欲檢索的數(shù)據(jù)庫進(jìn)行處理:
For nsfCount=0 To Ubound( ArrNsf )
SearchDB=ArrNsf(nsfCount)
Set db = sess.GetDatabase("",SearchDB)
出現(xiàn)錯誤則轉(zhuǎn)向:
On Error Goto BadQuery
獲得滿足查詢條件的記錄集:
Set collection = db.FTSearch(doc.Query(0),0)
On Error Goto 0
輸出數(shù)據(jù)庫標(biāo)題:輸出該數(shù)據(jù)庫中滿足條件的記錄個數(shù):
There are " & Str$(collection.Count) & " matching
documents
參考文獻(xiàn)
[1]白毅.JSP訪問WEB數(shù)據(jù)庫[J].廈門科技,2005,3.
[2]王師.基于ASP技術(shù)開發(fā)Web數(shù)據(jù)庫檢索程序[J].山西煤炭管理干部學(xué)院學(xué)報,2008,2.