張 程,任海霞,張繼軍
(松遼水利委員會(huì)水文局(信息中心),吉林長(zhǎng)春 130021)
TRS信息發(fā)布檢索系統(tǒng)是由北京拓爾斯信息技術(shù)有限公司開(kāi)發(fā)的結(jié)構(gòu)優(yōu)、功能強(qiáng)、面向文本數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)檢索系統(tǒng),其特點(diǎn)是軟件成熟,二次開(kāi)發(fā)容易,人機(jī)交互界面簡(jiǎn)捷友好,維護(hù)工作量小,檢索與發(fā)布功能強(qiáng),滿足網(wǎng)站全文檢索功能要求。系統(tǒng)由TRS全文檢索數(shù)據(jù)庫(kù)((TRS Database Server)、TRS 全文檢索網(wǎng)關(guān)(TRS GateWay)、TRS信息發(fā)布應(yīng)用服務(wù)器系統(tǒng)(TRS WAS)三部分組成,另外TRS Admin作為維護(hù)模塊,用于對(duì)TRS server數(shù)據(jù)庫(kù)進(jìn)行維護(hù)。
TRS全文數(shù)據(jù)庫(kù)系統(tǒng)是采用TR的信息檢索技術(shù)和中文自然語(yǔ)言處理成果開(kāi)發(fā)完成,其核心功能是對(duì)結(jié)構(gòu)化數(shù)據(jù)提供全文檢索功能。主要特點(diǎn)包括:異構(gòu)數(shù)據(jù)庫(kù)海量數(shù)據(jù)統(tǒng)一管理,非結(jié)構(gòu)化數(shù)據(jù)聯(lián)合檢索和智能檢索,檢索準(zhǔn)確性高,檢索速度快,動(dòng)態(tài)索引實(shí)時(shí)更新,提供多語(yǔ)種查詢引擎,可隨需需求隨時(shí)擴(kuò)展。
TRS全文檢索網(wǎng)關(guān)是實(shí)現(xiàn)TRS數(shù)據(jù)與主流關(guān)系型數(shù)據(jù)庫(kù)數(shù)據(jù)之間進(jìn)行數(shù)據(jù)轉(zhuǎn)換遷移同步的工具,實(shí)現(xiàn)了關(guān)系數(shù)據(jù)庫(kù)與TRS全文數(shù)據(jù)庫(kù)之間數(shù)據(jù)共享,使用戶在享有關(guān)系數(shù)據(jù)庫(kù)卓越的數(shù)據(jù)處理功能的同時(shí),同時(shí)擁有TRS優(yōu)秀的非結(jié)構(gòu)化全文檢索功能。
TRS WAS由兩部分組成:一是系統(tǒng)控制,稱(chēng)為T(mén)RS WAS管理控制臺(tái),用于設(shè)置和管理要發(fā)布的信息;二是應(yīng)用,用于將數(shù)據(jù)庫(kù)中的信息動(dòng)態(tài)發(fā)布到Web服務(wù)器上。
管理控制臺(tái)基于Web方式實(shí)現(xiàn),管理靈活,可實(shí)現(xiàn)遠(yuǎn)程管理。檢索網(wǎng)頁(yè)采用JSP模板技術(shù),通過(guò)概覽和細(xì)覽模板控制頁(yè)面顯示風(fēng)格,通過(guò)設(shè)置頻道對(duì)動(dòng)態(tài)網(wǎng)頁(yè)的輸出進(jìn)行控制。應(yīng)用模塊基于應(yīng)用程序,根據(jù)管理控制臺(tái)的設(shè)置,并根據(jù)前端的訪問(wèn)請(qǐng)求,自動(dòng)訪問(wèn)后臺(tái)數(shù)據(jù)庫(kù)系統(tǒng),動(dòng)態(tài)地將信息組織成Web頁(yè)面發(fā)送到前端。
TRS WAS提供1套TRS置標(biāo),使用此置標(biāo)和網(wǎng)頁(yè)開(kāi)發(fā)語(yǔ)言可以快速開(kāi)發(fā)JSP檢索頁(yè)面,既減少了開(kāi)發(fā)的復(fù)雜程度,又保證了任務(wù)的順利完成,同時(shí)使用戶的各種需求能得到保證。
TRS管理員工具以實(shí)現(xiàn)遠(yuǎn)程對(duì)TRS Server中的數(shù)據(jù)庫(kù)進(jìn)行維護(hù),包括直接對(duì)數(shù)據(jù)庫(kù)進(jìn)行查看、重命名、刪除等項(xiàng)操作,直觀地設(shè)置或修改數(shù)據(jù)庫(kù)的結(jié)構(gòu)和字段屬性、數(shù)據(jù)增加、刪除等項(xiàng)操作,進(jìn)行用戶管理,支持多種文件格式的加載。
圖1 松遼委網(wǎng)站檢索拓?fù)浣Y(jié)構(gòu)圖
松遼委網(wǎng)站以TRS WCM內(nèi)容管理系統(tǒng)為核心設(shè)計(jì)構(gòu)建,網(wǎng)站采用oracle數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)。網(wǎng)站檢索系統(tǒng)基于TRS全文檢索系統(tǒng)開(kāi)發(fā)建設(shè),系統(tǒng)包括:TRS全文檢索數(shù)據(jù)庫(kù)、TRS全文檢索網(wǎng)關(guān)、TRS WAS和TRS管理員工具組成。根據(jù)松遼委網(wǎng)站部署拓?fù)浣Y(jié)構(gòu),TRS全文檢索數(shù)據(jù)庫(kù)和TRS全文檢索網(wǎng)關(guān)部署在位于局域網(wǎng)內(nèi)的TRS內(nèi)容管理服務(wù)器上,TRS WAS和TRS admin部署在位于防火墻DMZ區(qū)的松遼委網(wǎng)站外網(wǎng)插件服務(wù)器上,在防火墻上設(shè)置開(kāi)放端口實(shí)現(xiàn)外網(wǎng)檢索和檢索結(jié)果展示數(shù)據(jù)的雙向傳輸。
TRS全文檢索網(wǎng)關(guān)采用C/S架構(gòu),由服務(wù)端和客戶端組成,服務(wù)端包括:服務(wù)主體程序、服務(wù)關(guān)閉程序、服務(wù)監(jiān)控工具、產(chǎn)品注冊(cè)工具、配置升級(jí)工具、紅櫻楓外部調(diào)用工具;客戶端包括客戶端主體程序,實(shí)現(xiàn)了源數(shù)據(jù)庫(kù)與TRS全文檢索數(shù)據(jù)庫(kù)之間數(shù)據(jù)遷移與共享。
根據(jù)松遼委網(wǎng)站的檢索需求,首先進(jìn)行oracle數(shù)據(jù)庫(kù)到TRS數(shù)據(jù)庫(kù)的數(shù)據(jù)遷移同步設(shè)置,啟動(dòng)TRS網(wǎng)關(guān)客戶端登陸進(jìn)入任務(wù)控制臺(tái)創(chuàng)建任務(wù),設(shè)置源數(shù)據(jù)庫(kù)登錄信息,指定源數(shù)據(jù)庫(kù)表或視圖,指定源數(shù)據(jù)庫(kù)表或視圖的主鍵,設(shè)置目標(biāo)數(shù)據(jù)庫(kù)登錄信息,創(chuàng)建目標(biāo)數(shù)據(jù)庫(kù)表,設(shè)置目標(biāo)數(shù)據(jù)庫(kù)參數(shù),設(shè)置更新方式,先創(chuàng)建oracle到TRS數(shù)據(jù)庫(kù)數(shù)據(jù)同步完全更新任務(wù),啟動(dòng)任務(wù)更新一次,再創(chuàng)建oracle到TRS數(shù)據(jù)庫(kù)數(shù)據(jù)同步增量更新任務(wù),每天0:00進(jìn)行增量更新。
根據(jù)松遼委網(wǎng)、子網(wǎng),以及專(zhuān)題檢索頁(yè)面展示要求,在TRS WAS控制臺(tái)上分別創(chuàng)建定義檢索頻道,包括:設(shè)置頻道名、頻道說(shuō)明、TRS服務(wù)器IP、TRS服務(wù)器端口、TRS用戶帳號(hào)、TRS用戶密碼、頻道條件、概覽模板名、細(xì)覽模板名、組合檢索模板名、發(fā)送郵件模板名、打印模板名、TRS數(shù)據(jù)庫(kù)表或視圖,設(shè)置數(shù)據(jù)庫(kù)字段的字段名、字段類(lèi)型、字段顯示名、字段屬性、主鍵字段等。分別創(chuàng)建了松遼委網(wǎng)站、松遼流域水文信息網(wǎng)等子網(wǎng),以及松遼委網(wǎng)站專(zhuān)題的檢索頻道,各檢索頻道的檢索范圍在頻道條件中設(shè)置實(shí)現(xiàn),在每個(gè)檢索頻道中,進(jìn)行相應(yīng)的JSP模板設(shè)計(jì),通過(guò)TRS的置標(biāo)語(yǔ)句設(shè)置,實(shí)現(xiàn)對(duì)TRS數(shù)據(jù)庫(kù)的檢索和顯示要求;在松遼委網(wǎng)站以及子網(wǎng)和專(zhuān)題相應(yīng)模板中嵌入調(diào)用檢索頻道號(hào),并輸入檢索關(guān)鍵字等,實(shí)現(xiàn)網(wǎng)站內(nèi)容的檢索需求,同時(shí),系統(tǒng)提供“高級(jí)檢索搜索”功能,在高級(jí)檢索界面可以根據(jù)標(biāo)題、正文、開(kāi)始時(shí)間、結(jié)束時(shí)間等屬性進(jìn)行檢索,并且可以指定檢索結(jié)果按照默認(rèn)排序、日期倒序、日期正序、相關(guān)度進(jìn)行排序顯示。
利用TRS檢索系統(tǒng)構(gòu)建松遼委網(wǎng)站全文檢索系統(tǒng),檢索體系結(jié)構(gòu)先進(jìn)、功能強(qiáng)大、軟件比較成熟,開(kāi)發(fā)性工作相對(duì)較少,人機(jī)交互界面友好,維護(hù)便利,檢索和發(fā)布功能完備,TRS檢索技術(shù)將會(huì)在網(wǎng)站檢索功能中得到更深入的應(yīng)用。