孫廣路 易成岐 郎非
摘要:為了改進傳統(tǒng)的文本檢索技術存在檢索文件格式種類單一,索引大數(shù)據(jù)量文件速度慢,甚至造成內(nèi)存溢出等問題,基于Lucene系統(tǒng)及相關技術,研究了基于合并因子的多種格式文件索引技術,并在此基礎上構建了中文文本信息檢索系統(tǒng),實驗分析表明,本系統(tǒng)有效地實現(xiàn)了多種格式文件檢索功能,通過合并因子的設定有效提高了索引速度,系統(tǒng)可靠性高。
關鍵詞:文本檢索;合并因子;多種格式文件索引
中圖分類號:TM391.3文獻標志碼:A文章編號:1007-2683(2012)02-0001-04