国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Solr的海洋空間資源搜索應(yīng)用研究

2021-08-20 07:04張則飛茅克勤蔣嬋娟楊萬康
海洋開發(fā)與管理 2021年12期
關(guān)鍵詞:搜索引擎數(shù)據(jù)中心數(shù)據(jù)庫

張則飛 茅克勤 蔣嬋娟 楊萬康

摘要:為促進海洋數(shù)據(jù)的應(yīng)用和共享 , 有力支撐海洋空間資源管理 , 文章通過構(gòu)建海洋綜合數(shù)據(jù)庫和數(shù)據(jù)分類 ,采用Solr技術(shù)實現(xiàn)對海洋空間資源的多源、異構(gòu)和海量數(shù)據(jù)搜索。研究結(jié)果表明: Solr是專業(yè)、高效和開源的搜索引擎 ,基于海洋綜合數(shù)據(jù)庫平臺 , 可實現(xiàn)對海洋空間資源的基礎(chǔ)搜索、業(yè)務(wù)數(shù)據(jù)搜索、搜索定制和搜索展現(xiàn) ,具有搜索字段更加豐富、搜索速度更快、搜索結(jié)果更加準確和搜索結(jié)果展現(xiàn)形式更加多樣等優(yōu)點。

關(guān)鍵詞:海洋空間資源;數(shù)據(jù)中心;大數(shù)據(jù);數(shù)據(jù)庫;搜索引擎

中圖分類號:N37;TP392;P74????? 文獻標志碼:A?????? 文章編號:1005-9857(2021)12-0098-05

Application Research of Marine Space Resources Search Based on Solr

ZHANG Zefei1,MAO Keqin1,JIANG Chanjuan1,YANG Wankang2

(1.Marine Academy of Zhejiang Province,Hangzhou 310012,China;

2.Second Institute of Oceanography,MNR, Hangzhou 310012,China)

Abstract:In order to promote the application and sharing of marine data and effectivelysupport the management of marine spatial resources, this paper constructed an integratedmarine database and data classification, and used Solr technology to realize the multi-source,heterogeneous and massive data search of marine spatial resources. The results showed thatSolr was a professional, efficient and open source search engine. Based on the marine comprehensive database platform, Solr could realize the basic search, business data search, searchcustomization and search display of marine space resources. It had the advantages of richersearch fields, faster search speed, more accurate search results and more diverse displayforms of search results.

Keywords:Ocean space resources,Data center,Big data,Database,Search engines

0 引言

隨著海洋戰(zhàn)略地位的提升 , 海洋基礎(chǔ)調(diào)查投入日益加大 ,信息采集技術(shù)不斷發(fā)展 , 各類海洋空間資源數(shù)據(jù)日趨豐富 , 導(dǎo)致數(shù)據(jù)量急劇增加和數(shù)據(jù)種類繁多[1]。因此 ,搭建一體化管理的數(shù)據(jù)庫并實現(xiàn)快速有效檢索 ,是目前海洋空間資源數(shù)據(jù)庫構(gòu)建和應(yīng)用必須面對的問題[2]。本研究以浙江省建設(shè)海洋多數(shù)據(jù)、多來源和多類型綜合數(shù)據(jù)庫為例 , 探索基于Solr的海洋空間資源搜索應(yīng)用 , 實現(xiàn)對多元、多源、異構(gòu)和海量數(shù)據(jù)的快速有效檢索。

1 Solr技術(shù)及其特點

1.1 Solr的定義

人們都有使用搜索功能的經(jīng)歷 ,無論是瀏覽網(wǎng)站還是辦理業(yè)務(wù) ,搜索存在于生活的方方面面。在強大的搜索功能背后通常須消耗巨大的資源 ,且隨著數(shù)據(jù)量的增加 ,對資源的消耗越來越大。為解決這一問題 ,須將搜索功能轉(zhuǎn)移到外部服務(wù)器 , 通過建立索引完成搜索任務(wù) ,并極大地減少對數(shù)據(jù)庫本身的直接消耗。Solr就是這樣的開源搜索平臺 ,并兼容大多數(shù)計算機語言。

Solr的基本定義是全文搜索引擎 ,類似非關(guān)系型數(shù)據(jù)庫(NOSQL) , 利用非關(guān)系型數(shù)據(jù)存儲和處理技術(shù)構(gòu)建搜索應(yīng)用程序。Solr是企業(yè)級、快速和高度可擴展的搜索應(yīng)用程序 ,其基本原理是在數(shù)據(jù)庫前端搭建索引庫 ,將搜索功能和數(shù)據(jù)庫本身相互隔離 ,從而提高搜索的反應(yīng)速度和提升海量數(shù)據(jù)的處理能力;通過引進模糊搜索和建立專業(yè)索引字庫等方式 ,提高搜索精確度 , 并有效減少對數(shù)據(jù)庫本身的消耗。Solr還可與 HADOOP等其他程序一起使用 ,從而實現(xiàn)不僅限于搜索的功能。

1.2 Solr的特點

Solr在本質(zhì)上仍是數(shù)據(jù)庫 , 只是其搜索速度相比傳統(tǒng)數(shù)據(jù)庫更加快捷 , 因此在平臺開發(fā)時將搜索功能交由Solr完成會更加專業(yè)和高效。也就是說 ,人們?nèi)粘J褂盟阉鞴δ芩阉鞒鰜淼男畔⒉⒉恢苯觼碜詳?shù)據(jù)庫本身 , 而是來自Solr的索引庫。數(shù)據(jù)庫自帶的搜索功能只能進行簡單的模糊搜索 ,搜索效率不高且速度很慢 , 尤其面對多源和海量數(shù)據(jù)的搜索效果并不理想。而在實際應(yīng)用中 , 搜索功能是比較常用的功能之一, 如果直接使用數(shù)據(jù)庫搜索會給數(shù)據(jù)庫本身帶來較大壓力。Solr在平臺前端建立索引庫并具有專業(yè)的分詞功能 , 主要有3個優(yōu)點。①減少數(shù)據(jù)庫本身的壓力 , 大大降低對整個系統(tǒng)軟、硬件的要求;②搜索的效率更高、速度更快、精確度更高和專業(yè)性更強;③具有開源性 ,可與任何計算機語言兼容 , 具有廣泛應(yīng)用的基礎(chǔ)。

2 海洋綜合數(shù)據(jù)庫

2.1 系統(tǒng)平臺

2.1.1 建設(shè)背景

當前大數(shù)據(jù)在經(jīng)濟社會發(fā)展中的基礎(chǔ)性和戰(zhàn)略性地位越來越重要。隨著信息采集技術(shù)的不斷發(fā)展 ,海洋空間資源的本底數(shù)據(jù)、管理業(yè)務(wù)數(shù)據(jù)和監(jiān)視監(jiān)測數(shù)據(jù)等各類基礎(chǔ)數(shù)據(jù)量快速增長 ,逐漸呈現(xiàn)大數(shù)據(jù)的特征。各級海洋管理部門對海洋空間資源數(shù)據(jù)的實時直觀展示和分析的需求日益強烈[3] ,對海洋空間資源大數(shù)據(jù)的擴展、挖掘和應(yīng)用提出更加全面和迫切的要求。

針對海洋管理由粗放式向精準化和精細化轉(zhuǎn)變 ,須有全面和翔實的數(shù)據(jù)為基礎(chǔ)支撐 , 從而做好技術(shù)審查和事中、事后監(jiān)管;針對政府職能轉(zhuǎn)變 ,各級政府須根據(jù)各自權(quán)限頻繁進行數(shù)據(jù)交互;根據(jù)自然資源部“兩個統(tǒng)一”職責要求 , 須有多源數(shù)據(jù)綜合評價為決策支撐。然而目前各類海洋業(yè)務(wù)管理系統(tǒng)彼此獨立 , 數(shù)據(jù)資源無法共享和整合 , “信息孤島”現(xiàn)象嚴重 ,深層次數(shù)據(jù)應(yīng)用不充分 ,數(shù)據(jù)更新機制不完善[4]。

2.1.2 建設(shè)目標

為滿足浙江省海洋管理由粗放式向精準化和精細化轉(zhuǎn)變的需求 , 建設(shè)多數(shù)據(jù)、多來源和多類型的海洋綜合數(shù)據(jù)庫平臺 ,建立海洋空間資源數(shù)據(jù)標準體系 ,實現(xiàn)海洋管理全流程、全要素和全領(lǐng)域的“一庫管理”,并在海洋空間資源核心數(shù)據(jù)庫的基礎(chǔ)上構(gòu)建海洋空間資源“一張圖”地理信息平臺 , 實現(xiàn)海洋空間數(shù)據(jù)與海洋資源數(shù)據(jù)的融合以及海洋信息的可視化展示和應(yīng)用[5]。

2.1.3 建設(shè)思路

海洋綜合數(shù)據(jù)庫平臺以海洋空間資源基礎(chǔ)數(shù)據(jù)的管理模型研究為基礎(chǔ) , 以海洋管理各環(huán)節(jié)產(chǎn)生的過程數(shù)據(jù)為核心 , 以融合、高效、開放和實用為基本原則 ,基于地理信息系統(tǒng)底層軟件 , 根據(jù)海洋空間資源要素特點 , 以“實時數(shù)據(jù)整合-監(jiān)管平臺建設(shè)-業(yè)務(wù)化應(yīng)用”為主線 , 建立海洋空間資源數(shù)據(jù)標準體系和海洋空間資源信息共享交換的長效機制 ,為各級海洋管理部門提供統(tǒng)一的海洋空間資源管理技術(shù)支撐。綜合應(yīng)用海量、異構(gòu)和多維空間數(shù)據(jù)展示技術(shù),快速、模糊和精準檢索技術(shù)以及智能分析和自動識別處理技術(shù)等,建成集數(shù)據(jù)管理、應(yīng)用、展示、共享、交換和更新于一體的數(shù)字化綜合平臺,基本實現(xiàn)浙江省海洋空間資源“以圖管海、動態(tài)監(jiān)管”的目標(圖1)。

2.2 數(shù)據(jù)中心

數(shù)據(jù)中心是對多源、異構(gòu)和海量數(shù)據(jù)進行管理、更新和處理的復(fù)雜系統(tǒng)??臻g數(shù)據(jù)集成平臺支持空間數(shù)據(jù)庫和數(shù)據(jù)源、空間數(shù)據(jù)結(jié)構(gòu)以及空間轉(zhuǎn)換處理算子,除常見的關(guān)系型和非關(guān)系型數(shù)據(jù)庫和文檔數(shù)據(jù)外,還支持空間地理數(shù)據(jù)的集成[6-7]。除對共享交換數(shù)據(jù)進行后繼加工處理外,數(shù)據(jù)中心還可通過對接非標數(shù)據(jù)接口和協(xié)議補充共享交換的數(shù)據(jù)采集能力[3]。

2.2.1 數(shù)據(jù)建模

數(shù)據(jù)建模通常有2種方法:①基于業(yè)務(wù)流程再造的模型設(shè)計, 即對業(yè)務(wù)流程進行梳理,建立相應(yīng)的業(yè)務(wù)處理規(guī)范標準并進行數(shù)字化實現(xiàn);②面向數(shù)據(jù)應(yīng)用的模型設(shè)計,即基于數(shù)據(jù)本身,按照類型、來源或用途進行數(shù)據(jù)分類,并根據(jù)數(shù)據(jù)應(yīng)用的方式和方法進行模型設(shè)計。根據(jù)具體階段和需求的不同, 建模方法也不同。

在綜合分析平臺應(yīng)用領(lǐng)域和發(fā)展方向的基礎(chǔ)上,結(jié)合管理數(shù)據(jù)的類型、種類和格式等進行數(shù)據(jù)分類,劃分為不同的應(yīng)用領(lǐng)域,并建立相應(yīng)領(lǐng)域的數(shù)據(jù)標準和規(guī)范,對收集的不同數(shù)據(jù)進行相應(yīng)的規(guī)范化處理,以保證數(shù)據(jù)庫中的數(shù)據(jù)規(guī)范一致、來源可溯和精度可靠。

數(shù)據(jù)中心按照建模方式可分為以硬件存儲為核心的物理建模和以實際應(yīng)用為核心的邏輯建模。對于基于業(yè)務(wù)流程再造的數(shù)據(jù)庫平臺,須根據(jù)業(yè)務(wù)部門自身工作需求來實現(xiàn)業(yè)務(wù)流程的數(shù)字化, 因此邏輯建模是不可或缺的。數(shù)據(jù)可總體分為2個類型:①記錄具體節(jié)點和事項的細節(jié)數(shù)據(jù),這類數(shù)據(jù)的建模方式通常采用第三范式;②經(jīng)過加工處理并匯總的數(shù)據(jù), 這類數(shù)據(jù)的建模方式通常采用星型模式。

2.2.2 元數(shù)據(jù)管理

元數(shù)據(jù)驅(qū)動是建立柔性技術(shù)架構(gòu)的核心,建立規(guī)范的元數(shù)據(jù)庫是整個平臺數(shù)據(jù)管控和過程管控的基礎(chǔ),包括模型元數(shù)據(jù)管理和流程元數(shù)據(jù)管理2種方式。①模型元數(shù)據(jù)管理。數(shù)據(jù)中心對關(guān)系、空間和其他非標數(shù)據(jù)進行規(guī)范建模,將異構(gòu)數(shù)據(jù)整合為規(guī)范的邏輯模型,以符合主體業(yè)務(wù)邏輯。數(shù)據(jù)中心對模型元數(shù)據(jù)進行統(tǒng)一管理和維護[8] ,以保證數(shù)據(jù)中心的靈活性和可擴展性,為數(shù)據(jù)中心的長期運行、維保和拓展提供有力支撐。②流程元數(shù)據(jù)管理。規(guī)范、修正和優(yōu)化數(shù)據(jù)中心的日常運行,保證數(shù)據(jù)中心的數(shù)據(jù)質(zhì)量和服務(wù)質(zhì)量, 并減少人工工作量。

2.2.3 主數(shù)據(jù)管理

由于數(shù)據(jù)來自不同業(yè)務(wù)系統(tǒng),在數(shù)據(jù)內(nèi)容沖突時須有沖突仲裁和解決機制。采用主數(shù)據(jù)管理處理這種問題,通過主數(shù)據(jù)管理發(fā)現(xiàn)重復(fù)和錯誤數(shù)據(jù)以及進行一致性檢查和數(shù)據(jù)結(jié)構(gòu)校驗,通過清理步驟解決錯誤,將相同數(shù)據(jù)的多個版本合并為1個真實版本或“高質(zhì)量記錄”, 并管理內(nèi)部的層次和關(guān)系,形成對主數(shù)據(jù)的掌握, 從而規(guī)范數(shù)據(jù)的總體質(zhì)量。

2.2.4 數(shù)據(jù)接入

對于實時度高、數(shù)據(jù)量大和接入點多的數(shù)據(jù), 接入處理的支撐是非常重要的內(nèi)容。①高性能離散式并發(fā)運行構(gòu)造可方便地配置感知物聯(lián)網(wǎng)的相關(guān)服務(wù),由框架自適應(yīng)地利用多機、多 CPU 和多核的并行計算能力、通信能力和高速緩存能力,實現(xiàn)高性能離散式并發(fā)運行。②高速數(shù)據(jù)通信傳輸技術(shù)用于及時、準確和完整地傳輸海量、實時和空間數(shù)據(jù),實現(xiàn)多個復(fù)雜通信環(huán)節(jié)相互一致的高效可靠通信。

2.2.5 基于元數(shù)據(jù)的復(fù)雜來源數(shù)據(jù)管控

從平臺整體提供的服務(wù)來看:數(shù)據(jù)種類比較多樣 ,包括管理流程、業(yè)務(wù)數(shù)據(jù)和統(tǒng)計報表等;數(shù)據(jù)來源比較復(fù)雜 , 包括管理部門、第三方服務(wù)機構(gòu)和企業(yè)等;數(shù)據(jù)結(jié)構(gòu)包含多種格式 , 包括傳統(tǒng)空間地理信息數(shù)據(jù)、現(xiàn)代點云數(shù)據(jù)和分析圖表數(shù)據(jù)等。因此 ,須對規(guī)范的數(shù)據(jù)進行梳理 , 并統(tǒng)一標準和開展質(zhì)量檢查;對零散的數(shù)據(jù)進行整理 ,建立標準規(guī)范;對不符合要求的數(shù)據(jù)進行整改 ,并對無法整改的數(shù)據(jù)進行剔除;根據(jù)不同用戶、不同系統(tǒng)和不同業(yè)務(wù)流程構(gòu)建不同的數(shù)據(jù)服務(wù)平臺[9]。

3 數(shù)據(jù)分類

從數(shù)據(jù)管理和集成的角度考慮 , 整個系統(tǒng)主要包括基礎(chǔ)底圖、海圖、專題、業(yè)務(wù)和監(jiān)管等數(shù)據(jù)。

(1)基礎(chǔ)底圖數(shù)據(jù)以基礎(chǔ)調(diào)查產(chǎn)生的各類遙感影像數(shù)據(jù)、基礎(chǔ)地理數(shù)據(jù)(地名、行政界、地形、海岸線和交通等)和 DEM 數(shù)據(jù)組成。這類數(shù)據(jù)以定期更新為主 ,數(shù)據(jù)格式標準且來源可靠 , 但數(shù)據(jù)量較大 ,數(shù)據(jù)處理工作量較大。

(2)海圖數(shù)據(jù)由專業(yè)機構(gòu)繪制和更新 , 主要包括海底地形、海島、海上航道、標志物和近岸地形地貌。此類數(shù)據(jù)來源較統(tǒng)一且標準體系較完備。

(3)專題數(shù)據(jù)是由基礎(chǔ)地理空間定期調(diào)查、常規(guī)監(jiān)測和日常行政管理等生成的專業(yè)數(shù)據(jù) , 主要由點、線和面的矢量數(shù)據(jù)組成。①海域數(shù)據(jù)包括界址點、面積、管理規(guī)劃、用海起止時間和用途等;②海島數(shù)據(jù)包括無居民海島的位置、面積、岸線、開發(fā)利用和地質(zhì)地貌等以及有居民海島的位置、面積和岸線等;③海岸線數(shù)據(jù)包括位置、長度、屬性(人工或自然)、岸灘地貌、沖淤潮間帶底質(zhì)和開發(fā)利用等。

(4)業(yè)務(wù)數(shù)據(jù)貫穿于海域管理全流程 , 包括事前調(diào)查論證、事中審批和事后監(jiān)管評估等各環(huán)節(jié) , 每個環(huán)節(jié)都會產(chǎn)生生態(tài)、空間、報告和圖表等不同的數(shù)據(jù)。

(5)監(jiān)管數(shù)據(jù)主要包括依據(jù)監(jiān)管目標構(gòu)建的點、線和面的矢量數(shù)據(jù) , 過程表格以及通過監(jiān)管分析生成的成果。

4 基于Solr的海洋空間資源搜索

以元數(shù)據(jù)的方式存儲 ,應(yīng)用Solr實現(xiàn)海洋空間資源的全流程管理 , 建立海洋空間資源大數(shù)據(jù)模型。用戶使用htp方式向Solr發(fā)送規(guī)范標準的 XML文件 ,Solr高亮顯示搜索到的數(shù)據(jù) , 實現(xiàn)海洋空間資源的可視化展示;預(yù)先按照維度對海洋空間資源進行統(tǒng)計、分類和排序 , 采用第三范式和星型模式建立海洋空間資源數(shù)據(jù)模型 ,有效提高數(shù)據(jù)庫運行效率;實現(xiàn)對業(yè)務(wù)數(shù)據(jù)、實時數(shù)據(jù)、空間數(shù)據(jù)、關(guān)系數(shù)據(jù)和多媒體數(shù)據(jù)的統(tǒng)一搜索 ,從搜索頁面可直接進入相關(guān)業(yè)務(wù)系統(tǒng)[10]。

4.1 基礎(chǔ)搜索

(1)綜合查詢:根據(jù)業(yè)務(wù)數(shù)據(jù)的特征提供多種搜索條件 , 根據(jù)不同需求對這些條件進行排列整合 ,對不同的條件類型提供文本輸入、單一條件和多種條件等輸入方式。

(2)數(shù)據(jù)分類樹查詢:按照數(shù)據(jù)分類建立分層次的數(shù)據(jù)分類樹 , 提供拖拉和復(fù)選框選擇方式 , 用戶在數(shù)據(jù)分類樹上選擇搜索的1個或多個數(shù)據(jù) , 系統(tǒng)根據(jù)用戶選擇自動列出所選數(shù)據(jù)的各類過濾條件 ,用戶選擇過濾條件后系統(tǒng)返回符合條件數(shù)據(jù)。

(3)模糊查詢:主要面向元數(shù)據(jù) , 用戶輸入指標名稱的部分內(nèi)容 ,系統(tǒng)查找與輸入相匹配的所有指標元數(shù)據(jù)名稱 ,用戶從返回的指標元數(shù)據(jù)列表中選擇所需指標 , 系統(tǒng)列出所選指標過濾條件 , 用戶選擇過濾條件后系統(tǒng)返回符合條件數(shù)據(jù)。

4.2 業(yè)務(wù)數(shù)據(jù)搜索

業(yè)務(wù)數(shù)據(jù)搜索主要基于 GIS服務(wù)中間件進行二次開發(fā) , 采用 GIS的空間查詢和空間分析服務(wù) , 支撐基于空間要素條件的搜索 ,并在系統(tǒng)中提供空間信息搜索服務(wù)。

(1)建立系統(tǒng)業(yè)務(wù)規(guī)則:以系統(tǒng)為單位 , 以系統(tǒng)處理的業(yè)務(wù)為區(qū)分 ,將系統(tǒng)和數(shù)據(jù)中心的實體相關(guān)聯(lián) ,將實體和實體字段相關(guān)聯(lián) ,建立以系統(tǒng)為主線 , 從系統(tǒng)到實體字段的搜索規(guī)則。

(2)建立實體搜索規(guī)則:以實體為單位 ,設(shè)置數(shù)據(jù)中心可被搜索的實體以及實體搜索的優(yōu)先級。匹配程度規(guī)則包括完全匹配、模糊匹配和百分比匹配3種方式 ,在系統(tǒng)語義識別層提供匹配程度分析服務(wù) ,根據(jù)匹配規(guī)則自動分析搜索內(nèi)容的匹配程度。

4.3 搜索定制服務(wù)

(1)搜索規(guī)則定制:用戶自定義搜索規(guī)則 , 即配置關(guān)鍵字在系統(tǒng)功能中搜索 ,前提是該功能須在系統(tǒng)級規(guī)則范圍內(nèi)。定義時間規(guī)則 , 即設(shè)置輸入的時間關(guān)鍵字和結(jié)果排序;定義統(tǒng)計規(guī)則 , 即當用戶需要后臺統(tǒng)計操作的搜索時 , 可設(shè)置統(tǒng)計的格式和排序等;定義空間規(guī)則 , 即當用戶輸入空間關(guān)鍵字后搜索空間數(shù)據(jù)和顯示結(jié)果;定義文本規(guī)則 , 即設(shè)置用戶輸入的文本匹配規(guī)則 , 可靈活配置輸入的關(guān)鍵字。

(2)搜索業(yè)務(wù)定制:用戶自定義搜索業(yè)務(wù) , 系統(tǒng)針對每個用戶相對同一個業(yè)務(wù)系統(tǒng)的不同關(guān)注點設(shè)置不同的搜索規(guī)則 , 以便于在搜索結(jié)果中查看信息。例如:設(shè)置文本規(guī)則優(yōu)先 , 那么將首先顯示包含搜索關(guān)鍵字的信息;設(shè)置時間規(guī)則優(yōu)先 , 那么將首先顯示按時間排序的信息。

4.4 搜索展現(xiàn)

建設(shè)針對業(yè)務(wù)數(shù)據(jù)資源的一站式全文搜索門戶 ,方便快捷地實現(xiàn)對業(yè)務(wù)對象的搜索和全面的信息展示 ,進而重新整合、過濾和展現(xiàn)搜索結(jié)果。

查詢記錄管理主要表現(xiàn)為搜索成果的表現(xiàn)方式 ,主要包括列表展現(xiàn)、表格展現(xiàn)和圖形展現(xiàn)3種方式。列表展現(xiàn)是搜索展現(xiàn)中最常用的方式 ,將搜索記錄以列表的形式展現(xiàn)給用戶 , 用戶可點擊列表中的記錄查看詳細信息;表格展現(xiàn)主要針對統(tǒng)計方式的搜索結(jié)果 , 以表格匯總的形式展現(xiàn)給用戶;圖形展現(xiàn)主要包括柱圖、餅圖和曲線圖 , 主要供用戶進行比較性搜索。

5 結(jié)語

基于Solr的海洋空間資源搜索技術(shù)實現(xiàn)多源、異構(gòu)和海量數(shù)據(jù)搜索的快速和高效 , 主要具有4項優(yōu)點。①搜索字段更加豐富 , 支持模糊全庫搜索;②搜索速度更快 , 反應(yīng)速度低于0.2 ms, 比常規(guī)數(shù)據(jù)庫搜索技術(shù)提升超過100倍;③支持分詞搜索且可定制分詞方式 , 搜索過程更加科學(xué) , 搜索結(jié)果更加準確;④搜索結(jié)果的展現(xiàn)形式更加多樣和直觀 , 可結(jié)合直方圖和統(tǒng)計表等形式展現(xiàn)。

由于海洋空間資源數(shù)據(jù)具有敏感性 , 系統(tǒng)只能在專網(wǎng)運行 , 對數(shù)據(jù)安全和應(yīng)用提出更高的要求 , 本研究提出3項建議。①做好Solr開源代碼安全性能評測 ,針對整個系統(tǒng)做好安全等級測評;②配置大容量前置內(nèi)存 , 用以建立強大的索引庫 , 提高Solr的運行效率;③引入海洋空間資源專用名詞庫 ,用以訓(xùn)練Solr分詞庫 , 進一步提高搜索的精準性。

參考文獻

[1] 蔣帥.海洋空間數(shù)據(jù)庫的建立和發(fā)展[J].海洋信息 , 2010(4):6-9.

[2] 張則飛 ,蔣嬋娟 , 陳培雄.浙江省海洋空間資源調(diào)查必要性研究報告[J].海洋開發(fā)與管理 ,2015,32(9):62-65.

[3] 孫朝輝 ,李兆欣 ,劉增宏.智慧海洋國際共享應(yīng)用平臺發(fā)展趨勢及其對策建議[J].海洋開發(fā)與管理 ,2020,37(1):3-9.

[4] 徐超 ,李莎.我國海洋科學(xué)數(shù)據(jù)網(wǎng)絡(luò)共享現(xiàn)狀[A].中國海洋學(xué)會 , 中國太平洋學(xué)會.中國海洋學(xué)會2017年學(xué)術(shù)年會論文集[C].北京:海洋出版社 ,2017:243-252.

[5] 宋轉(zhuǎn)玲 ,劉海行 ,李新放 , 等.國內(nèi)外海洋科學(xué)數(shù)據(jù)共享平臺建設(shè)現(xiàn)狀[J].科技資訊 ,2013(36):20-23.

[6] 徐承德.海洋數(shù)據(jù)共享的問題和對策[A].中國海洋學(xué)會 , 中國太平洋學(xué)會.中國海洋學(xué)會2017年學(xué)術(shù)年會論文集[C].北京:海洋出版社 ,2017:253-257.

[7] 耿姍姍 ,劉振民 ,梁建峰 , 等.基于數(shù)字海洋框架的海洋資料整合與共享服務(wù)管理模式淺析[J].海洋開發(fā)與管理 , 2015, 32(2):33-36.

[8] 楊錦坤 , 董明媚 ,武雙全 , 等.推進我國海洋數(shù)據(jù)深入共享服務(wù)的總體考慮[J].海洋開發(fā)與管理 ,2015,32(3):68-72.

[9] 常虹 , 于華明 ,鮑獻文 , 等.我國海洋數(shù)據(jù)信息共享現(xiàn)狀及立法建議[J].海洋開發(fā)與管理 ,2008,25(1):134-138.

[10] 黃如花 ,王斌 ,周志峰.促進我國科學(xué)數(shù)據(jù)共享的對策[J].圖書館 ,2014(3):7-13.

猜你喜歡
搜索引擎數(shù)據(jù)中心數(shù)據(jù)庫
關(guān)于間接蒸發(fā)冷機組在數(shù)據(jù)中心中應(yīng)用的節(jié)能分析
Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項
世界表情符號日
2018年數(shù)據(jù)中心支出創(chuàng)新高
2017第十屆中國數(shù)據(jù)中心大會榜單
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
基于Lucene搜索引擎的研究
平邑县| 鹿泉市| 关岭| 高要市| 广元市| 沾化县| 海兴县| 华坪县| 蓬莱市| 贞丰县| 称多县| 南投县| 大安市| 溧水县| 福安市| 杭州市| 恩平市| 弥渡县| 湾仔区| 稻城县| 马尔康县| 镇原县| 咸阳市| 台江县| 宜宾市| 林口县| 定边县| 西林县| 巢湖市| 甘肃省| 武陟县| 油尖旺区| 龙州县| 台安县| 汝南县| 临猗县| 苍山县| 赤水市| 临夏县| 双柏县| 凤冈县|