王風(fēng)云++鄭紀(jì)業(yè)++封文杰++趙佳++李喬宇++阮懷軍
摘要:根據(jù)山東省農(nóng)村農(nóng)業(yè)信息化示范省建設(shè)過(guò)程中信息資源整合的要求,對(duì)信息資源的分析、評(píng)價(jià)、篩選、類聚、標(biāo)引、著錄、排序、建庫(kù)和存儲(chǔ)等過(guò)程進(jìn)行了分析,研究了農(nóng)村農(nóng)業(yè)信息資源整合的關(guān)鍵技術(shù),以期為其他省份的農(nóng)村農(nóng)業(yè)信息資源整合提供借鑒。
關(guān)鍵詞:山東?。晦r(nóng)村;農(nóng)業(yè);信息化;資源整合
中圖分類號(hào):S126 (252)
文獻(xiàn)標(biāo)識(shí)號(hào):A 文章編號(hào):1001-4942(2015)12-0107-04
2009年,中華人民共和國(guó)科學(xué)技術(shù)部、中華人民共和國(guó)工業(yè)和信息化部、中共中央組織部聯(lián)合啟動(dòng)了國(guó)家農(nóng)村農(nóng)業(yè)信息化示范省建設(shè)工作;通過(guò)代表性、工作基礎(chǔ)、工作機(jī)制等方面的認(rèn)真研究、論證,2010年,決定把山東省作為第一個(gè)國(guó)家農(nóng)村農(nóng)業(yè)信息化示范省,進(jìn)行全國(guó)農(nóng)村農(nóng)業(yè)信息化的試點(diǎn)。
基于資源整合、統(tǒng)一接人、分地運(yùn)營(yíng)和專業(yè)服務(wù)構(gòu)建省級(jí)農(nóng)村農(nóng)業(yè)綜合信息服務(wù)平臺(tái)是山東省作為國(guó)家農(nóng)村農(nóng)業(yè)信息化示范省建設(shè)的重要工作。按照“平臺(tái)上移,服務(wù)下延”的原則,集成農(nóng)村科技、遠(yuǎn)程教育、農(nóng)業(yè)、市場(chǎng)等各類信息資源,打造省級(jí)農(nóng)村農(nóng)業(yè)綜合信息服務(wù)平臺(tái)(含各專業(yè)信息服務(wù)系統(tǒng),即“1+N”平臺(tái)),支持短信、語(yǔ)音、視頻等多通道同時(shí)接人,能夠?qū)崿F(xiàn)對(duì)基層農(nóng)戶、企業(yè)和相關(guān)農(nóng)業(yè)合作組織的“扁平化服務(wù)”。
1 農(nóng)業(yè)信息資源整合定義
農(nóng)業(yè)信息資源整合,就是依據(jù)不同層次農(nóng)業(yè)信息用戶的需求,將原本離散的、多元的、異構(gòu)的、分布的信息資源,通過(guò)分析、評(píng)價(jià)、篩選、類聚、標(biāo)引、著錄、排序、建庫(kù)、存儲(chǔ)、鏈接等一系列邏輯和物理的優(yōu)化整合,最終形成一個(gè)有序的、效能更高的信息資源體系,從而體現(xiàn)出農(nóng)業(yè)領(lǐng)域知識(shí)的整體聯(lián)系,并利用一個(gè)統(tǒng)一的共享平臺(tái),滿足用戶多元化的信息需求,實(shí)現(xiàn)一站式服務(wù)。
在山東省作為國(guó)家農(nóng)村農(nóng)業(yè)信息化示范省建設(shè)過(guò)程中,建立了山東省農(nóng)村農(nóng)業(yè)信息化綜合服務(wù)平臺(tái),該平臺(tái)既整合了農(nóng)業(yè)自然資源信息,如作物生長(zhǎng)的氣候、土壤、水分、長(zhǎng)勢(shì)及病蟲害信息等;也整合了農(nóng)業(yè)經(jīng)濟(jì)技術(shù)資源信息,如農(nóng)產(chǎn)品市場(chǎng)、技術(shù)、政策法規(guī)、管理信息等。農(nóng)業(yè)自然資源信息為精準(zhǔn)農(nóng)業(yè)發(fā)展提供了可能性,農(nóng)業(yè)經(jīng)濟(jì)技術(shù)資源信息為實(shí)現(xiàn)農(nóng)業(yè)精準(zhǔn)化提供了必要保障。通過(guò)信息資源整合,有效地解決了當(dāng)前農(nóng)業(yè)信息資源建設(shè)各自為政、分散管理所造成的低水平重復(fù)建設(shè)和農(nóng)業(yè)知識(shí)的割裂現(xiàn)象,使分散在各農(nóng)業(yè)科研院所、高等院校、政府管理部門的信息資源得到有效整合,實(shí)現(xiàn)了農(nóng)業(yè)信息資源跨部門應(yīng)用,特別是為廣大農(nóng)村所共享。
2 農(nóng)業(yè)信息資源整合過(guò)程
2.1 農(nóng)業(yè)信息資源分析
根據(jù)農(nóng)村、農(nóng)業(yè)和農(nóng)民生產(chǎn)生活的需要,對(duì)大量涉農(nóng)信息進(jìn)行深層次的加工和分析研究,形成有助于問(wèn)題解決的新信息,這是資源整合的第一步。對(duì)于農(nóng)業(yè)科研人員來(lái)說(shuō),及時(shí)全面地獲取農(nóng)業(yè)信息資源,有助于提高自己的科研水平;農(nóng)業(yè)生產(chǎn)者及時(shí)地獲取農(nóng)業(yè)政策法規(guī)、農(nóng)產(chǎn)品生產(chǎn)和市場(chǎng)價(jià)格等信息,有利于減少農(nóng)業(yè)市場(chǎng)上的農(nóng)產(chǎn)品信息不對(duì)稱問(wèn)題,在一定程度上減少農(nóng)業(yè)生產(chǎn)者的損失;對(duì)于農(nóng)業(yè)管理者來(lái)說(shuō),全面地了解與農(nóng)業(yè)相關(guān)的信息,能更好地指導(dǎo)我國(guó)的農(nóng)業(yè)生產(chǎn)。
在山東省農(nóng)村農(nóng)業(yè)信息資源數(shù)據(jù)分析中,主要針對(duì)農(nóng)民對(duì)農(nóng)業(yè)生產(chǎn)的需求,分析了大田和設(shè)施栽培、水產(chǎn)養(yǎng)殖過(guò)程中的自然資源信息,包括農(nóng)作物的生長(zhǎng)環(huán)境、病蟲害、長(zhǎng)勢(shì)等信息。針對(duì)農(nóng)民對(duì)市場(chǎng)供求、法規(guī)政策、農(nóng)業(yè)技術(shù)等信息需求,分析了農(nóng)業(yè)實(shí)用技術(shù)、政策法規(guī)、生產(chǎn)資料、批發(fā)市場(chǎng)、農(nóng)牧專家、農(nóng)民經(jīng)紀(jì)人、龍頭企業(yè)、名優(yōu)特產(chǎn)、農(nóng)牧災(zāi)害、示范園區(qū)等信息,建立了農(nóng)業(yè)數(shù)據(jù)資源中心。
2.2 農(nóng)業(yè)信息資源評(píng)價(jià)
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù)的迅猛發(fā)展,網(wǎng)絡(luò)信息資源爆發(fā)式劇增,增加了用戶獲取所需信息的難度,而且信息的可靠性與真實(shí)性也影響了用戶對(duì)信息資源的利用,因此對(duì)農(nóng)業(yè)信息資源進(jìn)行評(píng)價(jià)至關(guān)重要。主要有定量評(píng)價(jià)、定性評(píng)價(jià)和綜合評(píng)價(jià)三種方法。
訪問(wèn)量統(tǒng)計(jì)、鏈接關(guān)系分析、網(wǎng)絡(luò)計(jì)量學(xué)等是信息資源整合中常用的定量評(píng)價(jià)方法,通過(guò)數(shù)據(jù)分析,可以從客觀量化的角度對(duì)網(wǎng)站信息資源進(jìn)行優(yōu)選和評(píng)價(jià)。定性評(píng)價(jià)則是從主觀角度,按照一定的評(píng)價(jià)標(biāo)準(zhǔn),建立相關(guān)的評(píng)價(jià)指標(biāo)體系,從而對(duì)網(wǎng)絡(luò)信息資源進(jìn)行優(yōu)選和評(píng)估。
在山東省農(nóng)村農(nóng)業(yè)信息化綜合服務(wù)平臺(tái)建設(shè)過(guò)程中,從定量和定性兩個(gè)方面對(duì)網(wǎng)絡(luò)信息資源進(jìn)行綜合評(píng)價(jià),即:通過(guò)定量分析盡可能多地獲取某一網(wǎng)絡(luò)信息資源的相關(guān)信息,分析統(tǒng)一資源定位器、該網(wǎng)絡(luò)信息資源被鏈接率以及與其它類似或相同領(lǐng)域的信息對(duì)比等,然后定性地從覆蓋面、準(zhǔn)確性、時(shí)效性等方面分析該網(wǎng)絡(luò)信息資源的內(nèi)容以及資源的可獲得性、頁(yè)面設(shè)計(jì)和布局等。
2.3 農(nóng)業(yè)信息資源篩選
根據(jù)信息資源評(píng)價(jià)確定的標(biāo)準(zhǔn),采用查重法、時(shí)序法和類比法等對(duì)農(nóng)業(yè)信息資源進(jìn)行篩選。查重法是篩選信息資源最簡(jiǎn)便的方法,可以剔除重復(fù)資料,選出有用的信息資源。時(shí)序法即逐一分析按時(shí)間順序排列的信息資源,在同一時(shí)期內(nèi),選取較新的,舍棄較舊的,使信息資源在時(shí)效上更有價(jià)值。類比法是將信息資源按空間、地區(qū)、產(chǎn)品層次分類對(duì)比,接近實(shí)質(zhì)的保留,否則舍棄,這種方法需要信息資源收集人員有比較扎實(shí)的專業(yè)知識(shí),熟悉自己的業(yè)務(wù)范圍,從而根據(jù)信息資源的題錄進(jìn)行取舍。
2.4 農(nóng)業(yè)信息資源類聚
農(nóng)業(yè)信息資源類聚就是將信息資源劃分成群組的過(guò)程,即把信息資源對(duì)象分成多個(gè)類或簇,同一簇中的對(duì)象之間具有較高的相似度,而不同簇中的對(duì)象差別較大。通過(guò)確定數(shù)據(jù)之間在預(yù)先制定的屬性上的相似性來(lái)完成類聚任務(wù),這樣最相似的數(shù)據(jù)就聚集成簇。
2.5 農(nóng)業(yè)信息資源標(biāo)引
農(nóng)業(yè)信息資源標(biāo)引是指在分析信息資源內(nèi)容的基礎(chǔ)上,用某種檢索語(yǔ)言把資源主題以及其它有意義的特征標(biāo)識(shí)出來(lái),作為資源存儲(chǔ)和檢索依據(jù)的一種資源處理過(guò)程。首先進(jìn)行主題分析,確定主題的類型和結(jié)構(gòu);然后在主題分析的基礎(chǔ)上,進(jìn)行概念轉(zhuǎn)換,將確定的主題概念賦予檢索標(biāo)識(shí)的過(guò)程,形成檢索標(biāo)識(shí)。不同的農(nóng)業(yè)信息資源數(shù)據(jù)庫(kù)可能會(huì)使用不同的分類法和主題詞表來(lái)標(biāo)引資源,《農(nóng)業(yè)科學(xué)敘詞表》由于能夠提供豐富的農(nóng)業(yè)專業(yè)術(shù)語(yǔ)以及術(shù)語(yǔ)間的關(guān)系,成為農(nóng)業(yè)信息資源整合過(guò)程中標(biāo)引和檢索農(nóng)業(yè)信息資源的工具。endprint
2.6 農(nóng)業(yè)信息資源著錄
農(nóng)業(yè)信息資源著錄是指在編制資源目錄時(shí),對(duì)資源內(nèi)容和形式特征進(jìn)行分析、選擇和記錄的過(guò)程。一般是按照某種標(biāo)準(zhǔn)化的格式和要求,對(duì)資源的某些被規(guī)定的特征進(jìn)行描述(如來(lái)源、作者、題名、日期等),給出信息資源的縮影。為了更好地實(shí)現(xiàn)信息資源的共享,著錄時(shí)編目人員要遵循統(tǒng)一的格式,使用受控的語(yǔ)言,逐條填寫各個(gè)款目的內(nèi)容。
山東省農(nóng)村農(nóng)業(yè)信息資源數(shù)據(jù)中心按15個(gè)大目錄122個(gè)子目錄進(jìn)行著錄,包括實(shí)用技術(shù)(14個(gè)子目錄)、政策法規(guī)(13個(gè)子目錄)、質(zhì)量標(biāo)準(zhǔn)(6個(gè)子目錄)、生產(chǎn)資料(13個(gè)子目錄)、批發(fā)市場(chǎng)(6個(gè)子目錄)、農(nóng)牧專家(11個(gè)子目錄)、農(nóng)民經(jīng)紀(jì)人(11個(gè)子目錄)、龍頭企業(yè)(11個(gè)子目錄)、名優(yōu)特產(chǎn)(6個(gè)子目錄)、科技項(xiàng)目(5個(gè)子目錄)、種質(zhì)資源(7個(gè)子目錄)、示范園區(qū)(6個(gè)子目錄)、科技成果(3個(gè)子目錄)、農(nóng)牧災(zāi)害(5個(gè)子目錄)和協(xié)會(huì)組織(5個(gè)子目錄)。
2.7 農(nóng)業(yè)信息資源排序
農(nóng)業(yè)信息資源排序就是采用排序算法把一系列的信息資源記錄,按照其中某個(gè)或某些關(guān)鍵字的大小,遞增或遞減排列起來(lái)的操作。排序算法是該過(guò)程中使用的主要方法,在處理大量數(shù)據(jù)時(shí),應(yīng)用該算法可以節(jié)省大量的資源。排序算法一般分為內(nèi)部排序和外部排序,內(nèi)部排序是指待排序列完全存放在內(nèi)存中進(jìn)行的排序過(guò)程,適合記錄較少的序列;而如果待排序列記錄數(shù)量非常多,排序過(guò)程不能在內(nèi)存中一次性完成,則必需對(duì)外存儲(chǔ)器進(jìn)行訪問(wèn),這種排序被稱為外部排序。
常見的內(nèi)部排序算法有插入排序、冒泡排序、選擇排序、快速排序、堆排序、歸并排序、基數(shù)排序和希爾排序等。在應(yīng)用中,可根據(jù)不同情況、不同要求選擇較適合的方法,甚至可將多種方法結(jié)合使用。當(dāng)待排序的記錄數(shù)不大時(shí),可選用插入排序、選擇排序和冒泡排序,方法簡(jiǎn)單,容易實(shí)現(xiàn);當(dāng)記錄數(shù)很大,但不強(qiáng)求排序穩(wěn)定性,且內(nèi)存容量不寬余時(shí),應(yīng)選用速度非??斓目焖倥判蚧蚨雅判颍划?dāng)記錄數(shù)很大,且對(duì)排序穩(wěn)定性有要求,內(nèi)存容量也寬余時(shí),用歸并排序最為合適,這也是山東省農(nóng)村農(nóng)業(yè)信息資源整合中選用的排序方法。
在對(duì)大型文件排序時(shí),由于文件很大,不可能將整個(gè)文件的所有記錄都同時(shí)調(diào)入內(nèi)存中進(jìn)行排序,這就需要利用外部排序技術(shù)來(lái)實(shí)現(xiàn)。外部排序最常用的是多路歸并法,主要有兩個(gè)步驟:第一步,按內(nèi)存大小,將外存上的文件分成若干個(gè)長(zhǎng)度相同的子文件或段,依次讀入內(nèi)存,并利用有效的內(nèi)部排序法進(jìn)行排序,將結(jié)果重新寫入外存;第二步,將這些有序的子文件或段由小到大在外存上形成一個(gè)排序文件。
2.8 農(nóng)業(yè)信息資源建庫(kù)和存儲(chǔ)
農(nóng)業(yè)信息資源整合中的建庫(kù),需要充分調(diào)研現(xiàn)有資源,并考慮將來(lái)數(shù)據(jù)庫(kù)的擴(kuò)展性。針對(duì)農(nóng)業(yè)信息資源整合中數(shù)據(jù)量大的問(wèn)題,主要采用分布式索引建庫(kù)方案,對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ)和計(jì)算。分布式索引建庫(kù)采用統(tǒng)一服務(wù)接口,給用戶提供一個(gè)可配置的建庫(kù)申請(qǐng)文件,自定義自己的程序信息,保證不同用戶可以并行啟動(dòng)分布式建庫(kù)任務(wù),完成最終的索引并傳輸至指定的機(jī)器。
3 農(nóng)業(yè)信息資源整合關(guān)鍵技術(shù)
農(nóng)業(yè)信息資源整合技術(shù)的完善和進(jìn)步在很大程度上決定著信息資源整合的步調(diào),因此,需要盡力挖掘新技術(shù)服務(wù)于信息資源整合和利用,保證用戶可以方便、準(zhǔn)確、及時(shí)地獲取所需信息。農(nóng)業(yè)信息資源整合所需的硬件關(guān)鍵技術(shù)有服務(wù)器虛擬化技術(shù)和負(fù)載均衡技術(shù),軟件關(guān)鍵技術(shù)有XML、Web和Web Service等技術(shù)。
3.1 硬件關(guān)鍵技術(shù)
在農(nóng)業(yè)信息資源整合過(guò)程中,經(jīng)常會(huì)遇到由于服務(wù)器配置高,僅用于部署單一資源應(yīng)用,無(wú)法充分發(fā)揮其優(yōu)越性能,造成服務(wù)器硬件資源閑置和浪費(fèi)的問(wèn)題。服務(wù)器虛擬化技術(shù)可以提高服務(wù)器利用率,加快應(yīng)用部署速度,通過(guò)提供高可靠性、高可用的資源,為用戶提供穩(wěn)定、高效地訪問(wèn)服務(wù),同時(shí)還節(jié)省了投資和維護(hù)成本等。
負(fù)載平衡技術(shù)可基于現(xiàn)有網(wǎng)絡(luò)結(jié)構(gòu),擴(kuò)展原有網(wǎng)絡(luò)設(shè)備和服務(wù)器的帶寬,增加網(wǎng)絡(luò)吞吐量,加強(qiáng)數(shù)據(jù)處理,提高網(wǎng)絡(luò)的靈活性和可用性。在信息資源整合過(guò)程中,負(fù)載平衡技術(shù)實(shí)現(xiàn)了連接的分配與調(diào)試,當(dāng)用戶通過(guò)資源訪問(wèn)地址請(qǐng)求時(shí),根據(jù)各目標(biāo)服務(wù)器的性能和網(wǎng)絡(luò)運(yùn)行狀況,選擇性能最佳的服務(wù)器響應(yīng)用戶的請(qǐng)求,并將所有流量均衡地分配到各個(gè)服務(wù)器,有效地避免了不均衡現(xiàn)象的發(fā)生。應(yīng)用負(fù)載平衡技術(shù),農(nóng)村農(nóng)業(yè)信息化綜合服務(wù)平臺(tái)明顯地獲得了高性能、高安全性和可擴(kuò)展性。
3.2 軟件關(guān)鍵技術(shù)
XML(Extensible Markup Language)是一種用于描述數(shù)據(jù)的標(biāo)記語(yǔ)言,主要使用文檔類型定義(DTD)或者模式(Schema)來(lái)描述數(shù)據(jù),與描述Web頁(yè)面的HTML有相似的格式。它可以利用Web瀏覽器進(jìn)行數(shù)據(jù)確認(rèn),還具備易于生成數(shù)據(jù)的優(yōu)點(diǎn),因此,利用它可以很方便地在部門間和部門內(nèi)部進(jìn)行數(shù)據(jù)交換和利用。XML獨(dú)立于平臺(tái),有利于跨平臺(tái)的信息交流,完全可以充當(dāng)網(wǎng)際語(yǔ)言,不僅可以降低應(yīng)用程序的負(fù)擔(dān),也使智能工具的開發(fā)更為便捷。
Web是一種超文本信息系統(tǒng),可以使文本從一個(gè)位置跳到另一個(gè)位置,有利于用戶從中獲取更多信息;還可以轉(zhuǎn)到別的主題上,如:想了解某個(gè)主題的內(nèi)容,只要在這個(gè)主題上點(diǎn)一下,就可以跳轉(zhuǎn)到包含這一主題的文檔上。另外,Web具有的圖形化、易于導(dǎo)航、與平臺(tái)無(wú)關(guān)、分布式、動(dòng)態(tài)和交互式的特性,讓信息資源整合的共享機(jī)制建設(shè)、適時(shí)更新和與用戶互動(dòng)機(jī)制建設(shè)等問(wèn)題都能得到很好的解決。Web中的圖形化顯示功能,可將圖形、音頻、視頻信息集于一體,從而使整合后的農(nóng)業(yè)信息資源以非常形象、易懂的形式呈現(xiàn)在農(nóng)戶面前。
Web Service獨(dú)立于平臺(tái)和軟件供應(yīng)商的標(biāo)準(zhǔn),是創(chuàng)建可互操作的、分布式應(yīng)用程序的新平臺(tái),且具有跨平臺(tái)的可互操作性能,能夠?qū)⑦\(yùn)行在不同平臺(tái)上的各程序進(jìn)行集成,為用戶提供一個(gè)統(tǒng)一的界而,甚至允許重用代碼,從而重用代碼背后的數(shù)據(jù)。另外,Web Service還可通過(guò)Web進(jìn)行互操作或遠(yuǎn)程調(diào)用。
4 結(jié)論
農(nóng)村農(nóng)業(yè)信息資源整合是個(gè)系統(tǒng)性的工程,包括支撐平臺(tái)的軟硬件系統(tǒng)、數(shù)據(jù)資源、應(yīng)用系統(tǒng)等。本文介紹了數(shù)據(jù)整合的分析、評(píng)價(jià)、篩選、類聚、標(biāo)引、著錄、排序、建庫(kù)、存儲(chǔ)等過(guò)程,以及實(shí)現(xiàn)數(shù)據(jù)整合的軟硬件關(guān)鍵技術(shù),以期為其它省份的農(nóng)村農(nóng)業(yè)信息資源整合提供技術(shù)借鑒。endprint