劉月學(xué)(信陽農(nóng)林學(xué)院圖書館 河南信陽 464000)
網(wǎng)絡(luò)信息資源融合機(jī)理研究*
劉月學(xué)
(信陽農(nóng)林學(xué)院圖書館河南信陽464000)
〔摘要〕文章從網(wǎng)絡(luò)信息資源、信息融合、網(wǎng)絡(luò)信息資源融合的基本概念入手,從原理、體系結(jié)構(gòu)、關(guān)鍵技術(shù)三個方面闡述了網(wǎng)絡(luò)信息資源的融合機(jī)理,指出網(wǎng)絡(luò)信息資源融合是實現(xiàn)網(wǎng)絡(luò)信息資源科學(xué)化管理的一種有效方式,其在信息資源管理中發(fā)揮著重要作用。
〔關(guān)鍵詞〕網(wǎng)絡(luò)信息資源融合機(jī)理體系結(jié)構(gòu)關(guān)鍵技術(shù)
近年來,網(wǎng)絡(luò)信息資源的融合利用問題已經(jīng)成為學(xué)術(shù)界和實踐領(lǐng)域關(guān)注的熱點,因此,文章對網(wǎng)絡(luò)信息資源的融合機(jī)理進(jìn)行探討,以引起業(yè)界的關(guān)注。
1.1網(wǎng)絡(luò)信息資源
網(wǎng)絡(luò)信息資源是指通過計算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和[1]。換句話說,是指把以符號、文字、圖像、聲音、動畫等多種形式的信息存儲在光、磁等非紙介質(zhì)的載體中,并通過網(wǎng)絡(luò)通信、計算機(jī)或終端等方式再現(xiàn)出來的各種資源。網(wǎng)絡(luò)信息資源融合的對象就是在網(wǎng)絡(luò)上傳播的各種不同介質(zhì)、不同種類的資源。
1.2信息融合
信息融合的概念是在20世紀(jì)70年代提出的, 又稱為數(shù)據(jù)融合, 起源于1973年美國國防部資助開發(fā)的聲納信號處理系統(tǒng)[2]。學(xué)者陳中荃[3]認(rèn)為,信息融合的基本原理是利用不同時序與空間的多個信息源, 采用計算機(jī)技術(shù)對觀測到的信息進(jìn)行合理的支配和使用,把在空間上的冗余或互補(bǔ)信息按照一定的準(zhǔn)則加以自動分析、綜合、支配和使用, 以獲取對被測目標(biāo)的一致性認(rèn)識, 以完成所需的決策和估計任務(wù), 以期得到比單一信息源更精確、更可靠的估計或推理決策。信息融合是網(wǎng)絡(luò)信息資源融合利用的基礎(chǔ)和關(guān)鍵。
1.3網(wǎng)絡(luò)信息資源融合
關(guān)于網(wǎng)絡(luò)信息資源的融合利用問題,張登軍[4]指出,網(wǎng)絡(luò)信息資源融合就是為了滿足和適應(yīng)當(dāng)代信息發(fā)展需求,給用戶提供更高級的信息服務(wù),將各種各樣的互聯(lián)網(wǎng)信息、轉(zhuǎn)化的電子信息以及處理后的加工信息進(jìn)行有序、有機(jī)、全面、系統(tǒng)、有效地揭示和關(guān)聯(lián)。
筆者綜合上述觀點認(rèn)為,網(wǎng)絡(luò)信息資源融合是指利用數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)關(guān)聯(lián)等關(guān)鍵技術(shù),將在互聯(lián)網(wǎng)傳播的不同介質(zhì)、不同種類的資源進(jìn)行揭示和關(guān)聯(lián),形成有機(jī)聯(lián)系的過程。網(wǎng)絡(luò)信息資源的融合是利用計算機(jī)網(wǎng)絡(luò)系統(tǒng)將分散的、雜亂無章的網(wǎng)絡(luò)信息資源以統(tǒng)一的方式集中揭示,實現(xiàn)了網(wǎng)絡(luò)信息資源的合理組織和快速定位,并呈現(xiàn)給用戶。網(wǎng)絡(luò)信息資源的融合并不等同于網(wǎng)絡(luò)信息資源的整合。網(wǎng)絡(luò)信息資源的整合是指在外力的作用下將不同的網(wǎng)絡(luò)信息資源集中到一起,將原來參差不齊的網(wǎng)絡(luò)資源趨向一致,將原來不協(xié)調(diào)的網(wǎng)絡(luò)資源協(xié)調(diào)一致,便于利用,而一旦失去外力作用,各種網(wǎng)絡(luò)信息資源將恢復(fù)到不協(xié)調(diào)的狀態(tài)。而網(wǎng)絡(luò)信息資源的融合是指各種網(wǎng)絡(luò)信息資源在本質(zhì)上就是可融的,不存在外力的作用。
從認(rèn)識論的角度來看,網(wǎng)絡(luò)信息資源融合就是對組成這些網(wǎng)絡(luò)信息資源的各種數(shù)據(jù)進(jìn)行認(rèn)知、綜合、判斷的過程,人類先通過視覺、聽覺、觸覺等感官器官獲取多種信息,接著人類對客觀事物進(jìn)行全方位的感知獲得大量的其他信息,然后大腦對信息進(jìn)行組合處理,先根據(jù)人類積累的經(jīng)驗常識去判斷正在發(fā)生的事件,由于人的感官器官能獲得不同特征的網(wǎng)絡(luò)信息資源,因而可以從不同角度獲取對同一對象的各種信息。在網(wǎng)絡(luò)信息資源融合過程中,要模仿人類的大腦對復(fù)雜信息進(jìn)行處理判斷。網(wǎng)絡(luò)信息資源主要包括網(wǎng)絡(luò)即時信息、周期規(guī)律的網(wǎng)絡(luò)信息、確定的信息和模棱兩可的信息等。網(wǎng)絡(luò)信息資源融合實現(xiàn)的原理就是模擬人類大腦對接收到的各種信息資源進(jìn)行處理,然后根據(jù)人類已有的經(jīng)驗或相關(guān)理論知識對數(shù)據(jù)進(jìn)行分析、處理,做出最終的判斷的過程。通過融合,可以對多方面的*本文系2014年度河南省社科聯(lián)、河南省經(jīng)團(tuán)聯(lián)調(diào)研課題“網(wǎng)絡(luò)信息資源的融合利用與質(zhì)量保障問題研究”(項目編號:SKL—2014—730)研究成果之一。信息重新進(jìn)行有規(guī)則的組合,從而獲得更多有價值的信息,這個過程不是簡單的信息輸入和輸出過程,而是各類網(wǎng)絡(luò)信息資源相互作用的結(jié)果(如圖1所示)。
圖1 網(wǎng)絡(luò)信息資源融合過程
從解釋學(xué)的角度來看,網(wǎng)絡(luò)信息資源的融合就是由人類(融合主體)對組成網(wǎng)絡(luò)信息資源的文本、圖像、聲音等要素(融合客體)進(jìn)行理解和解釋的過程。解釋是解釋者與文本之間互動產(chǎn)生意義的理解過程[5],就是對網(wǎng)絡(luò)信息資源融合現(xiàn)象進(jìn)行理解和解釋的過程。人類通過大腦對從傳感器獲得的各種信息進(jìn)行理解和解釋,經(jīng)過分析、處理后進(jìn)行重新組合,形成有價值的信息資源。
網(wǎng)絡(luò)信息資源融合的體系結(jié)構(gòu)可以分為集中式結(jié)構(gòu)、分布式結(jié)構(gòu)和分級式結(jié)構(gòu)。
3.1集中式結(jié)構(gòu)
圖2 網(wǎng)絡(luò)信息資源融合的集中式結(jié)構(gòu)
網(wǎng)絡(luò)信息資源融合的集中式結(jié)構(gòu)中,所有的網(wǎng)絡(luò)資源通過一個融合中心來進(jìn)行融合(如圖2)。首先,用來形成網(wǎng)絡(luò)資源的各種數(shù)據(jù)被送到融合中心;然后,融合中心對接收到的這些數(shù)據(jù)進(jìn)行有效的分析,經(jīng)過處理之后,形成新信息。這種方法的優(yōu)點是實時性好、獲得的信息完整、數(shù)據(jù)處理精度高。缺點是所有數(shù)據(jù)都由融合中心來處理,這就造成了融合中心的負(fù)荷過大,而且數(shù)據(jù)傳輸量大,可靠性也較低。在網(wǎng)絡(luò)信息資源的融合中,對信息的獲取是通過傳感器進(jìn)行的。在集中式結(jié)構(gòu)中,各個傳感器是獨立的,而通過傳感器獲取到的信息數(shù)據(jù)需要通過互聯(lián)網(wǎng)迅速的傳遞,這要求系統(tǒng)務(wù)必提供較寬的傳輸總線以滿足高速傳輸?shù)囊?,融合中心也需要安裝高性能的中央處理器來處理各種數(shù)據(jù)。因此,這些要求都增加了網(wǎng)絡(luò)信息資源融合的成本。
3.2分布式結(jié)構(gòu)
在分布式結(jié)構(gòu)中,每一種網(wǎng)絡(luò)信息資源會通過傳感器傳遞給用戶,用戶會為每個傳感器建立一個獨立的決策處理系統(tǒng),每種網(wǎng)絡(luò)信息資源經(jīng)過決策處理系統(tǒng)局部處理后將處理結(jié)果輸入融合中心,融合中心把這些局部處理結(jié)果進(jìn)行融合后生成新的網(wǎng)絡(luò)信息資源(如圖3)。在分布式結(jié)構(gòu)下,融合中心幾乎不需要原始信息數(shù)據(jù),因此對信道容量的要求大大降低。局部的傳感器失效不會導(dǎo)致整個系統(tǒng)的崩潰,具有很強(qiáng)的生命力。這種結(jié)構(gòu)的缺點是融合中心獲得的不是第一手信息,一旦有某個傳感器的決策系統(tǒng)出現(xiàn)錯誤,將會導(dǎo)致整個系統(tǒng)最終結(jié)果錯誤,也就是說增加了網(wǎng)絡(luò)信息資源融合處理的不確定性。
圖3 網(wǎng)絡(luò)信息資源融合的分布式結(jié)構(gòu)
3.3分級式結(jié)構(gòu)
網(wǎng)絡(luò)信息資源融合的分級式結(jié)構(gòu)是集中式結(jié)構(gòu)和分布式結(jié)構(gòu)的組合,這種結(jié)構(gòu)綜合了兩種方式的優(yōu)缺點。在分級式結(jié)構(gòu)中,有一個融合中心,多個融合節(jié)點,每一個融合節(jié)點融合了兩種或兩種以上的網(wǎng)絡(luò)信息資源。融合中心的主要任務(wù)是將送入其中的各個融合節(jié)點的融合結(jié)果進(jìn)行分析和處理,得到最后的決策結(jié)果。這種結(jié)構(gòu)中網(wǎng)絡(luò)信息資源的融合是分層次進(jìn)行的,并從低層向高層逐層進(jìn)行。分級式結(jié)構(gòu)分為兩種,一種為無反饋分級式結(jié)構(gòu)(如圖4);另一種為有反饋分級式結(jié)構(gòu),其結(jié)構(gòu)和無反饋融合結(jié)構(gòu)基本相同,只是增加了反饋環(huán)節(jié)(如圖5)。
圖4 網(wǎng)絡(luò)信息資源融合的無反饋分級式結(jié)構(gòu)
圖5 網(wǎng)絡(luò)信息資源融合的有反饋分級式結(jié)構(gòu)
網(wǎng)絡(luò)信息資源融合中要用到的關(guān)鍵技術(shù)主要包括數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)關(guān)聯(lián)和融合算法等技術(shù)。
4.1數(shù)據(jù)轉(zhuǎn)換技術(shù)
信息資源融合過程中要使用不同類型的傳感器對需要融合的網(wǎng)絡(luò)信息資源進(jìn)行多方面的監(jiān)測,所獲得的數(shù)據(jù)類型也是多種多樣,對這些數(shù)據(jù)進(jìn)行融合計算之前,需要將這些不同來源的數(shù)據(jù)轉(zhuǎn)換成相同的格式,然后對這些數(shù)據(jù)進(jìn)行相關(guān)處理操作。在這個過程中,數(shù)據(jù)的轉(zhuǎn)換是不可少的,另外,對監(jiān)測目標(biāo)的描述可能存在差異,也需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換。
網(wǎng)絡(luò)信息資源的數(shù)據(jù)轉(zhuǎn)換主要包括數(shù)據(jù)庫之間的數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)文件的轉(zhuǎn)換、消息的轉(zhuǎn)換、數(shù)據(jù)模型之間的轉(zhuǎn)換和特定模型內(nèi)的轉(zhuǎn)換[6]。網(wǎng)絡(luò)信息資源的數(shù)據(jù)轉(zhuǎn)換要用到的關(guān)鍵技術(shù)就是XML技術(shù),XML被稱為可擴(kuò)展標(biāo)記語言,是一種用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語言[7]。XML可以以一種統(tǒng)一的數(shù)據(jù)模式描述來自不同數(shù)據(jù)源的數(shù)據(jù),XML已經(jīng)成為信息交換事實上的標(biāo)準(zhǔn)??梢杂肵ML標(biāo)記的數(shù)據(jù)主要包括:普通文檔、結(jié)構(gòu)化記錄、具有數(shù)據(jù)和方法的對象、數(shù)據(jù)庫查詢記錄、圖形顯示、所有Web上的信息之間的聯(lián)接等[8]。因此,網(wǎng)絡(luò)上絕大多數(shù)的信息資源都可以用XML來標(biāo)記。
XML數(shù)據(jù)轉(zhuǎn)換的原理是在數(shù)據(jù)的轉(zhuǎn)換過程中以XML格式作為中介,將不同數(shù)據(jù)源的數(shù)據(jù)轉(zhuǎn)換成XML模式,將XML模式進(jìn)行處理之后,再將其轉(zhuǎn)換為目標(biāo)數(shù)據(jù)。(如圖6)
圖6 基于XML的數(shù)據(jù)轉(zhuǎn)換
XML與網(wǎng)絡(luò)信息資源的數(shù)據(jù)源之間的數(shù)據(jù)轉(zhuǎn)換包括數(shù)據(jù)源到XML文檔和XML文檔到數(shù)據(jù)源之間的轉(zhuǎn)換。在網(wǎng)絡(luò)數(shù)據(jù)交換中,XML作為數(shù)據(jù)交換的標(biāo)準(zhǔn)已經(jīng)廣泛應(yīng)用于網(wǎng)絡(luò)信息資源的融合中,XML作為網(wǎng)絡(luò)數(shù)據(jù)轉(zhuǎn)換的標(biāo)準(zhǔn)和工具,具有更強(qiáng)的通用性和更高的轉(zhuǎn)換效率。
4.2數(shù)據(jù)關(guān)聯(lián)技術(shù)
所謂數(shù)據(jù)關(guān)聯(lián),就是在數(shù)據(jù)集合與數(shù)據(jù)集合之間建立關(guān)系或者聯(lián)接。從這個角度上來看,數(shù)據(jù)關(guān)聯(lián)應(yīng)該是作用于兩個或多個集合之上的[9]。對于網(wǎng)絡(luò)信息資源融合而言,由于傳感器對網(wǎng)絡(luò)信息資源進(jìn)行監(jiān)測時會受到工作環(huán)境和自身誤差的影響,其監(jiān)測的數(shù)據(jù)可能會不準(zhǔn)確、不完整,也有可能是虛假的信息。數(shù)據(jù)關(guān)聯(lián)技術(shù)主要用來解決傳感器監(jiān)測的數(shù)據(jù)對環(huán)境或監(jiān)測目標(biāo)做出不一致甚至沖突的描述或解釋的情況,這樣就能夠使數(shù)據(jù)保持一致,保證融合結(jié)果能夠真實的反映客觀事實。數(shù)據(jù)關(guān)聯(lián)技術(shù)在網(wǎng)絡(luò)信息資源的融合過程中發(fā)揮著重要作用,數(shù)據(jù)關(guān)聯(lián)技術(shù)能夠?qū)㈦x散的、無規(guī)律的網(wǎng)絡(luò)信息資源和數(shù)據(jù)按特定的規(guī)律和原則形成相應(yīng)的知識,便于對網(wǎng)絡(luò)信息資源的融合。
對于融合的對象(網(wǎng)絡(luò)信息資源的數(shù)據(jù)源)而言,不妨假設(shè)存在給定時刻的多個目標(biāo)融合狀態(tài){Pj,j = 1, 2,..., m},以及多個目標(biāo)的傳感器測量數(shù)據(jù){Zj,j=1,2,...,n}。當(dāng)然,對于多傳感器的數(shù)據(jù)監(jiān)測而言,這兩個集合可能分別對應(yīng)傳感器A和傳感器B,即存在測量集合{aj, j = 1,2,..., m}和測量集合{bj ,j = 1,2,..., n}。對于這兩個集合而言,他們存在著數(shù)據(jù)關(guān)聯(lián)關(guān)系,兩者在數(shù)學(xué)意義上具有等價性。
圖7 數(shù)據(jù)關(guān)聯(lián)原理示意圖
如圖7所示,假設(shè)融合中心存在四個目標(biāo),分別為T1、T2、T3、T4,某個時刻對應(yīng)的融合狀態(tài)分別為p1, p2, p3, p4, 同時,傳感器在該時刻觀測到了五個狀態(tài)信息,分別為z1、z2、z3、z4、z5,為了對已有的四個目標(biāo)狀態(tài)進(jìn)行更新,需要在預(yù)測集合{Pj,j=1,2,3,4}和測量集合{Zj,j=1,2,3,4,5}之間建立某種映射關(guān)系。從圖7中可預(yù)測出,p1和z1來自同一個目標(biāo),p2和z2來自同一個目標(biāo),p3和z5來自同一個目標(biāo),p4和z4來自同一個目標(biāo)。而對于測量z3則不存在預(yù)測與之對應(yīng),這是因為,z3在測量的過程中可能存在噪聲的干擾,也就是虛假信號的干擾。網(wǎng)絡(luò)信息資源融合中的數(shù)據(jù)管理最大匹配示意圖(見圖8)。
圖8 數(shù)據(jù)關(guān)聯(lián)最大匹配示意圖
4.3融合算法技術(shù)
關(guān)于網(wǎng)絡(luò)信息資源的融合,到現(xiàn)在為止,還沒有形成統(tǒng)一的基本理論框架,融合大多數(shù)是針對某一特定領(lǐng)域的問題進(jìn)行的。因此,在解決具體的問題時,需要充分分析問題的特點,針對融合的目標(biāo)及數(shù)據(jù)特性選擇融合算法,這是網(wǎng)絡(luò)信息資源融合的基本問題。
目前,對于網(wǎng)絡(luò)信息資源的融合而言,其算法均是基于非線性的數(shù)學(xué)方法,容錯性能好,自適應(yīng)性強(qiáng),具有聯(lián)想記憶和并行處理的能力,都可以用來作為融合方法。常見的融合算法有:加權(quán)平均法、卡爾曼濾波法、貝葉斯估計、統(tǒng)計決策法、聚類分析法、小波變換法、D-S證據(jù)推理、模糊聚類理論、專家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)等[10]。
網(wǎng)絡(luò)信息資源的融合是對組成網(wǎng)絡(luò)信息資源的數(shù)據(jù)對象、功能結(jié)構(gòu)以及這二者之間互動關(guān)系的創(chuàng)造性融合,將其融合為新的有機(jī)整體。隨著網(wǎng)絡(luò)技術(shù)和數(shù)字化技術(shù)的發(fā)展,網(wǎng)絡(luò)信息資源的融合將成為信息資源組織的一項重要工作,它改變了人類處理和利用信息資源的方式。更重要的是,網(wǎng)絡(luò)信息資源的融合克服了網(wǎng)絡(luò)信息資源的分布性和異構(gòu)性問題,消除了用戶使用分布性和異構(gòu)性網(wǎng)絡(luò)信息資源的障礙。因此,網(wǎng)絡(luò)信息資源的融合日益重要,通過融合,可以將各種分布的、異構(gòu)的和多樣化的網(wǎng)絡(luò)信息資源重新處理和組織,實現(xiàn)了網(wǎng)絡(luò)信息資源的優(yōu)化管理,提高了人類利用網(wǎng)絡(luò)信息資源的效率。
(來稿時間:2015年1月)
參考文獻(xiàn):
1.網(wǎng)絡(luò)信息資源.[2014-10-21].http://baike.baidu.com/view/1356256.htm?fr= Aladdin
2.信息融合.[2014-10-22].http://baike.baidu.com/view/125985.htm?fr=aladdin
3.陳中荃.信息融合技術(shù)在圖書館情報系統(tǒng)中的應(yīng)用.現(xiàn)代情報,2006(5):56-57
4.張登軍.再論網(wǎng)絡(luò)信息資源融合.科技傳播,2014(7):231,216
5.劉月學(xué).基于解釋學(xué)的虛擬社區(qū)研究.圖書館學(xué)研究,2013(15):7-9,15
6.王生西,潘永躍.數(shù)據(jù)轉(zhuǎn)換技術(shù)研究.無線互聯(lián)科技,2011(12):16-18
7.可擴(kuò)展標(biāo)記語言.[2014-10-29]. http://baike.baidu.com/view/159832.htm?from_id=86251&type=syn&fromtitle=xml&fr=aladdin
8.張春紅.基于XML的異構(gòu)數(shù)據(jù)庫集成技術(shù)研究. 廊坊師范學(xué)院學(xué)報(自然科學(xué)版),2014(4):29-30,43
9.史盟釗.多傳感器數(shù)據(jù)關(guān)聯(lián)與狀態(tài)跟蹤算法研究.合肥:中國科學(xué)技術(shù)大學(xué)碩士論文,2014:13-14
10.吳太旗.組合導(dǎo)航多源信息融合方法研究及仿真.鄭州:中國人民解放軍信息工程大學(xué)碩士論文,2004:2-3
〔分類號〕G203
〔作者簡介〕劉月學(xué)(1983-),男,碩士,信陽農(nóng)林學(xué)院圖書館館員,研究方向:信息資源管理。
A Study on the Integration Mechanism of Network Information Resources
Liu Yuexue
( Library of Xinyang Agricultural and Forestry University )
〔Abstract〕This article expounds the integration mechanism of network information resources from three aspects of the principle, the system structure and the key technology and indicates that integration of the network information resources is an effective way to realize the scientific management that plays important role in it.
〔Keywords〕Network information resources Integration Mechanism System structure Key technology