楊曉梅 張菊玲 趙忠華
摘 ? 要:首先,文章闡述了多源信息融合的概念與模型;其次,探討了多源信息融合的層次和方法;最后,介紹了多源信息融合技術(shù)的應(yīng)用領(lǐng)域和發(fā)展趨勢(shì),特別討論了幾個(gè)新興的應(yīng)用領(lǐng)域。
關(guān)鍵詞:多源信息;信息融合;信息融合技術(shù)
1 ? ?多源信息融合的概念和模型
多源信息融合從20世紀(jì)70年代末由一門新興學(xué)科迅速發(fā)展起來(lái)。隨著信息技術(shù)的進(jìn)步,各種應(yīng)用系統(tǒng)背景越來(lái)越復(fù)雜,因而多源信息系統(tǒng)大量出現(xiàn),對(duì)不同信息源的信息進(jìn)行有效融合已成為迫切的需求。同時(shí),各種關(guān)于信息融合的新理論、新方法和新技術(shù)層出不窮,多源信息融合技術(shù)的應(yīng)用領(lǐng)域也越來(lái)越廣泛。
1.1 ?多源信息融合的基本概念
多源信息融合(簡(jiǎn)稱為信息融合)是指組合和合并多個(gè)來(lái)源的信息或數(shù)據(jù),以便形成一個(gè)統(tǒng)一結(jié)果的技術(shù)[1],其過(guò)程是用技術(shù)工具和數(shù)據(jù)方法來(lái)綜合處理不同來(lái)源的信息,通過(guò)對(duì)信息的優(yōu)化組合,得到高品質(zhì)的有效信息。簡(jiǎn)而言之,即信息融合是為綜合信息系統(tǒng)的用戶提供多個(gè)數(shù)據(jù)源的統(tǒng)一視圖的過(guò)程[2]。多源信息融合的目的主要有兩個(gè)方面:一方面,針對(duì)多源信息的冗余性,消除輸入信息中的噪聲和異常值;另一方面,針對(duì)多源信息的互補(bǔ)性,獲取與實(shí)際應(yīng)用相關(guān)的有價(jià)信息,最大限度地獲取所觀察對(duì)象的完整信息描述。
多源信息融合是一個(gè)多學(xué)科交叉的研究領(lǐng)域,為各學(xué)科的研究者提供了互相合作與借鑒的機(jī)會(huì),已廣泛應(yīng)用于眾多領(lǐng)域。
1.2 ?多源信息融合的模型
多源信息融合模型可分為功能模型、結(jié)構(gòu)模型、過(guò)程模型和數(shù)學(xué)模型等類別。前3類可以統(tǒng)稱為信息融合模型,而數(shù)學(xué)模型多指各種信息融合方法。
到目前為止,人們已提出了多種信息融合模型,如JDL模型、OO-DA模型、Omnibus模型、STDF模型等[3],其中,應(yīng)用最廣泛的是JDL模型及其演化版本。最初的JDL模型根據(jù)信息融合的結(jié)果可分為3級(jí):第一級(jí)是位置估計(jì)與目標(biāo)身份識(shí)別;第二級(jí)是態(tài)勢(shì)評(píng)估;第三級(jí)是威脅估計(jì)。后期的四級(jí)融合模型在三級(jí)模型的基礎(chǔ)上增加了第四級(jí)“精細(xì)處理”,而五級(jí)融合模型與三級(jí)模型相比,將位置級(jí)融合與目標(biāo)識(shí)別級(jí)融合分開,并且增加了“檢測(cè)級(jí)融合”。使JDL模型從軍事應(yīng)用成功推廣到民用領(lǐng)域的模型改進(jìn)主要是將第三級(jí)“威脅評(píng)估”改為“影響評(píng)估”。
2 ? ?多源信息融合的層次和方法
多源信息融合用不同層次來(lái)表示對(duì)信息的處理的不同級(jí)別,不同級(jí)別的輸入信息和輸出結(jié)果都有所不同。每個(gè)層次都會(huì)涉及很多具體的方法與技術(shù),研究各種技術(shù)方法的適用范圍、優(yōu)缺點(diǎn)以及相互之間的關(guān)系等,可以為多源信息融合的技術(shù)方法及應(yīng)用提供借鑒。
2.1 ?多源信息融合的層次
根據(jù)輸入信息的抽象層次,可將多源信息融合分為3個(gè)層次:數(shù)據(jù)級(jí)融合、特征級(jí)融合和決策級(jí)融合。
(1)數(shù)據(jù)級(jí)融合,屬于3個(gè)融合層次的最低層,對(duì)采集到的原始信息進(jìn)行直接融合處理,能夠盡可能多地保持現(xiàn)場(chǎng)數(shù)據(jù),并且能夠?qū)π畔⑻幚斫Y(jié)果進(jìn)行特征提取和相應(yīng)的決策判斷。數(shù)據(jù)級(jí)融合處理方法能夠提供更加細(xì)致的信息,且信息損失較少,所以分析結(jié)果的精度較髙。但是因?yàn)閿?shù)據(jù)容量大,所以處理時(shí)間長(zhǎng)、代價(jià)高、實(shí)時(shí)性差。在數(shù)據(jù)融合階段多用傳統(tǒng)方法進(jìn)行處理,例如加權(quán)平均法、特征匹配法等。
(2)特征級(jí)融合,是介于數(shù)據(jù)融合和決策融合之間的層次。首先,對(duì)多源信息進(jìn)行特征提取;其次,按照特征信息對(duì)多源信息進(jìn)行分類和融合;最后,形成基于融合特征矢量的屬性說(shuō)明。該層主要由目標(biāo)特征信息和目標(biāo)狀態(tài)信息融合組成,常用的方法有分類法、卡爾曼濾波、聚類法等。
(3)決策級(jí)融合,是多源信息融合中最髙層次的融合,通過(guò)對(duì)特征信息分類和識(shí)別等處理,再進(jìn)行進(jìn)一步的信息融合,其結(jié)果用來(lái)為各種控制和決策提供依據(jù)。由于決策級(jí)融合的預(yù)處理工作量大,信息損失也較多,易造成精度降低,但是它適用于異構(gòu)傳感器場(chǎng)合,且融合處理過(guò)程代價(jià)較低,抗干擾能力較強(qiáng)。常見決策級(jí)融合方法有貝葉斯網(wǎng)絡(luò)推理法、D-S理論和專家系統(tǒng)等。
2.2 ?多源信息融合的方法
多源信息融合方法種類繁多,每種方法都各有優(yōu)缺點(diǎn),各種方法相互之間也具有一定的互補(bǔ)性。按照多源信息融合算法的數(shù)學(xué)基礎(chǔ)可分為估計(jì)理論方法、不確定性推理方法和人工智能和模式識(shí)別方法。
(1)估計(jì)理論方法,包括線性估計(jì)技術(shù)和非線性估計(jì)技術(shù)。常見的線性估計(jì)技術(shù)有卡爾曼濾波與加權(quán)平均等;非線性估計(jì)技術(shù)如擴(kuò)展卡爾曼濾波(Extended Kalman Filter,EKF)、強(qiáng)跟蹤濾波器(Strong Tracking Filter,STF)和UKF濾波等。隨著對(duì)信息融合認(rèn)知程度的加深,基于隨機(jī)抽樣技術(shù)的非線性非高斯系統(tǒng)的研究也獲得了很多成果。
在多源信息融合的系統(tǒng)中,各種源信息本身包含大量的不確定性,不確定推理方法的目的就是實(shí)現(xiàn)根據(jù)這些不確定信息進(jìn)行信息處理,用來(lái)實(shí)現(xiàn)對(duì)目標(biāo)身份的識(shí)別和屬性判斷等。不確定推理方法主要包括主觀貝葉斯方法、D-S證據(jù)推理方法、DSmT方法、模糊數(shù)學(xué)理論方法和可能性推理方法等。其中,主觀貝葉斯方法要求系統(tǒng)可能的決策相互獨(dú)立,是早期使用的一種高效率的信息融合方法;D-S證據(jù)理論采用信任函數(shù)作為量度,能夠較好解決未知所引起的不確定問(wèn)題;DSmT方法是傳統(tǒng)D-S理論的延伸,通過(guò)組合使用信任函數(shù),可以表達(dá)任何類型的獨(dú)立源。
人工智能和模式方法可以處理不完善數(shù)據(jù),在處理信息的過(guò)程中通過(guò)自身不斷學(xué)習(xí)與歸納,最終把不完善的信息融合為較為統(tǒng)一和完善的信息。主要方法包括粗糙集理論、隨機(jī)理論、信息熵理論、灰色系統(tǒng)理論、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)和遺傳算法等。
3 ? ?多源信息融合技術(shù)的應(yīng)用及發(fā)展趨勢(shì)
多源信息融合理論和技術(shù)起源并應(yīng)用于軍事領(lǐng)域。近年來(lái),多源信息融合系統(tǒng)在民用方面也得到了蓬勃發(fā)展,主要應(yīng)用領(lǐng)域?yàn)椋簣D像融合、目標(biāo)跟蹤、工業(yè)控制、環(huán)境監(jiān)測(cè)、醫(yī)療保健和各種智能系統(tǒng)等。
隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,面向互聯(lián)網(wǎng)的多源信息融合問(wèn)題越來(lái)越多地受到關(guān)注,例如Web信息融合、網(wǎng)絡(luò)安全、數(shù)據(jù)隱私保護(hù)及其他應(yīng)用等。下面著重討論網(wǎng)絡(luò)方向的相關(guān)應(yīng)用。
3.1 ?Web信息融合
Web信息融合是指將不同來(lái)源的Web信息進(jìn)行整合,從而為用戶提供所需的、統(tǒng)一的、高質(zhì)量的信息結(jié)果。Web信息融合的研究工作主要集中于信息檢索數(shù)據(jù)融合和Web文檔知識(shí)融合,包括多媒體的融合和多語(yǔ)言信息融合。Web信息融合技術(shù)的發(fā)展將促進(jìn)基于Web支持系統(tǒng)的各種研究與開發(fā)。
3.2 ?網(wǎng)絡(luò)安全
網(wǎng)絡(luò)本身具有高度的復(fù)雜性,在網(wǎng)絡(luò)系統(tǒng)受到各種各樣攻擊的時(shí)候,對(duì)攻擊的理解和檢測(cè)判斷往往依賴于多源信息的收集和關(guān)聯(lián)。在網(wǎng)絡(luò)安全防護(hù)的各個(gè)階段都可以采用多源信息融合技術(shù)。目前針對(duì)入侵檢測(cè)的多源信息融合研究比較集中,研究中的重點(diǎn)主要是分類器組合和警報(bào)組合。
3.3 ?數(shù)據(jù)隱私保護(hù)及其他應(yīng)用
當(dāng)涉及數(shù)據(jù)隱私問(wèn)題時(shí),需要嚴(yán)格控制特定敏感信息的獲取,尤其是通過(guò)數(shù)據(jù)挖掘等技術(shù)從商業(yè)數(shù)據(jù)庫(kù)中獲取相關(guān)數(shù)據(jù)時(shí),對(duì)隱私數(shù)據(jù)的保護(hù)尤為重要。多源信息融合技術(shù)在數(shù)據(jù)隱私中所起的作用主要表現(xiàn)在兩個(gè)方面[4-5]:(1)通過(guò)數(shù)據(jù)聚合來(lái)擾亂或屏蔽特定信息。(2)用記錄鏈接來(lái)匹配與合并多個(gè)來(lái)源的數(shù)據(jù)信息,從而實(shí)現(xiàn)多源信息之間的隱私保護(hù)。
隨著信息技術(shù)的迅猛發(fā)展,海量數(shù)據(jù)融合、分布式信息融合、安全信息融合和多模態(tài)異類信息融合的實(shí)現(xiàn)有待進(jìn)一步研究,另外,這些信息融合問(wèn)題也可考慮采用Web Service和云計(jì)算方案來(lái)解決。未來(lái)的多源數(shù)據(jù)融合技術(shù)正朝著物理化、大數(shù)據(jù)化和全自動(dòng)化的方向發(fā)展。
4 ? ?結(jié)語(yǔ)
多源信息融合的理論和技術(shù)及應(yīng)用范圍非常廣泛。本文通過(guò)探討多源信息融合的基本概念、模型和多源信息融合的層次、方法以及應(yīng)用,以期更好地選擇融合方法,從而找到適應(yīng)具體多源數(shù)據(jù)環(huán)境與現(xiàn)實(shí)問(wèn)題需求的最優(yōu)解。
[參考文獻(xiàn)]
[1]陳科文,張祖平,龍軍.多源信息融合關(guān)鍵問(wèn)題、研究進(jìn)展與新動(dòng)向[J].計(jì)算機(jī)科學(xué),2013(8):6-13.
[2]BLEIHOLDER J,SZOTT S,HERSCHEL M,et al.Subsumption and complementation as data fusion operators[C].Lausanne:13th International Conference on Extending Database Technology,2010.
[3]彭冬亮,文成林,薛安克.多傳感器多源信息融合理論及應(yīng)用[M].北京:科學(xué)出版社,2010.
[4]NAVARRO A G,TORRA V.Information fusion in data privacy:a survey[J].Information Fusion,2012(4):22-24.
[5]韓崇昭,朱洪艷,段戰(zhàn)勝,等.多源信息融合[M].北京:清華大學(xué)出版社,2006.