国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的電子對抗本體知識模型構(gòu)建方法研究

2023-09-05 01:36高墨昀陳金煒
艦船電子對抗 2023年4期
關(guān)鍵詞:電子對抗數(shù)據(jù)源本體

高墨昀,柴 恒,陳金煒

(中國船舶集團有限公司第七二三研究所,江蘇 揚州 225101)

0 引 言

2012年Google公司為加強智能搜索能力,提出知識圖譜的概念[1]。概念提出后知識圖譜逐漸獲得各大公司及科研機構(gòu)的重視。各行業(yè)各領(lǐng)域的眾多機構(gòu)先后開發(fā)了面向不同專業(yè)和應(yīng)用的知識圖譜。目前知識圖譜已被廣泛應(yīng)用于互聯(lián)網(wǎng)、金融、醫(yī)學(xué)等領(lǐng)域,在智能搜索、智能決策和智能問答等方面發(fā)揮著重要的作用[2]。

由于電子對抗領(lǐng)域的知識具有高度專業(yè)性、封閉性、數(shù)據(jù)導(dǎo)向等特點,同時當(dāng)前電子目標(biāo)識別、電子對抗決策等方面高度依賴專家知識和經(jīng)驗,智能化程度低,因此電子對抗領(lǐng)域的知識圖譜在目標(biāo)識別、對抗決策等方向具備極大的應(yīng)用潛力。對電子對抗知識進行合理準(zhǔn)確的建模是電子對抗知識圖譜應(yīng)用實現(xiàn)的重點和難點。運用本體的方法進行建模的領(lǐng)域知識庫具有概念包容多、概念描述準(zhǔn)確、關(guān)系表達充分、開放性好、機器可讀、推理能力強等優(yōu)點[3]。本文對電子對抗知識進行基于本體的建模研究,并對電子對抗多源數(shù)據(jù)和知識進行抽取,構(gòu)建電子對抗領(lǐng)域知識圖譜。

1 本體模型構(gòu)建

知識圖譜基于圖的數(shù)據(jù)結(jié)構(gòu)進行存儲,是語義網(wǎng)絡(luò)的技術(shù)之一[4]。按照金芝提出的本體邏輯三元組結(jié)構(gòu)[5],本體組織模型的邏輯結(jié)構(gòu)如下:

O=〈C,R,A〉

(1)

式中:C表示概念,是指電子對抗知識領(lǐng)域中,一組共享某些相同屬性的對象的集合,例如雷達類,就包括了戰(zhàn)略預(yù)警雷達類、警戒引導(dǎo)雷達類、炮瞄雷達類、制導(dǎo)雷達類、戰(zhàn)場監(jiān)視雷達類等子類;R表示概念之間的關(guān)系,是指戰(zhàn)場電磁環(huán)境中概念之間的交互關(guān)系和邏輯關(guān)系,交互關(guān)系反映的是概念之間的相互影響,諸如雷達偵察、識別、干擾等;邏輯關(guān)系反映的是概念之間的內(nèi)在聯(lián)系,諸如概念之間的繼承關(guān)系、屬性關(guān)系等;A表示屬性,是指電子對抗知識領(lǐng)域中概念所具有的戰(zhàn)術(shù)指標(biāo)和技術(shù)指標(biāo),諸如雷達的頻率、作用距離等都是電子對抗知識領(lǐng)域中雷達本體的屬性。

本文在上述邏輯結(jié)構(gòu)的基礎(chǔ)上,引入知識推理語義元模型(KRSM)的概念[6],并結(jié)合多粒度的思想進行電子對抗本體模型設(shè)計。KRSM能夠全面、形式化地表征電子對抗領(lǐng)域知識。

定義面向知識推理的語義元模型KRSM由不同的4個元素組合而成,如圖1所示。

KRSM的形式化表達為K={L,A,I,D},各元素的具體含義如下:

(1)L={l1,l2,…,ln}表示語義元連接邊的有窮非空集合,用于描述各類型語義元之間的關(guān)聯(lián)關(guān)系,集合中的元素li可以是實例語義元之間的聯(lián)系,可以是概念語義元間的聯(lián)系,也可以是實體語義元和抽象語義元間的聯(lián)系,如:attribute-of表示屬性關(guān)系,instance-of表示實體類型和抽象類型的關(guān)系,kind-of表示節(jié)點的父子類關(guān)系,part-of表示整體和部分的關(guān)系等。

(2)A={a1,a2,…,an}表示抽象語義元的有窮非空集合,集合元素ai可以表示為本體層中的概念類型抽象語義元,例如雷達和電子對抗裝備,或有源干擾技術(shù)模型以及相關(guān)數(shù)理模型等,也可以表示實體層中實例化類型的抽象語義元,例如某種具體雷達或電子對抗裝備等。

(3)I={i1,i2,…,in}表示具體實例語義元的有窮非空集合,集合元素ij主要由參數(shù)實例和語義實例組成,其中屬性參數(shù)實例主要以可量化和可比較為基礎(chǔ)的實例語義元,而語義實例是指以非參數(shù)化屬性相對應(yīng)的語義實例。

(4)D={d1,d2,…,dn}表示業(yè)務(wù)邏輯語義元對象的有窮非空集合,集合中di表示某一個具體的業(yè)務(wù)運用邏輯語義元對象,例如干擾決策推理邏輯等。其形式化表達如下:

di={Issuei,Solutioni}

(2)

以電子對抗知識語義元為基礎(chǔ),構(gòu)建的知識圖譜在邏輯上由本體層、實體層和交叉映射關(guān)系層構(gòu)成縱向關(guān)聯(lián)關(guān)系,由各層相應(yīng)的概念、屬性、特征參數(shù)和關(guān)系圖譜等構(gòu)成橫向的網(wǎng)絡(luò)化關(guān)聯(lián)關(guān)系,如圖2所示。

圖2 電子對抗知識圖譜邏輯結(jié)構(gòu)

在模型設(shè)計過程中,將專家知識以及多源知識融合提煉后,形成電子對抗知識圖譜本體模型。

以有源干擾領(lǐng)域為例。有源干擾領(lǐng)域本體的主要組成可以分為2類,一類是有源干擾設(shè)備的主要組成部件及屬性(上層屬性、總體屬性、干擾參數(shù)、指標(biāo)、天線、發(fā)射機、接收機),一類是有源干擾的具體干擾樣式(壓制干擾、欺騙類干擾、組合干擾)。對有源干擾知識進行枝葉衍生時,將上述各組成部分建立成獨立的枝葉節(jié)點,依此類推,再以上述枝葉節(jié)點為父節(jié)點,繼續(xù)對其組成部件(或?qū)傩?進行枝葉節(jié)點的衍生。由于不同部件(枝葉節(jié)點)間并無交集,因此各分支呈樹狀關(guān)系,無需連接。最終形成的電子對抗知識圖譜本體模型的基本結(jié)構(gòu)如圖3所示。

圖3 電子對抗知識本體模型結(jié)構(gòu)圖

2 實體知識抽取

2.1 知識抽取

針對不同電子對抗知識和數(shù)據(jù)來源,包括電子對抗原理等書籍、Wiki互動百科等公開數(shù)據(jù)源、專家知識、已經(jīng)生成的情報數(shù)據(jù)等,設(shè)計不同的抽取方案,以滿足不同類型數(shù)據(jù)的自動化知識抽取需求。最終完成雷達對抗目標(biāo)的組成、屬性、隸屬、使用、抗干擾技術(shù)等相關(guān)知識,雷達有源干擾裝備的組成、屬性、隸屬、使用、干擾技術(shù)等相關(guān)知識,雷達有源干擾設(shè)備交戰(zhàn)邏輯知識、干擾與抗干擾技術(shù)博弈關(guān)系、技術(shù)體制與干擾技術(shù)對抗關(guān)系知識的抽取。

針對互聯(lián)網(wǎng)來源數(shù)據(jù)難以獲取的問題,采用網(wǎng)絡(luò)檢索與模板匹配輔助的冷啟動方式。首先通過調(diào)研得到記錄部分雷達信息的相關(guān)互聯(lián)網(wǎng)網(wǎng)站,通過網(wǎng)絡(luò)檢索匹配方式抽取其中重要部分,得到實體關(guān)系信息,并經(jīng)過機器翻譯、數(shù)據(jù)消歧、數(shù)據(jù)清洗等處理手段,得到質(zhì)量較好的知識抽取數(shù)據(jù)。

針對存在于公開數(shù)據(jù)源中的文本段落、電子對抗原理等書籍中的知識,即非結(jié)構(gòu)化的知識,由于知識源形式雜亂,其中的書籍內(nèi)容為圖片形式的PDF,因此難以用通用的自動化抽取工具進行抽取,則由人工處理這些知識源,從中提取有用信息構(gòu)建本體庫及知識圖譜。在構(gòu)建本體庫的過程中,以專家知識為指導(dǎo),構(gòu)建本體庫中的上層枝干;對于葉子結(jié)點,則通過手工的方式從非結(jié)構(gòu)化的知識(包括書籍文獻和部分公開數(shù)據(jù)源)中提取出公式、屬性集、系統(tǒng)框圖等信息,其中圖片無法存儲在知識圖譜中,因此將圖片制成靜態(tài)數(shù)據(jù)源,而在本體庫中僅存儲靜態(tài)數(shù)據(jù)源的uri鏈接。其它信息包括雷達組成、功能、體制、發(fā)射機、接收機、數(shù)據(jù)處理、信號處理、上層屬性等,均以文字形式在知識圖譜中直接存儲,如圖4所示。

圖4 知識抽取數(shù)據(jù)組織形式示意圖

2.2 知識融合

針對抽取的多源數(shù)據(jù)的不同特點,首先將不同的數(shù)據(jù)源統(tǒng)一為中文,然后采用基于規(guī)則的方法對各數(shù)據(jù)源的屬性進行去重操作,完成多個數(shù)據(jù)源的實體屬性融合。

下一步需要對同一實體進行多源知識補齊,如多個數(shù)據(jù)源含有同樣的表頭,先判斷內(nèi)容的屬性相似性,相似性高的情況下再把來自不同數(shù)據(jù)源的數(shù)據(jù)進行合并。接著對合并后的數(shù)據(jù)進行實體消歧,使用Rule-based方法進行指代消解。完成合并后的數(shù)據(jù)仍然可能存在實體重復(fù)的問題,需要將實體進行統(tǒng)一和去重。

最后去除稀疏屬性和稀疏實體,以此提高數(shù)據(jù)的存儲效率。設(shè)置1個閾值,統(tǒng)計表格中的每行(實體)或每列(屬性)中數(shù)值不為空或不為"NaN"的槽的數(shù)目,當(dāng)該數(shù)目少于閾值時將該行或者該列刪除。

2.3 知識評估

知識評估主要實現(xiàn)的功能是對已抽取的三元組形式知識的權(quán)威度、冗余度、多樣性、一致性進行評估,以生成權(quán)威、無冗余的知識圖譜數(shù)據(jù)。其中需要解決的核心問題是如何對于這些權(quán)威度、冗余度、多樣性、一致性進行定義,并選擇合適的評估方式。

權(quán)威度這個概念在不同領(lǐng)域里的含義不盡相同。大體上可以理解為在領(lǐng)域內(nèi)權(quán)威知識或者專家的評估下,知識準(zhǔn)確的程度。冗余度可以理解為以三元組形式儲存在知識圖譜中的實體節(jié)點是否存在重復(fù),冗余度低的知識圖譜往往節(jié)點互異,邏輯結(jié)構(gòu)更加合理,從而要求抽取的三元組知識能做到完備而不冗余。多樣性可以理解為對專業(yè)領(lǐng)域的知識調(diào)研是否充分,抽取實體來源是否多元,是否涵蓋領(lǐng)域內(nèi)的現(xiàn)有研究成果,從而達到實際應(yīng)用需求。一致性可以理解為抽取的實體是否與其本體概念相匹配,評估一致性是對實體抽取與本體建模的雙向反饋,以完善知識圖譜的專業(yè)性。

為保證對已抽取知識的權(quán)威度、冗余度、多樣性、一致性進行合理評估,設(shè)計并實施了符合功能需求的評估方案,具體如下:

(1) 從專業(yè)領(lǐng)域角度出發(fā),對已抽取知識進行抽樣評測,構(gòu)建標(biāo)準(zhǔn)測試集。首先評估測試集中的知識實體的抽取來源是否滿足多源性,從而評估其多樣性。實體知識來源應(yīng)包括但不限于:電子對抗原理等書籍、公開數(shù)據(jù)源、專家知識、已經(jīng)生成的情報數(shù)據(jù)。為評估抽取知識的權(quán)威性,對測試樣本進行源頭回訪,調(diào)研其信息是否專業(yè)權(quán)威。

(2) 從工具鏈角度出發(fā),利用知識圖譜可滿足功能需求的程度,對抽取知識進行質(zhì)量評估。為了評估知識冗余度,我們對抽取知識節(jié)點人工添加規(guī)則后綴,并對節(jié)點互異性進行評估,在冗余度評估過程中不斷完善知識融合方法,最終得到了低冗余度、節(jié)點互異的實體集。

(3) 從構(gòu)建方法角度出發(fā),利用電子對抗知識圖譜的自頂向下性,通過已經(jīng)構(gòu)建的概念本體,評估實體知識的一致性。基于Python編寫“實體—本體”匹配代碼,通過規(guī)則匹配方法,評估實體知識是否與本體概念保持一致。

通過上述知識評估功能,對已抽取知識的權(quán)威度、冗余度、多樣性、一致性進行了有效評估,以生成權(quán)威、無冗余的知識圖譜數(shù)據(jù)。

3 知識表示與知識存儲

按照前述步驟獲得了完備的本體建模模型,以及有效的實體與關(guān)系三元組數(shù)據(jù),下面將此模型與三元組數(shù)據(jù)導(dǎo)入知識圖譜系統(tǒng)中,以便進行存儲、展現(xiàn)和利用。通過Protégé本體建模與知識統(tǒng)一表達技術(shù),運用開源工具Protégé可進行知識表示。生成的三元組數(shù)據(jù)以owl文件格式存儲,該格式可直接作為輸入導(dǎo)入到Neo4j圖數(shù)據(jù)庫中進行存儲和使用。Neo4j具備高質(zhì)量的圖像化展示以及知識圖譜操作功能,是一種高性能NoSQL圖數(shù)據(jù)庫。其底層為嵌入式的、基于磁盤的、具備完全的事務(wù)特性的Java持久化引擎,將結(jié)構(gòu)化數(shù)據(jù)存儲在圖中而不是表中。將owl文件導(dǎo)入Neo4j數(shù)據(jù)庫后,其基本結(jié)構(gòu)如圖5所示。在Neo4j數(shù)據(jù)庫的基礎(chǔ)上,可以進行展示圖譜、關(guān)系推導(dǎo)、圖譜導(dǎo)出等功能,以及進行定制化開發(fā),基本能滿足實際運用中的各類要求。

圖5 電子對抗知識圖譜結(jié)構(gòu)示意圖

4 知識應(yīng)用

不同于關(guān)系型數(shù)據(jù)庫所使用的結(jié)構(gòu)化查詢語言(SQL),基于Neo4j的知識圖譜,利用圖數(shù)據(jù)庫查詢語言(Cypher)進行查詢和使用,通過設(shè)計過程查詢模式,將數(shù)據(jù)庫中組成三元組的節(jié)點和關(guān)系編碼為所需要的查詢邏輯。現(xiàn)以已知信號對抗決策為例,說明知識圖譜應(yīng)用設(shè)計過程。

在信號參數(shù)和樣式已知的條件下,可以獲知準(zhǔn)確度很高的信號樣式識別結(jié)果。通過該結(jié)果在知識圖譜的知識庫中進行查詢,能夠獲取針對使用該信號樣式的雷達進行對抗所需的信息和知識,進而通過決策算法和邏輯生成決策結(jié)果。

在此情形下,查詢起點位已知信號識別結(jié)果,包括雷達型號和體制、雷達工作狀態(tài)等。如果知識庫中相關(guān)雷達知識較為完整,并且知識庫中包含此前成功對抗的經(jīng)驗知識或仿真結(jié)果,則查詢終點包括針對此雷達的有效干擾樣式和參數(shù)。如果針對該雷達或者該信號樣式的知識庫不完整,知識存在缺失,或此前沒有相關(guān)對抗經(jīng)驗,則查詢終點包括可能有效的對抗干擾樣式。最終查詢結(jié)果為一組包含干擾樣式和參數(shù)的對抗策略的集合,其中每一條對抗策略均有一個可信度估算值,查詢結(jié)果按照估算的可信度進行排序,從而形成系統(tǒng)推薦的對抗策略集。

5 結(jié)束語

本文對電子對抗領(lǐng)域知識進行基于本體的建模研究,并對包括電子對抗原理等書籍、Wiki互動百科等公開數(shù)據(jù)源、專家知識、已經(jīng)生成的情報數(shù)據(jù)等在內(nèi)的電子對抗多源數(shù)據(jù)和知識進行抽取,設(shè)計構(gòu)建了電子對抗領(lǐng)域知識圖譜。在后續(xù)的研究中,可以結(jié)合多種數(shù)據(jù)分發(fā)中間件,包括各類消息隊列和數(shù)據(jù)分發(fā)系統(tǒng)(DDS),以及基于web技術(shù)的RESTful訪問接口,實現(xiàn)對知識圖譜的擴展和利用?;陔娮訉怪R圖譜,設(shè)計基于規(guī)則的決策或推薦系統(tǒng),可以在已有設(shè)備的基礎(chǔ)上,通過增加小規(guī)模智能處理單元,實現(xiàn)非智能化設(shè)備的智能化升級,同時也能夠應(yīng)用到新一代智能化設(shè)備當(dāng)中,幫助新設(shè)備形成跨代優(yōu)勢。

猜你喜歡
電子對抗數(shù)據(jù)源本體
Abstracts and Key Words
關(guān)于變更《航天電子對抗》投稿郵箱的通知
《航天電子對抗》編輯部召開第九屆編委會成立會
《航天電子對抗》歡迎來稿
Web 大數(shù)據(jù)系統(tǒng)數(shù)據(jù)源選擇*
基于不同網(wǎng)絡(luò)數(shù)據(jù)源的期刊評價研究
大數(shù)據(jù)技術(shù)在電子對抗情報系統(tǒng)中的應(yīng)用
《我應(yīng)該感到自豪才對》的本體性教學(xué)內(nèi)容及啟示
基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評價算法
專題