王玥?趙健?朱燕
摘要:近年來,知識圖譜不斷發(fā)展,得到各領(lǐng)域的廣泛關(guān)注。作為一項(xiàng)新興技術(shù),知識圖譜迎來了多應(yīng)用場景布局和落地的新局面,為不同知識領(lǐng)域的數(shù)據(jù)價值挖掘發(fā)揮了重要作用。以軍事領(lǐng)域?yàn)榍腥朦c(diǎn),闡述了知識圖譜的概念及構(gòu)建框架、在軍事領(lǐng)域的研究應(yīng)用現(xiàn)狀,分析了知識圖譜在軍事領(lǐng)域的應(yīng)用前景和意義,以期為后續(xù)的研究提供借鑒。
關(guān)鍵詞:知識圖譜;軍事應(yīng)用;數(shù)據(jù)價值;知識推理
一、前言
隨著數(shù)字化轉(zhuǎn)型的不斷深入,人類工作生活和交往中產(chǎn)生的數(shù)據(jù)呈爆炸式增長。國際數(shù)據(jù)公司(IDC)預(yù)測,2025年全球數(shù)據(jù)量將達(dá)到175ZB,較2018年增長5倍,其中中國的數(shù)據(jù)量占比將超過全球的四分之一。
這些海量數(shù)據(jù)背后蘊(yùn)含著巨大的價值,如何快速從中發(fā)掘和管理知識寶藏,提高數(shù)據(jù)資源利用率,讓數(shù)據(jù)成為重要的生產(chǎn)要素,是政治、社會、經(jīng)濟(jì)等各領(lǐng)域提升數(shù)字化生產(chǎn)力的關(guān)鍵,同時也關(guān)系著軍事領(lǐng)域智能化發(fā)展的數(shù)據(jù)基礎(chǔ)。
知識圖譜作為一種數(shù)據(jù)挖掘技術(shù)已在多個場景中被應(yīng)用。在金融領(lǐng)域,構(gòu)建了商業(yè)銀行會計(jì)案防知識圖譜;在文學(xué)領(lǐng)域,將中國歷代存世典籍與知識圖譜技術(shù)相結(jié)合,并建設(shè)了知識服務(wù)平臺;在教育領(lǐng)域,通過知識圖譜技術(shù)研究了比較教育的現(xiàn)狀和熱點(diǎn)[1]。本文從軍事領(lǐng)域出發(fā),梳理了知識圖譜的研究現(xiàn)狀,提出應(yīng)用前景和意義。
二、知識圖譜的概念與構(gòu)建
(一)知識圖譜的概念
2012年,知識圖譜這一概念由Google公司正式提出,Google公司最先將其用于優(yōu)化搜索引擎,使得在搜索結(jié)果中顯示其他網(wǎng)站鏈接的同時,匯總提供詳細(xì)的關(guān)于搜索主題的結(jié)構(gòu)化信息。知識圖譜本質(zhì)上是一種語義網(wǎng)絡(luò),以符號的形式通過節(jié)點(diǎn)(實(shí)體)和邊(關(guān)系)來清晰地描述物理世界中各實(shí)體間的關(guān)系,旨在從自然語言或者復(fù)雜類型的數(shù)據(jù)中提取實(shí)體、屬性和關(guān)系,并轉(zhuǎn)換為圖來展示和存儲,便于理解和分析[2]。
(二)知識圖譜的構(gòu)建
知識圖譜的構(gòu)建過程如圖1所示,自下而上分別為知識抽取、知識融合、知識存儲、知識推理、知識應(yīng)用。
1.知識抽取
知識抽取主要是將不同數(shù)據(jù)源、不同結(jié)構(gòu)數(shù)據(jù)中的實(shí)體、關(guān)系等信息抽取出來,這一過程如圖2所示,具體包括實(shí)體識別與擴(kuò)展、關(guān)系抽取、事件抽取等。對于結(jié)構(gòu)化數(shù)據(jù),知識抽取的過程較為簡單,可直接將其轉(zhuǎn)化為RDF(資源描述框架)或要求的其他知識庫格式;對于半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),在知識抽取前可通過人工標(biāo)注、包裝器歸納、機(jī)器學(xué)習(xí)等方法對數(shù)據(jù)進(jìn)行預(yù)處理[3]。
2.知識融合
簡單地說,知識融合是對抽取后的數(shù)據(jù)進(jìn)行消歧和整合,以降低噪聲和冗余。知識抽取的數(shù)據(jù)來源各異,數(shù)據(jù)標(biāo)準(zhǔn)多樣,需按照一個統(tǒng)一的標(biāo)準(zhǔn)和規(guī)則將數(shù)據(jù)融合成為統(tǒng)一的整體。知識融合的過程如圖3所示,涉及框架匹配、實(shí)體對齊、沖突檢測與消解、實(shí)體鏈接、實(shí)體消歧等。
3.知識存儲
知識存儲是將數(shù)據(jù)轉(zhuǎn)化為“實(shí)體-關(guān)系-實(shí)體”的三元組數(shù)據(jù)結(jié)構(gòu)并存儲于數(shù)據(jù)庫中。不同行業(yè)、不同應(yīng)用場景、不同階段所采取的知識存儲架構(gòu)各異,如傳統(tǒng)的知識庫通常采用關(guān)系型數(shù)據(jù)庫,而大規(guī)模知識庫則為了提高計(jì)算能力需采用分布式數(shù)據(jù)庫,如圖4所示。目前主要存儲方式包括RDF數(shù)據(jù)庫、關(guān)系型數(shù)據(jù)庫、分布式數(shù)據(jù)庫、圖數(shù)據(jù)庫等。
4.知識推理
知識推理的過程中,可結(jié)合邏輯推理、統(tǒng)計(jì)規(guī)律、機(jī)器學(xué)習(xí)等方式,對融合后的知識進(jìn)行推理和分析。用戶可根據(jù)需求對某一場景事件的發(fā)展、特點(diǎn)、問題等方面進(jìn)行推理,從而輔助后續(xù)決策,如圖5所示。
5.知識應(yīng)用
知識圖譜構(gòu)建完成后,可將其應(yīng)用于實(shí)際場景中,如圖6所示。目前知識圖譜在知識問答、知識對話、歷史研究、金融監(jiān)管等方面應(yīng)用較為廣泛。
三、知識圖譜在軍事領(lǐng)域的研究現(xiàn)狀
近年來,知識圖譜在知識檢索、機(jī)器人和物聯(lián)網(wǎng)等通用領(lǐng)域和金融監(jiān)管、智慧交通、醫(yī)療資源管理等專業(yè)領(lǐng)域應(yīng)用較為廣泛,但在軍事領(lǐng)域的應(yīng)用尚處于起步階段。研究人員基于知識圖譜對涉軍網(wǎng)絡(luò)輿情熱點(diǎn)進(jìn)行了相關(guān)研究,采用網(wǎng)絡(luò)爬蟲技術(shù)采集鐵血網(wǎng)等涉軍網(wǎng)站、論壇中相關(guān)數(shù)據(jù)信息,構(gòu)建輿情熱點(diǎn)分析數(shù)據(jù)集,繪制用戶活躍度趨勢圖進(jìn)行用戶參與活躍度分析,利用詞匯云圖進(jìn)行事件熱點(diǎn)詞匯分析,設(shè)置熱度閾值進(jìn)行輿論熱點(diǎn)發(fā)現(xiàn)。也有將知識圖譜應(yīng)用于軍事人力資源領(lǐng)域,從人員基本信息、履歷、社會管理、性格等多方面進(jìn)行數(shù)據(jù)收集和整合,繪制軍隊(duì)人力資源知識圖譜,并將其應(yīng)用于人物關(guān)系挖掘、單位間關(guān)系挖掘、數(shù)據(jù)不一致校驗(yàn)等多個場景,實(shí)現(xiàn)了人物關(guān)系強(qiáng)度評估、個人垂直領(lǐng)域畫像、人崗匹配、職業(yè)發(fā)展規(guī)劃等功能。還有研究人員對軍事領(lǐng)域知識圖譜構(gòu)建技術(shù)和知識檢索應(yīng)用做了相關(guān)研究,在數(shù)據(jù)采集結(jié)果上構(gòu)建了包含近8萬個實(shí)體的軍事領(lǐng)域?qū)嶓w庫,通過BiLSTMCRF、PCNN等算法進(jìn)行實(shí)體識別和關(guān)系分析,形成了結(jié)構(gòu)清晰的軍事領(lǐng)域知識圖譜并存儲于Neo4j圖數(shù)據(jù)庫,并實(shí)現(xiàn)了知識概覽、查詢、問答等功能。該研究聚焦軍事領(lǐng)域知識圖譜構(gòu)建技術(shù),實(shí)現(xiàn)了更高效、更智能、更全面的軍事知識反饋[4]。知識圖譜于2016年開始在軍事領(lǐng)域被逐漸應(yīng)用,主要集中在軍事信息檢索、文獻(xiàn)分析、人才畫像、裝備數(shù)據(jù)管理等方面,相比其他領(lǐng)域來說起步較晚,應(yīng)用場景有待進(jìn)一步豐富。
四、知識圖譜在軍事領(lǐng)域的應(yīng)用前景和意義
(一)知識圖譜在軍事領(lǐng)域的應(yīng)用
大數(shù)據(jù)時代已經(jīng)到來,各類數(shù)據(jù)井噴式增長,軍事領(lǐng)域海量數(shù)據(jù)的有效價值亟待挖掘。為加強(qiáng)機(jī)械化、信息化、智能化融合發(fā)展,作為數(shù)據(jù)分析和挖掘的重要手段,知識圖譜這一技術(shù)在軍事領(lǐng)域的應(yīng)用前景廣闊。
1.情報分析
情報作為一種特殊知識和信息,在國家政治、經(jīng)濟(jì)、社會安全等方面扮演著舉足輕重的角色。隨著信息社會發(fā)展,情報不再局限于傳統(tǒng)、固有來源,社會生活中產(chǎn)生的任何一條信息都可能成為有價值的情報。當(dāng)前情報分析人員配置不足,能力和經(jīng)驗(yàn)不一,難以保證高強(qiáng)度認(rèn)知、分析質(zhì)量;情報來源多樣,缺乏統(tǒng)一標(biāo)準(zhǔn)規(guī)范,傳統(tǒng)技術(shù)手段對異構(gòu)數(shù)據(jù)處理能力較弱;情報管理流程復(fù)雜、分工過細(xì),導(dǎo)致管理成本增加、情報共享流通不暢。因此,需加快自動化、智能化轉(zhuǎn)型。在情報分析場景中,知識圖譜在數(shù)據(jù)聚合、表達(dá)、推理方面的優(yōu)勢可得到充分的發(fā)揮。知識圖譜將傳統(tǒng)情報和開源情報融合,構(gòu)建多維情報知識圖譜,在拓展情報數(shù)據(jù)源的同時,使海量的、復(fù)雜的情報信息轉(zhuǎn)變?yōu)橹庇^清晰、易于理解的圖譜表達(dá)形式,并根據(jù)具體需求篩選、跟蹤重要情報,輔助軍事決策。
2.輿情監(jiān)控
隨著微博、微信、公眾號等自媒體的發(fā)展,輿情信息激增、傳播迅速、影響范圍擴(kuò)大,特別是軍事輿情高度敏感,嚴(yán)重影響著社會穩(wěn)定和國家安全,勢必要加強(qiáng)監(jiān)控和管理。隨著軍事輿情監(jiān)控工作實(shí)時性和有效性要求不斷提高,監(jiān)控手段和技術(shù)需同步完善和擴(kuò)展。軍事輿情監(jiān)控結(jié)合知識圖譜技術(shù),在前期輿情熱點(diǎn)發(fā)現(xiàn)研究的基礎(chǔ)上,對輿情信息進(jìn)行全方位總覽分析和重點(diǎn)事件精準(zhǔn)定位。將自有數(shù)據(jù)和外部采集輿論數(shù)據(jù)清洗、消歧、融合構(gòu)建成軍事輿情知識圖譜,通過梳理輿情圖譜脈絡(luò),溯源、跟蹤輿情傳播路徑,定位輿情傳播范圍,對負(fù)面輿情信息及時預(yù)警,以降低輿情風(fēng)險和監(jiān)管工作量,提升輿情監(jiān)控效率和質(zhì)量[5]。
3.戰(zhàn)場態(tài)勢感知
智能化戰(zhàn)爭時代的來臨推動著作戰(zhàn)指揮模式發(fā)生轉(zhuǎn)變,指揮智能化成為智能化戰(zhàn)爭作戰(zhàn)指揮的一大重要特征。指揮員如何在瞬息萬變的戰(zhàn)場上實(shí)時獲取戰(zhàn)場信息、快速定位處理、迅速決策、及時評估反饋結(jié)果,充分挖掘和發(fā)揮戰(zhàn)場信息的有效價值,實(shí)現(xiàn)對戰(zhàn)場態(tài)勢的準(zhǔn)確感知和強(qiáng)勢控制,是智能化戰(zhàn)爭的一個重要課題。知識圖譜為戰(zhàn)場態(tài)勢感知提供了一個新的技術(shù)方向。戰(zhàn)場建設(shè)、兵力部署、電磁環(huán)境、自然環(huán)境、社會人文、交通等信息都屬于戰(zhàn)場環(huán)境的一部分,這些數(shù)據(jù)來自多個領(lǐng)域、多個層級,結(jié)構(gòu)不同,復(fù)雜多樣。知識圖譜對異構(gòu)數(shù)據(jù)源的高融合處理能力可將這些數(shù)據(jù)進(jìn)行收集、整合、分析、推理,為指揮員提供實(shí)時、高效的決策基礎(chǔ)。
4.軍事文化發(fā)展研究
軍事文化是我國文化的重要組成部分,從物質(zhì)方面的武器制造技藝、導(dǎo)彈研發(fā)等技術(shù),到精神方面的文學(xué)創(chuàng)作、文藝作品演繹,等等,軍事文化體現(xiàn)在軍事生活中的方方面面。和中華文化一樣,我國軍事文化源遠(yuǎn)流長。知識圖譜作為一種研究工具,能夠幫助研究者從幾千年的歷史長河中對軍事文化的發(fā)展進(jìn)行探索和描繪。聚焦軍事文化,從研究文獻(xiàn)、文藝作品、文化產(chǎn)品、建筑、技藝等多個領(lǐng)域挖掘?qū)嶓w及實(shí)體間聯(lián)系,既可從全維度構(gòu)建軍事文化通用知識圖譜,又可從單個應(yīng)用場景出發(fā)構(gòu)建專用知識圖譜。借助知識圖譜技術(shù)能力,深入剖析各階段、各時期軍事文化特點(diǎn)、影響因素、發(fā)展路徑及演變進(jìn)程等,從宏觀上把握軍事文化發(fā)展脈絡(luò),在細(xì)微處揭示軍事文化發(fā)展細(xì)節(jié)。
(二)知識圖譜對于軍事領(lǐng)域應(yīng)用的意義
1.提升數(shù)據(jù)價值挖掘能力
知識圖譜在軍事領(lǐng)域的應(yīng)用可以充分發(fā)揮數(shù)據(jù)價值,拓展數(shù)據(jù)寬度,挖掘數(shù)據(jù)深度。融合大數(shù)據(jù)、機(jī)器學(xué)習(xí)等技術(shù)手段,將散落在各處的目標(biāo)主體相關(guān)數(shù)據(jù)進(jìn)行清洗整合,厘清數(shù)據(jù)脈絡(luò),把握關(guān)鍵信息,從而提高相關(guān)場景的知識表達(dá)和推理能力[6]。
2.提升決策實(shí)時性和有效性
知識圖譜在信息監(jiān)管、決策分析等方面的應(yīng)用具有高實(shí)時性和高有效性的特點(diǎn)。伴隨著智能化戰(zhàn)爭的發(fā)展,軍事數(shù)據(jù)激增,只有借助先進(jìn)的科學(xué)技術(shù),在實(shí)現(xiàn)數(shù)據(jù)處理自動化的同時,提升數(shù)據(jù)推理的實(shí)時性和有效性,才能不斷增強(qiáng)軍事能力,實(shí)現(xiàn)強(qiáng)軍目標(biāo)。
五、結(jié)語
總的來說,知識圖譜在軍事領(lǐng)域的運(yùn)用是提升軍事數(shù)據(jù)價值的一種探索,為多源數(shù)據(jù)融合、可視化語義表達(dá)、智能化推理決策提供切實(shí)可行的實(shí)現(xiàn)路徑。智能化戰(zhàn)爭時代萬物互聯(lián),只有深入挖掘、梳理、量化各主體間內(nèi)在或外在關(guān)系,在繁雜的數(shù)據(jù)中抽絲剝繭,才能準(zhǔn)確把握事物發(fā)展規(guī)律,為軍事決策、軍事研究、軍事管理等奠定堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ),助力智能化戰(zhàn)爭。
參考文獻(xiàn)
[1]陳強(qiáng),代仕婭.基于金融知識圖譜的會計(jì)欺詐風(fēng)險識別方法[J].大數(shù)據(jù),2021,7(03):116-129.
[2]歐陽劍,梁珠芳,任樹懷.大規(guī)模中國歷代存世典籍知識圖譜構(gòu)建研究[J].圖書情報工作,2021,65(05):126-135.
[3]孔令帥,范永勝.近十年我國比較教育研究的現(xiàn)狀考察與熱點(diǎn)綜述[J].比較教育學(xué)報,2021(05):13-25.
[4]王蘭成,婁國哲.大數(shù)據(jù)環(huán)境下涉軍網(wǎng)絡(luò)輿情的知識圖譜服務(wù)研究[J].中華醫(yī)學(xué)圖書情報雜志,2018,27(04):1-6.
[5]賴榮煊,鄒順,吳文輝,等.知識圖譜在軍事人力資源領(lǐng)域的應(yīng)用綜述[J].軟件導(dǎo)刊,2021,20(06):243-247.
[6]薛坤.面向軍事領(lǐng)域的知識圖譜構(gòu)建與應(yīng)用研究[D].大連:大連理工大學(xué),2020.