李靈芝 李 浩 馮 訊
烏克蘭危機是人類進入數(shù)字化、信息化、智能化時代的一次重大軍事沖突,呈現(xiàn)了戰(zhàn)爭形態(tài)和規(guī)則顛覆性的變革,使戰(zhàn)爭的主體和范疇不斷擴展、戰(zhàn)爭的社會化特點更加突出。戰(zhàn)爭不僅僅是現(xiàn)實世界的火力攻擊,更是人類認知的激烈博弈。借助于算力、算法,數(shù)據(jù)算法認知戰(zhàn)在烏克蘭危機中大顯身手,使人們第一次深刻體會到智能化時代認知攻防的巨大威力。算法認知戰(zhàn)是算法戰(zhàn)和認知戰(zhàn)的結合,它基于情報能力的支撐,利用算法的強大力量與數(shù)字條件下的智能優(yōu)勢,達到改變?nèi)祟愓J知的目的。
利用社交媒體操控和影響民心士氣,進而影響決策已經(jīng)成為算法認知戰(zhàn)的通用手段。以美國為例,對內(nèi),類似Cambridge Analytica利用大數(shù)據(jù)影響美國競選的丑聞屢見不鮮;對外,從顏色革命到烏克蘭危機,利用各類媒體操控和影響民眾意識更是層出不窮。縱觀算法認知戰(zhàn)的實踐運用,算法固然是核心,情報信息卻是算法顯效的關鍵,由此凸顯了開源情報工作的重要性。開源情報具有易獲取、時效強、內(nèi)容多、傳播快等特點,但同時也存在數(shù)據(jù)一致性差、數(shù)據(jù)解釋力低下、碎片化等不足,傳統(tǒng)的開源情報分析方法已經(jīng)不能滿足算法認知戰(zhàn)的要求,需要研究利用機器學習、知識圖譜等人工智能新理念與新技術,形成快速、精準、高效的情報產(chǎn)品,以面對未來戰(zhàn)爭的混合多域和智能化的發(fā)展需要。
要充分發(fā)揮開源情報在算法認知戰(zhàn)中的巨大優(yōu)勢,就要對各類開源數(shù)據(jù)應搜盡搜。根據(jù)各類數(shù)據(jù)進行挖掘分析,形成目標的活動規(guī)律庫、事件的關聯(lián)關系庫等,以便構建目標知識圖譜,對目標進行研判,對事件進行推理預測,制定策略措施。但要發(fā)揮開源情報在算法認知戰(zhàn)的最大效能還面臨著以下三大主要挑戰(zhàn)。
情報來源多且同質(zhì)化嚴重。開源情報獲取渠道眾多,隨著各類新媒體的出現(xiàn),使得信息流動更快更方便,大量傳播者和平臺喜歡跟風炒作熱點事件,敵方利用這一特點,制造熱點新聞和話題,迅速以音頻、視頻、文本、評論等方式散播,使大眾看到聽到的都是重復內(nèi)容,達到改變大眾認知的目的。同質(zhì)化的開源信息需要情報搜集人員全面、細致地篩選,既影響了情報人員研判的客觀性,又可能遺漏重要的情報,還增加了情報預處理的難度。
情報源質(zhì)量不高。算法認知戰(zhàn)是一場看不見硝煙的戰(zhàn)爭,大部分原始數(shù)據(jù)都來自于網(wǎng)絡上的視頻、音頻、文本等非結構化數(shù)據(jù),為了贏得戰(zhàn)爭,采用深度偽造技術,充分利用短視頻、直播、演講等直觀有沖擊力的方式,引發(fā)大眾強烈的情感,致使在信息洪流中,搜集到的數(shù)據(jù)帶有欺騙性和隱蔽性,挖掘分析的結果會出現(xiàn)嚴重偏差,大大降低了情報的可用性,甚至會導致錯誤的決策。
開源情報信息易失效。社交媒體等網(wǎng)絡平臺的實時信息,往往是目標識別、趨勢預測、威脅預警的第一窗口,但網(wǎng)絡上各類輿論信息是快餐式、碎片化的,甚至是曇花一現(xiàn)的,而有的極具情報價值的關鍵點可能就隱藏在某些不易察覺的信息里,如果沒有及時發(fā)現(xiàn),就會很快被淹沒在信息洪流中,再要尋找無異于大海撈針。而稍縱即逝的時間窗口被耽誤后,敵方很可能就達到了瞞天過海的目的,實現(xiàn)信息時代“眼皮子底下”的運籌帷幄、排兵布陣。
威脅情報信息體量、獲取難度、重要性的層級圖
隨著算法認知戰(zhàn)在不同沖突場景中的廣泛應用,新的威脅在無形中快速出現(xiàn),開源情報的價值挖掘在算法認知戰(zhàn)中將持續(xù)提升。人工智能技術的迅速發(fā)展為開源情報分析持續(xù)賦能,探索將人工智能領域新興技術應用到開源情報搜集、分析和運用流程中,采用機器學習、關聯(lián)規(guī)則、神經(jīng)網(wǎng)絡等智能化技術或方法,從大量的開源數(shù)據(jù)中,發(fā)現(xiàn)其中的隱含價值,為決策者提供有效情報,對打贏算法認知戰(zhàn)具有重要意義。
收集層收集開源情報數(shù)據(jù)并進行預處理,是情報分析的基礎層。由于不同數(shù)據(jù)源采用的數(shù)據(jù)格式、度量單位、屬性描述等不一定相同,因此需要經(jīng)過清洗、去重、分類、評估等一系列預處理,才能得到相對完整準確的數(shù)據(jù)。數(shù)據(jù)清洗可以去掉無關的廣告、垃圾信息等;數(shù)據(jù)去重可以去掉不同來源的重復信息,減少數(shù)據(jù)處理的時間和空間;數(shù)據(jù)分類可以按照任務或規(guī)則分成不同的類別并且打上標簽;數(shù)據(jù)評估可以去除虛假情報,并對情報來源的重要程度進行排序。
廣東省藥品檢驗所堅持“為藥品標準做方法,為藥品監(jiān)督做方法”,不斷提升食品藥品檢測能力和水平,把食品藥品質(zhì)量風險關進防控籠子里,書寫“最嚴謹標準”的“廣東樣本”。
管理層分布存儲并管理各類預處理后的數(shù)據(jù)。預處理后的數(shù)據(jù)具有不同的結構,而不同結構數(shù)據(jù)采用不同的數(shù)據(jù)庫來保存,如表格等結構化數(shù)據(jù)可采用關系型數(shù)據(jù)庫來保存;視頻、圖像、文本等非結構化數(shù)據(jù),采用HDFS保存。在保存數(shù)據(jù)時,需要實時監(jiān)控各個存儲節(jié)點的存儲資源,當某一節(jié)點出現(xiàn)過載時,則需要將數(shù)據(jù)遷移到其他節(jié)點,從而達到負債均衡。
各類數(shù)據(jù)中蘊涵大量的目標特征信息,具有一定的價值,因此在存儲數(shù)據(jù)時采用相應的冗余策略,避免出現(xiàn)某一節(jié)點崩潰導致數(shù)據(jù)丟失的現(xiàn)象。同時,大部分數(shù)據(jù)具有一定的密級,需求設置訪問權限、加密存儲、數(shù)據(jù)隔離等措施來提高數(shù)據(jù)安全性。
分析層分析層是算法認知戰(zhàn)中算法、算力價值的體現(xiàn)。通過對大量的數(shù)據(jù)進行分析和處理,挖掘出敵方的行為模式、意圖、目標等證據(jù)庫,構建其知識圖譜,為目標識別、態(tài)勢預測、威脅評估提供依據(jù)。
應用層應用層是挖掘分析結果在作戰(zhàn)中的運用。根據(jù)活動規(guī)律、事件關聯(lián)等證據(jù)性結果,對事件進行推理研判、趨勢預測,結合重點區(qū)域、要地目標,研判其企圖、評估威脅等級;根據(jù)不同用戶的需求和理解力,對信息進行精準推送,實現(xiàn)信息的高效利用和認知效能的最大化。
算法認知戰(zhàn)背景下,智能化開源情報知識的挖掘和運用主要是通過分析獲取開源情報中的敵方目標活動規(guī)律、網(wǎng)絡行為痕跡、關系關聯(lián)網(wǎng)絡等信息構設知識圖譜,基于知識圖譜開展算法認知戰(zhàn)攻防行動。
智能化開源情報知識挖掘數(shù)據(jù)挖掘的方法包括統(tǒng)計分析、聚類分析、關聯(lián)規(guī)則挖掘、序列模式挖掘等。統(tǒng)計分析法可以揭示目標的活動規(guī)律,從而發(fā)現(xiàn)敵方目標活動特點、行為習慣等;聚類分析法可以將數(shù)據(jù)按照不同的特征進行聚類,從而發(fā)現(xiàn)敵方的不同活動區(qū)域、不同組織結構或不同的目的;關聯(lián)規(guī)則法可以挖掘出數(shù)據(jù)之間的關聯(lián)關系和規(guī)則,從而發(fā)現(xiàn)敵方行動背后的關聯(lián)事件和規(guī)律;序列模式法可以挖掘出數(shù)據(jù)之間的時序關系,從而預測敵方下一步可能的行動。
智能化開源情報分析的體系架構
揭示目標活動規(guī)律。雖然算法認知戰(zhàn)以高頻、分層、精準、多樣的形式對普通大眾形成思維認知壓迫,但其背后仍然存在一定的規(guī)律。目標活動規(guī)律主要包括目標活動頻次、活動地域、活動時間、活動路線、興趣偏好等來表征。主要采用聚類分析、分類分析方法揭示各類目標在特定路線、特定地域、特定時間反復出現(xiàn)的活動狀態(tài),挖掘出不同類型目標規(guī)律性的特性,進而綜合分析和歸納總結出目標的活動規(guī)律。例如,通過關鍵人物的外交、演講、行為等開源數(shù)據(jù),挖掘其性格特點、活動習慣等規(guī)律,按照一定的格式組裝后,建立起目標活動規(guī)律的數(shù)據(jù)庫。
挖掘目標事件關聯(lián)關系。向大眾精準推送專門設計的內(nèi)容是算法認知戰(zhàn)的關鍵環(huán)節(jié)之一,而推送的內(nèi)容不僅僅是一次簡單的事件,往往與社會活動、軍事行動等有一定的關聯(lián)度。事件關聯(lián)關系是發(fā)現(xiàn)不同事件之間的聯(lián)系,這種聯(lián)系可以從多個維度挖掘,包括事件發(fā)生的時間、地點、參與者、利益相關者、因果關系等。關聯(lián)規(guī)則分析是目標事件關聯(lián)關系挖掘的重要研究方法之一。在大數(shù)據(jù)環(huán)境下,關聯(lián)規(guī)則分析的作用得到了極大的發(fā)揮,它可在海量數(shù)據(jù)中尋找隱藏的數(shù)據(jù)項之間的關聯(lián)或相互關系。采用關聯(lián)規(guī)則分析可尋找得出某一事件或目標與其他相關事務之間的關聯(lián)關系,通過對挖掘所得的關聯(lián)規(guī)則的理解,達到預測推理的目的。
構建知識圖譜。大量傳播偽造信息是實施有效的算法認知戰(zhàn)的重要手段之一。要準確理解敵方行動意圖,就要掌握敵方復雜的內(nèi)在連接關系、戰(zhàn)場事件序列、動態(tài)變化等情況。知識圖譜可以根據(jù)目標相關的專業(yè)知識,建立目標體系關系,從而形成以知識為中心的態(tài)勢。知識圖譜構建主要包括知識抽取、知識融合、知識存儲三個步驟。
知識建模是按照知識圖譜約定的一些模式進行業(yè)務抽象以及業(yè)務建模,主要是指對目標活動數(shù)據(jù)中的文本內(nèi)容進行實體、實體屬性、實體屬性值類型、實體關系等的定義。
知識圖譜構建和運用過程
知識抽取是從管理層的結構化、半結構化和非結構化數(shù)據(jù)中提取實體、屬性、關系和事件數(shù)據(jù),構建他們之間的關系,形成一系列的知識表達。例如,在算法認知戰(zhàn)情報感知體系知識圖譜中,目標實體包括人物、裝備等;屬性包括人物外形特征、活動特點、興趣愛好,裝備的型號、性能參數(shù)、作戰(zhàn)能力等;關系包括人際關系、裝備部署、指揮關系等;事件包括重點人物參與重要事件的時間、地點,裝備參與主要戰(zhàn)爭使用情況等。
知識融合是將不同來源的知識在規(guī)范下進行關聯(lián)、消歧處理,減少冗余和錯誤,達到知識、方法、思想的綜合,形成統(tǒng)一的目標知識庫。實體關聯(lián)是判斷兩個或多個實體是否屬于同一目標的實體,并將屬于同一目標的實體進行融合;實體消歧是根據(jù)上下文關系消除模糊、消除同一實體的一詞多義。
知識存儲將融合后的知識實體以“圖”這種數(shù)據(jù)結構存儲起來,形成知識圖譜。
將目標活動規(guī)律庫和關聯(lián)規(guī)則庫與知識圖譜結合起來,可以通過可視化的方式展現(xiàn)事件的發(fā)展趨勢,對目標進行識別和威脅評估。知識運用的結果又可以更新知識圖譜,使圖譜不斷完整壯大,為算法認知戰(zhàn)提供有力的情報支撐。
知識結果在算法認知戰(zhàn)中的運用算法認知戰(zhàn)是一個復雜的系統(tǒng)工程,基于算法、數(shù)據(jù)、情報、媒體等的支撐,才能穩(wěn)中有序地層層推進,實現(xiàn)作戰(zhàn)目的。
趨勢預測。通過目標活動規(guī)律庫、目標關聯(lián)關系庫、知識圖譜等證據(jù),形成包括目標、目標體系、事件之間的活動特點和關系數(shù)據(jù),進而生成重要事件熱度趨勢、擴散途徑、發(fā)展演化,大眾在事件中的情感傾向、觀點態(tài)度等多維度全方位的分析結果,采用神經(jīng)網(wǎng)絡建模、時間序列等方法實現(xiàn)事件發(fā)展趨勢預測和目標行為意圖預測,發(fā)出早期預警。
目標識別。通過分析敵方算法的語義、行為模式、邏輯結構等信息,識別出敵方的目標、意圖和動機。目標識別的方法包括文本分析、圖像識別、語音識別等,通過自然語言處理技術,可以分析出文本中的關鍵詞、主題、情感等,從而判斷出敵方的意圖和目標;圖像識別技術可以識別出圖片中的物體、場景、人臉等,從而判斷出敵方的行動計劃和目標;語音識別技術可以識別出語音中的關鍵詞和語調(diào),從而判斷出敵方的情緒和態(tài)度。
威脅評估。這是評估敵方攻擊能力和可能造成危害的重要手段。通過對敵方算法的分析,評估出敵方的技術水平、不同內(nèi)容攻擊范圍和層次、可能造成的傷害等。威脅評估的方法包括定量評估和定性評估。定量評估可以通過數(shù)學建模,分析敵方算法的攻擊能力和危害程度;定性評估可以通過專家意見、案例分析等方式,評估敵方算法的威脅程度。
算法認知戰(zhàn)具有壓制敵人思維認知的智能優(yōu)勢。近幾場具有智能化特點的軍事沖突表明,開源情報尤其是社交媒體情報在算法認知戰(zhàn)中的重要性日益增加。未來人工智能技術與開源情報挖掘分析將深度融合,人工智能等新興技術是一把雙刃劍,在提升開源情報分析能力的同時也可能面臨情報虛假欺騙的問題,因此需要把握三個方面。
技術為主,人工為輔。利用人工智能技術可以及時篩選、抓取、搜集并分析處理開源情報信息,自動生成規(guī)范化的情報產(chǎn)品,及時為事件的發(fā)展預測提供預警。人工智能的計算速度和耐力已經(jīng)遠遠突破了人腦的極限,但人工智能技術不能完全模擬人的行為、也無法感知人的情感,面對算法認知戰(zhàn)的精準釋能,難以從多維度分析,因此在關鍵環(huán)節(jié)仍然需要人的干預。由于開源情報信息數(shù)據(jù)來源和內(nèi)容的復雜性,利用人工智能技術提升人腦認知能力才是算法認知戰(zhàn)中開源情報分析工作發(fā)展的方向。
知識結果在算法認知戰(zhàn)中可用于威脅評估
分級管理,數(shù)據(jù)共享。開源情報種類繁多,各級各類情報分析部門搜集方法與手段不一樣,得到的情報維度和深度就不一樣,針對有計劃、有迭代、無孔不入、大范圍制造的話題熱點,應建立“戰(zhàn)爭目標中心、全源數(shù)據(jù)分析、按規(guī)分類共享”的分布式大情報分析體系,打破情報部門之間的壁壘,建立不同層級的數(shù)據(jù)管理機制,在安全的條件下,協(xié)調(diào)不同情報機構搜集分析盡可能全面的數(shù)據(jù),并實現(xiàn)相互共享。
加強監(jiān)測,防范安全?;谒惴ㄕJ知戰(zhàn)的開源情報分析需要實時關注輿論環(huán)境的變化,不斷掃描監(jiān)測有無異常信息,對熱點話題進行持續(xù)跟蹤,但當數(shù)據(jù)積累到一定程度的時候,情報分析人員的操作習慣會被敵方發(fā)現(xiàn)并利用,從而可能出現(xiàn)身份冒用、惡意入侵等安全問題。因此,要增強數(shù)據(jù)入口、傳輸和分析過程中的安全監(jiān)控、威脅預警等能力,使用基于人工智能技術研究數(shù)據(jù)加密、存儲的方法,確保數(shù)據(jù)安全。
算法認知戰(zhàn)在烏克蘭危機中顯示出巨大威力,開源情報、智能技術在其中起到了決定性作用。面對如今無處不在的開源數(shù)據(jù),應加強人工智能相關領域以及相關技術的開發(fā),將復雜的數(shù)據(jù)、先進的技術優(yōu)勢、分析人員的主觀能動性結合起來,充分挖掘開源情報數(shù)據(jù)的內(nèi)在價值,破解算法認知戰(zhàn)中情報分析的困境,進一步滿足作戰(zhàn)的情報需求。