李睿
阿爾法狗(AlphaGo)讓很多人驚呼“留給人類的時間不多了”
提到人工智能就有人想到深度學習,仿佛深度學習就是人工智能,實際上,深度學習只是人工智能領域里的一個分支算法,遠不能代表人工智能本身,但由于傳統(tǒng)人工智能方法早已被運用到軍事活動的各個領域,并不屬于新生事物,因而本文所討論的人工智能在軍事上的應用只限于深度學習,不討論傳統(tǒng)的人工智能方法。
人工智能起源于1950年代,一開始就朝著利用計算機模擬人腦的方向發(fā)展,根據科學家對人腦機制理解的不斷發(fā)展,人工智能迄今為止也經過三次高潮,相應地發(fā)展出了三類方法。
1980年代以前,科學家普遍認為人類的思維是一系列邏輯表達的集合體,因而將主要研究精力放在了啟發(fā)式搜索和邏輯推理方面,進而引發(fā)了人工智能革命的第一次浪潮。日本和美國科學家一馬當先大搞專家系統(tǒng),希望能夠用邏輯窮盡表達各行各業(yè)知識,造出一臺萬能的通用機器人,美國國防部國防高級研究計劃局(DARPA)更是受到“深藍”(“深藍”是美國IBM公司生產的一臺超級國際象棋電腦,質量達1279kg,有52個大腦,也即微處理器,每秒鐘可以計算2億步——編者注)戰(zhàn)勝卡斯帕羅夫事件刺激,試圖搞出所謂的戰(zhàn)爭全能輔助決策系統(tǒng)“深綠”,作為部隊戰(zhàn)力“倍增器”。但現(xiàn)實世界存在不確定性,不可能利用窮舉法和邏輯定式來表示,因而第一波人工智能高潮失敗了,美日等國也承受了探索損失,但也留下了啟發(fā)式搜索和邏輯推理的成果,迄今為止,仍然作為各類武器裝備和軍事系統(tǒng)的核心算法。
1980年代開始,人工智能發(fā)展跌入低谷,但一部分科學家堅持了下來,并逐漸發(fā)現(xiàn),統(tǒng)計和概率數學方法是處理不確定性問題的強力工具。從這個思路出發(fā),人工智能逐漸開辟出以有監(jiān)督學習、無監(jiān)督學習、強化學習等統(tǒng)計學習方法為主要手段的人工智能新技術,發(fā)展出有監(jiān)督學習方法(如感知器、logistics回歸、隨機森林等),無監(jiān)督學習方法(EM聚類、支持向量機等)、半監(jiān)督學習方法(強化學習、增強學習等)等統(tǒng)計學習方法理論,進而誕生了人工智能的第二次熱潮。這些方法時至今日仍然是深度學習的理論基礎,但第二次人工智能熱潮仍然跌入低谷,原因在于當數據量極為龐大時,計算機硬件難以支撐其龐大的計算量,極易產生所謂的“維度災難”,直到GPU和云計算技術發(fā)展起來,讓數據并行處理成為可能,才真正推動了統(tǒng)計學習方法的進一步提升,進而引發(fā)了以深度學習技術為代表的第三次,也就是本次人工智能高潮的再次爆發(fā)。
“深藍”擊敗卡斯帕羅夫事件讓DARPA(美國國防部國防高級研究計劃局)深受刺激,試圖搞出所謂的戰(zhàn)爭全能輔助決策系統(tǒng)“深綠”。雖然最終未成功,但也留下了寶貴的成果
深度學習算法的發(fā)明時間是2006年,提出者是加拿大教授杰弗里·辛頓(Geoffrey Hinton),但在2010年后GPU和云計算技術取得突飛猛進的進步后,這種算法在工程上才得到廣泛運用。深度學習的基本框架是一種叫作感知器的統(tǒng)計學習方法結構,通過大量感知器組網連接,形成一個可以利用簡單函數模擬任何復雜函數的網絡,每一個感知器被稱為神經元,若干感知器組成一個神經元層,若干神經元層組成一個神經網絡。之所以如此稱呼,是因為這種結構與人類的大腦神經元是類似的,感知器的工作原理和神經沖動傳遞過程也是一致的。當層數較多時就被稱為深度神經網絡,而訓練和使用深度神經網絡的過程就被稱為深度學習。
由于深度學習都是基于統(tǒng)計學習方法的,因而其內在原理和貝葉斯推斷理論是一致的。即人類搜集大量帶標簽的歷史數據組,將數據組輸入深度神經網絡,網絡利用相應算法得到該數據組的聯(lián)合分布規(guī)律,這樣,深度神經網絡在被輸入沒有標簽的新數據時,就可以預判到其輸出。例如,利用人類射手統(tǒng)計到某一手槍在前100次射擊時每次射擊前的狀態(tài)數據和射擊環(huán)數,讓系統(tǒng)學到聯(lián)合分布規(guī)律,那么在第101次射擊時,僅需知道射擊前的狀態(tài),就可以預測本次射擊會有什么樣的結果,相應改變射擊前的狀態(tài),就能達到最佳射擊效果,提高射擊準確率。
必須注意的是,在這個過程中,由于機器是自動學習數據的聯(lián)合分布規(guī)律的,該分布只能用一堆參數來表示,人類很可能無法理解,因而就形成了人工智能的“黑箱效應”,即人類無法解釋系統(tǒng)是如何做到的,但系統(tǒng)就是能做到,人類可以理解為,這個系統(tǒng)有了“經驗”,但這種“經驗”并不是真正的理解,只是按照既定算法達到的一種狀態(tài),不能認為該系統(tǒng)具有了人類的智能。這種數據學習能力也就引出了人工智能在軍事領域的第一個潛在應用價值——作戰(zhàn)數據分類與預測。
上文舉例手槍射擊可以看出,以統(tǒng)計學習方法為核心的人工智能對數據分類和預測具有神奇的效果,這種依靠帶標簽的歷史數據得到的結果往往比解析法得到的計算結果精確得多。因為利用解析法計算時往往難以將所有不確定性因素窮盡,而統(tǒng)計學習方法則可以將所有不確定因素(如導彈飛行過程中的擾動)直接歸類到某種分布律,進而得到更精確的結果。作戰(zhàn)活動中往往會產生大量數據,例如敵軍作戰(zhàn)單元活動的軌跡、武器的毀傷范圍、通信系統(tǒng)覆蓋范圍等等,由于自然環(huán)境的影響,這些數據和理論計算數據差距往往較大,此時利用解析法計算出來的理論值就比較粗糙,對指導作戰(zhàn)往往不利,但利用人工智能系統(tǒng)的數據分類和預測功能,則可以非常接近真實值,從而讓數據催生出戰(zhàn)斗力,大大增強己方武器的命中概率,使武器精確度更高,成倍增加部隊和武器的作戰(zhàn)效能。
以彈道導彈為例,在融入人工智能系統(tǒng)的作戰(zhàn)數據分類和預測后,可以最大限度地從訓練、演習發(fā)射數據中學習到導彈發(fā)射諸元和命中精度的聯(lián)合分布規(guī)律,進而在實戰(zhàn)中使普通彈道導彈達到先進彈道導彈水平。而在反導彈攔截作戰(zhàn)中,則可以根據X波段對敵軍日常彈道導彈發(fā)射、試驗的偵測數據,讓系統(tǒng)學習到雷達回波特征和彈頭類型的聯(lián)合分布規(guī)律,在實戰(zhàn)攔截中,大大增加系統(tǒng)對導彈軌跡與落點預測的準確率,進而增加對彈道導彈攔截的成功率。
雖然幾乎所有的統(tǒng)計學習方法都有數據分類和預測功能,但當數據量較多時,深度學習方法的性能表現(xiàn)最好,就數據分類而言,可以達到95%以上的準確率,這一水平比傳統(tǒng)算法的75%左右的準確率提高了不少,但當數據量小時,工作效率反而比不上傳統(tǒng)模型。
信息化技術讓作戰(zhàn)活動的OODA(觀察-判斷-決策-攻擊)速度不斷增加,但由于信息系統(tǒng)本身不具備智能,因而在目標識別上一直效率不高。海灣戰(zhàn)爭期間,美軍誤傷造成的地面部隊損失巨大,時至今日,這一問題仍然無法得到有效解決。而以圖像識別為代表的敵我目標識別技術能為這一問題提供解決方案。
基于深度學習的圖像識別技術是將圖像按照像素分為3個通道(RGB)的數字矩陣,將其輸入卷積神經網絡,而后實現(xiàn)類型識別。所謂的卷積神經網絡即利用卷積窗口對圖像的固定大小區(qū)域進行加權求和,以捕捉圖像特征。在世界各類圖片分類大賽中,經過良好設計的卷積神經網絡的識別準確率高達98%以上,遠超傳統(tǒng)方法。
該技術在軍事上的用途十分廣泛。例如在反暴恐行動中,可以利用安裝在城市各處的攝像頭,根據犯罪分子的臉部特征、體態(tài)特征識別想要抓捕的恐怖分子。而在地面和空中武器平臺上,一旦雷達、攝像頭等傳感器使用該算法,即可快速識別敵人的飛機、艦船、坦克等作戰(zhàn)單元類型,特別是對于具有一定偽裝能力的敵作戰(zhàn)單元,可以一舉解決敵我識別難題。據美國媒體報道,美軍使用該技術判讀衛(wèi)星圖像,幾十分鐘就尋找到了多處隱藏地空導彈陣地,而這項工作如果由圖像判讀員來完成,耗費的時間以及準確率根本無法與前者相比。
圖像識別可以大大提高敵我識別概率
著名人工智能學者、前百度首席科學家吳恩達正在演講
在軍事裝備制造維修方面,目標識別技術也有很大的用處,著名人工智能學者、前百度首席科學家吳恩達于2017年12月14日宣布成立新公司Landing.ai,并與富士康公司合作,利用圖像識別算法做電路板的合格率檢測,效率和速度遠遠超過人工,該技術當然也可以用于軍事裝備,如軍事裝備戰(zhàn)后的快速定損等。
智能作戰(zhàn)決策是最令人心動的人工智能應用領域,許多人都曾設想制造出如阿爾法狗一般強大的無人坦克、無人機橫行戰(zhàn)場。但這種想法在最近10年內實現(xiàn)的可能性并不大。阿爾法狗之所以能擊敗人類最頂尖的圍棋選手,在于圍棋是一個確定性的博弈模型,對弈雙方的每步走法和效果都十分明確,每一步和每一步之間都有停頓,而真實世界的復雜性遠超圍棋,單純利用圖像識別技術識別出戰(zhàn)場中敵軍飛行員的身份和動作意圖需要的計算量都絕對超過阿爾法狗,更不要說還有復雜自然戰(zhàn)場環(huán)境和戰(zhàn)術背景了。
在制造智能機器人方面,日本走在世界前列,但在福島核泄漏時,日本機器人前往沾染區(qū)處理時效果并不好,原因就是出現(xiàn)了“機器人電線被纏住了”之類的問題
特別是機器人本身沒有“常識”,往往會遇到難以預料的“意外”。在制造智能機器人方面,日本走在世界前列,但在福島核泄漏時,日本機器人前往沾染區(qū)處理時效果并不好,原因就是出現(xiàn)了“機器人電線被纏住了”之類的問題,這些問題很難被設計者事先預料到,機器人也無法處理。深度學習技術設計者們也多次強調,該技術只能處理特定任務,并非是理想中的通用AI。
但是面對智能決策話題,深度學習也并非一籌莫展,阿里巴巴曾經在2017年發(fā)表過一篇論文,其中提到阿里巴巴AI試驗室利用雙向循環(huán)神經網絡讓星際爭霸里的作戰(zhàn)單元學會了人類選手的攔截、圍殺等各種戰(zhàn)術,其內在算法就是將深度學習和強化學習結合起來,設置出了一個巧妙的價值函數,通過和人類選手的反復搏殺,讓AI始終求取價值函數最大值,實現(xiàn)學習戰(zhàn)術的目的。但游戲和真實世界的區(qū)別在于,游戲作戰(zhàn)單元都有“血條”這種簡單的收益、戰(zhàn)損衡量方法,而真實交戰(zhàn)世界中的戰(zhàn)術效能、毀傷效果評估十分復雜,遠非一個簡單的價值函數能夠解決。但這樣的方法至少讓人看到了深度學習+強化學習結合起來的深度強化學習在智能決策上的巨大潛力,該技術可能是未來作戰(zhàn)武器智能決策系統(tǒng)的主要發(fā)展方向。
數據生成模擬指的是人工智能系統(tǒng)(例如深度神經網絡)利用歷史數據、既定規(guī)則生成與真實數據一致的大量模擬數據的技術,這種模擬數據的真實性甚至可以達到令人工智能系統(tǒng)自身都難以分辨的水平。該技術最典型的運用就是模擬語音系統(tǒng),在收集到某人的語音錄音后,系統(tǒng)可以根據該語音特征,模擬出本人說出的任何一句話,這一技術可以使我方電臺模擬對方指揮員指揮其部隊。除語音外,基于作戰(zhàn)數據生成模擬技術的智能系統(tǒng)還可以模擬出敵軍的雷達回波、通信聯(lián)絡等各類數據,達到以假亂真的效果。
特別是2014年,出現(xiàn)了一種叫作生成式對抗網絡(GAN)的新神經網絡結構,該結構具有兩個網絡,一個造假,一個鑒真,在互相對抗中,可以讓造假網絡和鑒真網絡達到最佳性能,現(xiàn)存的任何數據造假器和數據鑒別器都無法與其相比。
作戰(zhàn)數據生成模擬技術在軍事上的第一個用處就是欺騙系統(tǒng),如將GAN運用到制造新的電子干擾機時,該電子干擾機將能夠根據對手的雷達信號制造出令其雷達接收機根本無法識別的假信號,達到干擾功率最小、干擾效果最大的目的,到那時,世界各國以雷達為基礎的空防系統(tǒng)就變得形同虛設。這種欺騙系統(tǒng)的軍事意義之大,不言而喻。
作戰(zhàn)數據生成模擬技術在軍事上的第二個用處就是制造虛擬態(tài)勢。該技術可以根據真實數據的分布規(guī)律或戰(zhàn)場規(guī)則,對其稍加修改,不斷生成不同的作戰(zhàn)態(tài)勢,直接用于訓練指揮員、戰(zhàn)斗員的作戰(zhàn)技巧和指揮藝術。阿爾法狗的進化版阿爾法零就是在沒有輸入人類棋譜的情況下,僅依靠棋盤規(guī)則自己生成數據,進行左右互搏,在72小時內就超越了阿爾法狗,可見數據生成模擬技術威力之強。未來,很可能在智能決策過程中,為了讓系統(tǒng)適應復雜的真實世界,先利用數據生成模擬技術生成數千萬模擬數據來考驗智能決策系統(tǒng),再將其投入戰(zhàn)場,最大限度減少意外狀況的發(fā)生。
無人駕駛指讓一個智能體(機器人、汽車、飛行器等)擁有自主決策、自主尋路和自主檢測目標的能力,谷歌、百度等公司判斷,未來10~15年內,無人駕駛汽車必然取代有人駕駛汽車成為交通主力,而應用到軍事領域中,無人作戰(zhàn)車輛、無人坦克、無人潛航器、無人機等作戰(zhàn)裝備也將在戰(zhàn)場上扮演愈加重要的角色。無人駕駛技術涉及的主要領域為無人定位、圖像識別、自動控制、路徑規(guī)劃等。
以無人作戰(zhàn)車輛為例,通過安裝在車體上的照相機、GPS、激光雷達和毫米波雷達作為傳感器不斷對周圍進行掃描,建立三維影像,不斷對自身實施精確定位、識別周邊各類物體,實施作戰(zhàn)系統(tǒng)控制,形成一個集檢測、定位、作戰(zhàn)為一體的閉環(huán)系統(tǒng),實現(xiàn)無人駕駛平臺上戰(zhàn)場,但這種無人駕駛平臺不能處理所有的“意外”問題,因而還不能完全脫離人的操控,“無人+有人”協(xié)同作戰(zhàn)體系是無人作戰(zhàn)平臺走向戰(zhàn)場的現(xiàn)有作戰(zhàn)模式,未來向何種方向發(fā)展,仍需拭目以待。
人工智能遠未達到理想程度,機器人取代人類作戰(zhàn)為時過早
無人作戰(zhàn)平臺將在戰(zhàn)場上扮演愈加童要的角色
總的來說,目前以深度學習為代表的人工智能技術將會讓軍隊對于軍事數據的價值挖掘利用能力越來越高,展望未來,效能更好的深度學習結構和并行處理硬件會不斷取得突破,這將使現(xiàn)有的武器和軍事系統(tǒng),發(fā)現(xiàn)目標速度更快、識別準確率更高、決策速度更快、決策質量更優(yōu),攻擊精度明顯提升,面對沒有經過智能化技術改造的軍事體系,形成壓倒性優(yōu)勢。但同時,我們也要理性地看到,以現(xiàn)有人工智能技術造出通用AI機器人尚待時間,機器人取代人類作戰(zhàn)為時過早。
編輯/劉蘭芳