魏 驊 丁衛(wèi)華 關(guān) 兆
近年來,世界各國官方和民間智庫加大了對我國防和軍隊(duì)建設(shè)的研究,其中以美國尤甚。其投入力量之大、研究范圍之廣、綜合分析之深,前所未有。美研究者通過對因特網(wǎng)公開資料等開源情報(bào)的初步分析,建立大數(shù)據(jù)統(tǒng)計(jì)、分析和預(yù)測模型,在比較及縱觀性研究基礎(chǔ)上,獲得了大量研究成果,進(jìn)而推動本國國防理念及技術(shù)應(yīng)用的整體進(jìn)步。通過觀察美國海軍戰(zhàn)爭學(xué)院等智庫對大數(shù)據(jù)的利用,筆者認(rèn)為,在新形勢下,我國防大數(shù)據(jù)建設(shè)應(yīng)全面提升保密意識,優(yōu)先強(qiáng)化對現(xiàn)有開源數(shù)據(jù)的分級保密,同時加強(qiáng)我軍在大數(shù)據(jù)分析方面的對等研究。
近年來,美國海軍戰(zhàn)爭學(xué)院、海軍分析中心、布魯金斯學(xué)會、日本防衛(wèi)研究所等智庫專家學(xué)者頻繁訪華。通過與相關(guān)學(xué)者的交流發(fā)現(xiàn),美、日等國在公開宣揚(yáng)西太平洋軍事和戰(zhàn)略壓力的同時,以亞太“再平衡”戰(zhàn)略為指引,加快了軍事西進(jìn)對壘。在軍事智庫建設(shè)方面,著重于力量建設(shè)和發(fā)展,此舉不僅加強(qiáng)了服務(wù)本國的軍事理論和應(yīng)用研究,更重要的是為其盟友提供了具有針對性的戰(zhàn)術(shù)研究和風(fēng)險研判。
以美國海軍戰(zhàn)爭學(xué)院的研究為例。為進(jìn)一步加強(qiáng)涉華研究力量,近兩年,該學(xué)院成立了中國海洋研究中心(CMSI),聚合了海軍戰(zhàn)爭學(xué)院長期參與對華研究的專家學(xué)者,同時邀請?jiān)和鈱W(xué)者參與共同研究,并通過學(xué)術(shù)期刊《中海》按需發(fā)布,在按主題重點(diǎn)發(fā)布學(xué)術(shù)研究成果的同時,還開展對相關(guān)領(lǐng)域的回顧性研究。
《中海》自2008年開通網(wǎng)絡(luò)版以來,已陸續(xù)發(fā)布12期,其內(nèi)容主要涉及中國軍方尤其是海軍的科研創(chuàng)新、人才隊(duì)伍建設(shè)、船舶基地建設(shè)等基礎(chǔ)性、根本性問題。其中,運(yùn)用大數(shù)據(jù)搜索分析方法進(jìn)行歸納研究的案例逐漸增多。從該期刊第一期的研究文章《中國造船業(yè)的全面調(diào)查:商業(yè)發(fā)展與戰(zhàn)略意義》一文中可以看到,作者通過搜集中國造船業(yè)的相關(guān)報(bào)道、學(xué)術(shù)文章、官方數(shù)據(jù)等數(shù)據(jù),詳細(xì)繪制出《自1999年起十年間中國各省份造船能力分布圖》,噸位及標(biāo)注非常詳細(xì)。
國外智庫專家普遍表示,中國目前正在公布越來越多的數(shù)據(jù),從國有企業(yè)的上市信息到各類媒體的新聞報(bào)道,無所不有,這些數(shù)據(jù)對于他們的研究有直接幫助。美國海軍戰(zhàn)爭學(xué)院教授肯尼斯·艾倫在其撰寫的《解放軍海軍的招聘、教育和訓(xùn)練》一文中,通過對《解放軍報(bào)》等媒體、《中國國防生》等著作、軍隊(duì)院校及普通高校國防生班報(bào)考指南、各省教育廳招考信息、百度百科等大量開源數(shù)據(jù)的綜合分析、分類整理,完成了有關(guān)我海軍生長軍官特別是海軍系統(tǒng)國防生教育訓(xùn)練的全面研究。
經(jīng)調(diào)查了解,艾倫教授通過長期的數(shù)據(jù)“清洗”和整合分析,分散獲得中國所有國防院校的招生計(jì)劃,對國防生招生的數(shù)量和專攻領(lǐng)域、國防生后續(xù)的分配及訓(xùn)練項(xiàng)目都有了全面系統(tǒng)的認(rèn)識,并通過表格等形式予以公開,形成了系統(tǒng)、翔實(shí)且具有極高價值的分析報(bào)告。
在與美國海軍戰(zhàn)爭學(xué)院教授吉原恒淑等專家學(xué)者交流過程中,學(xué)者們向筆者展示了大量利用開源數(shù)據(jù)對我海軍進(jìn)行研究所得的全面、系統(tǒng)的研究成果,研究領(lǐng)域覆蓋國防生教育體系、近海防務(wù)、大洋戰(zhàn)略等范疇,內(nèi)容多引自我軍地公開的招生計(jì)劃、學(xué)術(shù)刊物等素材,通過建立相關(guān)數(shù)學(xué)模型,利用非結(jié)構(gòu)性海量數(shù)據(jù)分析方法,完成了對這些數(shù)據(jù)的系統(tǒng)整理,形成了對我海軍人才培養(yǎng)方向、近海防務(wù)建設(shè)進(jìn)度、海洋戰(zhàn)略等情況詳盡的分析判斷。
數(shù)據(jù)是一種特殊的戰(zhàn)略資源。新形勢下推進(jìn)國防大數(shù)據(jù)建設(shè),應(yīng)從根本上轉(zhuǎn)變傳統(tǒng)數(shù)據(jù)觀念。大數(shù)據(jù)的核心是預(yù)測,其精髓在于分析信息時的三個轉(zhuǎn)變:一是大數(shù)據(jù)技術(shù)可以處理與某個問題相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣數(shù)據(jù);二是大數(shù)據(jù)更關(guān)注宏觀問題,而不是微觀精確度;三是大數(shù)據(jù)更關(guān)注事物之間的相關(guān)關(guān)系,而非因果關(guān)系。
第一個轉(zhuǎn)變的實(shí)質(zhì),是徹底突破了信息缺乏時代和信息流通受限制的模擬數(shù)據(jù)時代給數(shù)據(jù)分析造成的局限,即只能通過隨機(jī)選擇樣本進(jìn)行采樣分析。隨機(jī)采樣雖有其時代意義和使用價值,但實(shí)踐證明,由于實(shí)現(xiàn)采樣的隨機(jī)性非常困難,一旦采樣過程中存在任何偏見,分析結(jié)果就會相去甚遠(yuǎn)。大數(shù)據(jù)出現(xiàn)后,“樣本即總體”成為可能,前述美國海軍戰(zhàn)爭學(xué)院艾倫教授的工作即是如此。
第二個轉(zhuǎn)變的實(shí)質(zhì),是接受了因數(shù)據(jù)量大幅增加可能造成結(jié)果不準(zhǔn)確的現(xiàn)實(shí),同時還要接受一些混亂甚至錯誤的數(shù)據(jù)混入研究數(shù)據(jù)庫的可能。這個轉(zhuǎn)變是數(shù)據(jù)發(fā)展趨勢使然。據(jù)統(tǒng)計(jì),在數(shù)據(jù)發(fā)展過程中,非結(jié)構(gòu)性數(shù)據(jù)如網(wǎng)頁和視頻資源,占所有數(shù)據(jù)的95%。由于混亂和錯誤數(shù)據(jù)的出現(xiàn),數(shù)據(jù)才真正體現(xiàn)出其完整性。
第三個轉(zhuǎn)變的實(shí)質(zhì),是顛覆“知其所以然”的傳統(tǒng)觀念。擁有大數(shù)據(jù)技術(shù)后,數(shù)據(jù)分析指向的因果關(guān)系將逐漸被相關(guān)關(guān)系所取代。在某種程度上,研究者利用大數(shù)據(jù)技術(shù),只需得知“會發(fā)生什么”而不是“為什么會發(fā)生”,而這正是大數(shù)據(jù)的價值。比如,谷歌公司曾把5000萬條美國人最頻繁檢索的詞條和美國疾控中心在2003~2008年間季節(jié)性流感傳播時期的數(shù)據(jù)進(jìn)行比較,從而預(yù)測出2009年甲型H1N1流感的爆發(fā)。谷歌聲稱,他們并不依賴特定檢索詞條的語義理解,只關(guān)注特定檢索詞條的使用頻率與流感在時間和空間上的傳播之間的聯(lián)系。
“看似不起眼的海量分散數(shù)據(jù),一旦被加以整合分析,將能夠形成對某一學(xué)科及領(lǐng)域十分透徹甚至影響深遠(yuǎn)的研究?!痹跀?shù)據(jù)日益“開源”的當(dāng)下,這席話已不再危言聳聽。面對日益嚴(yán)峻的信息安全危機(jī),要進(jìn)行換位思考,國防大數(shù)據(jù)科研不僅要加強(qiáng)對內(nèi)關(guān)鍵數(shù)據(jù)的保護(hù),更要注重對外數(shù)據(jù)的采集及分析研判。
通過基層調(diào)研發(fā)現(xiàn),由于數(shù)據(jù)分散搜集、使用和保存,大多數(shù)數(shù)據(jù)管理部門并未意識到手中數(shù)據(jù)的重要意義,反而對數(shù)據(jù)予以公開傳播。以國防生信息為例,雖然國防生的招生介紹并不屬保密范疇,然而一旦將各高校教務(wù)信息中的招生信息進(jìn)行匯總比對,就可形成對我軍未來人才數(shù)量需求、建設(shè)目標(biāo)、能力素質(zhì)、職業(yè)化程度等情況的詳細(xì)分析。
近年來,許多招收國防生的大專院校為了吸引更多優(yōu)質(zhì)生源,對國防生教育訓(xùn)練信息都予以公開,不僅包括國防生招收門類、選拔方案、培養(yǎng)協(xié)議,更細(xì)到平時訓(xùn)練、教學(xué)內(nèi)容甚至包括學(xué)生個人簡介及學(xué)習(xí)感言。類似內(nèi)容“恰巧”成為國外學(xué)者研究的重點(diǎn)。因此,筆者建議我相關(guān)數(shù)據(jù)管理部門,不僅應(yīng)從本崗位、本機(jī)構(gòu)職責(zé)出發(fā)考慮信息安全,上級指導(dǎo)單位應(yīng)更全面細(xì)致地考慮研究,站在數(shù)據(jù)使用者的角度“極端化”考量問題,同時建立數(shù)據(jù)分級管理體系,加強(qiáng)對分散數(shù)據(jù)的保管和風(fēng)險研判力度。
目前,國內(nèi)有關(guān)國防大數(shù)據(jù)的研究還較為分散,學(xué)者主要依靠內(nèi)部或涉密資料加以研究,在觀念上,比較輕視國內(nèi)外開源數(shù)據(jù)分析;在應(yīng)用上,對因特網(wǎng)數(shù)據(jù)檢索與分析方法較為陌生。因此,我國相關(guān)領(lǐng)域研究者應(yīng)加強(qiáng)內(nèi)外研究統(tǒng)籌,在打通內(nèi)部研究渠道的同時,加強(qiáng)本地跨學(xué)科、跨領(lǐng)域、跨區(qū)域的共同研究,強(qiáng)化對海外資源、信息搜集方法的應(yīng)用和借鑒,全方位提升國防大數(shù)據(jù)科研的水平和效率。
除了借鑒國外方法,我國相關(guān)科研機(jī)構(gòu)也應(yīng)適當(dāng)派遣人員前往海外學(xué)習(xí)參與研究,從而拓展研究領(lǐng)域和思維方式。據(jù)悉,包括美國國會研究服務(wù)部(CRS)、海軍分析中心(CNA)在內(nèi)的美國官方主要智庫的對華研究部門,長期定向招募華裔研究人員。因此,相關(guān)機(jī)構(gòu)在借鑒國外智庫經(jīng)驗(yàn)建立有關(guān)國家國別研究中心的基礎(chǔ)上,可以考慮引入具有海外學(xué)習(xí)和工作背景的研究人員。
面對大數(shù)據(jù)時代日趨嚴(yán)峻的信息泄露風(fēng)險,我國各級信息數(shù)據(jù)管理部門應(yīng)當(dāng)優(yōu)先對現(xiàn)有數(shù)據(jù)進(jìn)行分級保密管理,同時,大力推進(jìn)國際搜索能力建設(shè),通過提升信息采集能力,逐步開展并強(qiáng)化對外開源數(shù)據(jù)的對等研究,從而把大數(shù)據(jù)威脅轉(zhuǎn)變?yōu)閲览鳌?/p>
一要篩查涉軍單位開源數(shù)據(jù)并分級管理。因特網(wǎng)和物聯(lián)網(wǎng)解決了數(shù)據(jù)產(chǎn)生問題,云計(jì)算解決了數(shù)據(jù)、服務(wù)和計(jì)算資源的共享問題。當(dāng)海量數(shù)據(jù)“奔涌”出現(xiàn),傳統(tǒng)的“一刀切”不公開和簡單的物理隔絕等信息保密手段就顯得捉襟見肘。以大數(shù)據(jù)技術(shù)取代傳統(tǒng)保密手段,實(shí)現(xiàn)對海量數(shù)據(jù)的分級管理已成為必然趨勢。以國防生信息為例,招生數(shù)量和培養(yǎng)方向均可對學(xué)生、家長公布,然而具體的培養(yǎng)計(jì)劃、培訓(xùn)內(nèi)容、專業(yè)素質(zhì)及個人信息都應(yīng)列為保密內(nèi)容。這種“宏觀公開,具體保密”的做法已經(jīng)在美國較為通行。比如,著名智庫蘭德公司針對兩岸臺海危機(jī)出臺的研究報(bào)告《恐怖的海峽?》中應(yīng)用了美軍“聯(lián)合一體化作戰(zhàn)模型”作為研究的重要工具,這個作戰(zhàn)模型基本反映了美軍在這些戰(zhàn)爭中的作戰(zhàn)思想和戰(zhàn)術(shù)特點(diǎn)。但是,美軍在實(shí)際作戰(zhàn)中極其重視而且大量使用的某些作戰(zhàn)要素,在該報(bào)告使用的“聯(lián)合一體化作戰(zhàn)模型”中,既沒有任何表達(dá),也沒有任何戰(zhàn)術(shù)或技術(shù)數(shù)據(jù)。
二要加強(qiáng)國際搜索能力建設(shè)。目前,國內(nèi)部分研究者過分依賴境外搜索服務(wù),其中不乏軍隊(duì)科研機(jī)構(gòu)和軍事院校的相關(guān)人員,大多通過使用代理服務(wù)器等方式搜索國外的外文資料并加以研究。由于國外一些因特網(wǎng)公司已經(jīng)具備強(qiáng)大的大數(shù)據(jù)分析能力,國內(nèi)研究者對相關(guān)問題搜索所形成的數(shù)據(jù)基礎(chǔ)已經(jīng)成為其研判我軍事科研動向的重要依據(jù)。比如,谷歌基于其所有搜索記錄(以每天30億條遞增),對特定檢索詞條的使用頻率與某些問題之間的聯(lián)系進(jìn)行分析,已在公共衛(wèi)生領(lǐng)域取得突破性進(jìn)展。但也必須認(rèn)識到這一現(xiàn)象存在的隱患:谷歌、雅虎等主流境外搜索引擎看似便捷,但我研究者進(jìn)行搜索時產(chǎn)生的海量數(shù)據(jù)亦盡在其搜索服務(wù)運(yùn)營商掌控之中。因此,建議相關(guān)單位及學(xué)者,除加強(qiáng)對境外搜索引擎使用的監(jiān)管外,更應(yīng)加強(qiáng)國內(nèi)外文搜索能力的建設(shè),逐步發(fā)展起能夠滿足國內(nèi)需求的搜索引擎。
三要加強(qiáng)開源數(shù)據(jù)應(yīng)用研究。目前,我國學(xué)者受限于搜索引擎等工具壁壘,在獲取開源數(shù)據(jù)方面存在一定難度,部分學(xué)者特別是社會科學(xué)領(lǐng)域的學(xué)者,不重視研究領(lǐng)域?qū)I(yè)與技術(shù)的結(jié)合,不重視對開源數(shù)據(jù)的應(yīng)用。如此一來,不僅呈現(xiàn)出技術(shù)與專業(yè)脫節(jié)的現(xiàn)象,而且直接影響到研究質(zhì)量。軍隊(duì)科研機(jī)構(gòu)和院校宜借鑒自然科學(xué)領(lǐng)域開源數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),引入成熟研究方法和可靠研究工具,加強(qiáng)開源數(shù)據(jù)應(yīng)用研究,提高大數(shù)據(jù)分析研判能力,助推我國防領(lǐng)域的信息化建設(shè)。