劉萬增,陳軍,趙勇,李然,章煒,翟曦,王新鵬 ,王勇
1. 國家基礎(chǔ)地理信息中心,北京 100830;
2. 自然資源部時空信息與智能服務(wù)重點實驗室,北京 100830;
3. 湖北珞珈實驗室,武漢 430079;
4. 自然資源部地理信息管理司,北京 100812;
5. 中國測繪科學(xué)研究院,北京 100830
眾所周知,地理信息是自然和人文要素空間分布及變化的數(shù)字化描述與表達,是重要戰(zhàn)略信息資源與生產(chǎn)要素,兼具空間載體和知識存量兩大作用,為國防建設(shè)、經(jīng)濟社會發(fā)展和科學(xué)研究提供時空基底保障(劉萬增和彭震中,2016)。一方面,地理信息數(shù)據(jù)是戰(zhàn)場態(tài)勢感知與可視化的基礎(chǔ),是贏得現(xiàn)代戰(zhàn)爭主動權(quán)的重要戰(zhàn)略資源,因而成為“國之重器,不可與人”(孫寶云和沈永社,2012)。另一方面,我國生態(tài)文明建設(shè)、國土空間規(guī)劃、“宜居地球”研究,以及電子商務(wù)、無人駕駛等新興應(yīng)用領(lǐng)域蓬勃發(fā)展,對地理信息的網(wǎng)絡(luò)化、公開化應(yīng)用提出了迫切需求,正催生著公眾版地理信息的大規(guī)模生產(chǎn)和服務(wù),推動著地理信息保密安全評估技術(shù)的創(chuàng)新發(fā)展(周鴻昌和呂雁華,2015;朱長青和任娜,2015;朱日祥等,2021)。
然而,長期以來,我國地理信息保密安全評估手段落后于地理信息產(chǎn)業(yè)發(fā)展的規(guī)模,無法從容應(yīng)對所面臨的嚴(yán)峻安全形勢,對什么情況是密必保,什么情況非密放開,缺乏明確的技術(shù)指標(biāo)和先進的評估手段,在一定程度上加劇了地理信息保密與應(yīng)用的矛盾(周鴻昌和呂雁華,2015;朱長青和任娜,2015;劉萬增和彭震中,2016)。如果把握不好涉密數(shù)據(jù)與非涉密數(shù)據(jù)之間的界限,容易導(dǎo)致保密管理過嚴(yán)或過寬,都將深刻影響國家安全和發(fā)展利益。在實際工作中,部分部門或單位往往選擇從嚴(yán)管理,來被動降低技術(shù)缺位帶來的涉密地理信息安全風(fēng)險,不可避免地限制了地理信息的應(yīng)用廣度和深度(劉萬增和彭震中,2016)。
為加強測繪地理信息安全保密工作,2020 年國家頒布了《測繪地理信息管理工作國家秘密范圍的規(guī)定》,從是否為敏感區(qū)域、比例尺、位置精度、涉密屬性、分辨率、等高距及數(shù)據(jù)范圍等方面,對國家測繪地理信息管理工作秘密事項名稱、密級、保密期限及知悉范圍等進行了詳細規(guī)定,為地理信息安全評估提供了政策、法規(guī)依據(jù)。但由于缺乏有效的技術(shù)支撐,我國的地理信息安全評估工作還主要依賴有經(jīng)驗的技術(shù)人員對地理信息數(shù)據(jù)逐一進行檢查判斷,檢查效率低、檢查范圍小、結(jié)果不全面,難以得到科學(xué)的評價結(jié)果,更難以應(yīng)對大批量涉密地理信息數(shù)據(jù)的保密安全評價,成為制約我國地理信息保密安全評估的技術(shù)瓶頸。
當(dāng)前,我國正在實施以數(shù)字化改革推動高質(zhì)量發(fā)展的國家戰(zhàn)略,地理信息作為基礎(chǔ)性、戰(zhàn)略性信息資源和生產(chǎn)要素,將發(fā)揮重要的支撐作用。統(tǒng)籌發(fā)展與安全,開展地理信息保密安全評估技術(shù)創(chuàng)新,處理好地理信息安全與應(yīng)用的矛盾,全面支撐國家各領(lǐng)域的數(shù)字化發(fā)展,是當(dāng)前做好地理信息安全監(jiān)督管理工作的迫切需要,也是地理信息管理部門貫徹總體國家安全觀的重要使命。
地理信息保密安全評估是近年來我國地理信息安全監(jiān)督管理工作面臨的新問題,其研究剛剛起步,相關(guān)研究文獻還很少,因而,該問題的解決需要借助傳統(tǒng)的數(shù)字化測繪技術(shù)和人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索出一種適合我國國情的地理信息保密安全智能化評估方法,重點解決碎片化數(shù)據(jù)尺度自動判斷、地形圖精度高效評估、遙感影像敏感信息智能識別等核心技術(shù)。本文從地理信息數(shù)據(jù)空間尺度判定、地形圖精度評定、遙感影像智能認知三個方面,分析國內(nèi)外學(xué)者在該領(lǐng)域研究現(xiàn)狀和趨勢。
尺度是地理數(shù)據(jù)的基本特征,作為地圖學(xué)、地理科學(xué)研究的核心問題,受到國內(nèi)外眾多學(xué)者的關(guān)注(Lam 和Quattrochi,1992;李霖和李德仁,1994;劉凱等,2008)。尺度不變量、改變尺度的能力、尺度效應(yīng)的度量、尺度作為過程模型中的參數(shù),以及多尺度實施等為尺度的五大關(guān)鍵問題,因而成為國內(nèi)外學(xué)者爭相研究的熱點(Quattrochi 和Goodchild,1997;李志林等,2018)。針對尺度不變量,李志林(2005)探討了歐氏空間和地理空間中尺度的差別,認為隨著尺度變化,對象的形狀保持不變,即尺度變換具有可逆性,如不同比例尺地圖上的同一條海岸線具有不同的長度值。因此,Xia和 Clarke(2023)建議使用分數(shù)維來處理地理空間的多尺度問題,將分數(shù)維看作地理空間的一個尺度不變量;Lowe(2004)研究了遙感圖像的尺度不變量,通過探測某種尺度空間的響應(yīng)極值來保持尺度變換不變性的特征。此外,部分學(xué)者認為地理信息尺度具有時間、空間和語義三種屬性,只要這三種屬性不變,地理信息尺度的不變性在一定程度上等同于這三種屬性不變性(劉凱和秦耀辰,2010;張玲,2013)。
在以上研究中,分數(shù)維作為地理空間的尺度不變量,雖能為尺度判定提供理論參考,但如何量化尺度變化引起的信息量的變化,并反之將該變化量用于尺度判定,仍缺乏系統(tǒng)性的研究。Li 和Openshaw(1993)提出了對現(xiàn)實世界地形、地物數(shù)字化抽象和概括的“自然法則”原理,基于人眼觀察到空間目標(biāo)的復(fù)雜性是隨距離變化的這一自然界普遍存在的物理規(guī)律,實現(xiàn)不同尺度地物的概括(Li,1996)。該原理揭示了矢量數(shù)據(jù)蘊含的尺度特征,也是一種尺度不變量,為尺度判定提供了新思路。
數(shù)據(jù)精度分析和質(zhì)量控制是測繪領(lǐng)域長期關(guān)注的熱點問題(李建成等,2017;張菊清和楊元喜,2009)。相關(guān)研究多側(cè)重于地理信息系統(tǒng)(geographic information system,GIS)空間數(shù)據(jù)質(zhì)量的不確定性,楊元喜(2009)研究了點位誤差的不同度量標(biāo)準(zhǔn),Perkal(1956)提出了線元不確定性度量的“ε 帶”指標(biāo)。有學(xué)者基于上述理論進一步研究了圓曲線、緩和曲線、一般曲線、面的不確定性模型(Shi,1997;史文中等,2000;郭同德等,2003)。劉文寶等(1998)用隨機過程理論推導(dǎo)了“De 帶”的邊界線方程,并提出了面位誤差環(huán)的概念;游揚聲(2005)提出了線元的整體誤差帶,對誤差帶進行了擴展。靳燕(2014)用區(qū)間數(shù)理論研究了位置不確定性的大小。以上空間數(shù)據(jù)不確定性研究側(cè)重于數(shù)據(jù)的誤差分布特征,而地形圖精度評估關(guān)注的是給定范圍地形數(shù)據(jù)的整體位置精度。傳統(tǒng)的方法是采用測量儀器,選擇一定數(shù)量的地物特征點進行實地測量,將測量坐標(biāo)與待檢地形數(shù)據(jù)中的同名點坐標(biāo)進行比對,計算相對中誤差,如美國于1998 年發(fā)布的空間數(shù)據(jù)精度國家標(biāo)準(zhǔn)(National Standard for Spatial Data Accuracy,NSSDA)中,定義了空間數(shù)據(jù)定位精度的統(tǒng)計和測試方法。該方法要求對地圖精度進行評估時,地圖覆蓋的地區(qū)至少應(yīng)分布有20 個控制點;而STANAG 2215 標(biāo)準(zhǔn)中,則明確定義了對每張地形圖精度進行評估,至少需要167 個明確定義的控制點(El-Mowafy,2005)。在實踐上,Bozic 和 Radojcic(2011)對每張地形圖布設(shè)了190 個控制點,評估了塞爾維亞軍事地理研究所制作的1∶50000 數(shù)字地形圖的水平精度;Doskocz(2010)基于全站儀測量數(shù)據(jù)、正交和極地測量數(shù)據(jù),分析在大比例尺數(shù)字地圖水平精度。伍素貞等(2012)將在AutoCAD 中拾取的若干地物點與RTK 采集的相應(yīng)點進行對比,評估地形圖精度;趙鵬等(2020)利用三維激光掃描儀采集的地面點坐標(biāo)檢測數(shù)據(jù),檢驗了大比例尺地形圖的數(shù)學(xué)精度,探討了基于三維激光掃描技術(shù)質(zhì)量檢驗的可行性。
以上兩種方法都存在成本高、效率低的問題,無法用于大區(qū)域地形圖精度評估。
遙感影像內(nèi)容識別在某種程度上是對影像內(nèi)容的判讀和檢索。較早的研究是基于圖像底層視覺特征(如色彩、紋理、幾何形狀)構(gòu)建相似性測度指標(biāo)來對圖像內(nèi)容進行檢索查詢,即基于內(nèi)容的圖像檢索(content-based image retrieval,CBIR)技術(shù)(李向陽等,2001;Lee 等,2005;Li 等,2012;Li,2014);然而其實際性能往往受制于圖像數(shù)據(jù)本身的視覺特征復(fù)雜程度(Liu 等,2007;李士進等,2010)。有研究表明,影像地物語義信息的引入可明顯提高CBIR 系統(tǒng)的智能性和精確度(Kang 等,2011)。Liu 等(2012)在遙感影像分割的基礎(chǔ)上通過EM 算法建立地物目標(biāo)、影像特征與分割區(qū)域之間的語義化關(guān)系來實現(xiàn)遙感影像的區(qū)域檢索;Wang等(2013)以面向?qū)ο蠓诸惤Y(jié)果為基礎(chǔ),利用影像整體視覺特征和地物方位關(guān)系的描述構(gòu)建了相應(yīng)的遙感影像檢索系統(tǒng);dos Santos 等(2013)在多尺度分類結(jié)果的基礎(chǔ)上,引入自然語言處理中的詞袋模型(bag of words model,BoW)來影像特征及其關(guān)系的高效檢索。
可以看出,傳統(tǒng)影像內(nèi)容與語義的檢索方法仍是以底層視覺特征間相似性或影像語義關(guān)系為主,很難做到對影像全局的場景化理解與識別。因此,近年來將時空場景認知與內(nèi)容檢索結(jié)合成為新的研究熱點,Wang 等(2001)通過概念領(lǐng)域模型來描述影像中對象空間關(guān)系,實現(xiàn)了基于影像對象的場景化語義檢索。Zhao 等(2012)為了縮小基于內(nèi)容的圖像檢索中用戶查詢概念和低層次特征之間的差距,采用基于支持向量機(support vector machine,SVM)分類理論的相關(guān)性反饋算法來提高遙感圖像的檢索精度。閆利等(2022)利用多尺度遙感影像基準(zhǔn)網(wǎng)與多形態(tài)、多時相的自然資源典型地類樣本庫,通過深度學(xué)習(xí)技術(shù)達到了較高的影像分類精度。
因此,利用影像自身的內(nèi)容信息,結(jié)合國家級多尺度、多時相海量遙感影像數(shù)據(jù)庫進行對比檢索,成為解決“無來源信息、無定位信息、無參考信息”的“無源”影像安全評估的基本思路。
地理信息保密安全評估是按照國家相關(guān)法律法規(guī)、標(biāo)準(zhǔn)規(guī)范等,采用信息化的技術(shù)手段,對地理信息的保密安全風(fēng)險進行科學(xué)評價,給出可公開、不涉密、涉密及其保密等級、保密期限、適用范圍等評價。這就涉及評價指標(biāo)的選取和計算,其中,地理信息數(shù)據(jù)的涉密屬性、數(shù)據(jù)范圍和等高距等信息可以通過數(shù)據(jù)解析或語義識別加以判斷,但對于碎片化數(shù)據(jù)的比例尺、分辨率、敏感內(nèi)容的判斷就比較復(fù)雜,其本質(zhì)上是定量和定性結(jié)合、主觀和客觀交融的認知問題,目前尚沒有高效可行的解決方案;另外,地形圖平面相對精度的低成本、高效率地計算和評估,一直是GIS 數(shù)據(jù)質(zhì)量研究領(lǐng)域面臨的技術(shù)難點之一,也是制約地理信息保密安全評估智能化的瓶頸問題。因此,本文主要從數(shù)據(jù)空間尺度計算、地形位置精度評定、影像敏感內(nèi)容識別三個方面討論地理信息保密安全評估的基本問題。
空間尺度是指最小的可辨識單元所代表的特征長度、面積或體積,是人們認識地理空間、進行地理建模和表達的基礎(chǔ)和前提(李志林,2005;李志林等,2018)??臻g尺度的判定主要針對無源碎片化地理信息,在缺乏元數(shù)據(jù),沒有空間定位信息的情況下,對碎片化的矢量或柵格數(shù)據(jù)的尺度特征進行計算和綜合判斷,實際上是對數(shù)據(jù)空間或符號空間蘊含的空間特征或模式認知的問題,需要融入時空場景認知的理論和方法,在非線性高維空間進行尺度識別的模型構(gòu)建和算法實現(xiàn),顯然,以處理低維線性空間問題見長的數(shù)字化測繪的技術(shù)手段很難滿足需求。
位置精度的評估技術(shù)瓶頸在于如何高效率、低成本地獲得空間對象位置的真值。傳統(tǒng)采用同名點坐標(biāo)進行比對來衡量待檢地形數(shù)據(jù)精度(El-Mowafy,2005;Bozic 和Radojcic,2011;趙鵬等,2020)的方法存在成本高、效率低的問題,無法用于大區(qū)域地形圖精度評估。因而,人們往往按照地形圖的比例尺推估其精度,而實際上,不同部門、不同數(shù)據(jù)生產(chǎn)方式生產(chǎn)的同一區(qū)域相同比例尺的地形數(shù)據(jù),其實際精度變化幅度非常大,采用這種方法評估出來的精度,其可靠性很難完全滿足需求。因而長期以來,地形數(shù)據(jù)精度評估一直是GIS 領(lǐng)域的一大難題。
影像敏感信息認知也是一種非線性高維空間的認知計算問題,需要引入混合智能計算范式,將敏感區(qū)域影像判讀知識和深度學(xué)習(xí)算法進行多模態(tài)、多節(jié)點耦合,依據(jù)幾何紋理形態(tài)的尺度不變性規(guī)則,對影像進行目標(biāo)識別與語義分割,提取敏感地物的實體特征,計算其間的拓撲、方向及度量等空間關(guān)系,從而突破低維線性空間數(shù)字化測繪的技術(shù)局限,實現(xiàn)對影像敏感信息場景的認知與表達。
綜上,地理信息保密安全評估是我國實施地理信息安全監(jiān)管的迫切需求,面臨高效率、自動化評估的技術(shù)瓶頸,需要解決地理信息數(shù)據(jù)智能化尺度判斷、時空場景認知和自動化精度評估三個方面的科學(xué)問題。
可以看出,地理信息安全評估存在的基本問題涉及非線性高維空間的認知計算,單單采用常規(guī)的測繪算法很難有效解決,需要充分利用人們在長期測繪生產(chǎn)實踐中形成的測繪智能,與深度學(xué)習(xí)、測繪算法等深度融合提出一種新的解決思路。
近幾年迅速發(fā)展的深度學(xué)習(xí)、群體智能、知識圖譜等人工智能技術(shù),為自然測繪智能的挖掘、提取、描述、表達提供了新手段。為此,本文針對國家地理信息安全監(jiān)管對地理信息數(shù)據(jù)安全智能化評估技術(shù)的迫切需求,借助智能化測繪的理念,基于現(xiàn)代信息技術(shù),將人類在長期測繪活動中積累的豐富的感知、認知等自然智能,與機器的計算智能有機融合,形成以知識為引導(dǎo)、算法為基礎(chǔ)的測繪混合智能計算范式(劉經(jīng)南和高柯夫,2017;王家耀,2017;寧津生,2019;艾廷華,2021;陳軍等,2021;龔健雅等,2021;李清泉等,2021;李志林等,2021;劉萬增等,2021;閆利等,2021;楊元喜等,2021),破解地理信息安全評估中高維、非線性的求解難題。
如圖1 所示,基于這一理論框架,擬將尺度效應(yīng)、空間約束及時空關(guān)聯(lián)等智能機理,與深度學(xué)習(xí)、測繪算法等結(jié)合,建立地理信息保密安全評估知識庫和指標(biāo)體系;突破碎片化地理信息尺度計算模型、地理信息數(shù)據(jù)精度自動化評估模型、遙感影像安全評估場景化認知模型的構(gòu)建方法;以此為基礎(chǔ),研制地理信息數(shù)據(jù)安全智能化評估系統(tǒng),實現(xiàn)地理信息尺度計算、敏感屬性過濾、相對精度評估、典型敏感區(qū)域判別等功能,支撐地理信息保密鑒定、數(shù)據(jù)定密、安全評價、公開化處理等安全監(jiān)管業(yè)務(wù),逐步形成“控得住”“管得好”“用得順”的地理信息保密安全評估與監(jiān)管技術(shù)體系,為國家地理信息安全和社會化應(yīng)用提供精準(zhǔn)化、智能化的技術(shù)支撐。
圖1 研究思路圖Fig.1 Research framework diagram
根據(jù)以上研究思路,從以下五個方面開展研究,解決地理信息保密安全評估的關(guān)鍵技術(shù)問題。
收集地理信息保密安全評估的相關(guān)法律法規(guī)、典型案例、文獻資料、技術(shù)標(biāo)準(zhǔn)等,對其進行評估知識抽取與關(guān)聯(lián)化處理,建立地理信息保密安全評估的基礎(chǔ)知識庫;針對空間基準(zhǔn)數(shù)據(jù)、遙感影像數(shù)據(jù)、地形數(shù)據(jù)、地圖數(shù)據(jù)及三維實景等數(shù)據(jù)產(chǎn)品,分析提出其安全保密等級判定的關(guān)鍵因子及其單一或綜合的量化指標(biāo),與基礎(chǔ)知識庫進行關(guān)聯(lián),構(gòu)建多類型地理信息數(shù)據(jù)產(chǎn)品安全指標(biāo)評估的知識模型與評估方法。利用時空知識圖譜與圖神經(jīng)網(wǎng)絡(luò)關(guān)系計算等技術(shù)方法,實現(xiàn)基于測繪知識推理計算的自動化評估。
分析不同尺度地形矢量數(shù)據(jù)的尺度特征,揭示地理信息數(shù)據(jù)空間尺度的變換機理;融入自然法則的原理,分析地形圖數(shù)據(jù)的尺度不變特征,挖掘提取其尺度不變量,來計算和表征地形矢量數(shù)據(jù)的尺度,發(fā)展基于尺度統(tǒng)計特征的地理信息矢量數(shù)據(jù)尺度計算模型。基于地理信息數(shù)據(jù)尺度特征的知識引導(dǎo),結(jié)合深度學(xué)習(xí)的正負樣本特征提取能力來模擬人類地圖認知表達,設(shè)計高效、可靠的碎片化柵格地圖數(shù)據(jù)尺度智能識別算法,實現(xiàn)矢量、柵格兩種模態(tài)無源碎片化地形圖數(shù)據(jù)的尺度智能化判定。
制約地形圖相對精度智能化評估的瓶頸在于如何得到數(shù)字空間地形要素的真實位置。針對大范圍、多要素、多尺度的矢量地形圖精度評估效率低、可靠性差等缺陷,研究幾何特征自洽的地形數(shù)據(jù)相對精度評估方法。利用人們在長期測繪實踐中形成的測繪智能,凝練出與地形圖幾何精度相關(guān)的典型要素幾何特征,并映射到數(shù)字空間。形成典型地形要素(如道路、河流)的內(nèi)部幾何結(jié)構(gòu)的約束條件,并將其轉(zhuǎn)化為普適的數(shù)學(xué)模型(如公路平曲線半徑),作為數(shù)字空間要素幾何形態(tài)參數(shù)的“真值”,實現(xiàn)地形圖相對精度智能、高效、便捷評估。
影像敏感信息場景識別是一種非線性高維空間的認知計算問題。構(gòu)建面向遙感影像敏感區(qū)域地理場景認知的知識圖譜數(shù)據(jù)庫和多時相、多尺度的海量遙感影像敏感信息樣本庫,針對影像敏感區(qū)域幾何結(jié)構(gòu)、紋理特征、分辨率等安全評估決策因子,分別構(gòu)建其影像判定的大規(guī)模深度神經(jīng)網(wǎng)絡(luò)。再結(jié)合深度學(xué)習(xí)多任務(wù)中先驗歸納知識(inductive knowledge)嵌入的技術(shù)方法,將敏感區(qū)域影像判讀知識和深度學(xué)習(xí)算法進行多模態(tài)、多節(jié)點耦合。依據(jù)幾何紋理形態(tài)的尺度不變性規(guī)則,對影像進行目標(biāo)識別與語義分割,提取敏感地物的實體特征,計算其間的拓撲、方向及度量等空間關(guān)系,實現(xiàn)基于空間知識圖譜的遙感影像內(nèi)容檢索與敏感區(qū)域智能識別。
基于以上模型和方法,研制地理信息數(shù)據(jù)安全智能評估原型系統(tǒng),實現(xiàn)地理信息尺度計算、敏感屬性過濾、相對精度評估、典型敏感區(qū)域判別等功能,經(jīng)過不斷優(yōu)化迭代,形成國家地理信息保密安全評估的支撐軟件,逐步向各省及各行業(yè)示范和推廣應(yīng)用。
地理信息保密安全智能化評估是當(dāng)前國家地理信息安全監(jiān)管提出的迫切需求。本文在國內(nèi)外文獻分析的基礎(chǔ)上,指出了地理信息保密安全智能化評估的基本問題;借助智能化測繪的理念,將人類的自然智能與機器計算智能有機融合,設(shè)計了基于混合智能的地理信息數(shù)據(jù)安全評估的技術(shù)框架,明確了地理信息數(shù)據(jù)安全評估的基本任務(wù)??陀^地講,實現(xiàn)地理信息數(shù)據(jù)安全評估智能化還有很長的路要走,許多關(guān)鍵技術(shù)、指標(biāo)體系、標(biāo)準(zhǔn)規(guī)范、運行機制、服務(wù)模式等還有待進一步研究和解決。可喜的是,在總體國家安全觀的指導(dǎo)下,我國各級測繪地理信息主管部門正在全面推進構(gòu)建新一代的地理信息安全監(jiān)管的技術(shù)體系,地理信息數(shù)據(jù)安全評估作為其核心技術(shù),必將迎來前所未有的發(fā)展機遇,在國家地理信息安全監(jiān)管和社會化應(yīng)用中發(fā)揮更加廣泛和深入的保障作用。