李牧閑,桂志鵬,,成曉強(qiáng),吳華意,秦 昆
1. 武漢大學(xué)遙感信息工程學(xué)院,湖北 武漢 430079; 2. 武漢大學(xué)測(cè)繪遙感信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430079; 3. 地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079; 4. 湖北大學(xué)資源環(huán)境學(xué)院,湖北 武漢 430062
WMS是開(kāi)放式地理信息聯(lián)盟(open geospatial consortium,OGC)制定的在線動(dòng)態(tài)制圖服務(wù)標(biāo)準(zhǔn),是推動(dòng)地理信息共享與互操作的重要里程碑。自2000年發(fā)布1.0版本標(biāo)準(zhǔn)以來(lái)得到業(yè)界廣泛運(yùn)用,大量源自政府部門、國(guó)際組織和研究機(jī)構(gòu)的地理空間數(shù)據(jù)以網(wǎng)絡(luò)地圖服務(wù)(web map service,WMS)形式涌現(xiàn),目前全球公開(kāi)在線的WMS數(shù)目眾多。有研究在互聯(lián)網(wǎng)中爬取超過(guò)4萬(wàn)條可訪問(wèn)WMS,通過(guò)分析發(fā)現(xiàn)所包含的30多萬(wàn)張圖層空間覆蓋遍及全球,應(yīng)用主題囊括氣候、地質(zhì)、資源與生態(tài)等地理觀測(cè)組織(group on earth observations,GEO)定義的九大社會(huì)受益領(lǐng)域[1]。面對(duì)如此海量豐富的WMS數(shù)據(jù)資源,亟須一種高效準(zhǔn)確的檢索方法幫助用戶從中發(fā)掘和定位興趣資源。
基于元數(shù)據(jù)字段的文本匹配和空間關(guān)系查詢是目前地理信息資源檢索的主要方式。Data.gov[2]、ESRI’s Geoportal server[3]、INSPIRE GeoPorta[4]、GEOSS Clearinghouse[5]、NOAA Data Catalog[6]和Spatineo Directory[7]等全球知名地理信息門戶通過(guò)提取WMS元數(shù)據(jù)中蘊(yùn)含的圖層標(biāo)題、關(guān)鍵字、服務(wù)提供者、發(fā)布時(shí)間和空間范圍等信息,運(yùn)用文本匹配查詢實(shí)現(xiàn)對(duì)WMS資源的粗粒度檢索。由于資源提供者與不同領(lǐng)域用戶對(duì)地理資源元數(shù)據(jù)的表述方式存在差異,文本匹配無(wú)法實(shí)現(xiàn)精準(zhǔn)查詢,引入地理本體和粗糙集理論優(yōu)化圖層描述詞匯可實(shí)現(xiàn)語(yǔ)義層面的演繹推理[8];建立文本語(yǔ)義搜索規(guī)則,使用語(yǔ)義相似性評(píng)估來(lái)衡量搜索結(jié)果與用戶需求之間的相似性可提高檢索精度[9]。為提高檢索的命中率,學(xué)者們還提出多種檢索輔助策略,如依據(jù)圖層信息量豐富度生成一組代表不同尺度下典型地圖內(nèi)容的高質(zhì)量縮略圖[10],并設(shè)計(jì)圖層動(dòng)態(tài)預(yù)覽功能以增強(qiáng)用戶體驗(yàn)[9];通過(guò)連續(xù)監(jiān)測(cè)WMS響應(yīng)時(shí)間和主動(dòng)收集用戶評(píng)價(jià)評(píng)估WMS質(zhì)量作為篩選依據(jù),并進(jìn)行動(dòng)態(tài)可視化[11-12]。上述策略利用語(yǔ)義優(yōu)化文本檢索策略或引入其他輔助信息擴(kuò)展檢索維度,一定程度上提升了WMS檢索的準(zhǔn)確率與用戶體驗(yàn)。然而大量在線WMS圖層元數(shù)據(jù)缺失、元數(shù)據(jù)缺乏明確的內(nèi)容約束機(jī)制(如不少圖層命名為機(jī)構(gòu)縮寫、圖層摘要為傳感器編號(hào),關(guān)鍵字設(shè)定隨意)等,使得元數(shù)據(jù)無(wú)法具體表述圖層的內(nèi)容構(gòu)成、制圖方法等信息。地圖內(nèi)容與元數(shù)據(jù)間的語(yǔ)義鴻溝使得基于文本的WMS檢索產(chǎn)生大量誤檢和漏檢結(jié)果,用戶雖可通過(guò)縮略圖預(yù)覽等輔助方式提升選擇效率,但仍無(wú)法直接基于地圖內(nèi)容進(jìn)行檢索。
針對(duì)現(xiàn)有檢索方法缺乏“感知”地圖內(nèi)容,無(wú)法應(yīng)對(duì)圖文描述不符的問(wèn)題,本文借鑒基于內(nèi)容的圖像檢索,將圖層間的視覺(jué)相似性作為檢索依據(jù)以提高檢索精度?;趦?nèi)容的圖像檢索按照特征提取方式可分為人工設(shè)定特征和自動(dòng)學(xué)習(xí)兩類方法。人工設(shè)定特征的檢索方法通常選用顏色、形狀、紋理、光譜特征和SIFT算子等視覺(jué)特征作為圖像內(nèi)容描述[13-14],并依據(jù)特征向量間的相似度實(shí)現(xiàn)檢索。這類方法對(duì)樣本數(shù)量要求較低,但因?yàn)樘卣鬟x取直接影響檢索結(jié)果,需設(shè)計(jì)多組對(duì)比試驗(yàn)選取合適的特征。自動(dòng)學(xué)習(xí)的特征由深度學(xué)習(xí)框架(如卷積神經(jīng)網(wǎng)絡(luò)模型)對(duì)大量圖像樣本訓(xùn)練獲得,通過(guò)低層特征組合形成抽象且包含一定語(yǔ)義信息的高層表示,極大提升了對(duì)圖像內(nèi)容的描述能力[15]。但高維特征加大了海量圖像相似性度量的計(jì)算量,導(dǎo)致檢索速率低下。為此,有研究使用PCA或乘積量化對(duì)特征進(jìn)行壓縮和降維加速相似度計(jì)算[16-17];或結(jié)合深度學(xué)習(xí)與哈希思想將高維特征映射為一串二進(jìn)制編碼,通過(guò)計(jì)算漢明空間距離降低相似性計(jì)算復(fù)雜度[18]。盡管深度學(xué)習(xí)在眾多圖像檢索場(chǎng)景下性能優(yōu)異,但并不適用于WMS檢索:①深度學(xué)習(xí)是數(shù)據(jù)饑渴型方法,需要大量樣本數(shù)據(jù)訓(xùn)練模型,而目前WMS圖層尚未形成統(tǒng)一規(guī)范的關(guān)鍵詞體系,樣本規(guī)模較小且標(biāo)簽信息匱乏、質(zhì)量欠佳,無(wú)法支持基于深度學(xué)習(xí)的高層特征提??;②深度學(xué)習(xí)模型訓(xùn)練與優(yōu)化的時(shí)間成本較高,而不同用戶檢索差異化大(如空間范圍、專題類型、制圖風(fēng)格等),難以根據(jù)用戶需求動(dòng)態(tài)調(diào)整模型參數(shù),從而無(wú)法滿足實(shí)時(shí)個(gè)性化檢索的需求。針對(duì)WMS圖層檢索,有研究通過(guò)對(duì)圖層分塊提取顏色空間分布特征,并結(jié)合SVM分類器對(duì)小樣本集進(jìn)行學(xué)習(xí)實(shí)現(xiàn)檢索[19],但僅使用顏色特征,無(wú)法全面多角度地概括圖層內(nèi)容,圖層檢索效果欠佳。因此,需要提取并融合多種特征,使各類特征信息能根據(jù)用戶差異化的檢索需求合理作用于分類模型的生成。
為此本文提出一種基于多特征多核學(xué)習(xí)的WMS圖層檢索方法,通過(guò)圖層的顏色、形狀和紋理特征表征圖層內(nèi)容,利用多核學(xué)習(xí)自適應(yīng)分配3種特征在分類模型中所占權(quán)重,實(shí)現(xiàn)WMS檢索與相似度排序。同時(shí)結(jié)合用戶對(duì)搜索結(jié)果的反饋精化分類模型和調(diào)整特征權(quán)重,并通過(guò)迭代檢索提高檢索精度,以支持基于圖層圖像內(nèi)容的WMS個(gè)性化檢索與推薦。
本文使用多特征多核學(xué)習(xí)分類方法,將WMS圖層分為匹配與非匹配兩類,算法流程如圖1所示。用戶首先使用文本關(guān)鍵詞觸發(fā)初始檢索,文本匹配的WMS圖層縮略圖分頁(yè)批量展示于檢索結(jié)果頁(yè)面;其次,用戶利用鼠標(biāo)標(biāo)記興趣圖層構(gòu)建正樣本集,其余為負(fù)樣本,系統(tǒng)從特征文件中讀取上述圖層對(duì)應(yīng)特征向量構(gòu)成訓(xùn)練集(所有WMS圖層特征向量通過(guò)對(duì)GetMap操作獲得的最大包圍盒地圖圖像預(yù)先提取生成,并以CSV文件格式存儲(chǔ)于服務(wù)器端);然后,系統(tǒng)利用多核學(xué)習(xí)訓(xùn)練樣本構(gòu)建分類模型并計(jì)算檢索結(jié)果;最后,按相似度排序輸出并更新檢索結(jié)果頁(yè)面。若結(jié)果不滿意,用戶可再次進(jìn)行正樣本標(biāo)記,并觸發(fā)分類模型精化訓(xùn)練與二次分類。
圖1 結(jié)合多核學(xué)習(xí)與用戶反饋的WMS圖層檢索算法流程Fig.1 WMS layer retrieval workflow combined with multiple kernel learning and user feedback
WMS檢索需要設(shè)計(jì)有效的視覺(jué)特征來(lái)描述圖層圖像內(nèi)容。作為反映客觀世界的符號(hào)模型及空間信息的載體[20],通過(guò)WMS發(fā)布的地圖在類型與表達(dá)形式上豐富多樣,既包括由點(diǎn)線面等矢量數(shù)據(jù)通過(guò)符號(hào)化渲染得到的矢量地圖也包括影像地圖,其中矢量地圖(包括普通地圖與針對(duì)某類地理要素的專題地圖)的表達(dá)形式與自然影像和遙感影像存在顯著差異(圖2)。自然影像和遙感影像中的場(chǎng)景與對(duì)象較為具象,組件構(gòu)成相對(duì)穩(wěn)定。如自然影像中的街道由道路、行人和建筑等構(gòu)成,遙感影像中機(jī)場(chǎng)包含飛機(jī)和航站樓等對(duì)象,而飛機(jī)有機(jī)身、機(jī)翼等組件構(gòu)成,視覺(jué)特征顯著。因此,可使用物體濾波器響應(yīng)、詞袋模型等方法構(gòu)建高層語(yǔ)義特征向量,判斷影像中對(duì)象構(gòu)成及其分布情況來(lái)對(duì)圖像內(nèi)容進(jìn)行描述[21-22]。而矢量地圖中對(duì)象表達(dá)與比例尺、制圖風(fēng)格等因素密切相關(guān),往往較為抽象與多樣(如大比例尺下水體表達(dá)為面對(duì)象,在小比例尺下為點(diǎn)或線對(duì)象;等高線和暈渲圖均可用于表達(dá)地形信息),無(wú)穩(wěn)定的組合形式,人為設(shè)計(jì)一種普適的高層語(yǔ)義特征難度大。圖像領(lǐng)域常用的視覺(jué)特征包括顏色、形狀、紋理、空間關(guān)系特征、SIFT和HOG等,其中形狀、顏色、紋理特征適用性較優(yōu)而被廣泛運(yùn)用于圖像檢索,而空間關(guān)系特征對(duì)旋轉(zhuǎn)、反轉(zhuǎn)、尺度敏感[23],HOG維度過(guò)高[24],SIFT對(duì)低對(duì)比度圖像檢索效率較低[25],應(yīng)用范圍較前三者小。通過(guò)對(duì)WMS圖層內(nèi)容的分析,本文認(rèn)為顏色、形狀和紋理3種底層特征為一定程度上描述地圖內(nèi)容提供了可行方案:①WMS圖層渲染與地理要素屬性的空間分布有關(guān),顏色風(fēng)格鮮明且表現(xiàn)出顯著的空間分布特性;②WMS圖層對(duì)象形狀輪廓清晰,可明顯觀察到區(qū)域輪廓,有效傳達(dá)區(qū)位信息;③隨著要素空間分布密集度的變化,WMS圖層可能具有多尺度或方向上的紋理。因此,本文選取顏色、形狀和紋理作為WMS圖層檢索的視覺(jué)特征。
本文在HSV(hue,saturation,value)空間內(nèi)統(tǒng)計(jì)分塊顏色直方圖作為顏色特征。常用的顏色特征中,顏色矩由于僅利用低階矩概括顏色分布,使得圖像區(qū)分能力較弱[26];而顏色聚合向量為引入空間分布信息,通過(guò)設(shè)定閾值劃分顏色聚合與不聚合區(qū)域,容易出現(xiàn)因閾值選取不當(dāng)導(dǎo)致的空間信息丟失問(wèn)題[27]。分塊顏色直方圖通過(guò)圖像幾何分割提取顏色空間分布信息,并可根據(jù)WMS渲染特點(diǎn)量化各分塊內(nèi)的顏色,從而能夠更好地刻畫地理要素的空間分布與屬性變化。為此,本文結(jié)合地圖利用顏色變化代表不同地理屬性及其等級(jí)這一特點(diǎn),對(duì)應(yīng)將色調(diào)、飽和度和明度分別劃分為3、8和12個(gè)等級(jí)。同時(shí),考慮到人眼對(duì)圖層中心區(qū)域的重點(diǎn)關(guān)注,結(jié)合空間金字塔匹配[28]原理,使用橢圓(長(zhǎng)短軸等于WMS縮略圖長(zhǎng)寬的一半)和4條基線將圖像分為5部分。最后分別計(jì)算各分塊的顏色直方圖,并組成形成該圖層的顏色特征,共(3+8+12)×5=115維。
圖2 自然圖像、遙感影像與WMS圖層圖像示例Fig.2 Examples of natural image, remote sensing image and WMS layer image
本文使用Hu矩[29]對(duì)地圖對(duì)象形狀進(jìn)行描述。Hu矩是一種計(jì)算量和冗余度較小的形狀區(qū)域描述符,有效避免了傅里葉描述符和鏈碼等形狀輪廓描述符因前后景分割復(fù)雜情況導(dǎo)致的輪廓提取問(wèn)題[30],如部分WMS圖層存在前后景定義不清晰的現(xiàn)象。本文通過(guò)計(jì)算圖層灰度圖像的中心矩,并使用零階矩對(duì)其進(jìn)行歸一化,生成一系列可描述區(qū)域輪廓旋轉(zhuǎn)半徑、圖像橢圓、主軸方向角等形狀屬性的低階矩。然后,對(duì)上述矩進(jìn)行非線性組合,構(gòu)造出7個(gè)具有旋轉(zhuǎn)、平移和尺寸不變性的Hu矩。
本文使用Gabor紋理特征對(duì)WMS圖層的紋理分布進(jìn)行描述。常用紋理特征包括灰度共生矩陣、LBP、Gabor特征等。其中灰度共生矩陣和LBP均基于灰度的空間相關(guān)特性,尺度描述較為單一,難以應(yīng)對(duì)WMS圖層紋理在尺度和方向上的多樣性;Gabor紋理特征通過(guò)對(duì)基小波的旋轉(zhuǎn)和尺度變換,得到一組自相似但方向和尺度各不相同的濾波器,能夠更加有效刻畫地圖中不同尺度和方向的紋理信息[31]。本文參考文獻(xiàn)[32]選取5個(gè)尺度和8個(gè)方向,得到共40個(gè)濾波器,計(jì)算濾波結(jié)果的均值和標(biāo)準(zhǔn)方差作為紋理特征,特征維度為40×2=80。
本文選用的3種圖像特征在維度、數(shù)量級(jí)上存在較大差異,對(duì)此使用一種多核學(xué)習(xí)的方法對(duì)特征進(jìn)行融合并實(shí)現(xiàn)WMS分類。核方法通過(guò)非線性映射將低維線性不可分問(wèn)題轉(zhuǎn)化為高維空間中線性可分的問(wèn)題,并用核函數(shù)替換高維空間中復(fù)雜的內(nèi)積問(wèn)題,降低運(yùn)算復(fù)雜度。傳統(tǒng)單核方法將所有向量映射到同一高維空間,對(duì)不同維度和數(shù)量級(jí)特征構(gòu)成的異構(gòu)數(shù)據(jù)分類效果不佳。針對(duì)這種現(xiàn)象,文獻(xiàn)[33—34]提出多核學(xué)習(xí)(multiple kernel learning,MKL),采用多個(gè)核函數(shù)的凸組合代替單個(gè)核函數(shù),將異構(gòu)數(shù)據(jù)的不同特征分量分別輸入對(duì)應(yīng)的核函數(shù)進(jìn)行映射,使數(shù)據(jù)在新的特征空間中得到更好的表達(dá)。多核學(xué)習(xí)通過(guò)與SVM相結(jié)合在多個(gè)領(lǐng)域得到了廣泛運(yùn)用,如圖像分類、目標(biāo)檢測(cè)與識(shí)別和模式回歸等[35]。多核學(xué)習(xí)模型如式(1)所示
(1)
式中,km(x,xi)為基核;qm為基核對(duì)應(yīng)的權(quán)重;K(x,xi)表示合成核,通過(guò)兩個(gè)向量的內(nèi)積實(shí)現(xiàn)特征隱式的非線性映射。使用SVM分類器,多核學(xué)習(xí)的核權(quán)重計(jì)算和優(yōu)化可通過(guò)求解式(2)的凸規(guī)劃優(yōu)化來(lái)實(shí)現(xiàn)
(2)
式中,C為規(guī)則化參數(shù);ξi為松弛變量;αi和b為可通過(guò)樣本學(xué)習(xí)到的系數(shù)。使用Lagrangian函數(shù)結(jié)合對(duì)偶理論等計(jì)算得到?jīng)Q策函數(shù)(式(3)),其中只有權(quán)重非零的核函數(shù)在分類中有效
(3)
本文使用SimpleMKL[36]對(duì)WMS進(jìn)行圖層分類。由于SimpleMKL引入了L2正則化公式約束權(quán)重以促進(jìn)稀疏核的組合,并使用簡(jiǎn)化梯度算法實(shí)現(xiàn)迭代優(yōu)化,相比其他多核學(xué)習(xí)算法具有收斂性好、求解效率高的優(yōu)點(diǎn)。本文選用局部性強(qiáng)、適用性高且求解參數(shù)少的高斯核函數(shù)構(gòu)建多核模型。尺度參數(shù)σ是高斯核函數(shù)最重要的參數(shù),當(dāng)σ趨近于0時(shí)所有樣本都屬于同一類;當(dāng)σ趨于無(wú)窮時(shí)任意樣本都屬于不同類。對(duì)于各特征,在0至無(wú)窮大之間都存在一個(gè)最優(yōu)尺度參數(shù)使樣本在映射后的高維空間中實(shí)現(xiàn)最優(yōu)區(qū)分。針對(duì)所選取的顏色、形狀、紋理特征,本文為每種特征分別構(gòu)建一組尺度不同高斯核(如圖3)。結(jié)合文獻(xiàn)[36]和圖層參數(shù)尋優(yōu)試驗(yàn),設(shè)置每組高斯核由十個(gè)核組成,各核尺度參數(shù)σ∈[0.03,1,2,5,7,10,12,15,17,20]。
圖3 融合3種圖像特征的多核構(gòu)造方法Fig.3 Multiple kernel construction method for fusing three types of image features
對(duì)本文構(gòu)建的多核模型進(jìn)行訓(xùn)練求解,可根據(jù)WMS圖層樣本內(nèi)容自適應(yīng)地調(diào)整特征權(quán)重并為每個(gè)特征選擇恰當(dāng)?shù)暮藚?shù),以滿足用戶差異化的檢索需求。如圖4中Blue Marble影像和西班牙氣溫專題圖的顏色空間分布或形狀輪廓相似性較高,則訓(xùn)練后分類模型中顏色或形狀特征權(quán)重較大,有效提高了決策函數(shù)的可解釋性和預(yù)測(cè)性能等。
由于選取的3種底層特征均不具備高級(jí)語(yǔ)義信息,本文引入用戶反饋機(jī)制。通過(guò)用戶興趣樣本補(bǔ)充,調(diào)整多核模型中各核權(quán)重,以期縮小檢索中的語(yǔ)義鴻溝,實(shí)現(xiàn)分類模型精化,滿足用戶個(gè)性化檢索需求。
用戶反饋于開(kāi)發(fā)的基于Web的WMS圖層檢索系統(tǒng)原型實(shí)現(xiàn),用戶通過(guò)鼠標(biāo)點(diǎn)擊行為標(biāo)記當(dāng)前檢索結(jié)果頁(yè)面中所有正確檢索結(jié)果,如圖5所示,檢索結(jié)果中紅框標(biāo)心的圖層縮略圖為人工標(biāo)記的正確檢索圖層,系統(tǒng)將其與前次檢索使用的正樣本合并去重作為新正樣本集。當(dāng)前頁(yè)面中未被選中圖層為負(fù)樣本,與前次檢索使用的負(fù)樣本合并后,從中選擇與新正樣本數(shù)量相當(dāng)?shù)膱D層作為新負(fù)樣本集,以保證正負(fù)樣本數(shù)目均衡。對(duì)補(bǔ)充后的樣本集重新訓(xùn)練得到新的分類模型,再次計(jì)算檢索結(jié)果并排序輸出顯示。
本文從檢索準(zhǔn)確性、檢索高效性和用戶反饋有效性3個(gè)方面開(kāi)展試驗(yàn)分析,綜合驗(yàn)證本文方法的可行性:①結(jié)合對(duì)比試驗(yàn)驗(yàn)證多特征融合對(duì)各類WMS檢索準(zhǔn)確性的提升;②探討檢索用時(shí)的影響因素及實(shí)時(shí)檢索的可能性;③分析反饋機(jī)制對(duì)檢索精度的提升效果,驗(yàn)證其有效性。
本文使用的試驗(yàn)數(shù)據(jù)來(lái)自全球653條WMS,共包含11 689張可訪問(wèn)圖層,涵蓋全球溫度、云量、風(fēng)速、土壤和土地利用等多種專題類型地圖,也包括道路網(wǎng)圖、地名地址等基礎(chǔ)設(shè)施分布地圖等。試驗(yàn)中所有圖層縮略圖統(tǒng)一存儲(chǔ)為3通道的JPEG格式。
本文使用查準(zhǔn)率作為檢索精度衡量指標(biāo),分析該方法相比現(xiàn)有基于顏色直方圖和SVM的檢索方法[19]在檢索精度上的優(yōu)勢(shì)??紤]到點(diǎn)、線、面要素和遙感影像4類圖層視覺(jué)差異大,且顏色、形狀和紋理特征相似程度不同,本文從4類圖層中分別選擇多組圖層進(jìn)行人工標(biāo)簽標(biāo)注開(kāi)展無(wú)反饋檢索對(duì)比試驗(yàn),驗(yàn)證多特征融合在WMS檢索中的必要性。各組圖層中正負(fù)樣本總數(shù)為30個(gè)。圖4為部分圖層訓(xùn)練樣本與檢索結(jié)果示例,圖6為對(duì)應(yīng)的查準(zhǔn)率。
由圖6可知,本文方法融合多種特征能有效地提升查準(zhǔn)率,但不同類型圖層的查準(zhǔn)率仍存在較大差異。①面要素圖層的顏色分布和對(duì)象輪廓描述了地理要素在特定區(qū)域的空間分布。如圖4所示的西班牙溫度分布圖和愛(ài)荷華州魚(yú)群分布圖,顏色分布細(xì)節(jié)存在差異,但區(qū)域輪廓一致,通過(guò)訓(xùn)練可提高形狀特征對(duì)應(yīng)權(quán)重,達(dá)到提高查準(zhǔn)率的目的。②盡管Blue Marble風(fēng)格影像的藍(lán)色系配色風(fēng)格易與其他同色系圖層混淆(如全球卷云反射率等),但由于類內(nèi)圖層內(nèi)容在顏色、形狀和紋理上相似性高,綜合使用3種特征能有效提高查準(zhǔn)率。③通常點(diǎn)線要素圖層的要素空間排布形態(tài)與緊湊度受到多種因素影響。如圖4中的全球生物量圖和道路網(wǎng),隨著統(tǒng)計(jì)目標(biāo)和道路級(jí)別的不同,點(diǎn)線及其顏色分布產(chǎn)生差異,并引起內(nèi)部紋理和輪廓變化。特別是點(diǎn)要素圖層輪廓細(xì)碎,類內(nèi)配色風(fēng)格差異大,視覺(jué)相似度低,僅使用顏色特征無(wú)法有效概括類內(nèi)圖層內(nèi)容的相似性。盡管本文方法綜合利用3種特征使得查準(zhǔn)率有所提升,但整體精度仍較低。
為驗(yàn)證本文方法能否支持WMS圖層實(shí)時(shí)檢索,本文統(tǒng)計(jì)分析不同樣本規(guī)模下不同有效核數(shù)目對(duì)應(yīng)的平均檢索用時(shí)。為保證圖層縮略圖的清晰展現(xiàn),限定每頁(yè)檢索結(jié)果頁(yè)面可容納的縮略圖數(shù)量為80張,同時(shí)考慮到實(shí)際系統(tǒng)交互的用戶體驗(yàn),用戶反饋標(biāo)記操作多集中在第1—2頁(yè),樣本數(shù)目至多160個(gè),本試驗(yàn)設(shè)置10、50、100、150和200共5個(gè)樣本數(shù)量級(jí)。對(duì)各樣本數(shù)量下5000組不同正負(fù)樣本構(gòu)成的訓(xùn)練集進(jìn)行學(xué)習(xí)并解算核權(quán)重,統(tǒng)計(jì)每組權(quán)重非零的有效核數(shù)目和10次重復(fù)試驗(yàn)的平均檢索用時(shí)。試驗(yàn)環(huán)境為單臺(tái)臺(tái)式機(jī),硬件配置為intel i5四核處理器(主頻3.00 GHz)和16 GB內(nèi)存,操作系統(tǒng)為Windows 10,算法基于MATLAB實(shí)現(xiàn)。
統(tǒng)計(jì)各樣本數(shù)量下有效核數(shù)目出現(xiàn)頻次,如圖7所示有效核數(shù)目最大為18,但主要集中于10以內(nèi),且最大檢索用時(shí)未超過(guò)2.5 s。為此本文進(jìn)一步分析有效核數(shù)目為1~9時(shí)檢索用時(shí)變化規(guī)律(圖8)。本文將檢索用時(shí)劃分為訓(xùn)練用時(shí)和其余用時(shí)(包括樣本數(shù)據(jù)讀入、多核模型預(yù)設(shè)、預(yù)測(cè)分類和相似性排序用時(shí)等)兩部分,并以樣本數(shù)量10為基準(zhǔn)分析不同樣本數(shù)量和有效核數(shù)目下訓(xùn)練用時(shí)和其余用時(shí)的變化率,計(jì)算公式如式(4),tn,k為樣本數(shù)為n,有效核數(shù)目為k時(shí)的訓(xùn)練用時(shí)或其余用時(shí)
時(shí)間變化率=(tn,k-t10,k)/t10,k
(4)
圖4 部分圖層訓(xùn)練樣本與檢索結(jié)果示例(帶紅框圖層為檢索錯(cuò)誤結(jié)果)Fig.4 Examples of training set and results (wrongly retrieved images are marked with red rectangle borders)
圖5 WMS圖層檢索結(jié)果展示界面及用戶反饋示例(以全球甲烷(CH4)分布圖為例)Fig.5 The GUI of WMS layer retrieval result exhibition page and user feedback demonstration (taking global CH4 distribution map for example)
由圖8可知,檢索用時(shí)隨樣本數(shù)量和有效核數(shù)目的增加而增加,不同樣本數(shù)量和有效核數(shù)下的平均檢索用時(shí)為0.1~1.6 s,基本能夠滿足用戶實(shí)時(shí)檢索的需求。其中訓(xùn)練用時(shí)隨樣本數(shù)量和有效核數(shù)目增加呈增長(zhǎng)趨勢(shì),有效核數(shù)目與檢索所需特征類數(shù)高度相關(guān)。當(dāng)檢索對(duì)象為使用單一特征可有效區(qū)分的WMS圖層,分類模型復(fù)雜度低有效核數(shù)目較少(多為1~2個(gè)),訓(xùn)練用時(shí)較短。其余用時(shí)不受核數(shù)目變化的影響但隨樣本數(shù)量的增加呈線性增長(zhǎng)。其中樣本數(shù)據(jù)讀入時(shí)間受樣本數(shù)量影響最大,而多核模型預(yù)設(shè)、預(yù)測(cè)分類和相似性排序用時(shí)所占比重小,受樣本數(shù)量影響較小,其變化對(duì)其余用時(shí)影響有限。同時(shí),對(duì)比圖8訓(xùn)練用時(shí)和其余用時(shí)變化率曲線,訓(xùn)練用時(shí)隨樣本數(shù)量增長(zhǎng)速度略高于其余用時(shí),可從算法優(yōu)化和數(shù)據(jù)讀取并行等角度進(jìn)一步加速檢索速率。
圖6 單顏色直方圖SVM與多特征多核檢索算法的查準(zhǔn)率對(duì)比Fig.6 The precision comparison of SVM with blocking color histogram as the single feature and the proposed multiple kernel learning with three selected features
本文分別選取點(diǎn)、線、面要素地圖和遙感影像中的多組代表圖層開(kāi)展反饋有效性驗(yàn)證試驗(yàn)。試驗(yàn)選用查準(zhǔn)率和查全率評(píng)估反饋對(duì)檢索精度的提升,使用平均準(zhǔn)確率(average precision,AP)評(píng)估反饋對(duì)正確檢索結(jié)果位序的影響,綜合評(píng)判反饋能否輔助用戶快速獲取有效信息。各指標(biāo)計(jì)算如式(5),其中Q為檢索結(jié)果總數(shù),r為位序,P(r)為當(dāng)前位置的查準(zhǔn)率。迭代反饋中各項(xiàng)指標(biāo)變化情況如圖9所示。
(5)
圖7 不同樣本數(shù)量下有效核數(shù)目的頻次分布Fig.7 The frequency distribution of kernel number in different training sample sizes
圖8 多核學(xué)習(xí)訓(xùn)練用時(shí)與其余用時(shí)隨樣本數(shù)量及核數(shù)目的變化趨勢(shì)Fig.8 The increasing of training time and other computing time with the increased training sample sizes and kernel numbers
由圖9可知反饋對(duì)查全率貢獻(xiàn)小,但能有效提高查準(zhǔn)率和平均準(zhǔn)確率。查全率在反饋中保持不變或僅有小幅度提升。其中點(diǎn)、線圖層中要素分布模式多樣、視覺(jué)差異大,檢索結(jié)果與正樣本視覺(jué)相似性高,用戶在此基礎(chǔ)上反饋無(wú)法補(bǔ)充其他分布模式的點(diǎn)線要素圖層信息,因此不能有效提高該類圖層的查全率。隨著反饋迭代大量錯(cuò)誤檢索結(jié)果被剔除,查準(zhǔn)率提升迅速。多次反饋后仍被誤檢的圖層與正樣本在地理要素或?qū)傩钥臻g分布、配色風(fēng)格或區(qū)域輪廓上差異有限、視覺(jué)相似度高,將這些圖層作為負(fù)樣本補(bǔ)充后會(huì)干擾訓(xùn)練,使分類模型向錯(cuò)誤方向調(diào)整,造成查準(zhǔn)率波動(dòng)。通過(guò)反饋檢索平均準(zhǔn)確率到達(dá)了較高水平,說(shuō)明反饋能夠有效剔除錯(cuò)誤結(jié)果,并有效改善正確結(jié)果的相似度排序。同時(shí)試驗(yàn)表明,經(jīng)過(guò)1—2次反饋后,樣本規(guī)模已足夠輔助模型捕捉到圖層間的相似性,并將各核權(quán)重調(diào)節(jié)至合理區(qū)間,此后查全率、查準(zhǔn)率和平均準(zhǔn)確率等指標(biāo)基本保持穩(wěn)定。綜上所述,用戶通過(guò)少數(shù)次反饋能有效篩除錯(cuò)誤干擾項(xiàng),提高正確檢索結(jié)果位序,快速找到匹配的圖層。
圖9 不同類型圖層的用戶反饋有效性試驗(yàn)結(jié)果Fig.9 Results of user feedback validity experiment for different types of layers
本文將基于內(nèi)容圖像檢索應(yīng)用于WMS圖層檢索,設(shè)計(jì)了一種基于多特征多核學(xué)習(xí)的檢索策略,并結(jié)合用戶反饋機(jī)制提升檢索精度。試驗(yàn)結(jié)果表明該算法能夠?qū)崟r(shí)準(zhǔn)確滿足用戶多樣化的檢索需求。相比現(xiàn)有WMS檢索方法,本文方法考慮了圖層的視覺(jué)相似性,融合顏色、形狀、紋理3種特征對(duì)圖層內(nèi)容進(jìn)行描述;通過(guò)多核學(xué)習(xí)實(shí)現(xiàn)特征的高效組合和核函數(shù)參數(shù)選擇;結(jié)合用戶反饋,動(dòng)態(tài)調(diào)整與優(yōu)化分類模型,適應(yīng)了用戶檢索差異化大的需要。
本文算法對(duì)面要素圖層和遙感影像效果較好,而點(diǎn)線要素圖層需進(jìn)一步優(yōu)選特征或結(jié)合深度學(xué)習(xí)框架提取圖層高級(jí)語(yǔ)義特征,以提高檢索精度。目前本文方法假定反饋過(guò)程中所有檢索正確結(jié)果均被用戶手動(dòng)標(biāo)記,可借鑒半監(jiān)督學(xué)習(xí)或弱監(jiān)督學(xué)習(xí)的思想,通過(guò)少量標(biāo)記圖層篩選檢索結(jié)果中其他興趣圖層,減輕用戶反饋標(biāo)記負(fù)擔(dān)。同時(shí),為應(yīng)對(duì)檢索用時(shí)隨樣本數(shù)目快速增長(zhǎng)的現(xiàn)象和大量用戶并發(fā)檢索的需求,需設(shè)計(jì)合理的并行計(jì)算方案,提升用戶體驗(yàn)。