李祥,姜程亮,徐宗澤
(1.中國(guó)電子科技集團(tuán)公司第二十八研究所,南京 210007;2.海軍指揮所,北京 100841 3.南京捷敏信軟件科技有限公司,南京 210000)
軍隊(duì)標(biāo)號(hào)草書(shū)標(biāo)繪識(shí)別技術(shù)研究與實(shí)現(xiàn)
李祥1,姜程亮2,徐宗澤3
(1.中國(guó)電子科技集團(tuán)公司第二十八研究所,南京 210007;2.海軍指揮所,北京 100841 3.南京捷敏信軟件科技有限公司,南京 210000)
展現(xiàn)戰(zhàn)場(chǎng)敵我雙方態(tài)勢(shì)的物理沙盤(pán)逐漸被電子沙盤(pán)取代,針對(duì)在電子沙盤(pán)上快速調(diào)整戰(zhàn)斗進(jìn)展情況和標(biāo)繪首長(zhǎng)戰(zhàn)斗決心圖的應(yīng)用需求。提出通過(guò)手(或手寫(xiě)筆)描繪標(biāo)號(hào)輪廓,使用圖像識(shí)別算法進(jìn)行軍標(biāo)識(shí)別的軍隊(duì)標(biāo)號(hào)草書(shū)標(biāo)繪方法。通過(guò)示例程序驗(yàn)證表明,此方法可有效實(shí)現(xiàn)電子沙盤(pán)自然、快速地草書(shū)標(biāo)繪需求。
軍隊(duì)標(biāo)號(hào);手繪;識(shí)別;Shape Context算法
隨著信息技術(shù)的發(fā)展,展現(xiàn)戰(zhàn)場(chǎng)敵我雙方態(tài)勢(shì)[1]的物理沙盤(pán)逐漸被電子沙盤(pán)所取代[2],電子沙盤(pán)應(yīng)用觸控設(shè)備和技術(shù)實(shí)現(xiàn)用戶對(duì)電子沙盤(pán)軟件的干預(yù)操作。如何在電子沙盤(pán)上快速調(diào)整戰(zhàn)斗進(jìn)展情況,快速標(biāo)繪首長(zhǎng)戰(zhàn)斗決心圖,是電子沙盤(pán)實(shí)現(xiàn)必須解決的重要課題之一。戰(zhàn)斗進(jìn)展情況和首長(zhǎng)戰(zhàn)斗決心通過(guò)軍隊(duì)標(biāo)號(hào)(簡(jiǎn)稱(chēng)“軍標(biāo)”)表現(xiàn),基于鼠標(biāo)鍵盤(pán)操作的電子標(biāo)圖軟件發(fā)展已經(jīng)比較成熟,廣泛應(yīng)用于各類(lèi)指揮信息系統(tǒng),使用觸控手勢(shì)實(shí)現(xiàn)軍標(biāo)標(biāo)繪的研究目前較少,比較常見(jiàn)的方法是通過(guò)手勢(shì)模擬鼠標(biāo)操作來(lái)實(shí)現(xiàn)軍標(biāo)標(biāo)繪[3-4],操作繁瑣且不自然。本文提出通過(guò)手(或手寫(xiě)筆)描繪標(biāo)號(hào)輪廓(簡(jiǎn)稱(chēng)“草書(shū)標(biāo)繪”,此類(lèi)軍標(biāo)定義為“手繪軍標(biāo)”),使用圖像識(shí)別算法進(jìn)行軍標(biāo)識(shí)別的軍隊(duì)標(biāo)號(hào)草書(shū)標(biāo)繪方法,實(shí)現(xiàn)電子沙盤(pán)軍標(biāo)的自然、快速標(biāo)繪?;邳c(diǎn)狀軍標(biāo)形狀固定(線面軍標(biāo)形狀不固定)的特點(diǎn),本文研究如何識(shí)別手繪點(diǎn)狀態(tài)軍標(biāo)并轉(zhuǎn)換為矢量軍標(biāo)的方法。
1.1 算法選擇
手繪軍標(biāo)識(shí)別的主要思想是將手繪的圖像與軍標(biāo)樣本庫(kù)進(jìn)行相似度匹配,得出相似度最高的軍標(biāo)。在圖像識(shí)別領(lǐng)域,有許多算法可以實(shí)現(xiàn)手繪圖像識(shí)別,如感知哈希算法[5]、SVM算法[6]和Shape Context算法[7]等,這些算法能夠有效識(shí)別出輸入圖像與樣本圖像庫(kù)中相似的圖像。因每個(gè)算法均有其特點(diǎn)和局限性,適用場(chǎng)景不同,下面結(jié)合軍標(biāo)的特征,分析選擇手繪軍標(biāo)識(shí)別算法。
感知哈希(Perceptual Hash Algorithm)算法是哈希算法的一種,將圖像的主要特征提取出來(lái),生成一組指紋,然后對(duì)指紋進(jìn)行比較,比較算法主要運(yùn)用漢明算法。指紋重合越多,圖像的相似度越高,越高相似度的圖像越可能是需要識(shí)別出的圖像。該算法運(yùn)行速度快,忽略圖像細(xì)節(jié)只保留主要部分,對(duì)圖像的大小和顏色沒(méi)有要求,可以運(yùn)用在相似圖像搜索領(lǐng)域。該算法不能解決圖像在旋轉(zhuǎn)情況下的識(shí)別問(wèn)題,軍標(biāo)有方向,因此手繪軍標(biāo)不適合使用感知哈希算法識(shí)別。
SVM(Support Vector Machine,支持向量機(jī))算法是一種機(jī)器學(xué)習(xí)算法,是一個(gè)有監(jiān)督的學(xué)習(xí)模型,通常運(yùn)用在模式識(shí)別、分類(lèi)以及回歸分析。其優(yōu)點(diǎn)是:可以解決小樣本下機(jī)器學(xué)習(xí),解決了高維和非線性問(wèn)題;缺點(diǎn)是:SVM對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施,處理多分類(lèi)問(wèn)題比較困難。軍標(biāo)樣本庫(kù)中圖像比較多,不適合使用該算法。
Shape Context(形狀上下文)算法是由Serge Belongie,Jitendra Malik以及Jan Puzicha在2002年提出的基于輪廓點(diǎn)集的形狀匹配算法,該算法在數(shù)字識(shí)別、基于圖像內(nèi)容的檢索以及基于形狀匹配方面具有較高的識(shí)別率,因而引起人們廣泛關(guān)注?,F(xiàn)在該算法已經(jīng)在多個(gè)應(yīng)用領(lǐng)域得到良好發(fā)展,能夠解決手繪軍標(biāo)的識(shí)別問(wèn)題。
1.2 Shape Context算法原理
Shape Context算法是一種良好的輪廓形狀識(shí)別器,它可以有效地識(shí)別出兩個(gè)圖像的相似度,是一種常用的輪廓識(shí)別算法。該算法的最終思想是將圖像形狀之間的匹配轉(zhuǎn)換成特征點(diǎn)點(diǎn)集之間的匹配。
若一幅圖中有N個(gè)點(diǎn),某點(diǎn)P與其余的N-1點(diǎn)均存在關(guān)系,即產(chǎn)生N-1個(gè)向量。這些N-1個(gè)向量描述豐富的信息,決定了目標(biāo)形狀特征。如果N越大,信息量越多,描述圖像越準(zhǔn)確。在邊界提取之后,進(jìn)行對(duì)數(shù)極坐標(biāo)變換,求出對(duì)數(shù)極坐標(biāo)直方圖。對(duì)數(shù)極坐標(biāo)直方圖代表此基準(zhǔn)點(diǎn)與其他離散輪廓點(diǎn)之間的空間位置關(guān)系。所以,Shape Context算法關(guān)注的是每個(gè)點(diǎn)對(duì)應(yīng)的其他所有輪廓點(diǎn)的全局的空間分布信息,這有助于查找兩個(gè)圖像的對(duì)應(yīng)點(diǎn)。
如圖1所示為指揮所軍標(biāo)的識(shí)別示例,(a)是原始的二值圖像;(b)是均勻的選取邊緣輪廓上的若干個(gè)點(diǎn),選取點(diǎn)數(shù)根據(jù)圖像特征確定,(c)是某點(diǎn)P和其余點(diǎn)組成的向量關(guān)系圖;(d)是對(duì)于邊緣上的任意一個(gè)點(diǎn)P,構(gòu)建類(lèi)似于雷達(dá)掃描系統(tǒng)的極坐標(biāo)系,它將整個(gè)區(qū)域劃分成5×12=60個(gè)區(qū)域,統(tǒng)計(jì)落入每個(gè)區(qū)域中邊界點(diǎn)的個(gè)數(shù);(e)以θ為橫坐標(biāo),lnr為縱坐標(biāo)建立的形狀直方圖,(f)根據(jù)二分圖最大匹配算法(最大流或匈牙利算法)找出對(duì)應(yīng)點(diǎn)的最大匹配。
軍標(biāo)是指標(biāo)示軍事情況的圖形語(yǔ)言,由一些規(guī)則和不規(guī)則圖形組成。在對(duì)手繪軍標(biāo)識(shí)別時(shí),轉(zhuǎn)換成對(duì)軍標(biāo)樣本庫(kù)中軍標(biāo)圖像相似度進(jìn)行判斷,通過(guò)相似度進(jìn)行排序,選取相似度最高的幾個(gè)圖像供用戶確認(rèn)選取。因此,手繪軍標(biāo)識(shí)別問(wèn)題轉(zhuǎn)換為兩個(gè)圖像的相似度計(jì)算問(wèn)題,本文使用Shape Context算法進(jìn)行圖像相似度計(jì)算,具體分為六個(gè)步驟,分別為:預(yù)處理、邊緣提取、對(duì)數(shù)極坐標(biāo)轉(zhuǎn)換、對(duì)數(shù)極坐標(biāo)直方圖轉(zhuǎn)換、歸一化和對(duì)應(yīng)點(diǎn)匹配。
圖1 Shape Context算法主要步驟
2.1 預(yù)處理
預(yù)處理是將軍標(biāo)圖像轉(zhuǎn)成灰度圖像。灰度處理可以去除軍標(biāo)的顏色屬性,獲取輪廓形狀,減少處理信息大小。
2.2 邊緣提取
對(duì)軍標(biāo)圖像預(yù)處理后,提取出軍標(biāo)邊緣輪廓點(diǎn),具體分兩步,一是使用Canny算法邊緣檢測(cè),二是輪廓跟蹤。Canny算法檢測(cè)出邊緣,提取出邊緣信息的二值圖像;然后用輪廓提取算法獲得二值圖像的輪廓,在將輪廓中尋找能夠體現(xiàn)輪廓形狀的點(diǎn),選擇點(diǎn)的數(shù)量越多,匹配效果越精確,但相應(yīng)的時(shí)間復(fù)雜度會(huì)增加。經(jīng)過(guò)對(duì)軍標(biāo)結(jié)構(gòu)特性分析,為保證高識(shí)別率和低時(shí)間復(fù)雜度,本文選取80個(gè)點(diǎn)描述二值圖像輪廓的形狀。圖像輪廓點(diǎn)應(yīng)根據(jù)輪廓曲率合理選擇,輪廓曲率越?。ㄈ缰本€),取點(diǎn)間隔應(yīng)越大,輪廓曲率越大,取點(diǎn)間隔應(yīng)越小。經(jīng)過(guò)試驗(yàn)驗(yàn)證,本文取出的輪廓點(diǎn)可以很好的體現(xiàn)出軍標(biāo)輪廓的形狀,同時(shí)運(yùn)算復(fù)雜度在可接收范圍內(nèi)。
2.3 對(duì)數(shù)極坐標(biāo)轉(zhuǎn)換
對(duì)數(shù)極坐標(biāo)轉(zhuǎn)換的方法是:先將軍標(biāo)圖像輪廓點(diǎn)的位置用笛卡爾坐標(biāo)表示,再將笛卡爾坐標(biāo)轉(zhuǎn)換成極坐標(biāo)。假設(shè)圖像上某一點(diǎn)笛卡爾坐標(biāo)用(x,y)表示,在極坐標(biāo)上用(r,θ)表示,笛卡爾坐標(biāo)轉(zhuǎn)換成對(duì)數(shù)極坐標(biāo)的映射方程是p(x,y)=lnr,q(x,y)=θ。
在笛卡爾坐標(biāo)中,點(diǎn)坐標(biāo)(x,y)相對(duì)于原點(diǎn)坐標(biāo)發(fā)生變換時(shí),若軍標(biāo)圖像發(fā)生放大r0,軍標(biāo)圖像角度旋轉(zhuǎn)θ0,坐標(biāo)(x,y)的變化在極坐標(biāo)中表示為(r+r0,θ+θ0),在對(duì)數(shù)極坐標(biāo)中表示為p(x,y)=lnr+lnr0,q(x,y)=θ+θ0。
笛卡爾坐標(biāo)系中,軍標(biāo)圖像的縮放在對(duì)數(shù)極坐標(biāo)系中表現(xiàn)為圖像的水平位移,軍標(biāo)圖像的旋轉(zhuǎn)在對(duì)數(shù)坐標(biāo)系中表現(xiàn)為圖像的垂直位移,這些特性稱(chēng)為對(duì)數(shù)極坐標(biāo)映射的二維不變性。Shape Context算法便是利用對(duì)數(shù)極坐標(biāo)二維不變性特性,很好地識(shí)別出有角度或縮放過(guò)的軍標(biāo)。
2.4 對(duì)數(shù)極坐標(biāo)直方圖轉(zhuǎn)換
將軍標(biāo)圖像轉(zhuǎn)換為對(duì)數(shù)極坐標(biāo)直方圖。假設(shè)手繪軍標(biāo)圖像某一點(diǎn)的坐標(biāo)為pi,對(duì)應(yīng)的對(duì)數(shù)極坐標(biāo)直方圖的步驟如下:
(1)以pi為坐標(biāo)原點(diǎn)進(jìn)行對(duì)數(shù)極坐標(biāo)變換;
(2)求落在每一格里的點(diǎn)數(shù);
(3)進(jìn)行歸一化處理,獲得直方圖。
如圖2所示,(a)圖是根據(jù)輪廓邊緣提取的輪廓點(diǎn)集,(b)圖是分成5×12個(gè)區(qū)域的對(duì)數(shù)極坐標(biāo)變換圖,(c)為(a)圖中某一點(diǎn)在對(duì)數(shù)極坐標(biāo)上的直方圖。
圖2 對(duì)數(shù)極坐標(biāo)直方圖轉(zhuǎn)換
2.5 圖像歸一化
歸一化目的是將數(shù)據(jù)按比例縮放,使之落入一個(gè)小的特定區(qū)間,由于信用指標(biāo)體系的各個(gè)指標(biāo)的度量單位不同,對(duì)指標(biāo)進(jìn)行規(guī)范化處理,就可以讓指標(biāo)參與評(píng)價(jià)計(jì)算中。
Hx(1,…,n)、Hx(1,…,n)分別是2個(gè)數(shù)集,使用經(jīng)驗(yàn)密度函數(shù)hx和hy來(lái)歸一化:
2.6 對(duì)應(yīng)點(diǎn)匹配
綜上所述,輪廓上的一個(gè)點(diǎn)可以用一個(gè)對(duì)應(yīng)形狀的直方圖表示。因此,可利用兩個(gè)形狀的直方圖之間的相似度來(lái)衡量對(duì)應(yīng)點(diǎn)的相似度。圖3中(a)、(b)分別表示在字母中選取的邊界點(diǎn),而(c)、(d)、(e)分別表示(a)中a點(diǎn)、(b)中b點(diǎn)和(a)中c點(diǎn)三個(gè)邊界點(diǎn)所對(duì)應(yīng)的形狀直方圖。
圖3 圖像邊界點(diǎn)的形狀直方圖表示
直方圖代價(jià)公式為:
在識(shí)別匹配過(guò)程中往往選取匹配代價(jià)最小的點(diǎn)作為離一點(diǎn)最近的對(duì)應(yīng)點(diǎn),這樣就將兩個(gè)點(diǎn)集轉(zhuǎn)換成二分圖最佳匹配問(wèn)題,處理二分圖最佳匹配問(wèn)題往往采用匈牙利算法或最大流算法,本文采用的是匈牙利算法解決最佳匹配問(wèn)題。
3.1 程序設(shè)計(jì)
為了提高工程應(yīng)用中手寫(xiě)軍標(biāo)識(shí)別的速度,盡量減少識(shí)別樣花費(fèi)在時(shí)間,本程序先對(duì)軍標(biāo)樣本庫(kù)中的樣本軍標(biāo)圖像進(jìn)行特征點(diǎn)集提取并保存,在每次對(duì)軍標(biāo)識(shí)別時(shí),無(wú)需再對(duì)樣本圖像進(jìn)行特征點(diǎn)集提取,可有效節(jié)省識(shí)別時(shí)間。同時(shí),為了進(jìn)一步減少識(shí)別時(shí)間,本程序利用多線程處理。
3.2 程序?qū)崿F(xiàn)
驗(yàn)證程序使用VS2010開(kāi)發(fā)環(huán)境,C++程序?qū)崿F(xiàn),并應(yīng)用了OpenCV庫(kù)(Open Source Computer Vision Library,開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù),2.4.9版)。
如圖4所示為驗(yàn)證程序主界面,包括手寫(xiě)區(qū)域、圖像顯示區(qū)域和操作指令區(qū)。手寫(xiě)區(qū)域供用戶手繪軍標(biāo),通過(guò)點(diǎn)擊“確認(rèn)選擇”按鈕完成手寫(xiě)并在圖像顯示區(qū)顯示;重繪圖像按鈕是將繪制好的進(jìn)行清除,清除后,手寫(xiě)區(qū)域變成白色,可以再次在該區(qū)域進(jìn)行手繪操作;匹配結(jié)果按鈕是獲取軍標(biāo)樣本庫(kù)中與手寫(xiě)圖像相似的軍標(biāo),并且顯示出4個(gè)最相似軍標(biāo)的名稱(chēng),路徑以及相似度指標(biāo)距離,如圖5所示(因特殊原因,部分文字和圖像模糊處理)。
圖4 驗(yàn)證程序主界面
每個(gè)軍標(biāo)顯示信息包括軍標(biāo)圖像、名稱(chēng)、路徑以及SC距離。SC距離是判斷相似度的標(biāo)準(zhǔn),SC距離越小,說(shuō)明兩者之間的相似度越高。相似越大的樣本軍標(biāo)排在最前面,最終選取4個(gè)與輸入圖像相似的軍標(biāo),盡量排除在手寫(xiě)時(shí)繪圖不準(zhǔn)確對(duì)識(shí)別結(jié)果帶來(lái)的干擾。
為了能減低時(shí)間復(fù)雜度,本程序利用多線程處理,進(jìn)過(guò)反復(fù)試驗(yàn),選取12個(gè)線程用時(shí)比較小。
3.3 效能分析
在雙核CUP(主頻3.46GHz)和4G內(nèi)存的計(jì)算機(jī)上運(yùn)行示例程序,手繪軍標(biāo),在800個(gè)樣本軍標(biāo)中找出相似標(biāo)準(zhǔn)軍標(biāo),平均消耗時(shí)3秒以內(nèi),識(shí)別準(zhǔn)確率平均達(dá)85%,能夠滿足電子沙盤(pán)草書(shū)標(biāo)繪應(yīng)用需要。
圖5 圖像顯示結(jié)果
軍隊(duì)標(biāo)號(hào)草書(shū)標(biāo)繪識(shí)別技術(shù)解決了電子沙盤(pán)應(yīng)用中軍標(biāo)標(biāo)繪的技術(shù)難題,實(shí)現(xiàn)了軍標(biāo)的自然、快速錄入。但是,該技術(shù)僅解決了具有一個(gè)定位點(diǎn)的點(diǎn)軍標(biāo)標(biāo)繪問(wèn)題,對(duì)于具有多個(gè)定位點(diǎn)的線面軍標(biāo)(線面軍標(biāo)形狀不定)草書(shū)標(biāo)繪識(shí)別無(wú)法解決。后續(xù)將進(jìn)一步研究線面軍標(biāo)草書(shū)繪制方法和識(shí)別技術(shù),實(shí)現(xiàn)線面軍標(biāo)的自然、快速錄入。
[1]程曉雪.海戰(zhàn)場(chǎng)綜合態(tài)勢(shì)構(gòu)建與同步方法[J].指揮信息系統(tǒng)與技術(shù),2016,7(3).
[2]吳振鋒,趙克儉.未來(lái)指揮所發(fā)展展望[J].火力與指揮控制,2005(4).
[3]陸錫高.軍交指揮空間用戶操作模型應(yīng)用研究[碩士學(xué)位論文].國(guó)防科學(xué)技術(shù)大學(xué),2008.
[4]張宏宇,李祥.基于實(shí)時(shí)戰(zhàn)場(chǎng)態(tài)勢(shì)的電子白板系統(tǒng)研究與實(shí)現(xiàn)[J].現(xiàn)代計(jì)算機(jī),2015,11(上).
[5]牛夏牧,焦玉華.感知哈希綜述[J].電子學(xué)報(bào),2008(7).
[6]Franois Poulet.SVM and Graphical Algorithms:a Cooperative Approach[C].IEEE International Conference on Data Mining(ICDM'04),2007
[7]Z.Y.Wang,L.Bin,and Z.R.Chi.Leaf Image Classification with Shape Context and SIFT Descriptors[J].Proceedings of International Conference on Digital Image Computing Techniques and Applications(DICTA),6-8 Dec 2011,pp.650-654.
Research and Implemention of Handwriting Military Symbols Recognition
LI Xiang1,JIANG Cheng-liang2,XU Zong-ze3
(1.The 14th research institute of China Electronic Technology Group Corporation,Nanjing 210007;2.Naval Command Post,Beijing 100841;3.Nanjing JMX Software Technology Co.Ltd.,Nanjing 210000)
The physical sand table is replaced by the electronic sand table for showing the whole battlefield situation.For solving how to plot combat process and combat determination of the commander in an electronic table quickly,proposes a handwriting military mark marking method which has three steps.Firstly,the military mark outline is depicted by hand.Then,the outline is recognizing by an image recognition algorithm.Finally,the outline is replaced by the real military mark.It is proved that the method can solve the problem of how to plot military marks by hand naturally and quickly.
Military Symbol;Handwriting;Recognition;Shape Context Algorithm
1007-1423(2016)33-0042-05
10.3969/j.issn.1007-1423.2016.33.009
李祥(1985-),男,江蘇南通人,碩士,工程師,研究方向?yàn)閿?shù)據(jù)可視化與展現(xiàn)技術(shù)
姜程亮(1983-),男,北京人,本科,工程師,研究方向?yàn)檐娛轮笓]學(xué)及指揮自動(dòng)化技術(shù)
徐宗澤(1990-),男,江蘇淮安人,碩士,工程師,研究方向?yàn)閳D像處理與識(shí)別技術(shù)
2016-09-27
2016-11-15