曹磊
(淮北師范大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
一種三維空間手寫數(shù)字的融合識別方法
曹磊
(淮北師范大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,安徽 淮北 235000)
在三維空間手寫數(shù)字識別研究中,特征的選取和融合直接決定最終的識別率.空間手寫數(shù)字特征一般包括時域特征和頻域特征兩大類,時域特征又包括加速度相關(guān)特征、旋轉(zhuǎn)特征及短時能量特征;頻域特征又包括DCT變換特征及FFT變換特征.針對這一特點,文章提出一種融合多種特征的識別方法.首先,對三維空間手寫識別的各種子特征進行提??;然后選取最能反映字符特點的兩種子特征進行融合并對融合后的特征向量進行降維處理;最后進入分類器進行識別.實驗結(jié)果表明,本方法相比采用單一特征進行識別時,其識別率有顯著提升.
特征融合;旋轉(zhuǎn)特征;DCT變換特征;三維空間手寫識別;支持向量機
平面聯(lián)機手寫及脫機手寫識別技術(shù)已經(jīng)非常成熟,并且應(yīng)用的范圍也比較廣泛,但受到書寫平面的制約,用戶使用時不太方便.三維空間手寫識別技術(shù)是一種全新的人機交互方式,利用加速度傳感器來采集空間書寫的特征,擺脫手寫板的束縛,用戶使用時更加快捷、方便,是手寫識別技術(shù)的發(fā)展趨勢.
此前,由于受到傳感器發(fā)展的制約,這項技術(shù)沒有得到充分發(fā)展,但隨著微電子機械系統(tǒng)(MEMS)技術(shù)的不斷發(fā)展成熟,并出現(xiàn)價格低廉、靈敏度高的MEMS加速度傳感器,為空間手寫識別技術(shù)的研究提供硬件保障[1].關(guān)于識別算法有兩類,一類是利用傳感器采集各類特征進行識別;另一類是利用攝像頭拍攝手勢動作,將視頻圖像處理后進行識別.兩者相比,第二類方法由于算法復(fù)雜、計算量大,沒有受到關(guān)注;而第一類方法中用到的加速度傳感器由于靈敏度高且成本低,越來越受到重視.
三維空間手寫識別流程如圖1所示,首先要對采集的特征數(shù)據(jù)進行預(yù)處理,使特征數(shù)據(jù)標(biāo)準化;然后利用PCA方法對時域RF特征及頻域DCT變換特征進行融合并降維處理;最后送入分類器,利用SVM進行分類識別.
圖1 三維空間手寫識別流程
利用加速度傳感器采集的空間手寫特征數(shù)據(jù)首先要進行預(yù)處理,因為在采集時會有多種噪聲干擾,比如手抖及溫度的干擾.另外,書寫習(xí)慣的不同也會造成特征數(shù)據(jù)的差異[2].所以不僅要對噪聲進行過濾,還要用歸一化的方法將最能反映數(shù)據(jù)特征的分量提取出來,進而消除特征數(shù)據(jù)的差異.
特征提取及融合是三維空間手寫識別最關(guān)鍵的一步,直接決定三維空間手寫識別的性能.文章所采用的特征提取方法是首先提取空間手寫的時域特征中的旋轉(zhuǎn)特征RF(Rotation Feature),然后利用離散余弦變換DCT(Discrete CosineTansform)來提取其頻域特征,最后利用主成分分析法PCA(Principal Com?ponent Analysis)進行特征融合及降維處理.
3.1 旋轉(zhuǎn)特征RF
基于加速度傳感器的三維空間手寫能獲得手勢運動時由三軸加速度傳感器測得的三個軸向的加速度信號,利用這些加速度信號進行識別.由于不需要采集用戶的書寫筆跡,所以可以擺脫由書寫角度、速度及力度的差異所帶來的影響.
當(dāng)時間t從0變化到l-1時,加速度信號會有順時針和逆時針的旋轉(zhuǎn)變化,由于每個字符的書寫運動變化過程都不同,所以可以提取這種旋轉(zhuǎn)變化的特征進行有效識別.文章選取垂直于書寫平面上的加速度信號作為主要二維特征,所以要將A()t投影到下述3個投影平面,然后分別從3個投影平面提取二維旋轉(zhuǎn)特征:
3.2 離散余弦變換特征DCT
DCT變換經(jīng)常用在圖像編碼中.其含義是特征數(shù)據(jù)有一定損失的情況下,可以用較少數(shù)目的點數(shù)來表示原點數(shù),所以一個高維的特征數(shù)據(jù)經(jīng)過 DCT變換后可以用較少數(shù)目的維數(shù)來表示,而且數(shù)據(jù)的本質(zhì)特征不會發(fā)生變化.DCT變換的優(yōu)點有兩個:(1)減少特征數(shù)據(jù)的噪聲影響;(2)可減少后續(xù)降維過程的復(fù)雜性.基于以上兩點,文章采用DCT變換對三維加速度特征數(shù)據(jù)進行頻域變換,進而取得頻域特征[3].
DCT變換是一個線性的可逆變換,一維離散余弦的變換形式如下:
其中,xn是輸入的離散數(shù)據(jù),也就是時域中的N點序列,XK為余弦變換系數(shù),k為廣義頻率分量[4].
圖2是DCT變換結(jié)果示意圖,由于DCT具有很強的“能量聚集”特性,關(guān)鍵的數(shù)據(jù)信息主要是聚集于一些 DCT的低頻區(qū)域,所以文章采集DCT變換的前128個幅值作為頻域特征.
圖2 DCT變換結(jié)果
3.3 基于PCA的時頻特征融合方法
信息融合是一種交叉型、多學(xué)科的綜合理論方法,涉及的研究領(lǐng)域包括人工神經(jīng)網(wǎng)絡(luò)、貝葉斯規(guī)則、模糊集理論、模糊積分理論、D-S證據(jù)理論、黑板結(jié)構(gòu)、不確定推理理論等.信息融合技術(shù)對多個信息源提供的信息能夠合理進行整合,使各種數(shù)據(jù)信息互為補充,從而提高系統(tǒng)的整體性能.信息融合根據(jù)處理對象層次的不同可劃分為三個層次:像素級融合,特征級融合和決策級融合[5].
特征融合是在數(shù)據(jù)處理的中間階段對信息進行整合,文章采用基于PCA(主成分分析法)的融合方法對時域及頻域特征進行融合并對融合后的特征向量進行降維處理,不僅能最大程度地保留用于識別的特征信息,而且數(shù)據(jù)信息量也得到壓縮,從而有效降低數(shù)據(jù)處理的復(fù)雜性.基于PCA的特征融合流程如圖3所示:
圖3 基于PCA的特征融合流程
首先選擇樣本庫里任意樣本ξ,提取其RF特征向量及DCT變換特征向量,分別記為χ和y,χ和y的維數(shù)分別為m和n,則融合后的特征向量為z∈(x,y)T,z的維數(shù)為m+n.可以看出融合后的向量維數(shù)增加很多,增加識別算法的復(fù)雜性,所以采用PCA方法對融合后的特征向量進行降維處理[6].
PCA目標(biāo)函數(shù)定義:
支持向量機(SVM)是結(jié)合統(tǒng)計學(xué)習(xí)、核函數(shù)方法和最優(yōu)化方法的一種機器學(xué)習(xí)算法,已經(jīng)在圖像處理及模式識別方面有較廣泛的應(yīng)用.它把特征向量通過非線性變換映射到高維特征空間,在這個空間中創(chuàng)建一個最優(yōu)分類超平面[7],使分類器具有較強的泛化能力,能夠根據(jù)有限的樣本信息找到學(xué)習(xí)能力與學(xué)習(xí)精度之間的最佳平衡點.SVM的基本原理如下所示:
5.1 樣本采集
實驗對0~9十個阿拉伯?dāng)?shù)字進行識別,由于書寫習(xí)慣的不同會造成特征數(shù)據(jù)的差異,為驗證本文方法的有效性,專門組織40人使用MEMS加速度傳感器對0-9十個數(shù)字分別書寫10次,得到各個數(shù)字的400個樣本.隨機選取各個數(shù)字的320個樣本作為訓(xùn)練樣本,其余的80個樣本作為測試樣本.
首先將訓(xùn)練樣本送入SVM分類器進行學(xué)習(xí),然后將測試樣本送入SVM進行分類識別,分別做3次實驗,取3次試驗結(jié)果的平均值.
5.2 性能分析及對比
圖4顯示選擇不同特征下的0-9十個數(shù)字的識別率:
圖4 不同特征下數(shù)字的識別率
從圖4可以看出,對于10個阿拉伯?dāng)?shù)字,采用融合特征的識別率最高,同時也反映出時域特征與頻域特征結(jié)合的有效性.
為了凸顯本文方法的有效性,將測試樣本的RF特征和DCT變換特征分別送入SVM分類器進行訓(xùn)練和識別,連做3次實驗,分別取其識別率的平均值.將采用不同特征進行識別的結(jié)果進行對比,由于采用的是同一種分類識別算法,所以平均識別率高的,其性能更優(yōu)越.識別結(jié)果如表1所示:
表1 采用不同特征的識別率
從表1可以看出,采用融合特征進行空間手寫識別,其識別率比采用單一特征進行識別分別提升了7.98%和13.35%.所以采用本文方法的識別性能有顯著提高.
文章提出一種基于PCA的特征融合方法對三維空間手寫數(shù)字進行識別.實驗結(jié)果表明,采用本文方法的識別率有顯著提高,但是對于空間數(shù)字識別中的連筆消除效果不佳,應(yīng)將其作為今后工作的研究重點.
[1]孔俊其.基于三維加速度傳感器的手勢識別及交互模型研究[D].蘇州:蘇州大學(xué),2009:1-14.
[2]譚嘯峰.空間手寫識別預(yù)處理算法研究[D].浙江:浙江大學(xué),2009:4-5.
[3]HE Zhengyu.A new feature fusion method for gesture reeognition based on 3d accelerometer[J].Applied Mechanics and Materials,2010:44-47.
[4]胡永剛,吳翊.高維數(shù)據(jù)降維的DCT變換[J].計算機工程與應(yīng)用,2006,32:21-22.
[5]韓崇昭,朱洪艷,段戰(zhàn)勝.多元信息融合[M].北京:清華大學(xué)出版社,2006.
[6]MARTINEZ A M,KAK A C.PCA Versus LDA[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001(23):229-238.
[7]ANDREW R W.Statistical Pattern Recognition[M].Publishing House of Electronics Industry,2004:5-6,106-111.
[8]劉晶,郭雷,聶晶鑫.基于SVM的一種新的分類器設(shè)計方法[J].計算機應(yīng)用研究,2006(7):181-182.
Fusion Recognition Method on 3D Space Handwriting Digit
CAO Lei
(School of Computer Science and Technology,Huaibei Normal University,235000,Huaibei,Anhui,China)
The extraction and fusion of the features determine the final recognition rate in the research of 3D space handwriting digit.Space handwriting digit features mainly include time-domain features and frequency-domain features.Time-domain fea?tures are typical of acceleration related features,rotation features and short-time energy;frequency-domain features are typical of DCT transform features and FFT transform features.This paper proposes multi-feature fusion method.The various sub-fea?tures were extracted and two sub-features which can reflect characters′features were chosen and fused to reduce the dimen?sion of the fused feature vectors.Then the classifier was introduced to categorize and recognize.The experimental results show that the multi-feature fusion method can significantly improve the recognization performance compared with the single featurebased method.
feature fusion;rotation feature;DCT transform feature;3D space handwriting recognization;support vector machines
TP 391
A
2095-0691(2013)04-0056-05
2013-07-10
安徽省高等學(xué)校省級優(yōu)秀青年人才基金項目(2012SQRL078);安徽省教育廳自然科學(xué)基金項目(KJ2012Z354)
曹 磊(1979- ),男,安徽宿州人,副教授,碩士,研究方向:信息融合、模式識別.