胡永輝 邢延
(廣東工業(yè)大學(xué)自動(dòng)化學(xué)院)
手寫簽名認(rèn)證是生物特征識(shí)別的一個(gè)重要內(nèi)容,其生成是一個(gè)動(dòng)態(tài)過程,難以模仿和偽造,而且不會(huì)遺忘。更重要的是,在傳統(tǒng)商務(wù)活動(dòng)中,簽名是認(rèn)證的一種主要手段。手寫簽名認(rèn)證根據(jù)所研究對(duì)象是否聯(lián)機(jī),分為在線手寫簽名認(rèn)證和離線手寫簽名認(rèn)證[1]。在線手寫簽名認(rèn)證可以獲取書寫過程中與時(shí)間相關(guān)的位置、速度、加速度、筆劃、筆順、時(shí)間標(biāo)志、書寫狀態(tài)、方位角、傾角以及書寫力等信息;離線簽名認(rèn)證只通過提取二維手寫簽名圖像中的個(gè)性化特征進(jìn)行分析鑒別。在線認(rèn)證往往能取得較好的認(rèn)證效果。在簽名識(shí)別中,動(dòng)態(tài)時(shí)間彎曲(Dynamic Time Warping,DTW)[2]、人工神經(jīng)網(wǎng)絡(luò)[3]以及隱馬爾可夫模型(HMM)[4]都是常用的匹配方法。
本文在DTW的基礎(chǔ)上,對(duì)簽名時(shí)間序列進(jìn)行優(yōu)化,彌補(bǔ)DTW算法忽略簽名時(shí)間序列長(zhǎng)度的影響。
DTM 是一個(gè)典型的優(yōu)化問題,它采用滿足一定條件的時(shí)間彎曲函數(shù)描述輸入樣本和參考模板在時(shí)間上的對(duì)應(yīng)關(guān)系,求解兩者匹配時(shí)累積距離最小所對(duì)應(yīng)的彎曲函數(shù),以度量樣本與參考模板的距離。在線簽名驗(yàn)證包括數(shù)據(jù)采集、預(yù)處理、特征提取、匹配判決等部分,具體在線簽名識(shí)別系統(tǒng)如圖1所示。
經(jīng)典DTW算法[5]的距離是取歐幾里德距離實(shí)現(xiàn)分類的,忽略了簽名時(shí)間序列長(zhǎng)度的影響。而部分研究考慮平衡這種長(zhǎng)度不同的效應(yīng)時(shí),在累計(jì)距離值基礎(chǔ)上直接除以匹配長(zhǎng)度,更是忽略了局部差異的重要性。同時(shí),歐幾里德距離的方法也使得部分真實(shí)樣本由于偶爾出現(xiàn)的畸變點(diǎn)而被拒絕。本文針對(duì)時(shí)間序列長(zhǎng)度對(duì)簽名識(shí)別的影響,提出了時(shí)間序列優(yōu)化。
圖1 在線手寫簽名認(rèn)證系統(tǒng)
時(shí)間序列優(yōu)化是根據(jù)模板簽名對(duì)待測(cè)簽名的時(shí)間序列進(jìn)行優(yōu)化。根據(jù)模板簽名,找出模板簽名對(duì)應(yīng)位置的最近似點(diǎn)。近似點(diǎn)的找法:首先計(jì)算模板簽名點(diǎn)的(x,y)與對(duì)應(yīng)的待測(cè)簽名位置五個(gè)點(diǎn)的歐氏距離;然后用余弦相似性,計(jì)算模板簽名點(diǎn) (α,β,p)與對(duì)應(yīng)的待測(cè)簽名位置五個(gè)點(diǎn)的相似度分別對(duì)應(yīng)的是方位角、傾角和壓力信息)。計(jì)算近似距離:。其中近似距離最小的那個(gè)點(diǎn)就是要找的近似點(diǎn)。具體實(shí)現(xiàn)過程如圖2所示(模板簽名為R,待測(cè)簽名為T)。
經(jīng)過時(shí)間序列優(yōu)化提取有用的識(shí)別信息后,DTW 匹配路徑對(duì)于類內(nèi)模式的最優(yōu)匹配結(jié)果影響較小,但會(huì)導(dǎo)致類間模式的匹配路徑與全局最優(yōu)差異加大,即基本不改變類內(nèi)距離的同時(shí),增強(qiáng)了分類效果。
圖2 時(shí)間序列優(yōu)化流程
本文實(shí)驗(yàn)數(shù)據(jù)來源于SVC2004國(guó)際簽名識(shí)別比賽。實(shí)驗(yàn)數(shù)據(jù)包括40組簽名,每組簽名包括20個(gè)真實(shí)簽名和20個(gè)偽造簽名。簽名中每個(gè)采樣點(diǎn)記錄X、Y坐標(biāo)、時(shí)間標(biāo)志、書寫狀態(tài)、方位角、傾角和壓力信息。首先對(duì)簽名數(shù)據(jù)做預(yù)處理,即簽名位置大小歸一化,平滑處理;然后對(duì)簽名進(jìn)行選優(yōu)、特征提取、特征選優(yōu)和時(shí)間序列優(yōu)化。
簽名特征空間分為兩個(gè)區(qū)域:真實(shí)簽名空間和偽造簽名空間。這樣在認(rèn)證實(shí)驗(yàn)中,會(huì)發(fā)生兩類錯(cuò)誤:錯(cuò)誤拒絕和錯(cuò)誤接受。使用FRR(False Reject Rate)和FAR(False Accept Rate)表示這兩種概率。在認(rèn)證試驗(yàn)中,一般取FRR=FAR的情況,即等錯(cuò)誤率EER(Equal Error Rate)作為系統(tǒng)評(píng)價(jià)依據(jù)。不同閾值下,F(xiàn)RR與 FAR為此消彼長(zhǎng)的關(guān)系,由此形成了一條ROC(Receiver Operating Characteristic)曲線。本實(shí)驗(yàn)都是基于Matlab環(huán)境下的仿真處理。
本文在未采用簽名時(shí)間序列優(yōu)化時(shí),通過實(shí)驗(yàn)分析得到系統(tǒng)的等錯(cuò)誤率(EER)為9.7953%。在采用簽名時(shí)間序列優(yōu)化后,通過實(shí)驗(yàn)分析得到系統(tǒng)的等錯(cuò)誤率(EER)為3.6667%。時(shí)間序列優(yōu)化前和優(yōu)化后ROC曲線對(duì)比如圖3所示。
圖3 時(shí)間序列優(yōu)化前和優(yōu)化后ROC曲線對(duì)比
通過實(shí)驗(yàn)發(fā)現(xiàn)采用簽名時(shí)間序列優(yōu)化時(shí),模板簽名采集點(diǎn)將在與其最近的位置尋找測(cè)試簽名中的對(duì)應(yīng)點(diǎn),這樣可以提取待測(cè)簽名與模板最近似的時(shí)間序列,即提取有用的識(shí)別信息,同時(shí)也保持了待測(cè)簽名與模板簽名時(shí)間序列長(zhǎng)度的一致性。從兩個(gè)試驗(yàn)結(jié)果來看,后者提高了簽名的識(shí)別效果。
本文在DTW算法的基礎(chǔ)上,對(duì)簽名和簽名的特征向量進(jìn)行最優(yōu)提取,提高了簽名的實(shí)時(shí)性和識(shí)別率。在簽名識(shí)別過程中,簽名時(shí)間序列長(zhǎng)度會(huì)影響簽名的識(shí)別結(jié)果,而DTW算法中沒有考慮到時(shí)間序列長(zhǎng)度影響。本文采用簽名時(shí)間序列優(yōu)化,彌補(bǔ)了DTW算法在這方面的不足。算法在實(shí)驗(yàn)中取得了很好的識(shí)別效果。而實(shí)際運(yùn)用中很注重實(shí)時(shí)性,如何進(jìn)一步提高簽名識(shí)別的實(shí)時(shí)性,還需要進(jìn)一步研究。
[1]A.K. Jain, F.D. Griess, S.D. Connell. On-line signature verification. Pattern Recognition, 2002,35(12):2963-2972.
[2]黃承杰,申飛,吳仲城.基于動(dòng)態(tài)時(shí)間規(guī)劃的在線簽名認(rèn)證方法研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2009,(2):49-52.
[3]C.Quek, R.W.Zhou.Antiforgery:a novel pseudo-outer product based fuzzy neural network driven signature verification system.Pattern Recognition Letters,2002,23(14):1795-1816.
[4]欒方軍,程海,宋曉宇.基于HMM的在線手寫簽名認(rèn)證系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2008,25(6):78-80.
[5]A.Piyush Shanker,A.N.Rajagopalan. Off-line signature verification using DTW. Pattern Recognition Letters. 2007.28(12):1407-1414.