陳俊梅
【摘 要】隨著計(jì)算機(jī)技術(shù)和信號處理技術(shù)的蓬勃發(fā)展,條形碼尤其是二維條碼在各個(gè)領(lǐng)域中的使用范圍越來越廣,為了保證對二維條碼中所含信息識別的準(zhǔn)確性,需要對條碼的識別算法加以研究。本文以PDF417碼為例,在普通的攝入環(huán)境下采集到干擾比較大的圖像,利用MATLAB通過濾波、分層等算法對這樣得到圖像進(jìn)行的一系列處理,最終得到圖像的源代碼。在處理過程中,保證了圖像解碼的準(zhǔn)確性,減少了在普通攝入環(huán)境下可能產(chǎn)生的圖像畸變、噪聲干擾、運(yùn)動偽影等干擾對條碼識別的影響。
【關(guān)鍵詞】二維條碼;圖像處理;PDF417;MATLAB;識別算法
【Abstract】Along with the vigorous development of computer technology and signal processing technology,barcode,especially the two-dimensional barcode,is used more and more widely,in order to ensure the accuracy of the recognition of two-dimensional barcode,the recognition algorithms should be learned.Using an ordinary camera equipment, a PDF417 barcode image can be got with a lot of noise points,through the image processing which is realized by the MATLAB, the source code of the image can be got.During the process,different algorithms such as filtering ,stratifing can be reduced to ensure the accuracy of the image decoding,and a series of problems which are caused by external disturbance such as image distortion,noise,motion artifacts can be reduced too.
【Key words】Two-dimensional barcode; Signal processing; PDF417; MATLAB; Recognition algorithm
0 引言
自20世紀(jì)中葉起,條形碼技術(shù)就開始發(fā)展起來了,它是實(shí)現(xiàn)信息自動采集和輸入的重要技術(shù)。雖然條形碼出現(xiàn)得比較早,但是它卻在近二十年得到實(shí)際應(yīng)用和迅速發(fā)展,即便這樣,它已經(jīng)成為人們信息化建設(shè)中不可或缺的一部分了,與此同時(shí),它也在不斷滲透到各個(gè)領(lǐng)域。在幾十年的發(fā)展中,條形碼的符號表示已經(jīng)由一維條形碼發(fā)展到了二維條形碼。二維條碼一直在用于儲存信息,它在美國、日本等很多國家都有了比較廣泛的應(yīng)用。目前,常見的二維條形碼被分成兩種。有一種條碼是層疊式的條形碼,它繼承了一維條形碼的一些功能,因此它們的閱讀設(shè)備和條碼印刷設(shè)備可共用,雖然這種二維條形碼是建立在一維條形碼基礎(chǔ)上的,但也增加了不少難度,需要一定的判定。另一種是二維條碼是矩陣式的,它是通過黑色和白色的像素點(diǎn)在圖像中的不同空間位置來確定二維條形碼的含義。日常生活中見的比較多的是QR Code這種矩陣式二維碼。另一種二維條碼的典型代表是PDF417碼,本就圍繞PDF417碼展開的。
1 PDF417碼的技術(shù)標(biāo)準(zhǔn)
PDF417碼的每一個(gè)符號字符都是由4個(gè)條和4個(gè)空構(gòu)成,如果將組成條形碼的最窄條或空稱為模塊,也就是后面所說的最小單位模塊,則上述的4個(gè)條和4個(gè)空的總模塊數(shù)必須為17,因此也稱它為417碼[1]。
PDF417條形碼在結(jié)構(gòu)上從左往右依次是左側(cè)空白區(qū),起始符(條空組合序列為81111113),左行指示符號、數(shù)據(jù)符號、右行指示符號、終止符(條空組合序列為711311121)、右側(cè)空白區(qū)[1]。從上往下依次是上空白區(qū)、符號區(qū)、下空白區(qū),如圖1所示。
2 條碼識別的流程
對PDF417條形碼解碼的過程主要是包括條碼圖像預(yù)處理(矯正、濾波等)、條碼分層、求取單位模塊寬度、求取各條空相對于最小模塊寬度的比值等。在圖像攝入之后,首先要對其作相應(yīng)的預(yù)處理,在此之后,要對堆疊式的PDF417碼進(jìn)行分層,然后在分別計(jì)算每一層條碼中條空寬度,最后完成原PDF417條碼源代碼的實(shí)現(xiàn)。流程圖如下圖2所示。
3 攝入圖像的預(yù)處理
3.1 圖像的采集
用手機(jī)對PDF417條形碼進(jìn)行采集,得到一幅干擾比較大的圖像,如圖3所示,在這個(gè)圖像中,有很多椒鹽噪聲,角度也存在一些偏差。
3.2 灰度化及二值化
對原圖像做處理,首先必須將其灰度化,在MATLAB中,每一個(gè)灰度圖像就是一個(gè)數(shù)據(jù)矩陣,其中矩陣中的每個(gè)數(shù)據(jù)都表示該點(diǎn)的顏色灰度值,轉(zhuǎn)換后的圖像如下圖4所示。
為了方便以后的計(jì)算,需將灰度圖像轉(zhuǎn)換為二值圖像,值域是[0,1]。其中,系統(tǒng)默認(rèn)的閾值level是由函數(shù)graythresh()計(jì)算得到的[1]?;叶然蟮亩祷瘓D像如圖5所示。
可以看到,經(jīng)過閾值分割后,圖像更加清晰明了,也消除了不少干擾,其中就包括對部分偽影的消除,但是還是存在一些干擾。
3.3 圖像矯正
在研究圖像的過程中,攝入圖像僅存在一點(diǎn)旋轉(zhuǎn)畸變,本文主要是針對這種情況進(jìn)行討論。這里在有干擾的情況下,常用的方法是Hough變換法。它主要是在圖像空間和參數(shù)空間建立起一個(gè)“線-點(diǎn)”的對應(yīng)關(guān)系,在下圖6中,直線l與坐標(biāo)原點(diǎn)的距離為ρ,它的方向角為θ,它們的關(guān)系如公式(1)所示。
ρ=xsinθ+ycosθ(1)
在做旋轉(zhuǎn)矯正時(shí),首先要對圖像做邊緣檢測,然后才能用Hough變換計(jì)算得到圖像的偏轉(zhuǎn)角度。邊緣檢測常見的有sobel、prewitt算子,這兩種算子的原理是相近的,只是適用情況略有差別,在旋轉(zhuǎn)中,本文使用了雙線性差值來進(jìn)行運(yùn)算,極大地避免圖像的失真,矯正后的結(jié)果如下圖7所示。
4 二維條碼源代碼的實(shí)現(xiàn)
首先采用采用數(shù)學(xué)的方法計(jì)算各層的起始坐標(biāo)對圖像分層,分層處理后,應(yīng)對求取每一層的源代碼。首先應(yīng)該求得每層條和空的坐標(biāo),計(jì)算得到每個(gè)條或空的寬度。因?yàn)镸ATLAB中最小計(jì)數(shù)單位為1,而當(dāng)出現(xiàn)一個(gè)噪聲點(diǎn)時(shí),所得的數(shù)值就會加1。這里主要是通過縱向投影對像素為0的點(diǎn)的累積來進(jìn)行計(jì)算。通過對投影值做了重新修改,在判斷條空時(shí),便可以通過對非0值與0值交界點(diǎn)的記錄從而實(shí)現(xiàn)對條和空的坐標(biāo)的記錄,依次對每一層代碼作上述處理,最后可以獲得一個(gè)大矩陣,里面儲存的是整個(gè)PDF417條碼的各個(gè)模塊的寬度,結(jié)果如下表1所示。
按照PDF417的編碼原理,在解碼時(shí)應(yīng)該求取單位模塊寬度,進(jìn)而求取每個(gè)條空的與最小單位模塊的倍數(shù)關(guān)系,得到條碼圖像的源代碼。根據(jù)已求得各個(gè)條空的實(shí)際寬度,又因?yàn)镻DF417碼的每一符號字符都是由四個(gè)條和四個(gè)空構(gòu)成,上述的四個(gè)條和四個(gè)空的總模塊數(shù)必須為17,所以可以利用總模塊數(shù)固定這一特點(diǎn),通過各條空占總寬度的比例關(guān)系從而確定各符號字符的代碼,再通過對數(shù)據(jù)整理之后便可初步得到源代碼,處理后效果如表2所示。
因?yàn)镻DF417碼的起始符和終止符分別為‘31111118和‘121113117,對照上表,基本沒有誤差,通過對照正確代碼后,可以發(fā)現(xiàn)這樣計(jì)算得到的代碼準(zhǔn)確率高、誤差率小。
【參考文獻(xiàn)】
[1]中華人民共和國國家標(biāo)準(zhǔn)四一七條碼(417 Bar code)[S]. 國家技術(shù)監(jiān)督局,1997.
[2]章毓晉.圖像處理和分析[M].北京:清華大學(xué)出版社,1998.
[3]劉寧鐘,楊靜宇.基于波形分析的二維條碼識別[J].計(jì)算機(jī)研究與發(fā)展,2004,41(3):463-469.
[4]謝金龍.條碼技術(shù)及應(yīng)用[M].北京:電子工業(yè)出版社,2009.
[5]黨春,段汕.PDF417條碼編碼算法的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與科學(xué),2007.
[6]劉志海,曾慶良,朱由鋒,等.條形碼技術(shù)與程序設(shè)計(jì)[M].北京:清華大學(xué)出版社,2009.
[7]朱習(xí)軍,隋思漣,張賓,劉尊年,等.MATLAB在信號與圖像處理中的應(yīng)用[M].北京:電子工業(yè)出版社,2009.
[8]Marr D.Hildrcth E.Theory of edge etection[M].Proc.RoyalSoc.Lodon,1980,207(1):87-217.
[9]Ostu N,A threshold selection method from gray level histogram[J]. IEEE Trans System,Man and Cybernetics,1979(1):62-66.
[10]Pamer Roger C.The Bar Code Book [M].America.Imers Publishing Inc.1991.
[責(zé)任編輯:湯靜]