孫翹楚,肖創(chuàng)柏,郭 犇,蘇 峰
(1.北京工業(yè)大學(xué)計算機學(xué)院,北京100124,sunqiaochu@hotmail.com;2.中國農(nóng)業(yè)銀行總行軟件開發(fā)中心,北京100073)
近年來,紅外光譜技術(shù)在食品鑒別方面的應(yīng)用研究發(fā)展迅速.紅外光譜技術(shù)的優(yōu)勢在于樣品幾乎不需要分離處理,從而使得鑒別過程更加迅速[1].同時根據(jù)樣品成分的紅外吸收率,紅外光譜技術(shù)能夠提供整體信息來鑒別樣品.紅外光譜根據(jù)不同的波數(shù)范圍分為近紅外(12 900~4 000 cm-1)、中紅外區(qū)(4 000~650 cm-1)和遠紅外區(qū)(650~10 cm-1)3個光區(qū).其中,中紅外區(qū)是應(yīng)用最早和最廣的一個區(qū),大多數(shù)有機化合物和無機離子的基頻振動吸收都落在中紅外區(qū)內(nèi).化合物分子中所含的化學(xué)鍵或官能團不同,或官能團所處的化學(xué)環(huán)境不同,其振動能級從基態(tài)躍遷到激發(fā)態(tài)所需能量不同會吸收不同波長的紅外光,形成不同的紅外光譜圖,而相關(guān)吸收峰的高度與其含量成正比.因此,紅外光譜法被廣泛用于有機物的定性和定量研究.由于傅里葉變換紅外光譜法(Fourier transform infrared spectroscopy,F(xiàn)TIR)具有整體、快速、無損鑒定復(fù)雜體系多種組份的特點,目前己在食品鑒別領(lǐng)域獲得了廣泛應(yīng)用[2-3].
劉沭華等[4]通過對幾種中藥的傅里葉變換紅外光譜進行求一階導(dǎo)數(shù)對其進行區(qū)分.但是在本文初期實驗中,這種方法并不適合食用植物油的紅外光譜.對其求一階導(dǎo)數(shù)并不足以對其區(qū)分.同時對各個光譜的指紋區(qū)進行了積分操作,提取的特征差別細微,不足以作為區(qū)分的標(biāo)準.賈素貞等[5]通過對幾種食用植物油的二維傅里葉變換紅外光譜進行特征提取,對其進行區(qū)分.這種方法可以很好的放大一維光譜的差異,但是計算復(fù)雜,對設(shè)備要求較高.本文提出一種利用分形理論提取食用植物油紅外光譜特征的算法,將此作為一種主要特征引入食用油紅外光譜模式識別中,在實驗中取得了較好效果.
分形學(xué)的概念的實質(zhì)是除傳統(tǒng)幾何學(xué)以外的不規(guī)則幾何體在標(biāo)度變換下的自相似性.
若F是分形集,則其應(yīng)具有以下性質(zhì)[6]:
1)F具有精細結(jié)構(gòu),即有任意小比例細節(jié);
2)F極不規(guī)則,以致其整體與局部都無法用傳統(tǒng)幾何語言描述;
3)F通常具有某種自相似性;
4)F的分形維數(shù)大于其拓撲維數(shù);
5)F可以用非常簡單的方法定義,可以由迭代產(chǎn)生.
一般而言若研究對象符合上述性質(zhì)中的全部或大多數(shù),即使有某個性質(zhì)例外,也并不影響稱其為分形.
計盒維數(shù)或稱盒維數(shù)(Box-counting or Box dimension)是應(yīng)用最廣泛的維數(shù)之一,它的普遍應(yīng)用主要由于這種盒維數(shù)的數(shù)學(xué)計算以及經(jīng)驗估計相對容易.
盒維數(shù)的定義為:設(shè)F為Rn中任一非空子集,記N(F,δ)表示最大直徑為δ且能覆蓋F的集合的最小數(shù),則F的上下盒維數(shù)分別定義為
如果上下維數(shù)相等,則稱這個共同的值F的計盒維數(shù)或者盒維數(shù),定義為
盒維數(shù)存在一些等價定義,有時這些定義更適合應(yīng)用.通常為以下五種[7]:
1)覆蓋F的半徑為δ的最小閉球數(shù);
2)覆蓋F的邊長為δ的最小立方塊數(shù);
3)相交于F的δ-網(wǎng)格塊數(shù);
4)覆蓋F的直徑至多為δ的最小集合數(shù);
5)球心在F中半徑為δ的互不相交球的最大數(shù).
本文利用定義(3)對紅外光譜的分形維數(shù)進行計算.
設(shè)A∈H(X),其中,(X,d)是度量空間,εn=cbn,0<b<1,c>0和n=1,2,3,….
如果
則A具有分形維數(shù)D.在式(4)中用γ代替ε,計算分形維數(shù)的公式為
故可讓ln N(A,γ)與ln γ成為一對變量,則式(5)變?yōu)?/p>
于是D(A)就成了(ln γ,ln N(A,γ))坐標(biāo)系統(tǒng)中的斜率[8].本文借以不同紅外光譜盒維數(shù)的不同,對其所代表的食用油進行區(qū)分.
紅外光譜在計算機中以圖像的格式存儲,文中使用Intel公司開發(fā)的OpenCV開源計算機視覺庫,實現(xiàn)了紅外光譜的分形維數(shù)計算.具體其分形維數(shù)計算過程如圖1所示.
圖1 紅外線光譜盒維數(shù)計算流程圖
1)首先讀入光譜圖像,對光譜圖像進行二值化處理[9].原始紅外光譜圖像為彩色圖像,進行盒維數(shù)計算時,應(yīng)先將彩色圖像轉(zhuǎn)換成二值圖像(如圖2所示).利用OpenCV的on-trackbar()函數(shù)生成滑動條,動態(tài)設(shè)定閾值,閾值的取值以能顯示全部光譜圖像為準.然后利用cvThreshold()函數(shù)將讀入圖片二值化.包含光譜的像素點值為0.
圖2 二值化后的光譜圖像(局部)及其對應(yīng)的二值數(shù)據(jù)
2)將得到的二值圖像轉(zhuǎn)存為矩陣.運用cv-Convert()函數(shù)將二值圖像轉(zhuǎn)存為與其同尺寸的矩陣I.
3)把得到的矩陣依次劃分為若干塊,每一塊的行數(shù)與列數(shù)均為 k,k取 1,2,4,…,2n,運用cvGetReal2D()函數(shù)掃描每個劃分塊,把包含像素0的塊的個數(shù)記為Nk.這樣就得到k與Nk的對應(yīng)數(shù)組B[10].
4)對數(shù)組B中的元素求對數(shù).并在雙對數(shù)坐標(biāo)平面中,以一元線性回歸用直線擬合數(shù)據(jù)點(ln k,ln Nk),k=1,2,4,…,2n,所得到的斜率的負值D就是該紅外光譜的盒維數(shù).
通過實驗發(fā)現(xiàn),分形維數(shù)的正確性與k的取值以及圖像的分辨率有關(guān).在實驗中取1,2,4,8,16,32,64,128,256,這9個值對圖像計算分形.
根據(jù)盒維數(shù)的定義,所取k的尺寸越小,所計算出的分形維數(shù)越精確.但由于對存儲在計算機中的圖像進行分形計算,只能分割到像素點尺寸.因此計算分形算法所得出的結(jié)果與實際分形維數(shù)之間存在誤差.而誤差的大小直接影響到特征提取的準確性,若計算出的誤差大于光譜分形維數(shù)的差異,則無法利用此差異對光譜進行區(qū)分.為驗證分形維數(shù)計算算法的準確性和可靠性,分別用直線、矩形、Koch曲線、Cantor三分集、Sierpinski三角墊和Sierpinski地毯等已知維度的分形圖形對算法進行驗證.結(jié)果如表1所示.
表1 分形維數(shù)計算結(jié)果
由實驗結(jié)果可知,誤差在小數(shù)點后三位到四位之間,而光譜分形維數(shù)的差異在小數(shù)點后兩位.因此,誤差不會對特征提取造成影響.
采用本文的算法,本文對市面上常見的福臨門、金龍魚、歐尚等品牌的幾種食用油的紅外光譜的分形維數(shù)進行了計算.通過對每種食用油各30個樣本的盒維數(shù)計算(抽樣結(jié)果如表2所示,其中,k為窗口大小,Nk為盒子數(shù)),可知食用油的盒維數(shù)總體在1.293 1~1.315 3之間.可利用此特征對食用油同其他液體進行區(qū)分.另外通過對玉米油和芝麻油的紅外光譜分形維數(shù)的計算得到,玉米油的紅外線光譜的分形維數(shù)在1.293 1~1.297 2之間,而芝麻油的紅外光譜分形維數(shù)在1.311 3~1.315 3之間,分形維數(shù)差別明顯,因此可利用此特征對兩種植物油的真?zhèn)芜M行鑒別.
表2 食用植物油紅外光譜盒維數(shù)計算結(jié)果
1)分形維數(shù)能有效地表現(xiàn)紅外光譜的復(fù)雜度以及自相似性特征.
2)分形維數(shù)的準確性與源圖像的分辨率有關(guān),在實驗中采用的光譜圖像分辨率為1280× 880.隨著儀器設(shè)備的不斷進步,更大分辨率的光譜圖像可以得到更為準確的分形維數(shù)特征.
3)通過引入其它特征,如譜峰高度、光譜導(dǎo)數(shù)、面積等特征,可以對其它食用油進行更好的區(qū)分.
4)通過對市面上幾種常見食用油的紅外線光譜的分形維數(shù)的計算表明,利用分形維數(shù)可以對玉米油以及芝麻油的真?zhèn)芜M行較好的區(qū)分.
[1]Van de VOORT F R,GHETLER A,GARCIA-GONZA'LEZ D L.Perspectives on quantitative mid-ftir spectroscopy in relation to edible oil and lubricant analysis:Evolution and integration of analytical methodologies[J].Food Analytical Methods,2008,3(1):153-163.
[2]MILLS B L,Van de VOORT F R,KAKUDA Y.The quantitative analysis of fat and protein in meat by transmission infrared analysis[J].Meat Science,1984,11(4):253-262.
[3]Van de VOORT F R,SEDMAN J,ISMAIL A A.A rapid FTIR quality control method for determining fat and moisture in high-fat products[J].Food Chemistry,1993,48(2):213-221.
[4]劉沭華,張學(xué)工,周群,等.近紅外漫反射光譜法和模式識別技術(shù)鑒別中藥材產(chǎn)地[J].光譜學(xué)與光譜分析,2006,26(4):629-632.
[5]賈素貞,鮑猛,聶傳平.幾種食用油的二維紅外相關(guān)分析[J].濟南大學(xué)學(xué)報,2007,21(2):124-129.
[6]BRIGGS J.Fractals:The Patterns of Chaos[M].London:Thames and Hudson,1992:148.
[7]FALCONER K.Techniques in Fractal Geometry[M].NJ,USA:John Willey and Sons,1997:59-61.
[8]張平,王新柯,李海濤,等.基于分形理論的太赫茲光譜識別[J].量子電子學(xué)報,2007,24(6):672-676.
[9]文志英.分形幾何的數(shù)學(xué)基礎(chǔ)[M].上海:上海科技教育出版社,2002.
[10]CHAUDHURI B B,SARKAR N.Texture segmentation using fractal dimension[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,17(1): 72-77.
[11]王韶娟,曾國蓀.分形維數(shù)的一個并行算法[J].計算機應(yīng)用與軟件,2005,22(10):19-20.