劉翠玲,王少敏,吳靜珠,孫曉榮
1. 北京工商大學計算機與信息工程學院,北京 100048 2. 北京工商大學食品安全大數(shù)據(jù)技術(shù)北京市重點實驗室,北京 100048
葵花籽是僅次于棕櫚、大豆、菜籽的世界第四大油料作物,其品質(zhì)的好壞對后期產(chǎn)油及相關(guān)產(chǎn)品的加工至關(guān)重要[1]。由于種植或儲存不當,葵花籽殼內(nèi)籽仁常會出現(xiàn)破損、蟲蝕、空殼等異常情況,若在榨油時選用的葵花籽存在以上異常顆粒,將影響后期出油率及生產(chǎn)油脂的品質(zhì)。因此,從源頭把控,對葵花籽內(nèi)部品質(zhì)進行檢測是很有必要的。
葵花籽異常顆粒的出現(xiàn)將會影響出油率和油脂的品質(zhì),傳統(tǒng)的檢測方法主要有人工檢驗和機器篩選,人工檢驗耗費人力,主觀性較大,可能存在漏檢等問題;機器篩選會破壞葵花籽外殼,易造成原材料污染,不利于后期貯藏加工。Ma等[2]利用可見光和近紅外區(qū)域的多光譜成像技術(shù)對葵花籽昆蟲侵染、發(fā)霉、異色、酸敗等異常情況進行了非破壞性區(qū)分,利用Fisher’s線性判別函數(shù)進行特征波長提取,結(jié)合Wilks lambda逐步法,對完好無損的葵花籽進行分類,準確率最低可達到97%;同時利用多光譜成像技術(shù)結(jié)合主成分分析聚類分析(PCA-CA),對不同酸敗程度的完整向日葵種子進行精準區(qū)分。李艷茹等[3]利用低場核磁共振技術(shù)結(jié)合主成分分析(PCA)方法對3種不同品種的葵花籽進行區(qū)分,并建立偏最小二乘回歸(PLSR)模型對3種葵花籽的含油量進行預測,實現(xiàn)了葵花籽品質(zhì)的檢測。Jayabrindha等[4]通過機器視覺技術(shù)對10個不同品種的葵花籽進行品種鑒定,利用SVM分類算法結(jié)合最佳順序級聯(lián)方法,分類準確率達到98.82%。以上研究內(nèi)容均實現(xiàn)對葵花籽品質(zhì)的檢測,但由于實驗儀器或方法的限制,均通過葵花籽的外部特征或剝除外殼后對品質(zhì)進行檢測研究,無法實現(xiàn)對葵花籽殼內(nèi)籽仁品質(zhì)的帶殼無損檢測。
太赫茲波介于紅外和微波之間,具有較低能量和較高穿透性,不會引起有害的電離反應,且對絕大部分非極性物質(zhì)有較強穿透能力,近年來在食品[5]、農(nóng)業(yè)[6]、工業(yè)[7]、醫(yī)學[8]、安檢[9]及考古[10]等檢測領(lǐng)域得到了廣泛應用。相比現(xiàn)有檢測手段,太赫茲時域光譜成像技術(shù)能在不破壞葵花籽外殼的情況下將內(nèi)部籽仁的形態(tài)以圖像的形式呈現(xiàn)出來。因此,本文利用太赫茲時域透射成像技術(shù)分別獲得帶殼葵花籽正常粒、破損粒、蟲蝕粒和空殼粒的透射圖像,再通過形態(tài)學濾波和K-均值圖像分割算法,實現(xiàn)對葵花籽殼內(nèi)籽仁品質(zhì)的帶殼無損檢測,為帶殼油料作物內(nèi)部品質(zhì)的無損檢測提供新思路。
本文選擇主要用于榨油的小油葵作為實驗對象。為檢測葵花籽常見的異常情況,選用一顆正??ㄗ裑如圖1(a)]作為參照樣本,同時參照GB/T 5494—2008《糧油檢驗 糧食、油料的雜質(zhì)、不完善粒檢驗》制備破損粒[如圖1(b),去掉葵花籽仁一部分)、蟲蝕粒(如圖1(c),籽仁邊緣挖洞]、空殼粒[如圖1(d),去掉籽仁]三類異常樣本。制備完成后將葵花籽的外殼嚴絲合縫的合并固定,使其在外觀上與正??ㄗ淹耆嗤?/p>
圖1 葵花籽樣品圖(a):正常粒;(b):破損粒;(c):蟲蝕粒;(d):空殼粒Fig.1 Sample of sunflower seeds(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
實驗儀器采用劍橋Tera View公司生產(chǎn)的太赫茲時域脈沖光譜儀,型號為TeraPulse 4000,如圖2(a)所示,成像方式為脈沖成像,可發(fā)射頻率從60 GHz到4 THz(2~133 cm-1)的太赫茲波,信噪比最高可達到70 dB。圖像數(shù)據(jù)采集部分利用太赫茲透射成像附件進行,如圖2(b)所示,其掃描范圍為20 mm×20 mm。
圖2 實驗儀器(a):太赫茲脈沖光譜儀;(b)太赫茲透射成像附件Fig.2 Experimental apparatus(a):Terahertz pulse spectrometer;(b):Terahertz transmission imaging attachment
葵花籽光譜圖像采集具體過程如下:將透射附件安裝到太赫茲時域脈沖光譜儀上,采集無樣品時的太赫茲脈沖波作為參考信號,確認信號源無誤后開始正式實驗。將樣品固定在樣品架中心位置,設(shè)置相關(guān)參數(shù)后開始采集,采集過程由TeraPulse軟件控制執(zhí)行。根據(jù)樣本大小設(shè)置合適的采樣范圍,以0.2 mm分辨率進行光譜圖像采集,采集一個完整的樣本圖像所需時間約13~14 min。圖像重構(gòu)方式選擇峰峰值成像。
太赫茲圖像含有噪聲,分辨率較低,邊緣模糊不光滑,需要對原始圖像進行相關(guān)優(yōu)化處理,保證葵花籽品質(zhì)檢測的準確性。
1.4.1 圖像濾波處理
為保留葵花籽透射圖像中的邊緣信息,選用形態(tài)學濾波器(Morphological filter)中的外部梯度[11]進行圖像濾波處理。外部梯度先對原始圖像進行一定次數(shù)的膨脹操作,再將膨脹結(jié)果與原始圖像做差,實現(xiàn)對原始圖像的濾波。
1.4.2 圖像分割算法
圖像分割方法包括基于閾值、基于區(qū)域、基于聚類及基于特定理論四大類,本研究選用基于聚類的K-均值(K-means)圖像分割算法對濾波后的葵花籽圖像進行分割。K-means算法可以實現(xiàn)類間相似度最低和類內(nèi)相似度最高[12],其基本原理[13]為:
將待分割圖像中所有像素點看作數(shù)據(jù)集合中的所有樣本點,隨機選取K個樣本點作為初始聚類中心,計算每個樣本點到各聚類中心的歐氏距離,找出其中的最小值,將該樣本點劃入該聚類中心所屬類,遍歷完所有樣本點以后,重新確定聚類中心,一般以所在區(qū)域內(nèi)樣本點的均值作為新的聚類中心;然后再次計算每個樣本點到新的聚類中心的距離,對樣本重新進行歸類,再次調(diào)整聚類中心;重復以上步驟,直到聚類中心不再改變,即當前所屬類區(qū)域內(nèi)的樣本點到該聚類中心的歐式距離平方和最小,樣本點劃分完畢,圖像分割完成。
以上數(shù)據(jù)處理過程均通過Matlab2017軟件完成。
太赫茲圖像不僅包含樣品的空間信息,也包括樣品時間軸上的信息,圖像中的每個像素點代表一條光譜。通過太赫茲透射成像附件掃描所得樣本的太赫茲圖像如圖3所示,觀察葵花籽的太赫茲圖像可發(fā)現(xiàn),葵花籽內(nèi)部籽仁的形態(tài)可初步分辨,但仍存在分辨率較低,邊緣不明確的問題。
圖3 四類葵花籽的太赫茲透射圖像(a):正常粒;(b):破損粒;(c):蟲蝕粒;(d):空殼粒Fig.3 Terahertz transmission images of four categories of sunflower seeds(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
此外,葵花籽的不同位置成像后顏色不同,以蟲蝕粒為例,對比籽仁部分和外殼部分太赫茲光譜可以發(fā)現(xiàn)有明顯區(qū)別,如圖4所示。籽仁主要成分為脂肪和蛋白質(zhì),所得太赫茲光譜曲線圖有明顯的兩個峰,并且籽仁部分相比空殼部分較厚,對太赫茲波的吸收較強,因此太赫茲信號的強度最大只達到2左右;空殼部分為干燥的木質(zhì)化外殼,對太赫茲信號吸收較少,太赫茲信號的強度最大可達到5左右。由于不同位置物質(zhì)不同,對太赫茲光的吸收強度不同,太赫茲光透射率不同,最終探測到返回的信號強度不同,使得重構(gòu)后圖像的不同位置有明顯的顏色差異。因此,通過對葵花籽的太赫茲圖像進行分析處理,實現(xiàn)對葵花籽品質(zhì)的帶殼無損檢測是可行的。
圖4 葵花籽不同位置對應的時域光譜Fig.4 Time-domain spectra corresponding to different positions of sunflower seed
為實現(xiàn)對葵花籽殼內(nèi)籽仁異常情況的檢測,需要提高圖像的對比度,同時盡可能保證邊緣信息被保留,因此首先對葵花籽太赫茲圖像進行濾波處理。圖5為采用中值濾波、均值濾波及非局部均值(non-local means,NLM)濾波對蟲蝕粒的太赫茲圖像進行濾波所得的結(jié)果,其中圖5(a)為利用5×5模板進行均值濾波所得結(jié)果,圖5(b)為5×5模板進行中值濾波的結(jié)果,圖5(c)為搜索窗口為5×5、鄰域窗口為2×2、濾波程度為10時NLM濾波結(jié)果。
圖5 蟲蝕葵花籽太赫茲圖像濾波結(jié)果圖(a):5×5模板均值濾波;(b):5×5模板中值濾波;(c):NML濾波Fig.5 Terahertz image filtering results of insect-eroded sunflower seeds(a):5×5 template mean filtering;(b):5×5 template median filtering;(c):NML filtering
圖6為采用外部梯度對葵花籽蟲蝕粒的太赫茲圖像進行濾波的結(jié)果。在利用外部梯度進行濾波時,應先考慮對原始圖像的膨脹。由膨脹的原理可知,與原始圖像進行卷積的核的選擇會直接影響濾波后圖像的質(zhì)量。觀察采集的太赫茲圖像可發(fā)現(xiàn)由于儀器精度限制和噪聲影響,圖像邊緣為鋸齒狀。為保證樣本形狀不發(fā)生巨大變化,同時使邊緣光滑,本文選擇的核為平坦型菱形結(jié)構(gòu)元素,其尺寸大小為3。同時,為確保圖像不被過度膨脹,本文只對各葵花籽的透射圖像進行一次膨脹,之后將膨脹結(jié)果與原始圖像做差,求得外部梯度。對比蟲蝕粒的外部梯度結(jié)果[如圖6(c)]和基礎(chǔ)形態(tài)學梯度結(jié)果[如圖6(d)]可發(fā)現(xiàn),外部梯度的濾波結(jié)果相比基本形態(tài)學梯度的濾波結(jié)果有明顯提升。
圖6 蟲蝕葵花籽太赫茲圖像形態(tài)學濾波結(jié)果圖(a):原始圖像;(b);一次膨脹結(jié)果;(c):外部梯度;(d):形態(tài)學梯度Fig.6 Results of morphological filtering of insect-eroded sunflower seeds terahertz image(a):Original image;(b):One dilatation result;(c):External gradient;(d):Morphological gradient
對比圖5和圖6(c)的濾波結(jié)果可以發(fā)現(xiàn),中值濾波、均值濾波及NLM濾波能很好地去除噪聲,但圖像清晰度低,邊緣部分并沒有得到很好地保留,不利于葵花籽籽仁形態(tài)的檢測。而形態(tài)學濾波明顯提升了圖像質(zhì)量,在有效去除圖像噪聲的同時,提高圖像對比度,還能準確保留圖像邊緣信息,使葵花籽與背景之間有明顯界限,其濾波結(jié)果明顯優(yōu)于中值濾波、均值濾波及NLM濾波結(jié)果。四種不同狀態(tài)的葵花籽對應的形態(tài)學濾波結(jié)果如圖7所示。
圖7 不同狀態(tài)葵花籽圖像形態(tài)學濾波結(jié)果(a):正常粒;(b):破損粒;(c):蟲蝕粒;(d):空殼粒Fig.7 Morphological filtering results of sunflower seed images with different states(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
為進一步準確識別葵花籽殼內(nèi)籽仁狀態(tài),本文采用K-means聚類算法對濾波后的太赫茲圖像進行圖像分割。經(jīng)形態(tài)學濾波后的太赫茲圖像是RGB圖像,構(gòu)成的是一種非均勻顏色空間,用歐氏距離難以測量出顏色之間的特征差異,影響分割效果。而CIE(Commission Internationale de L’Eclairage,國際照明委員會)-Lab顏色空間是一種均勻的顏色空間[14],在該顏色空間中,歐氏距離測量不同顏色之間差異性時具有不變性,即顏色相近的像素點其歐氏距離相應較小,顏色差異較大的其對應歐氏距離也較大[15]。因此,為使圖像分割結(jié)果準確,先將濾波后的太赫茲圖像轉(zhuǎn)換到Lab顏色空間再進行分割。
K-means聚類算法是一種無導師監(jiān)督的學習算法,初始聚類中心個數(shù)K的選擇直接影響圖像分割結(jié)果。本文針對籽仁的不同狀態(tài)確定各葵花籽圖像的初始聚類中心個數(shù)K如下:破損粒K=4,蟲蝕粒K=5,空殼粒K=3、正常粒K=4。確定初始聚類中心的個數(shù)后,設(shè)置最大迭代次數(shù)為500次,即可對不同狀態(tài)的葵花籽圖像進行分割,結(jié)果如圖8所示。
由圖8可看出,空殼粒圖像分割結(jié)果[圖8(d)]最好,能迅速準確的判斷殼內(nèi)無籽仁;正常粒[圖8(a)]、破損粒[圖8(b)]及蟲蝕粒[圖8(c)]的分割結(jié)果能將葵花籽籽仁部分劃分為一個類,但籽仁的最中間部分被分割到與背景同類,分析其原因是由于葵花籽籽仁的最中間位置沒有邊緣部分緊實,透過的太赫茲光強度相對較大,成像后的顏色經(jīng)形態(tài)學濾波后與背景顏色接近,故而在圖像分割時與背景歸為一類,但最終的圖像分割結(jié)果并未影響對葵花籽籽仁形態(tài)的判定。因此,盡管存在一些小的噪聲類,但K-means分割算法仍能準確呈現(xiàn)葵花籽殼內(nèi)籽仁的形態(tài),實現(xiàn)對葵花籽品質(zhì)的無損檢測。
圖8 不同狀態(tài)葵花籽圖像K-means圖像分割結(jié)果(a):正常粒;(b):破損粒;(c):蟲蝕粒;(d):空殼粒Fig.8 K-means image segmentation results of sunflower seed images with different states(a):Normal seed;(b):Damaged kernel;(c):Worm-eaten kernel;(d):Empty seed
利用太赫茲時域透射成像技術(shù)分別獲得正常飽滿的葵花籽和籽仁破損、蟲蝕、缺失三種異常情況下葵花籽的太赫茲圖像,利用形態(tài)學濾波中的外部梯度對葵花籽太赫茲圖像進行濾波處理,在提高圖像清晰度的同時,保證了樣品的形狀及邊緣信息不被改變或模糊。此外,結(jié)合K-means圖像分割算法對濾波后圖像進行分割,提高了對葵花籽殼內(nèi)籽仁形態(tài)的檢測準確性。實驗結(jié)果表明,相比傳統(tǒng)檢測方法費時費力,易造成原材料污染等缺點,太赫茲時域透射成像技術(shù)可以在不破壞葵花籽外殼的情況下將殼內(nèi)籽仁的形態(tài)以圖像的形式直觀呈現(xiàn),結(jié)合形態(tài)學濾波算法及K-means圖像分割算法,能夠?qū)ㄗ褮?nèi)籽仁的品質(zhì)實現(xiàn)快速無損綠色檢測,為建立基于太赫茲時域光譜圖像的葵花籽品質(zhì)檢測模型奠定基礎(chǔ),為油料作物內(nèi)部品質(zhì)的帶殼無損檢測提供新的方法參考。