曾 輝,沈紅巖,張寶文,陶 佳*,董秀秀
(1.保定市植保植檢站,河北 保定 071000;2.河北農(nóng)業(yè)大學(xué),河北 保定 071000;3.廣平縣農(nóng)牧局,河北 廣平 057650)
傳統(tǒng)的中草藥分類與質(zhì)量評估涉及到性狀鑒別和顯微鑒別,鑒別方式過于主觀,且鑒別效率偏低,無法滿足中醫(yī)中藥產(chǎn)業(yè)化發(fā)展的客觀需求[1-3]。如何對中草藥進(jìn)行準(zhǔn)確、高效的鑒別是目前亟待解決的問題和研究熱點(diǎn)。以中草藥中的藤莖類為研究對象,采用圖像識(shí)別算法及改進(jìn)K近鄰法,實(shí)現(xiàn)了比較準(zhǔn)確的圖像鑒別。
選取中麻黃、木通、雞血藤、北沙參、夜交藤和小薊6種類別的中草藥作為研究對象,每種中草藥在中草藥圖像數(shù)據(jù)庫中隨機(jī)選取圖片(尺寸為960×960 dpi)10幅,并將所取圖片等份分割為96×96 dpi,最終得到圖片100幅(圖1)。用以試驗(yàn)。
圖1 部分中草藥圖片切割后的待識(shí)別圖像Fig.1 The segmented images of some Chinese herbal medicines needed to be identified
隨機(jī)選取50幅用于對算法進(jìn)行訓(xùn)練,剩余的50幅作為測試集。對所有的樣本先以顏色直方圖進(jìn)行初步的分類,設(shè)置不同的K值(1-10)進(jìn)行分類,考察不同情況下的識(shí)別率,驗(yàn)證算法的效果。
1.2.1 傳統(tǒng)方法——局部二值模式方法
1.2.1.1 顯微圖像顏色特征提取。選取基于HSV的模型對藤類橫切面顯微圖像的顏色特征進(jìn)行描述和提取。結(jié)合人類視覺的生理特點(diǎn),將H、S、V空間進(jìn)行劃分,構(gòu)建基于HSV空間的一維顏色直方圖,把H、S、V三維空間轉(zhuǎn)換為一維矢量。
1.2.1.2 顯微圖像紋理特征提取。運(yùn)用局部二值模式方法[4]對紋理特征進(jìn)行提取。將目標(biāo)圖像鄰域點(diǎn)灰度值間的關(guān)系加入進(jìn)來。在對目標(biāo)圖像的窗口中心像素進(jìn)行灰度比較之前,把位于窗口左上方位置的像素,以順時(shí)針為序與相鄰像素比較灰度值,以局部二值模式的方法對所有的相鄰像素進(jìn)行二值化;當(dāng)結(jié)束一輪比較之后,會(huì)得到比較結(jié)果,即0、1序列值;對這些0、1序列值進(jìn)行編碼,將中心點(diǎn)周圍的鄰域點(diǎn)考慮進(jìn)來。將優(yōu)化后的局部二值模式取得的目標(biāo)圖像特征,與基于傳統(tǒng)模式的紋理特征像相互結(jié)合,作為目標(biāo)圖像的最終特征。
1.2.1.3 中草藥鑒別。結(jié)合所提取的顏色特征和紋理特征,對中草藥截面切片顯微圖像進(jìn)行鑒別。由于Chi平方統(tǒng)計(jì)法對訓(xùn)練樣本的數(shù)目要求較低,本研究最終選擇該方法對相似性度量進(jìn)行描述。
1.2.2 改良方法——改進(jìn)K近鄰法基于改進(jìn)K近鄰法[5]的分類識(shí)別。由于K近鄰法效率和準(zhǔn)確率均較高,所以,引入K近鄰法對圖像進(jìn)行分類識(shí)別。根據(jù)研究內(nèi)容的特點(diǎn),本研究將最短距離引入到K近鄰法中,對最優(yōu)解進(jìn)行整體判斷。當(dāng)K近鄰法獲取的K個(gè)成員中存在若干票數(shù)相同者(多優(yōu)解),則以距離最小的成員作為最優(yōu)解,為該成員賦予更高的權(quán)重,相應(yīng)減少距離最大的成員權(quán)重。具體的處理流程為:(1)提取基于K近鄰法的分類最優(yōu)解;(2)判斷該最優(yōu)解是否為唯一解,如果是,將其作為最優(yōu)解,算法結(jié)束;(3)在最優(yōu)解中選擇距離最小的最優(yōu)解,為其權(quán)重值加1;(4)在最優(yōu)解中選擇距離最大的最優(yōu)解,為其權(quán)重值減1;(5)循環(huán)(3)—(4),為所有的多優(yōu)解排序,選擇距離最小(權(quán)重最大)的解作為最優(yōu)解。
1.2.3 結(jié)果驗(yàn)證 結(jié)合訓(xùn)練集與測試集,驗(yàn)證本算法在中草藥橫截面顯微圖像識(shí)別方面的具體性能。實(shí)驗(yàn)環(huán)境為戴爾 OptiPlex,3.0G PIV CPU,4GB RAM,Windows8操作系統(tǒng),MATLAB 7.10.0。
運(yùn)用傳統(tǒng)與改進(jìn)2種方法對樣本進(jìn)行識(shí)別顯示(表1),K值沂[5,50],改進(jìn)K近鄰法的分辨率最高為96% ,且均不低于局部二值模式法。究其原因,傳統(tǒng)的局部二值模式法主要考慮的是中心點(diǎn)和領(lǐng)域的灰度關(guān)系,并未考慮領(lǐng)域像素的分布差異,因而未能完善地體現(xiàn)出目標(biāo)圖像的全部紋理特征,降低了算法的性能;改進(jìn)K近鄰法在傳統(tǒng)算法基礎(chǔ)上,增加了對于鄰域點(diǎn)間關(guān)系的描述,從而能夠包含目標(biāo)圖像更多的紋理特征,保留了更多的有用信息,在圖像分類中取得了更好的效果。
表1 不同K值及不同算法在識(shí)別率和識(shí)別時(shí)間上的對比Table 1 Comparison of different algorithms and K values in recognition rate and time
結(jié)合中草藥圖像識(shí)別的需求,提出了綜合考慮目標(biāo)圖像顏色特征和紋理特征的識(shí)別方法。針對紋理特征對于旋轉(zhuǎn)不變性的要求,以改進(jìn)的二值模式算法實(shí)現(xiàn)特征的提取。改進(jìn)了傳統(tǒng)K近鄰分類法,使之避免陷入多個(gè)最優(yōu)解,通過實(shí)驗(yàn)給出了較理想的K值。最后通過實(shí)驗(yàn)驗(yàn)證了本文算法的性能提升。本研究成果能夠?yàn)橹胁菟幮畔⒒ㄔO(shè)和發(fā)展提供智能支持。