呂宇琛 王健慶
摘要:目的? 通過對方向梯度直方圖(HOG)、局部二值模式(LBP)等特征提取及融合的方法研究,實現(xiàn)有效的中藥飲片圖像識別。方法? 分析HOG和LBP特征,進(jìn)行特征融合,采取支持向量機(SVM)分類算法,在采集整理的中藥飲片圖像數(shù)據(jù)集基礎(chǔ)上對算法進(jìn)行訓(xùn)練、測試和改進(jìn),從而獲得有效的中藥飲片多分類模型,并將模型與其他算法進(jìn)行比較,評價算法的有效性。結(jié)果? 通過對30種中藥飲片2927張圖像的訓(xùn)練和測試,等價模式下的HOG-LBP融合特征算法的飲片圖像識別率達(dá)91.16%,優(yōu)于傳統(tǒng)算法。結(jié)論? 等價模式下HOG-LBP融合特征結(jié)合SVM分類器的方法具有較高的識別率,可有效應(yīng)用于中藥飲片的識別和分類。進(jìn)一步提高數(shù)據(jù)種類和數(shù)據(jù)量,有助于提高算法的適用性和識別效果。
關(guān)鍵詞:中藥飲片;圖像識別;特征提取;方向梯度直方圖;局部二值模式
中圖分類號:R286.0;R2-05? ? 文獻(xiàn)標(biāo)識碼:A? ? 文章編號:1005-5304(2019)04-0106-05
藥材識別是中藥配方及飲片研究的關(guān)鍵技術(shù)之一,可用于中藥鑒定、分類識別、質(zhì)量品質(zhì)統(tǒng)計等領(lǐng)域,對臨床應(yīng)用研究起重要作用,借助計算機及人工智能技術(shù)的識別研究具有較好前景和潛在經(jīng)濟(jì)價值。通過計算機輔助手段對中藥飲片進(jìn)行分類識別,基于機器學(xué)習(xí)的圖像識別是最為有效和快捷的方法,特征提取是其核心技術(shù)之一。目前中藥飲片圖像識別研究尚未廣泛開展,主要采取顏色特征[1-2]、形狀特征[3-4]等,但識別效率尚不理想,無法實現(xiàn)實用的樣本分類。
在圖像特征描述中,局部二值模式(LBP)[5]計算較簡單,對圖像局部特征描述較好,但單獨使用對特征提取不完整。方向梯度直方圖(HOG)特征[6]通過計算梯度和方向的邊緣密度,可較好描述局部目標(biāo)邊緣和形狀信息。由于其對圖像幾何和光學(xué)變化可保持良好的不變性,被大量應(yīng)用于多種物體的分類[7-8]。本研究針對HOG和LBP特征描述子各自的特點和優(yōu)勢,根據(jù)中藥飲片識別對邊緣輪廓和局部紋理信息的要求,通過融合HOG和LBP特征的方法提取中藥飲片圖像特征,并采用LIBSVM軟件分類器進(jìn)行圖像分類,從而實現(xiàn)中藥飲片圖像的有效識別。
1? 特征提取
1.1? 方向梯度直方圖特征提取
本研究采用常用的30種中藥飲片,其HOG局部特征分布效果見圖1。
1.3? 特征融合
HOG特征對圖像幾何和光學(xué)的形狀保持良好的不變性,單獨使用HOG特征,能有效提取圖像邊緣局部紋理特征,但對非邊緣主體部分及一些易混淆的邊緣部分很難進(jìn)行識別。而某些中藥飲片圖像主要的區(qū)別存在于細(xì)微的紋理特征上。
針對HOG特征在描述局部紋理特征不足的問題,根據(jù)LBP局部紋理描述較好的特性,本研究采用HOG融合LBP的方法,以更好描述圖像的整體和局部特征。通過將HOG特征向量與LBP特征向量進(jìn)行串聯(lián),形成新的局部特征紋理描述。
(12)
2? 分類器
支持向量機(SVM)是一種有監(jiān)督的學(xué)習(xí)模型,可實現(xiàn)多分類問題[9]。本研究采用LIBSVM軟件訓(xùn)練器,選用C_SVC訓(xùn)練模型以及線性分類算子,將樣本及對應(yīng)的標(biāo)簽導(dǎo)入LIBSVM分類器,查找最優(yōu)超平面。操作步驟:
①建立訓(xùn)練樣本集合。設(shè)置樣本數(shù)據(jù)空間,導(dǎo)入樣本,設(shè)置樣本類名及相應(yīng)的標(biāo)簽。本實驗中設(shè)置標(biāo)簽共30類。②設(shè)置相關(guān)訓(xùn)練參數(shù)。選擇LIBSVM訓(xùn)練的模型為C_SVC,以及核函數(shù)為線性分類算子。③根據(jù)訓(xùn)練樣本對SVM進(jìn)行訓(xùn)練。其中,對1477個訓(xùn)練樣本數(shù)據(jù)的支持向量數(shù)為1364個。④輸出訓(xùn)練模型。在訓(xùn)練模型的核函數(shù)中,degree值為3 801 155,gamma值為1.6912e-306,coef0值為1.2906e-306。
3? 結(jié)果與分析
3.1? 實驗數(shù)據(jù)
實驗所用數(shù)據(jù)為阿膠珠、薜荔果、炒稻芽、炒牛膝、川貝母、大棗、牡丹皮、麩炒白芍、茯苓、覆盆子、枸杞子、花椒、淮小麥、蓮子、蜜麩僵蠶、牽牛子、全蝎、山香圓葉、升麻、水飛薊、水紅花子、天麻、溫山藥、烏梢蛇、鹽杜仲、薏苡仁、郁金、制何首烏、制吳茱萸及制遠(yuǎn)志30種常用中藥飲片圖像,均為RGB模式下的jpg格式圖像,見圖2。
3.2? 實驗分析
實驗測試了[等價模式(uniform)]LBP+HOG+[線性(linear)]SVM、[旋轉(zhuǎn)不變模式(rotation- invariant)] LBP+HOG+(linear)SVM、(uniform rotation–invariant) LBP+HOG+(linear)SVM、(uniform)LBP+(linear)SVM、HOG+(linear)SVM、(3層金字塔)PHOG[24]+(linear) SVM共6種不同的方法。
6組識別算法實驗結(jié)果見圖3,所采用的維度、訓(xùn)練時間、檢測時間以及樣本識別率見表2。實驗結(jié)果表明,單獨使用HOG特征對訓(xùn)練集識別率較高,但對測試集識別率較低,特別對易混淆樣本區(qū)分度較差。通過對LBP 3種模式的識別率比較可知,提取的LBP特征模式主要分布在等價模式中,且中藥飲片圖像沒有明顯旋轉(zhuǎn)現(xiàn)象。綜合識別時間和識別率,與其他方法比較,采用HOG特征描述子融合等價模式下的LBP特征描述子識別率為91.16%,識別效果更優(yōu)。
研究發(fā)現(xiàn),實驗樣本數(shù)量的增加,有助于提高識別率。本研究側(cè)重在3000樣本數(shù)量級對中藥飲片圖像進(jìn)行識別。訓(xùn)練樣本比率為50%時,樣本數(shù)量級對圖像識別率的影響見圖4。
根據(jù)不同中藥飲片的形狀及紋理特征,本研究將30種中藥飲片分成段、顆粒、塊、切片、枝葉5類進(jìn)行分析研究。各類別飲片識別率見表3。研究發(fā)現(xiàn),段、塊類的飲片識別率較低,主要由于此類飲片紋理差異較大,不同樣本間特征呈多樣化。而枝葉和顆粒種類的飲片識別率較高,由于此類飲片共同紋理特征較多,特征比較單一。
50%訓(xùn)練樣本下30種中藥樣本的識別率見表4。其中山香圓葉的識別率最低,由于此類飲片呈不同的折疊破碎狀,部分局部紋理在炮制過程中被破壞,對圖像識別造成了較大影響。展平樣本有助于提高識別精度,但不利于自動化操作。在訓(xùn)練樣本的預(yù)測模型中,1364個有效的支持向量數(shù)據(jù)均不位于類域之間的邊界上。提示各類中藥飲片提取出的特征存在共性。
4? 小結(jié)
近年來,圖像識別技術(shù)已逐步應(yīng)用于中醫(yī)藥領(lǐng)域[10],極大推動了中醫(yī)藥客觀化、標(biāo)準(zhǔn)化相關(guān)研究。采用模式識別方法不僅可提高中藥飲片識別自動化程度及分類識別的穩(wěn)定性,還能確保統(tǒng)一的分類結(jié)果,避免人工方法導(dǎo)致的分類結(jié)果不一致。實驗表明,HOG特征對樣本局部紋理特征描述不足而導(dǎo)致易混淆飲片的識別不理想,LBP可有效反映局部紋理特征,但對特征提取不完整。因此,融合的HOG-LBP特征相較于單獨特征方法,在識別率方面有了較大提高。今后研究可通過進(jìn)一步提高樣本的種類和數(shù)量,排除樣本的偶然性,以提高模型適應(yīng)性和算法的泛化性。同時,繼續(xù)深入研究特征提取,以進(jìn)一步提高識別率,并研究挖掘其更深層次的應(yīng)用價值。
參考文獻(xiàn):
[1] YONG R, HUANG T S, CHANG S F. Image retrieval:current techniques, promising directions, and open issues[J]. Journal of Visual Communication and Image Representation,2015,10(1):39-62.
[2] 木拉提·哈米提,員偉康,嚴(yán)傳波,等.基于顏色直方圖的新疆維吾爾醫(yī)藥材圖像特征提取與判別分析[J].生物醫(yī)學(xué)工程學(xué)雜志,2015,32(3):588-593.
[3] 李震.中藥飲片特征提取和識別系統(tǒng)[D].哈爾濱:哈爾濱工業(yè)大學(xué), 2013.
[4] 黃道,何晉,劉志愿,等.組合分類器算法bagging和adaboostM1在中草藥分類的研究[J].中國新通信,2014,16(4):21.
[5] OJALA T, PIETIKAINEN M, MAENPAA T. Gray scale and rotation invariant texture classification with local binary patterns[J]. European Conference on Computer Vision,2000,24(7):404-420.
[6] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[J]. Computer Vision and Pattern Recognition,2005, 1(12):886-893.
[7] 胡仕玲,顧爽,陳啟軍.基于HOG的物體分類方法[J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2011,39(S2):124-126.
[8] MARCOS J, FERN?NDEZ R. Computer vision for pedestrian detection using Histograms of Oriented Gradient[D]. Boston:Massachusetts Institute of Technology,2014.
[9] FLACH P A. On the state of the art in machine learning:A personal review[J]. Artificial Intelligence,2001,131(1):199-222.
[10] 陳夢竹,岑翼剛,許家佗,等.基于圖像處理的望診面色自動識別研究[J].中國中醫(yī)藥信息雜志,2018,25(12):97-101.
(收稿日期:2018-03-20)
(修回日期:2019-02-16;編輯:向宇雁)