陳昱辰 , 曾令超 , 張秀妹 , 鐘廣澤
(廣東白云學(xué)院,廣東 廣州 510450)
隨著人們生活水平的提高,對于生活垃圾的有效處理和相關(guān)高價(jià)值廢品的回收再利用,已日益成為社會(huì)關(guān)注的焦點(diǎn)。目前,生活垃圾多由環(huán)衛(wèi)工人手動(dòng)分揀,工作強(qiáng)度大、效率低而且嚴(yán)重危害環(huán)衛(wèi)工人身體健康[1]。雖然有用于分類的垃圾回收裝置,但是要求丟棄者進(jìn)行預(yù)分類且相關(guān)人員需具有很高的環(huán)保分類知識(shí),垃圾分類在社會(huì)上推廣受到一定的限制。
在垃圾識(shí)別和圖像分類方面,學(xué)者們進(jìn)行了大量的研究。吳健等[2]利用顏色和紋理特征,初步完成了垃圾分類,但由于不同數(shù)據(jù)集的圖像背景、尺寸、質(zhì)量不盡相同,傳統(tǒng)算法需要根據(jù)相應(yīng)數(shù)據(jù)人工提取不同的特征,算法的魯棒性較差,并且處理方式復(fù)雜,所需時(shí)間較長,無法達(dá)到實(shí)時(shí)分類的效果。在非公開數(shù)據(jù)集方面,Mittal等[3]利用2 561張的垃圾圖片數(shù)據(jù)集GINI,使用GarbNet模型,得到了87.69%的準(zhǔn)確率。不過由于相同類別垃圾的特征表征差異性較大,不僅增加了樣本的收集量,還無法確保準(zhǔn)確率。莫卓亞等[4]通過圖片的采集、模型的訓(xùn)練,初步實(shí)現(xiàn)了垃圾分類的識(shí)別。然而由于模型對預(yù)測圖片明暗色彩過度依賴,導(dǎo)致不同場景的圖片有些識(shí)別效果好,有些識(shí)別效果差。
針對目前垃圾識(shí)別和圖像分類精準(zhǔn)度、效率上存在的不足,課題組設(shè)計(jì)了基于LBP特征的級(jí)聯(lián)分類器對果皮和有害垃圾進(jìn)行識(shí)別,這種基于LBP特征的級(jí)聯(lián)分類器具有識(shí)別精度、效率較高的特點(diǎn)[5],并采用紋理描述算法對果皮和有害垃圾特征進(jìn)行提取的方法[6],最終實(shí)現(xiàn)對果皮和有害垃圾快速取樣識(shí)別。
LBP編碼算法是常見的紋理描述符算法[7],它根據(jù)圖像的n×n鄰域中,中心位置的像素值為閾值,將圖像的像素值轉(zhuǎn)換成一個(gè)二進(jìn)制數(shù)字。例如,在3×3的鄰域中,編碼后的像素值是根據(jù)閾值(對應(yīng)的原像素值)以及其相鄰的8個(gè)像素值決定的。編碼前需要將3×3區(qū)域的rgb像素值轉(zhuǎn)化為灰度值,并將其與相鄰點(diǎn)灰度值進(jìn)行比較,如果大于閾值為0,否則為1,最終得到由0和1組成的集合,最后沿圓周順時(shí)針追蹤像素,得到一個(gè)8位數(shù)的二進(jìn)制值,作為該點(diǎn)的像素值。
其中,fLBP(x,y)為編碼后圖像的f(x,y)的灰度值,滿足0≤fLBP(x,y)≤255;f(x,y)為編碼前圖像的(x,y)的灰度值。gp(x,y)與f(x,y)對應(yīng)關(guān)系如表1所示。
表1 gp(x,y)與f(x,y)對應(yīng)關(guān)系
輸入的樣本數(shù)為m,定義果皮樣本的輸出為1,有害垃圾等其他樣本輸出為-1,輸出結(jié)果集合為{-1,1}。訓(xùn)練弱分類器前,初始化各樣本集得到權(quán)重系數(shù)集合為:
其中,wij為第i級(jí)弱分類器的第j個(gè)樣本的權(quán)重系數(shù),wij滿足
利用決策樹算法,將帶權(quán)重的圖像提取的LBP灰度特征與分類器的特征進(jìn)行逐個(gè)比較,得到弱分類器hi(x)。由于LBP紋理特征計(jì)算涉及指數(shù)運(yùn)算,本研究采用的誤差計(jì)算方法是指數(shù)誤差計(jì)算,得到第i級(jí)分類器的誤差率ei滿足:
其中,yj為第j個(gè)樣本的實(shí)際分類值(1或-1)。hi(xi)為第i級(jí)弱分類器對第j張圖片計(jì)算得到的預(yù)測值,Ei為第i級(jí)弱分類器的最大誤差,滿足:
計(jì)算第i級(jí)弱分類器的學(xué)習(xí)率權(quán)重系數(shù)αi,誤差越大,學(xué)習(xí)的權(quán)重越大:
根據(jù)學(xué)習(xí)率權(quán)重系數(shù)αi更新下一級(jí)弱分類器各樣本的權(quán)重系數(shù)wij,滿足:
對前i級(jí)的分類器進(jìn)行加權(quán)平均,得到弱分類器組成的強(qiáng)分類器識(shí)別模型[8-10]Hi(x):
Adaboost的強(qiáng)分類器訓(xùn)練模型如圖1所示。
圖1 Adaboost的強(qiáng)分類器訓(xùn)練模型
針對果皮和有害垃圾的小樣本數(shù)據(jù)集進(jìn)行分類器訓(xùn)練,先對這兩類垃圾進(jìn)行分類標(biāo)定,果皮樣本作為正樣本,有害垃圾等其他樣本作為負(fù)樣本,并對正樣本進(jìn)行圖像尺寸變換為100×100。然后,初始化分類器參數(shù),負(fù)樣本進(jìn)行隨機(jī)裁切后,對所有樣本進(jìn)行LBP特征值計(jì)算,迭代訓(xùn)練i級(jí)弱分類器,一旦超過用戶設(shè)定的最大級(jí)數(shù)nS或者前i級(jí)組成的強(qiáng)分類器識(shí)別模型小于用戶設(shè)定的最小報(bào)警率FA,訓(xùn)練完成。
算法流程圖如圖2所示。
圖2 算法流程圖
主要算法流程如下:
1)輸入果皮和有害垃圾樣本。隨機(jī)從果皮和有害垃圾圖像庫中抽取42張圖片,作為訓(xùn)練正樣本集進(jìn)行輸入。
2)預(yù)處理。對輸入果皮和有害垃圾訓(xùn)練圖像進(jìn)行尺度和灰度轉(zhuǎn)換至預(yù)訓(xùn)練模型,規(guī)定輸入尺度大小。
3)建立果皮和有害垃圾識(shí)別模型。對LBP特征提取后的圖片樣本帶權(quán)重的輸入到Adaboost模型訓(xùn)練,通過梯度下降法調(diào)整弱分類器的模型權(quán)重,并計(jì)算學(xué)習(xí)率權(quán)重,產(chǎn)生該級(jí)弱分類器的權(quán)重系數(shù)以及下一級(jí)訓(xùn)練輸入至弱分類器模型的權(quán)重,直至滿足終止條件——級(jí)數(shù)超過設(shè)定值、總誤差率小于設(shè)定值。
4)模型測試。從果皮和有害垃圾圖像庫中抽取不同類型的果皮和有害垃圾圖片,作為測試原本集進(jìn)行模型測試,以驗(yàn)證模型的精確度。
對果皮和電池、廢燈管、殺蟲劑等有害垃圾進(jìn)行了識(shí)別研究,以123張圖片作為訓(xùn)練集,其余的作為測試集。
模型訓(xùn)練和測試硬件環(huán)境:Intel(R) Core(TM)i5-7300HQ CPU @ 2.5GHZ * 4處理器,16 G內(nèi)存,NVIDIA GeForce GTX 1050Ti 顯卡加速圖像處理。軟件環(huán)境:操作系統(tǒng)為Windows 10 Pro,開發(fā)軟件為CLion 2019。具體訓(xùn)練參數(shù)設(shè)置如表2所示。
表2 所有的級(jí)聯(lián)分類器LBP模型訓(xùn)練參數(shù)設(shè)置
訓(xùn)練樣本大小為123,通過訓(xùn)練層數(shù)得出由18級(jí)弱分類器加權(quán)得到的強(qiáng)分類器預(yù)測精確度最接近90%。網(wǎng)絡(luò)訓(xùn)練參數(shù)曲線圖以及果皮和有害垃圾識(shí)別效果圖如圖3、圖4所示。
圖3 網(wǎng)絡(luò)訓(xùn)練參數(shù)曲線圖
圖4 果皮和有害垃圾識(shí)別效果圖
果皮和有害垃圾數(shù)據(jù)測試集共用了314張圖片,包括香蕉皮80幅、電池97幅、廢燈管30幅,殺蟲劑107幅,分別測試網(wǎng)絡(luò)模型,得出識(shí)別結(jié)果如表3所示。
表3 垃圾圖像識(shí)別結(jié)果
1)提出了一種基于級(jí)聯(lián)分類器的LBP特征模型識(shí)別果皮和有害垃圾的方法,可提取果皮和有害垃圾的特征,避免了手工特征的設(shè)計(jì)和提取。
2)基于級(jí)聯(lián)分類器的LBP特征模型具有較高的識(shí)別精準(zhǔn)度,能夠達(dá)到快速識(shí)別的目的。
3)操作簡單,具有較強(qiáng)的健壯性,能夠維持某些性能的特征。