王 磊,殷姣姣,余心杰
(1.太原科技大學(xué)電子信息工程學(xué)院,山西 太原 030024;2.浙江大學(xué)寧波理工學(xué)院信息科學(xué)與工程學(xué)院,浙江 寧波 315100)
三文魚[1]也稱為大西洋鮭魚,屬于硬骨魚綱鮭形目鮭亞目鮭科的種類,是生長在加拿大、挪威和美國等高緯度地區(qū)的屬于冷水性的高度洄游魚類。三文魚生長的溫度大致范圍是0℃~30℃。若生長在溫度適宜的環(huán)境下,三文魚會(huì)攝取很多的食物,生長速度很快。相反,若生長的環(huán)境不合適,三文魚的攝食量就會(huì)大幅度地減少,從而影響其生長的速度。因?yàn)槿聂~是喜歡逆流生長的魚類,所以多采用流水型養(yǎng)殖。如果生長環(huán)境的水量和水流都是在最佳狀態(tài),則可刺激三文魚,使其保持其良好的物質(zhì)代謝,促進(jìn)其生長速度。研究表明,三文魚適宜的溶氧量為6 mg/L以上,最適合的pH 范圍為6.5~7.5。在養(yǎng)殖池中的三文魚主要喂養(yǎng)含有蝦青素的飼料,因此它的魚肉中含有蝦青素,所以其肉色為紅色或鮮橘紅色。
三文魚中富含腦黃金(DHA)、二甲氨基乙醇(DMAE)等主要成分,可預(yù)防慢性疾病、糖尿病等疾病,還可有效減輕因風(fēng)濕、牛皮癬等疾病帶來的痛苦,并且還能降低血液中的膽固醇含量,因此三文魚是世界上最有益健康的魚類之一。此外,三文魚的魚肉中,膽固醇含量很低,熱量低,蛋白質(zhì)含量高,符合現(xiàn)代食品營養(yǎng)學(xué)標(biāo)準(zhǔn)和人們對健康魚類的界定。
三文魚的肉色是消費(fèi)者判斷其品質(zhì)的重要標(biāo)準(zhǔn),對肉色鮮紅的三文魚,要想知道其顏色,就必須將其進(jìn)行宰殺并解剖。一般只通過觀察魚體本身,不能準(zhǔn)確地辨別魚肉的質(zhì)量,所以需要一種快速無損辨別魚肉質(zhì)量的方法。因?yàn)槲r青素在可近紅外光下的光譜反射比較明顯,因此利用近紅外光譜儀對三文魚進(jìn)行照射,得到的反射光譜數(shù)據(jù)[2]對三文魚進(jìn)行肉色分級(jí)分類研究。
1)近紅外光譜儀:QE65000 光譜儀由Ocean Optics 研制。光譜儀的測量區(qū)間為350~1100 nm;探測器是CCD 探測器,該探測器總共有15 個(gè)光柵,光譜采樣間隔為0.81 nm,采集所用的軟件是配套的Ocean Optics SpectraSuite,該軟件的數(shù)據(jù)采集頁面如圖1 所示。
圖1 軟件的數(shù)據(jù)采集頁面
2)光源:光源是與近紅外光譜儀所對應(yīng)的一個(gè)設(shè)備,該設(shè)備使用比較簡便,并且耐用、經(jīng)濟(jì),可測定的波長區(qū)間為300~1050 nm。
3)硬件環(huán)境:一臺(tái)PC 計(jì)算機(jī),基本配置中等即可。實(shí)驗(yàn)裝置如圖2 所示。
圖2 實(shí)驗(yàn)裝置
1)樣本準(zhǔn)備。
實(shí)驗(yàn)所用的三文魚是山東省煙臺(tái)市東方海洋養(yǎng)殖基地養(yǎng)殖的。挑選重量在1 kg 左右的三文魚作為實(shí)驗(yàn)?zāi)繕?biāo)。首先,在一個(gè)裝有干凈海水的小養(yǎng)殖池里,將挑選的三文魚進(jìn)行麻醉,每次麻醉幾條,然后放在暗箱上。
2)光譜數(shù)據(jù)的獲取。
利用近紅外光譜儀對三文魚進(jìn)行照射,照射的區(qū)域?yàn)閳D3 中的虛線區(qū)域,每次測量都做好標(biāo)記,便于以后進(jìn)行處理。利用軟件把光譜數(shù)據(jù)存起來,對每條魚的一面進(jìn)行測量,圖3 中虛線區(qū)域是測量范圍,這樣是為了避開魚體內(nèi)部和外部因素對數(shù)據(jù)采集產(chǎn)生干擾。最后,剖開魚體的表面,將測量部位的肉色(如圖4 所示)與SalmoFanTM比色卡(圖5 所示)進(jìn)行比對,并記錄等級(jí)。
圖3 魚肉的照射范圍
圖4 對照射部位進(jìn)行解剖
圖5 三文魚的魚肉和SalmoFanTM比色卡比對
對采集三文魚的近紅外光譜數(shù)據(jù),首先消除樣本不均勻、基線漂移、高頻隨機(jī)噪聲等影響,對采集的光譜數(shù)據(jù)進(jìn)行預(yù)處理,只保留300~1 000 nm 的數(shù)據(jù)來研究,其余波段的數(shù)據(jù)都去除;然后進(jìn)行基線校準(zhǔn),并采用平均平滑法,再進(jìn)行多元散射校正(MSC),得到預(yù)處理后的光譜數(shù)據(jù)(如圖6 所示);根據(jù)蝦青素的反射特點(diǎn),最后采用350.51~580.05 nm 范圍的光譜數(shù)據(jù)來處理和分析。在實(shí)際出售中,以SalmoFanTM進(jìn)行肉質(zhì)鑒別,比色卡上等級(jí)24 以上的肉質(zhì)是好的,所以分為2 類,等級(jí)大于24 的為第一類,等級(jí)小于24為第二類。
圖6 部分樣本預(yù)處理后的光譜數(shù)據(jù)
近一些年,在處理模式識(shí)別的各類問題上,稀疏表示分類算法是一種很重要的算法。稀疏表示分類算法的優(yōu)點(diǎn)是運(yùn)用殘差進(jìn)行數(shù)據(jù)的分類,比傳統(tǒng)的分類算法精確了不少,也提高了分類的準(zhǔn)確度。目前,國內(nèi)外的專家運(yùn)用稀疏表示分類算法對圖像去噪[3]、自適應(yīng)權(quán)重[4]和音樂流派與樂器分類[5]等方面進(jìn)行研究,而且對稀疏表示分類器進(jìn)行分類的范圍越來越多。例如基于和鉉識(shí)別在音樂結(jié)構(gòu)和旋律方面的重要性,董麗夢利用稀疏表示分類器進(jìn)行和弦識(shí)別,在識(shí)別率上高于傳統(tǒng)的識(shí)別方法[6]。
稀疏表示分類器[7]是一種基于l1最小化范數(shù)的分類器,在模式識(shí)別的應(yīng)用中已經(jīng)取得了很大的成效。在特征上,稀疏表示分類器是用少量的樣本數(shù)據(jù)來構(gòu)成樣本訓(xùn)練集,獲得比支持向量機(jī)(Support Vector Machine,SVM)和線性分類器等分類方法更好的分類性能[8-10]。下面采用本實(shí)驗(yàn)數(shù)據(jù)來實(shí)現(xiàn)稀疏表示分類器的分類。
已知進(jìn)行分類的光譜數(shù)據(jù)有80 個(gè)訓(xùn)練樣本,訓(xùn)練樣本數(shù)據(jù)可表示為:其中,Ai構(gòu)成了i 類的向量空間,矩陣A 構(gòu)成了1 種光譜數(shù)據(jù)的數(shù)據(jù)詞典,矩陣的行數(shù)表示每個(gè)樣本特征參數(shù)的個(gè)數(shù),矩陣的列數(shù)表示樣本的總數(shù)。
對于取自第k 類光譜數(shù)據(jù)的測試樣本的向量y,可由它的訓(xùn)練矩陣A 所構(gòu)成的空間線性表示:
在理想情況下,假設(shè)測試樣本y 是來自第k 類待測樣本,那么x 在其所屬類別的基Ak上的投影系數(shù)不為0,而在其他訓(xùn)練樣本基(即Ai,i≠k)上的投影為0。但實(shí)際情況是,測試樣本的類別是未知的,如果所求的列向量足夠稀疏,根據(jù)壓縮感知理論[11-20],得到如下求解公式:
在光譜數(shù)據(jù)的獲取過程中會(huì)包含噪聲,那么y 就很難對A 進(jìn)行準(zhǔn)確的線性表示,因此上述表達(dá)式可改寫為:
對于第i 類,定義δi是選取中一個(gè)與第i 類有關(guān)的系數(shù)向量。因此,如果判別y 為第i 類時(shí),用=Aδi)近似y,即與y 距離越小,屬于i 的可靠性越高。因此,提出識(shí)別y 所屬類別的方法如下:
其中,用第i 類訓(xùn)練樣本重建y 的殘差為ri(y)。
其中L(y)表示y 的標(biāo)記。
對預(yù)處理過的三文魚(其中100 個(gè)為訓(xùn)練樣本,每類50 個(gè);40 個(gè)為測試樣本,每類20 個(gè))的光譜數(shù)據(jù)進(jìn)行如下的操作:
1)稀疏表示算法在MATLAB2013a 下編程實(shí)現(xiàn),將數(shù)據(jù)的維數(shù)最終降到100 維。
2)主成分分析算法在MATLAB2013a 下編程實(shí)現(xiàn),共提取前100 個(gè)主成分。
3)基于線性判別分析的分類算法(LDA)在Matlab2013a 下編程實(shí)現(xiàn)。
4)基于最小二乘支持向量機(jī)算法(LS-SVM)在MATLAB2013a 下編程來實(shí)現(xiàn)。
光譜數(shù)據(jù)分別在主成分分析法和稀疏表示(降維方法)處理的基礎(chǔ)上,利用基于線性判別分析分類算法進(jìn)行模型建立,通過分析得出結(jié)果;光譜數(shù)據(jù)在2 種降維方法處理后,再利用基于最小二乘支持向量機(jī)分類算法進(jìn)行模型建立,通過分析得出結(jié)果。
表1 實(shí)驗(yàn)的分類結(jié)果
從表1 中可以看出,在第一類中,不管是在LDA還是在LS-SVM 分類處理上,SR 降維處理的分類正確率都比PCA 高;在第二類中,雖然在LDA 分類處理上,SR 和PCA 降維處理后的分類正確率相同,但是在LS-SVM 分類處理上,SR 還是比PCA 降維后的分類正確率高。
因此,利用稀疏表示分類算法降維后的光譜數(shù)據(jù)進(jìn)行分類的正確率比主成分分析降維后進(jìn)行分類的正確率要高。因此,與主成分分析法的降維方法相比較,稀疏表示算法能有效地提取高維光譜數(shù)據(jù)中的信息,在此基礎(chǔ)上,能更好地對三文魚的肉質(zhì)特色進(jìn)行正確的分類。
本文利用稀疏表示分類算法對三文魚的近紅外光譜數(shù)據(jù)進(jìn)行降維處理,再利用線性判別分析(LDA)和最小二乘支持向量機(jī)(LS-SVM)對三文魚的肉質(zhì)建立了分類預(yù)測模型。實(shí)驗(yàn)結(jié)果表明,利用稀疏表示算法對近紅外光譜數(shù)據(jù)進(jìn)行降維,能取得比傳統(tǒng)的主成分分析法(PCA)光譜降維方法更好的分類預(yù)測結(jié)果。所以稀疏表示分類算法為近紅外光譜檢測中的海量數(shù)據(jù)降維提供了一種良好的新途徑。
[1]羅剛.大西洋鮭魚營養(yǎng)研究概況[J].畜牧與飼料科學(xué),2009,30(5):23-25.
[2]高榮強(qiáng),范世福.現(xiàn)代近紅外光譜分析技術(shù)的原理及應(yīng)用[J].分析儀器,2002(3):9-12.
[3]喬雅莉.基于稀疏表示的圖像去噪算法研究[D].北京:北京交通大學(xué),2009.
[4]段剛龍,魏龍,李妮.基于自適應(yīng)權(quán)重的多重稀疏表示分類算法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(8):173-177.
[5]徐星.基于最小-范數(shù)的稀疏表示音樂流派與樂器分類算法研究[D].天津:天津大學(xué),2012.
[6]董麗夢,李鏘,關(guān)欣.基于稀疏表示分類器的和弦識(shí)別研究[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(29):133-136.
[7]Wright J,Yang A Y,Ganesh A,et a1.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,31(2):210-227.
[8]黃敏,萬相梅,朱啟兵,等.基于高光譜成像技術(shù)的菜用大豆厚度檢測[J].食品與生物技術(shù)學(xué)報(bào),2012,31(11):1142-1147.
[9]蔣璐璐,駱美富,張瑜,等.汽車變速箱油的近紅外光譜識(shí)別研究[J].光譜學(xué)與光譜分析,2014,34(1):64-68.
[10]Wright J,Yang A Y,Ganesh A,et a1.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,31(2):210-227.
[11]杜愎剛,朱毅,朱會(huì)田.汽車自動(dòng)變速器油質(zhì)異常的原因及預(yù)防措施[J].潤滑與封閉,2004(3):104-105,109.
[12]Suykens J A K,Gestel T Van,Brabanter J De.Least Squares Support Vector Machines [M].World Scientific Publishing Company,2002.
[13]程國首,郭俊先,石呰,等.基于高光譜成像技術(shù)的新疆紅富士蘋果重量預(yù)測[J].新疆農(nóng)業(yè)大學(xué)學(xué)報(bào),2011,34(3):249-252.
[14]洪添勝,喬軍,Michael D Ngadi,等.基于高光譜成像技術(shù)的雪花梨品質(zhì)無損檢測[J].農(nóng)業(yè)工程學(xué)報(bào),2007,23(2):151-155.
[15]徐爽,何建國,易東,等.基于高光譜成像技術(shù)的長棗糖度無損檢測[J].食品與機(jī)械,2012,28(6):168-170.
[16]孫玉寶.圖像稀疏表示模型及其在圖像處理反問題中的應(yīng)用[D].南京:南京理工大學(xué),2010.
[17]鄧承志.圖像稀疏表示理論及其應(yīng)用研究[D].武漢:華中科技大學(xué),2008.
[18]浦劍,張軍平.基于詞典學(xué)習(xí)和稀疏表示的超分辨率方法[J].模式識(shí)別與人工智能,2010,23(3):335-340.
[19]Donoho D.Compressive sensing[J].Transaction on Information Theory,2006,52(4):1289-1306.