納 嶸,任晉東,胡 波,趙 強(qiáng),雷 茜
(1.寧夏職業(yè)技術(shù)學(xué)院,寧夏 銀川 750021;2.浙江省農(nóng)業(yè)科學(xué)院,浙江 杭州 3100212;3.寧夏大北農(nóng)科技實(shí)業(yè)有限公司,寧夏 銀川 750200;4.北方民族大學(xué) 生物科學(xué)與工程學(xué)院,寧夏 銀川 750021;5.植物性農(nóng)產(chǎn)品貯藏與加工重點(diǎn)實(shí)驗(yàn)室,寧夏 銀川 750021)
苜蓿以“牧草之王”著稱,含豐富的粗蛋白、粗纖維、礦物質(zhì)和維生素等營養(yǎng)成分,不僅為草食家畜提供優(yōu)質(zhì)的粗飼料,也是制作精飼料的良好替代品和配合飼料的原料之一[1-2]。飼料中主要營養(yǎng)成分的檢測是保證其產(chǎn)品質(zhì)量的重要技術(shù)手段之一。苜蓿主要營養(yǎng)成分檢測所使用的常規(guī)分析方法,是一項(xiàng)繁瑣的工作,不僅費(fèi)時(shí)費(fèi)力,還需消耗大量測試樣品和化學(xué)試劑,檢測過程中產(chǎn)生的廢料還可能造成環(huán)境污染[3]。
近紅外光譜分析技術(shù)(near infrared spectroscopy,NIRS)是近年來發(fā)展較快的、用于有機(jī)物質(zhì)定性和定量分析的新技術(shù)[4-5]。近紅外光譜分析技術(shù)已經(jīng)在動(dòng)植物分析檢測中被廣泛應(yīng)用[6-10],具有一次性分析指標(biāo)多、分析速度快、無需樣品前處理、能減少和降低化學(xué)試劑對環(huán)境的污染等優(yōu)點(diǎn),從而滿足用戶對飼料檢測快速、準(zhǔn)確的需求[11]。近紅外光譜分析技術(shù)是一項(xiàng)間接分析技術(shù),在實(shí)際應(yīng)用中需要采集大量具有代表性的樣本建立模型。由于國內(nèi)外的苜蓿樣本在來源、刈割時(shí)間、茬次等方面的差異,所以無法用國內(nèi)外已建成的近紅外分析模型直接預(yù)測本區(qū)域的苜蓿,必須建立一套適合地域特點(diǎn)的分析模型,才能應(yīng)用于實(shí)踐中。
本研究在前人研究的基礎(chǔ)上,采用近紅外光譜技術(shù),掃描收集94個(gè)苜蓿樣品的近紅外光譜,對苜蓿含水量(Moisture)、粗蛋白(CP)、粗脂肪(EE)、酸性洗滌纖維(ADF)、中性洗滌纖維(NDF)和粗灰分(Ash)等6個(gè)營養(yǎng)成分定量檢測,采用近紅外光譜測定儀系統(tǒng)軟件將近紅外光譜對應(yīng)的化學(xué)值相關(guān)聯(lián)進(jìn)行建模。由于近紅外光譜的采集容易受顏色、樣品顆粒大小等影響,導(dǎo)致光譜的基線漂移和平移,因此有必要對原始光譜進(jìn)行預(yù)處理后再建模,盡管有關(guān)近紅外光譜分析技術(shù)檢測苜蓿營養(yǎng)成分的相關(guān)研究較多,然而將預(yù)處理方法應(yīng)用于光譜的優(yōu)化探索相關(guān)研究較少。本研究將4種數(shù)學(xué)處理方法與5種散射校正方法相結(jié)合,共20種預(yù)處理方法對光譜進(jìn)行預(yù)處理,綜合分析不同預(yù)處理方法對苜蓿樣本建模的影響,得出最佳光譜預(yù)處理方法后對苜蓿近紅外光譜進(jìn)行建模,構(gòu)建最佳的苜蓿營養(yǎng)成分近紅外定量分析模型,并對模型進(jìn)行驗(yàn)證,為飼料營養(yǎng)成分快速分析技術(shù)提供一定的參考。
2018年10月-2019年10月期間,共收集紫花苜蓿干草94個(gè),由寧夏普瑞祥科技有限公司、寧夏大北農(nóng)科技實(shí)業(yè)有限公司提供,來自于寧夏德瑞牧場、寧夏東聯(lián)牧場、寧夏新華牧場和寧夏前進(jìn)牧場等4個(gè)牧場。所有樣品粉碎至90%以上,通過40目的樣品篩。
1.2.1 樣品的近紅外光譜采集 苜蓿樣品的近紅外光譜采集,采用丹麥FOSS公司DS 2500F型近紅外光譜分析儀測定。分別掃描94個(gè)苜蓿樣品(在850~2 498 nm波長范圍內(nèi)),采集反射量(R),每隔2 nm采集1次,每份樣品重復(fù)掃描4次,取平均值。
1.2.2 樣品的營養(yǎng)成分化學(xué)值測定 苜蓿樣品的營養(yǎng)成分化學(xué)值測定按國家標(biāo)準(zhǔn)法對樣品中Moisture、CP、EE、ADF、NDF和Ash的含量進(jìn)行測定[12],每個(gè)樣品做3個(gè)平行測定,取均值作為常規(guī)法化學(xué)值,檢測方法見表1。
表1 苜蓿營養(yǎng)成分化學(xué)值測定方法Table 1 Chemical methods of nutritional components in alfalfa
1.2.3 樣品集的劃分 選取84個(gè)苜蓿樣品組成定標(biāo)集,建立苜蓿營養(yǎng)成分近紅外定量分析模型,其余10個(gè)樣品組成樣品驗(yàn)證集,以驗(yàn)證定標(biāo)模型準(zhǔn)確性。
1.2.4 光譜預(yù)處理 本研究使用FOSS公司光譜分析軟件Win ISI III對掃描后的苜蓿樣本光譜進(jìn)行預(yù)處理,剔除異常樣品后,剩余樣品經(jīng)過光譜和數(shù)學(xué)處理,選擇不同的數(shù)學(xué)處理方法和散射校正方法,并比較不同預(yù)處理方法對模型建模的影響。
為降低散射對光譜分析的干擾,F(xiàn)OSS公司光譜分析軟件Win ISI III軟件可以提供以下幾種去散射處理技術(shù),包括:對光譜不進(jìn)行散射校正(None);標(biāo)準(zhǔn)正?;幚?去偏異技術(shù)(SNV+Detrend);標(biāo)準(zhǔn)正?;幚?SNV only);去偏差技術(shù)(Detrend only);標(biāo)準(zhǔn)多元散射校正技術(shù)(Standard MSC)。
數(shù)學(xué)處理方法包括4方面內(nèi)容(D,G,S1,S2),D表示對光譜所做導(dǎo)數(shù)處理的階數(shù),G表示導(dǎo)數(shù)處理計(jì)算所采用的光譜點(diǎn)間隔數(shù)量,S1表示一次平滑處理間隔點(diǎn),S2是二次平滑處理間隔點(diǎn)。
本試驗(yàn)分別采用5種散射校正方法,包括:None,SNV+Detrend,SNV only,Detrend only和Standard MSC,并結(jié)合4種數(shù)學(xué)處理方法,包括“1,4,4,1”,“2,4,4,1”“3,4,4,1”和“4,4,4,1”綜合分析后,比較20種不同預(yù)處理方法對苜蓿6種常規(guī)營養(yǎng)成分含量的近紅外定量分析模型參數(shù)預(yù)測效果的影響,以交叉驗(yàn)證標(biāo)準(zhǔn)誤差(SECV)、定標(biāo)決定系數(shù)(RSQ)和交叉驗(yàn)證相關(guān)系數(shù)(1-VR)為選擇依據(jù),得出最佳光譜預(yù)處理方法和建模方法。
1.2.5 定標(biāo)模型的建立與評價(jià) 采用改進(jìn)最小二乘回歸法(MPLS),使用FOSS公司W(wǎng)in ISI III近紅外光譜分析軟件,建立苜蓿Moisture、CP、EE、ADF、NDF和Ash 6種常規(guī)營養(yǎng)成分近紅外定量分析模型。通過內(nèi)部驗(yàn)證和外部驗(yàn)證兩種形式,評價(jià)近紅外定量分析模型的預(yù)測性能。內(nèi)部驗(yàn)證以交叉驗(yàn)證標(biāo)準(zhǔn)誤差(SECV)、定標(biāo)決定系數(shù)(RSQ)和交叉驗(yàn)證相關(guān)系數(shù)(1-VR)可以評定苜蓿含水量、粗蛋白、粗脂肪、酸性洗滌纖維、中性洗滌纖維、粗灰分6種常規(guī)營養(yǎng)成分定標(biāo)模型預(yù)測性能。交叉驗(yàn)證標(biāo)準(zhǔn)誤差(SECV)越小,定標(biāo)決定系數(shù)(RSQ)和交叉驗(yàn)證相關(guān)系數(shù)(1-VR)越大,證明模型的預(yù)測性能越好[19-21]。
外部驗(yàn)證通過比較苜蓿驗(yàn)證集樣品的模型預(yù)測值與測定值相關(guān)性、預(yù)測標(biāo)準(zhǔn)誤差(SEP)、驗(yàn)證決定系數(shù)(RSQ)和交叉驗(yàn)證相對分析誤差(RPDV)評價(jià)模型預(yù)測性能。目前,飼料行業(yè)普遍應(yīng)用的評價(jià)標(biāo)準(zhǔn)是,當(dāng)RPDV≥2.5時(shí),模型的預(yù)測性能良好,可用于實(shí)際檢測;當(dāng)2.0≤RPDV≤2.5時(shí),定標(biāo)模型可用于樣品的粗略篩選;當(dāng)RPDV≤2.0時(shí),定標(biāo)模型的預(yù)測性能較差。
苜蓿樣品常規(guī)營養(yǎng)成分的化學(xué)分析結(jié)果如表2所示,苜蓿樣品中各營養(yǎng)成分含量變化幅度較大,說明樣品范圍覆蓋面大,數(shù)據(jù)分布合理,可用來建立苜蓿營養(yǎng)成分近紅外定量分析模型。
表2 苜蓿樣品常規(guī)營養(yǎng)成分的化學(xué)分析結(jié)果Table 2 Measurements of nutritional components in alfalfa samples
經(jīng)過近紅外光譜分析儀得到苜蓿樣品的近紅外原始光譜圖見圖1。橫坐標(biāo)代表光譜波長(nm),縱坐標(biāo)為相對吸光度,苜蓿樣品在850~2 498 nm的波長范圍內(nèi)有明顯的吸收峰和基本相同的變化趨勢,說明苜蓿樣品的吸光度與化學(xué)成分含量存在線性相關(guān)性,苜蓿的近紅外原始光譜圖可作為建立苜蓿營養(yǎng)成分含量快速檢測模型的依據(jù)。
圖1 苜蓿樣本原始光譜圖Fig.1 Original near-infrared spectra of alfalfa samples
近紅外光譜除含有樣品自身的化學(xué)信息外,還包含有其他無關(guān)信息和噪聲,如電噪聲、樣品背景和雜散光等,因此,要對光譜進(jìn)行預(yù)處理,對原始光譜圖進(jìn)行一階導(dǎo)數(shù)處理后,可得到一階導(dǎo)數(shù)處理后光譜,如圖2所示。處理后的光譜消除噪聲影響,吸收峰更加明顯,更有利于模型的準(zhǔn)確性。
圖2 一階導(dǎo)數(shù)處理后光譜Fig.2 One derivative spectra of alfalfa samples
2.3.1 定標(biāo)集超常樣品的剔除 使用FOSS公司光譜分析軟件Win ISI III軟件中的主成分分析技術(shù)(聚類分析技術(shù)),將光譜數(shù)據(jù)壓縮并分解為主成
分和得分矩陣數(shù)據(jù),然后比較各樣品光譜間的差異及某樣品與主組群品組間的差異,從而確定參與定標(biāo)的最好樣品。用馬氏距離評價(jià)樣品間的差異,將剔除限設(shè)置為3.0,經(jīng)過軟件得分計(jì)算后,標(biāo)記20號和29號兩個(gè)超常樣品,使這兩個(gè)樣品不參與定標(biāo),對苜蓿定標(biāo)集的剩余82個(gè)樣品進(jìn)行建模。
2.3.2 最佳預(yù)處理方法的確定及定標(biāo)模型的建立 經(jīng)過5種散射校正方法與4種數(shù)學(xué)處理方法綜合分析后[22],共20種預(yù)處理組合,分析比較得出最佳光譜預(yù)處理方法和建模方法,確定最佳定標(biāo)模型參數(shù),結(jié)果如表3所示。使用最佳定標(biāo)模型參數(shù),建立苜蓿Moisture、CP、EE、ADF、NDF和Ash6種常規(guī)營養(yǎng)成分含量定標(biāo)模型。
表3 最佳定標(biāo)模型參數(shù)Table 3 Optimal calibration model parameters
2.4.1 苜蓿營養(yǎng)成分近紅外定量分析模型的內(nèi)部交叉驗(yàn)證 對苜蓿Moisture、CP、EE、ADF、NDF和Ash6種常規(guī)營養(yǎng)成分含量定標(biāo)模型進(jìn)行內(nèi)部交叉驗(yàn)證,分析內(nèi)部交叉驗(yàn)證效果。苜蓿6種常規(guī)營養(yǎng)成分含量的預(yù)測模型的交叉驗(yàn)證標(biāo)準(zhǔn)誤差(SECV)分別為0.2419、0.4615、0.1812、0.8848、1.4332,0.4227;定標(biāo)決定系數(shù)(RSQ)分別為0.9632、0.9257、0.9879、0.9745、0.9511、0.9726;交叉驗(yàn)證相關(guān)系數(shù)(1-VR)分別為0.9614、0.8715、0.8554、0.9513、0.9218、0.8246。6種營養(yǎng)成分含量定標(biāo)模型的定標(biāo)決定系數(shù)(RSQ)數(shù)均達(dá)到0.9以上,交叉驗(yàn)證相關(guān)系數(shù)(1-VR)數(shù)均達(dá)到0.8以上。
2.4.2 苜蓿營養(yǎng)成分近紅外定量分析模型的外部驗(yàn)證 苜蓿營養(yǎng)成分近紅外定量分析模型建立后,用10個(gè)驗(yàn)證樣品集對模型進(jìn)行外部驗(yàn)證,預(yù)測結(jié)果見表4。通過計(jì)算預(yù)測標(biāo)準(zhǔn)誤差(SEP)和驗(yàn)證決定系數(shù)(RSQ)來評價(jià)模型實(shí)際測定效果,進(jìn)一步檢驗(yàn)其優(yōu)劣。
表4 近紅外法與化學(xué)法測定苜蓿營養(yǎng)成分含量的比較Table 4 The predictive value by NIRS and chemical value of nutritional components in alfalfa
近紅外光譜預(yù)測模型的外部驗(yàn)證結(jié)果參數(shù)如表5所示。運(yùn)用已建立的近紅外預(yù)測模型預(yù)測集,將預(yù)測值和實(shí)測值進(jìn)行相關(guān)性分析,其中橫坐標(biāo)代表化學(xué)測定的實(shí)測值,縱坐標(biāo)代表預(yù)測模型的預(yù)測值,結(jié)果如圖3所示。結(jié)果表明:預(yù)測標(biāo)準(zhǔn)誤差(SEP)分別為0.317、0.551、0.253、3.732、2.332、0.709;驗(yàn)證決定系數(shù)(RSQ)分別為0.905、0.929、0.758、0.567、0.886、0.630。交叉驗(yàn)證相對分析誤差(RPDV)分別為3.372、3.403、1.925、1.418、3.668、1.660。苜蓿中Moisture、CP、NDF的交叉驗(yàn)證相對分析誤差(RPDV)>3,EE、ADF、Ash的交叉驗(yàn)證相對分析誤差(RPDV)<2。證明所建成的模型對苜蓿中Moisture、CP、NDF的含量能精準(zhǔn)預(yù)測,對EE、ADF、Ash含量不能精準(zhǔn)預(yù)測,還需要調(diào)整。
圖3 苜蓿樣品驗(yàn)證集營養(yǎng)成分的光譜預(yù)測值與化學(xué)測定值的關(guān)系Fig.3 The relationship between predicted value and reference value of nutritional components in alfalfa samples
表5 近紅外光譜預(yù)測模型的外部驗(yàn)證結(jié)果參數(shù)Table 5 The external validation parameters of NIRS prediction model
利用近紅外光譜分析技術(shù)快速測定苜蓿營養(yǎng)成分在之前已有研究,郭濤[23]采集200份苜蓿干草樣品,對樣品6種營養(yǎng)成分分別進(jìn)行定標(biāo)。采用3種導(dǎo)數(shù)處理與7種去散射處理結(jié)合,構(gòu)建的DM和NDF預(yù)測模型可以用于實(shí)際生產(chǎn)中的精確預(yù)測,Ash的預(yù)測模型可以用于粗略的分析樣品;EE預(yù)測模型的濕化學(xué)分析值和預(yù)測值的相關(guān)性較差,模型還需要進(jìn)一步優(yōu)化。何云等[24]采集265個(gè)苜蓿干草草捆樣品,利用近紅外光譜技術(shù),采用偏最小二乘(PLS)的化學(xué)計(jì)量學(xué)方法,結(jié)合4種散射校正和10種導(dǎo)數(shù)處理方法,建立苜蓿干草4個(gè)指標(biāo)的近紅外預(yù)測模型。薛祝林等[25]采集苜蓿草捆樣品229份,利用改進(jìn)的偏最小二乘法,結(jié)合不同光譜處理和數(shù)學(xué)參數(shù)設(shè)置,建立苜蓿營養(yǎng)品質(zhì)和消化率的近紅外預(yù)測模型,結(jié)果表明模型可以用于苜蓿部分營養(yǎng)成分含量的分析。但由于國內(nèi)外的苜蓿干草在加工工藝、來源和收獲季節(jié)等方面存在差異,所以無法直接用國內(nèi)外研究的近紅外分析模型預(yù)測本區(qū)域的苜蓿,必須建立一套適合地域特點(diǎn)或企業(yè)的預(yù)測模型。本研究廣泛收集不同來源的苜蓿樣本94個(gè),樣本具有較好的代表性,和之前的研究者所使用的預(yù)處理方法有所不同,通過4種數(shù)學(xué)處理方法與5種散射校正方法相結(jié)合,共20種預(yù)處理方法對原始光譜進(jìn)行預(yù)處理,旨在建立一套更加準(zhǔn)確的苜蓿干草常規(guī)營養(yǎng)成分含量近紅外分析模型,實(shí)現(xiàn)苜蓿草營養(yǎng)成分快速測定,解決企業(yè)快速檢測苜蓿營養(yǎng)成分的需要。
近紅外光譜分析結(jié)果的準(zhǔn)確性受多種因素的影響,主要包括三大類:①樣本本身的影響,包括定標(biāo)樣本的數(shù)量、來源、成分含量與變異及物理性狀等;②樣本常規(guī)化學(xué)測定的準(zhǔn)確性,實(shí)驗(yàn)室化學(xué)分析誤差是影響近紅外分析準(zhǔn)確性的關(guān)鍵性因素。在建立定標(biāo)時(shí),應(yīng)嚴(yán)格國家標(biāo)準(zhǔn)對樣品成分進(jìn)行準(zhǔn)確測定,減小誤差,提高檢測數(shù)據(jù)的準(zhǔn)確度;③近紅外儀器的穩(wěn)定性及操作環(huán)境。了解影響近紅外光譜分析技術(shù)的各種因素,降低其影響,是今后減少近紅外模型誤差、提高效率的關(guān)鍵[26]。說明在實(shí)際生產(chǎn)實(shí)踐中,還需要不斷擴(kuò)充苜蓿模型樣本量及驗(yàn)證指標(biāo),提高試驗(yàn)檢測的準(zhǔn)確度,并對模型進(jìn)行長期校正和維持。本研究中苜蓿的定標(biāo)模型數(shù)據(jù)庫將應(yīng)用于企業(yè),并繼續(xù)更新和擴(kuò)增模型。
本試驗(yàn)利用近紅外光譜分析技術(shù)建立了苜蓿干草6個(gè)指標(biāo)的近紅外快速分析模型,經(jīng)過4種數(shù)學(xué)處理方法與5種散射校正方法綜合分析不同預(yù)處理方法對苜蓿樣本建模的影響,以交叉驗(yàn)證標(biāo)準(zhǔn)誤差(SECV)、定標(biāo)決定系數(shù)(RSQ)和交叉驗(yàn)證相關(guān)系數(shù)(1-VR)為選擇依據(jù),得出最佳光譜預(yù)處理方法和建模方法,并使用內(nèi)部驗(yàn)證和外部驗(yàn)證對模型的預(yù)測能力進(jìn)行評價(jià)。結(jié)果證明:所建成的模型對苜蓿中Moisture、CP、NDF的含量能精準(zhǔn)預(yù)測,對EE、ADF、Ash含量不能預(yù)測,還需進(jìn)一步調(diào)整優(yōu)化,提高模型的準(zhǔn)確性。