周 菲 王文軍 劉 巖 馬 軍 王 靜 吳立仁 關(guān)洪江 黃緒堂
(1黑龍江省農(nóng)業(yè)科學(xué)院博士后科研工作站,150086,黑龍江哈爾濱;2黑龍江省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所,150086,黑龍江哈爾濱)
向日葵(HelianthusannuusL.)是世界上最重要的油料作物之一。向日葵具有耐鹽堿、耐瘠薄和抗干旱等適應(yīng)性強(qiáng)的特性,近年來,向日葵生產(chǎn)發(fā)展很快,現(xiàn)已成為僅次于大豆、油菜和花生的第四大油料作物[1]。我國栽培向日葵已有近400年的歷史[2],2018年全國向日葵年栽種面積92.135萬hm2,總產(chǎn)量249.42萬t[3],主要集中在東北、華北及西北“三北”地區(qū)。向日葵油是一種營養(yǎng)價值很高的食用油,向日葵種子脂肪含量很高,不飽和脂肪酸含量比大豆和花生等主要油料作物高,其中亞油酸含量為69%左右,為胡麻的4倍、油菜籽的3倍、花生的2倍以及大豆的1.8倍[4]。
油料作物種子脂肪含量影響食用油的產(chǎn)量,而脂肪酸組成決定了食用油的品質(zhì),因此研發(fā)精確、快速和無損檢測脂肪和各種脂肪酸含量的方法對于向日葵品質(zhì)育種十分重要。目前測定種子脂肪和各脂肪酸含量的方法有索氏抽提法和氣相色譜法,化學(xué)方法雖然精確度較高,但存在測定之前需要甲酯化,預(yù)處理過程繁瑣,長鏈碳的酯較難氣化等問題[5],且待測的籽粒樣品要粉碎,無法再產(chǎn)生后代,不利于育種材料篩選。近紅外光譜(nearinfrared reflectance spectroscopy,NIRS)技術(shù)是利用有機(jī)化學(xué)物質(zhì)內(nèi)包含的各類含氫基團(tuán)(CH、OH、NH和SH等)在近紅外光譜區(qū)差異特征的吸收光譜,是快速檢測樣品成分含量的一項(xiàng)技術(shù)[6]。對于NIRS這種方法,建立高質(zhì)量的數(shù)據(jù)模型是確保檢測結(jié)果準(zhǔn)確的必要條件。相比于傳統(tǒng)的檢測方法,NIRS方法具有分析快速、操作簡便、可多組分同時測定、籽實(shí)能在無污染和無損傷條件下進(jìn)行分析等優(yōu)點(diǎn),保證種子能正常繁殖接代,目前已廣泛應(yīng)用于油菜、大豆、花生和亞麻等油料作物[7]。
本研究選取50份具有代表性的油用向日葵材料,構(gòu)建定量分析向日葵籽仁脂肪和4種主要脂肪酸含量的近紅外光譜模型,可快速無損檢測油用向日葵種子的品質(zhì),對于油用向日葵種質(zhì)資源快速篩選以及品質(zhì)育種具有重要意義。
于2016年在黑龍江省農(nóng)業(yè)科學(xué)院經(jīng)濟(jì)作物研究所種質(zhì)資源庫根據(jù)種子粒型和來源等,選取50份差異較大且具有代表性的油用向日葵材料,其中包括本單位選育的材料及國內(nèi)外引進(jìn)的資源(包括保持系、恢復(fù)系、雜交種和常規(guī)種)。
1.2.1 光譜采集 利用瑞典波通(Perten)公司型號為DA7200的二極管陣列近紅外光譜儀,首先設(shè)置儀器工作參數(shù),譜區(qū)掃描范圍是950~1650nm,采樣間隔為1nm,掃描次數(shù)是32,SPC文件分辨率是5nm。利用Simplicity TM軟件采集光譜,利用The Unscrambler 9.8軟件進(jìn)行數(shù)據(jù)分析和模型構(gòu)建。對向日葵種子進(jìn)行脫殼處理,儀器提前預(yù)熱30min,每個樣品掃描3次,重復(fù)裝樣3次,取平均光譜,保存后待分析。
1.2.2 脂肪和脂肪酸含量的測定 脂肪和主要脂肪酸(亞油酸、油酸、硬脂酸和棕櫚酸)含量的測定委托農(nóng)業(yè)部谷物及制品質(zhì)量監(jiān)督檢驗(yàn)測試中心(哈爾濱)完成,將烘干后的樣品粉碎至粉末后,采用索氏提取法測定脂肪含量(干基),檢測方法按照NY/T 4-1982;利用氣相色譜儀YLSB076測定脂肪酸含量,檢測方法按照GB/T 17376-2008,每個樣品重復(fù)測定3次,最后取平均值為樣品成分含量的標(biāo)準(zhǔn)值。
1.2.3 近紅外光譜模型的建立 采用偏最小二乘法(partial least squares,PLS)進(jìn)行模型的構(gòu)建。為消除背景噪聲影響,使用各種光譜預(yù)處理方法優(yōu)化模型,包括多元信號矯正(MSC)、標(biāo)準(zhǔn)正則變換(SNV)、一階導(dǎo)數(shù)(1st)以及多種方法結(jié)合。模型的預(yù)測精度和穩(wěn)健性采用校正相關(guān)系數(shù)R2、預(yù)測相關(guān)系數(shù)R2、校正均方根誤差(RMSEC)和預(yù)測均方根誤差(RMSEP)這4個參數(shù)來評價。
由50份油用向日葵籽仁脂肪和4種脂肪酸含量結(jié)果(表1)可以看出,脂肪、亞油酸和油酸含量的標(biāo)準(zhǔn)差均≥4.31,標(biāo)準(zhǔn)差較大,表明用于建模的樣品這幾種成分含量分布合理,范圍較大,樣品具有代表性。硬脂酸和棕櫚酸含量的標(biāo)準(zhǔn)差分別為0.85和0.49,其標(biāo)準(zhǔn)差偏低,可能是由于向日葵籽仁自身硬脂酸和棕櫚酸含量較低,導(dǎo)致樣本間差異較小。
表1 向日葵籽仁脂肪和脂肪酸化學(xué)測定值的統(tǒng)計(jì)分析Table 1 Statistical analysis of fat and fatty acids by chemical determination in sunflower seed kernels
對50份向日葵籽仁樣品進(jìn)行光譜采集,得到各樣品的原始光譜圖(圖1),各樣品吸光度均在0.5以下,不同波長下各樣品近紅外光譜的波峰、波谷和走勢相似,說明各樣品成分較為相似,油用向日葵種子中含有較多脂肪和蛋白質(zhì)等有機(jī)物質(zhì)。相同波長下樣品間的吸光度不完全重合,表明向日葵籽仁樣品間各組分含量具有差異性。
圖1 向日葵籽仁原始近紅外光譜Fig.1 Original near-infrared spectroscopy of sunflower seed kernels
為減小向日葵籽仁樣品不均勻產(chǎn)生的影響,消除光譜信號中的基線漂移、光散射和背景這些干擾信息及噪聲,提高模型的穩(wěn)健度,利用一階導(dǎo)數(shù)(1st)、標(biāo)準(zhǔn)正則變換(SNV)、一階導(dǎo)數(shù)結(jié)合標(biāo)準(zhǔn)正則變換(1st+SNV)以及多元信號矯正結(jié)合一階導(dǎo)數(shù)(MSC+1st)4種光譜處理方式,對原始光譜進(jìn)行處理,比較并篩選向日葵籽仁各組分模型的最優(yōu)光譜處理方法。圖2為4種方法處理后的光譜,修正了光譜峰的偏移和漂移,光譜更緊密,輪廓更清晰。
圖2 4種方法預(yù)處理后的光譜Fig.2 Spectrum after pretreatment by four methods
定量模型的校正和預(yù)測相關(guān)系數(shù)R2越高,校正和預(yù)測均方根誤差(RMSEC和RMSEP)值越低,表明模型預(yù)測精準(zhǔn)度越好。從不同光譜預(yù)處理方法所建近紅外模型的參數(shù)(表2)可以看出,經(jīng)MSC+1st處理后的脂肪含量模型為最佳模型,校正和驗(yàn)證相關(guān)系數(shù)R2分別為0.98和0.97,RMSEC和RMSEP分別為0.70和0.88;經(jīng)MSC+1st處理后的亞油酸含量模型為最佳模型,校正和驗(yàn)證相關(guān)系數(shù)R2分別為0.98和0.97,RMSEC和RMSEP分別為0.49和0.71;經(jīng)過1st+SNV處理后的油酸含量模型為最佳模型,校正和驗(yàn)證相關(guān)系數(shù)R2分別為0.98和 0.96,RMSEC和RMSEP分別為0.68和0.99;經(jīng)過1st處理后的硬脂酸含量模型為最佳模型,校正和驗(yàn)證相關(guān)系數(shù)R2分別為0.92和0.83,RMSEC和RMSEP分別為0.25和0.37;經(jīng)過SNV處理后的棕櫚酸含量模型為最佳模型,校正和驗(yàn)證相關(guān)系數(shù)R2分別為0.82和0.74,RMSEC和RMSEP分別為0.18和0.23。上述結(jié)果顯示脂肪、亞油酸和油酸所建最佳模型相關(guān)系數(shù)均大于0.96,且具有較低的均方根誤差,說明籽仁脂肪、亞油酸和油酸含量與近紅外光譜具有極強(qiáng)的相關(guān)性,而硬脂酸和棕櫚酸所建最佳模型相關(guān)系數(shù)相對較低,但也均大于0.74(圖 3)。
表2 不同預(yù)處理方法的籽仁脂肪及4種主要脂肪酸含量模型結(jié)果Table 2 Results of the models of fat content and four main fatty acids of seed kernels by using different pretreatment methods
圖3 向日葵籽仁脂肪和4種脂肪酸含量最佳模型校正(左)和預(yù)測(右)相關(guān)圖Fig.3 Correlation diagrams of calibration (left) and prediction (right) for the optimum model of fat and four fatty acids in sunflower seed kernels
隨機(jī)選取10份未參與建模的油用向日葵材料,利用相同方法對籽仁脂肪和脂肪酸含量進(jìn)行測定,并利用所建模型進(jìn)行成分含量的預(yù)測,通過比較樣本的化學(xué)值和近紅外預(yù)測值(表3),結(jié)果發(fā)現(xiàn),脂肪、亞油酸和油酸近紅外預(yù)測值與化學(xué)值之間相對誤差在1.25%~8.15%之間,均在10%以下,表明模型預(yù)測準(zhǔn)確度較高,能夠滿足樣品成分含量的快速測定,硬脂酸和棕櫚酸近紅外預(yù)測值與化學(xué)值之間相對誤差在4.66%~17.99%之間,可用于樣品成分含量的初步預(yù)測。
表3 10份材料化學(xué)值與近紅外預(yù)測值比較Table 3 Comparison of the chemical values and the predicted values of near-infrared of ten materials %
構(gòu)建模型所用樣品的成分含量范圍決定了模型適應(yīng)性,成分含量范圍必須要盡可能廣泛,才可以保證未來利用模型測定樣品的數(shù)值不會發(fā)生異?;虺霈F(xiàn)較大偏差[8],本研究構(gòu)建的硬脂酸和棕櫚酸的模型相關(guān)系數(shù)偏低,可能是由于向日葵種子中本身這2種成分含量較低,且變異幅度小,致使建模挑選樣品的代表性不夠好,同時由于其含量低,在利用化學(xué)方法測定中容易造成誤差,導(dǎo)致化學(xué)值準(zhǔn)確性低,進(jìn)而影響了模型的質(zhì)量[9]。向日葵種子脂肪酸組成除品種之間差異外,還受到多種因素的影響,如溫度[10-11]、土壤含鹽量[12]、播種期和播種密度[13],本研究中硬脂酸和棕櫚酸含量分布范圍較小,除由于材料自身特性外,也可能是由于環(huán)境因素影響所導(dǎo)致。本研究沒有將脂肪和脂肪酸含量表現(xiàn)為極值的向日葵材料作為建模樣品,主要因?yàn)檫@種類型樣品量太少,與其他樣品之間成分差異太大,只有積累較多此類樣品后才能加入到定標(biāo)集中,未來我們將通過增加樣品的數(shù)量從而擴(kuò)大樣品的變異幅度,對其進(jìn)行進(jìn)一步的優(yōu)化及完善。
不同光譜預(yù)處理方法會影響近紅外分析模型的精準(zhǔn)度,所以選擇最佳的預(yù)處理方法十分重要。一般使用的光譜預(yù)處理方法包括SNV、MSC、1st、二階導(dǎo)數(shù)和標(biāo)準(zhǔn)化處理法(normalization)等以及各種預(yù)處理方法的組合[14]。單?;ㄉN子近紅外模型建立發(fā)現(xiàn)一階導(dǎo)數(shù)結(jié)合多元信號矯正是棕櫚酸和亞油酸光譜的最優(yōu)預(yù)處理方法,一階導(dǎo)數(shù)結(jié)合矢量歸一化是油酸光譜的最優(yōu)預(yù)處理方法[15]。茶油脂肪酸組分近紅外模型構(gòu)建發(fā)現(xiàn)油酸和α-亞麻酸采用SNV預(yù)處理,十七烷酸和硬脂酸采用SNV和1st預(yù)處理,棕櫚酸和不飽和脂肪酸采用1st和趨近歸一化(normalization by closure)預(yù)處理所構(gòu)建模型較好[16]。油用牡丹種仁脂肪酸近紅外模型建立發(fā)現(xiàn),油酸最優(yōu)光譜預(yù)處理方法是SNV+1st,亞油酸是MSC+1st,亞麻酸是MSC,棕櫚酸是SNV[17],這與本研究中油酸、亞油酸和棕櫚酸最佳光譜預(yù)處理方法是一致的。
NIRS在向日葵中的研究很早就有報(bào)道。我們之前分別對向日葵完整種子、籽仁和粉末構(gòu)建向日葵粗蛋白含量的近紅外光譜模型,發(fā)現(xiàn)相比于完整種子,籽仁和粉末模型預(yù)測的精確度更高[18],因此為保證操作簡便和結(jié)果準(zhǔn)確,本研究選擇了脫殼后的籽仁進(jìn)行模型構(gòu)建。關(guān)于向日葵脂肪酸含量近紅外模型的研究已有一些報(bào)道,Sato等[19]發(fā)現(xiàn)NIRS定量分析的準(zhǔn)確性較高,利用向日葵籽仁建立的脂肪酸近紅外模型相關(guān)系數(shù)R2達(dá)到0.993。Velasco等[20]建立了向日葵籽仁可靠的脂肪酸測定模型,采用交叉驗(yàn)證評估硬脂酸、油酸和亞油酸建模效果,R2在0.83~0.93之間,這個研究實(shí)現(xiàn)了向日葵籽仁脂肪酸含量的無損單粒檢測。Fassio等[21]構(gòu)建向日葵種子水分、脂肪和蛋白NIRS模型,其R2在0.90~0.96之間。Pérez-Vich等[22]構(gòu)建向日葵完整種子、籽仁、粉末和葵花油的NIRS模型,其中籽仁、粉末和葵花油預(yù)測結(jié)果較好,籽仁模型R2在0.90~0.97之間。汪磊等[23]建立向日葵籽仁粗蛋白、粗脂肪、油酸和亞油酸等重要品質(zhì)性狀的近紅外模型,其R2在0.913~0.975之間。本研究利用最佳光譜預(yù)處理方法構(gòu)建的脂肪、亞油酸和油酸含量的近紅外模型相關(guān)系數(shù)R2在0.96~0.98之間,相比于前人的研究,該模型的相關(guān)系數(shù)較高,說明模型具有較好的預(yù)測能力。盡管研究者已經(jīng)構(gòu)建了一些向日葵品質(zhì)預(yù)測的近紅外模型,但近紅外技術(shù)模型在不同作物、不同設(shè)備及同一設(shè)備不同環(huán)境下,都不具有通用性[23],而且模型的應(yīng)用性還與建模樣品生長氣候、生長條件和收獲季節(jié)等有關(guān)[8],因此,本研究構(gòu)建的NIRS模型,更適用于本地區(qū)氣候條件下進(jìn)行油用向日葵種質(zhì)資源品質(zhì)鑒定和快速篩選,可加快品質(zhì)育種進(jìn)程。
采用無處理及4種光譜預(yù)處理方法構(gòu)建向日葵種子脂肪及4種脂肪酸含量的近紅外模型,其中近紅外掃描光譜與脂肪、亞油酸和油酸含量化學(xué)測定結(jié)果的相關(guān)性較高,采用最佳光譜預(yù)處理方法,校正和驗(yàn)證相關(guān)系數(shù)都大于0.96,且RMSEC和RMSEP都較低,近紅外預(yù)測值與化學(xué)值間相對誤差均在10%以下,能夠滿足樣品成分含量的快速測定。而硬脂酸和棕櫚酸模型近紅外掃描光譜與化學(xué)測定結(jié)果的相關(guān)性相對偏低,校正相關(guān)系數(shù)分別為0.92和0.82,驗(yàn)證相關(guān)系數(shù)分別為0.83和0.74,但RMSEC和RMSEP值均較低,近紅外預(yù)測值與化學(xué)值間相對誤差在4.66%~17.99%之間,可用于樣品成分的初步預(yù)測。