羅 峻,吳淑煥,聶鳳明,許 敏,范 偉,梁逸曾3
(1.廣州纖維產(chǎn)品檢測研究院,國家紡織品服裝服飾產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心(廣州),廣東 廣州 511447;2.湖南農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,湖南 長沙 410128;3.中南大學(xué)化學(xué)化工學(xué)院,湖南 長沙 410083)
近紅外光譜與模型集群分析測定毛滌混紡織物成分含量
羅峻1,吳淑煥1,聶鳳明1,許敏1,范偉2,梁逸曾3
(1.廣州纖維產(chǎn)品檢測研究院,國家紡織品服裝服飾產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心(廣州),廣東 廣州 511447;2.湖南農(nóng)業(yè)大學(xué)生物科學(xué)技術(shù)學(xué)院,湖南 長沙 410128;3.中南大學(xué)化學(xué)化工學(xué)院,湖南 長沙 410083)
將近紅外光譜法和模型集群分析方法應(yīng)用于毛滌混紡織物成分含量的快速無損測定。以近紅外測量方法采集93個毛滌混紡織物的光譜信號,利用光譜預(yù)處理消除信號漂移的影響,在模型集群分析基礎(chǔ)上,剔除異常樣本,篩選出30個關(guān)鍵波長,采用偏最小二乘法(PLS)建立滌綸含量的預(yù)測模型。所建立模型的訓(xùn)練集相關(guān)系數(shù)r2為0.9827、交互驗(yàn)證均方誤差(RMSECV)為3.26、預(yù)測均方根誤差(RMSEP)為3.34,預(yù)測結(jié)果令人滿意,適合于毛滌混紡織物中滌綸含量的快速、無損檢測。
近紅外光譜;模型集群分析;毛滌混紡織物;偏最小二乘法
當(dāng)前,我國的紡織品生產(chǎn)、出口和消費(fèi)均居世界第一。所以無論是政府監(jiān)管還是企業(yè)自檢自控,紡織品成分檢測的規(guī)模都非常巨大。然而,傳統(tǒng)的紡織品成分檢測方法如化學(xué)溶解法和顯微鏡法等,存在檢測時(shí)間長,檢測環(huán)境要求高、使用強(qiáng)酸強(qiáng)堿試劑,檢測成本高,需破壞樣品等缺點(diǎn),無法滿足各檢驗(yàn)監(jiān)督部門,包括生產(chǎn)企業(yè)對紡織品進(jìn)行大量檢測的需求[1-4]。在這種情況下,部分不法企業(yè)擅自降低混紡面料中某些纖維成分的含量,偷工減料,以次充好,牟取不當(dāng)利潤,造成不良影響。由近期全國各地公布的質(zhì)量狀況分析結(jié)果可看出,不合格紡織品中成分及含量與實(shí)際不符的問題最為嚴(yán)重[5]。
基于以上需求,研究和開發(fā)一種快速、無損、環(huán)境友好的檢測方法具有很好的應(yīng)用前景。近紅外光譜(NIR)是一種無損分析技術(shù)[6],它將近紅外光譜信號與化學(xué)分析數(shù)據(jù),利用統(tǒng)計(jì)回歸方法建立預(yù)測模型,然后測量未知樣品的光譜來快速預(yù)測其成分含量[7-8]。質(zhì)檢部門可利用近紅外快速檢測技術(shù)進(jìn)行初步篩查,對于快檢不合格的情況,依法啟動抽樣檢驗(yàn)程序,實(shí)現(xiàn)對紡織品企業(yè)、原材料加工廠、成衣加工廠以及批發(fā)零售終端等大批量的抽檢,充分保證國內(nèi)紡織品的質(zhì)量[9-10]。
當(dāng)前,已有關(guān)于近紅外光譜技術(shù)應(yīng)用于紡織品定量分析中的報(bào)道,但相關(guān)的研究主要集中在棉/滌、棉/氨等混紡織物[1,3,8-9],毛滌混紡織物報(bào)道較少。另外混紡織物近紅外光譜檢測的目標(biāo)在于建立一個有效可靠的預(yù)測模型,實(shí)現(xiàn)對未知樣本的含量預(yù)測。在實(shí)際工作中,這個模型的建立并不容易,由于模型完全未知,建模需要進(jìn)行探索,并且需要解決異常樣本、干擾信息等問題。傳統(tǒng)的一次性建模思路容易陷入模型欠擬合與過擬合的狀況。而新進(jìn)發(fā)展的模型集群分析打破了傳統(tǒng)一次性建模思路,力求最大限度地利用已有樣本信息,通過隨機(jī)采樣,從樣本空間、變量空間或是模型空間考察數(shù)據(jù)集的內(nèi)在性質(zhì),基于所得結(jié)果的統(tǒng)計(jì)分析可進(jìn)行異常樣品的檢測、關(guān)鍵波長的篩選和模型的評價(jià)等[11-12]?;诖?,本研究共收集毛滌混紡織物樣本共93個,建立了基于模型集群分析的毛滌混紡織物組分含量的近紅外光譜快速無損檢測方法。
1.1樣本
本實(shí)驗(yàn)研究的毛滌混紡織物樣本共計(jì)93個,均為市場購買成品樣本。成分含量按照標(biāo)準(zhǔn) FZ/T 01057系列進(jìn)行定性鑒別,按照國家標(biāo)準(zhǔn)GB/T 2910系列進(jìn)行成分含量定量分析。
1.2光譜信號的采集
信號采集來源為近紅外光譜儀(ANTARIS II,Thermo fisher),樣品采用漫反射方式測量,為保證樣品信號的代表性,每個樣品測量3次并取3次平均值作為其光譜信號數(shù)據(jù),信號采集時(shí)室內(nèi)溫度為20℃,濕度為60%。
1.3方法與原理
模型集群分析。模型集群分析的算法框架主要包括3個基本要素:1)通過隨機(jī)采樣獲取子數(shù)據(jù)集;2)針對每個子數(shù)據(jù)集,建立相應(yīng)子模型;3)從樣本空間、變量空間、參數(shù)空間或模型空間對所有建立的集群子模型的參數(shù)與結(jié)果進(jìn)行統(tǒng)計(jì)分析,獲取有用信息[13]。
應(yīng)用該算法框架可以進(jìn)行異常樣品的檢測、關(guān)鍵波長的篩選和模型的評價(jià)?;谀P图悍治龅漠惓颖咀R別方法可克服不同異常樣本的掩蔽效應(yīng),有效識別光譜信號及化學(xué)分析數(shù)據(jù)的異常值。具體算法如下:采用隨機(jī)分組的方式,將樣本集分為70%的訓(xùn)練集和30%的測試集。采用訓(xùn)練集樣本建立回歸模型并對測試集樣本進(jìn)行預(yù)測,重復(fù)該過程多次(本研究為3000次),可得每個樣本預(yù)測誤差的統(tǒng)計(jì)分布,計(jì)算每個樣本的殘差分布均值μ和標(biāo)準(zhǔn)偏差б并作圖,預(yù)測誤差分布的均值或偏差異常的樣本即被識別為異常樣本[14]。
基于模型集群分析的波長篩選方法可顯著提高近紅外分析預(yù)測的準(zhǔn)確度。因?yàn)榻t外光譜數(shù)據(jù)的共線性非常嚴(yán)重,其波長點(diǎn)數(shù)為幾百個至上千個。如此多的波長點(diǎn)數(shù)不僅存在著信息的冗余,而且部分波長的信號可能為干擾信息,對預(yù)測不利。因此,在建立預(yù)測模型時(shí)也需要對近紅外光信號進(jìn)行波長的篩選。對于毛滌混紡織物的關(guān)鍵波長篩選,我們設(shè)計(jì)了一種基于模型集群分析的新方法:MPA-PSO方法。PSO(粒子群優(yōu)化)是一種源于對鳥群捕食行為研究的進(jìn)化計(jì)算技術(shù)[15]。是一種基于疊代的優(yōu)化工具,系統(tǒng)初始化為一組隨機(jī)解,在解空間通過疊代搜尋最優(yōu)值。在PSO中,每個優(yōu)化問題的潛在解都可以想象成D維搜索空間上的一個點(diǎn),可稱之為“粒子”,所有的粒子都有一個被目標(biāo)函數(shù)決定的適應(yīng)值,每個粒子還有一個速度決定他們飛翔的方向和距離,然后粒子們就追隨當(dāng)前的最優(yōu)粒子在解空間中搜索。PSO方法實(shí)現(xiàn)較為簡便,本研究基于模型集群分析框架,通過隨機(jī)采樣,獲得不同的子數(shù)據(jù)集,然后對每個數(shù)據(jù)集進(jìn)行PSO關(guān)鍵波長篩選,根據(jù)選出波長的頻率來確定最終關(guān)鍵波長。
1.4數(shù)據(jù)處理
本文所采用的光譜信號處理及回歸等程序均在Matlab R2015b環(huán)境下運(yùn)行。
2.1樣本的劃分
在多元校正模型的建立及驗(yàn)證時(shí),需要將數(shù)據(jù)樣本劃分為訓(xùn)練集和獨(dú)立測試集。訓(xùn)練集用來優(yōu)化參數(shù)建立模型,獨(dú)立測試集不參與建模過程,僅用來驗(yàn)證模型的預(yù)測效果。本文采用Kenard-Stone樣本選擇方法,從總計(jì)93個毛滌織物樣本中篩選出具有代表性的80個樣本用于訓(xùn)練模型,13個樣本用于測試模型。
2.2光譜的預(yù)處理
在進(jìn)行混紡織物的近紅外光譜檢測時(shí),一般采用積分球漫反射的模式測量。測量過程中雖然盡量保持了環(huán)境條件的一致,但是混紡織物其表面結(jié)構(gòu)、平整性、厚度等不同因素會干擾光譜信息。從圖1中亦可以看出,近紅外信號的漂移非常嚴(yán)重,對近紅外光信號進(jìn)行適當(dāng)預(yù)處理可以干擾因素引起的信號漂移及旋轉(zhuǎn)等噪聲,從而提高信噪比,為建立預(yù)測模型提供有效信息。在本研究中,選擇5點(diǎn)2次多項(xiàng)式Savitsky-Golay一階微分法進(jìn)行處理,處理后光譜如圖2所示。對比圖1和圖2可看出,經(jīng)過預(yù)處理后,明顯消除了信號的整體漂移,強(qiáng)化了譜帶特征,處理后的光譜更適宜于預(yù)測模型的建立。
2.3異常樣本的檢測
依據(jù)模型集群分析的思路,為最大限度地利用已有訓(xùn)練集樣本信息,可通過隨機(jī)采樣,從樣本空間考察數(shù)據(jù)集的內(nèi)在性質(zhì),根據(jù)所得結(jié)果的統(tǒng)計(jì)分析進(jìn)行異常樣品的檢測。因此在本研究中,采用隨機(jī)分組方法對訓(xùn)練集重復(fù)進(jìn)行分組,每次取總數(shù)70%的樣本來回歸預(yù)測模型,30%進(jìn)行測試。重復(fù)3000次,每個樣本均得到多個預(yù)測值。計(jì)算多個預(yù)測值誤差的平均值與標(biāo)準(zhǔn)方差并繪圖,如圖3所示。可以看出,有樣本預(yù)測誤差均值明顯偏高,如13號樣本?;蚴穷A(yù)測誤差的方差較大,如34及77號樣本。經(jīng)驗(yàn)證,13號樣本為機(jī)織黑色布料,其表面具有裝飾嵌條,34號樣本為混色格子布料,77號樣本為呢料,表面起圈不平整。將此3個異常樣本剔除后建立回歸模型,并與全樣本預(yù)測模型作了比較,剔除后,交互驗(yàn)證均方根誤差(RMSECV)由全樣本的5.27降低到4.62,預(yù)測的準(zhǔn)確度明顯提高。
圖1 毛滌混紡織物的近紅外光譜圖
圖2 毛滌混紡織物的一階微分光譜圖
圖3 均值―方差分布圖
2.4關(guān)鍵波長優(yōu)選
近紅外光譜信號存在較為明顯的信息冗余,因此通過優(yōu)選波長可以提高模型的預(yù)測能力與適用性。本研究采用MPA-PSO法對毛滌混紡織物的關(guān)鍵波長進(jìn)行篩選,PSO具有深刻的智能背景,同其他優(yōu)化算法比較,PSO簡單易實(shí)現(xiàn)且沒有過多參數(shù)需要調(diào)整。運(yùn)行時(shí)首先設(shè)置粒子群搜索參數(shù):粒子種群大小為50,迭代次數(shù)為200,算法運(yùn)行10次,以F=Q2作為適應(yīng)度函數(shù),Q2為交互驗(yàn)證預(yù)測值和量測值的相關(guān)系數(shù)。重復(fù)選擇3000次后,對選出的波長進(jìn)行統(tǒng)計(jì)分析,最終選擇頻率大于50%的30個波長作為其關(guān)鍵波長。30個關(guān)鍵波長具體為:4 034,4 177,4204,4 281,4 756,4 968,4 972,4 975,5 095,5 099,5 103,5 295,6 044,6 113,6 117,6 144,6 198,8 632,8 748,8 751,9 118,9 280,9 338,9 507,9 608,9635,9696,9700,9800,9812cm-1。
利用30個關(guān)鍵波長建立預(yù)測模型的結(jié)果表明,經(jīng)過波長篩選后,預(yù)測誤差有所降低,關(guān)鍵波長預(yù)測模型的交互驗(yàn)證均方差值為之前的70.4%。而且,波長數(shù)量由原始的1557個減少到30個,減少了數(shù)據(jù)處理的工作量,可見MPA-PSO法應(yīng)用于波長篩選來處理近紅外信號可有效簡化模型并提高校正模型的預(yù)測能力。
2.5模型建立與預(yù)測
采用未參與模型建立的獨(dú)立測試集樣本對模型的預(yù)測效果進(jìn)行測試和驗(yàn)證。首先采用預(yù)處理方法對樣本信號進(jìn)行處理,然后調(diào)用訓(xùn)練集樣本建立PLS模型,并對未參與建模的獨(dú)立測試集樣本進(jìn)行預(yù)測,回歸模型的測試集相關(guān)系數(shù)為0.982 7,預(yù)測均方根誤差為3.34,交互檢驗(yàn)均方差為3.26,結(jié)果令人滿意。近紅外預(yù)測值與化學(xué)分析測定值之間的相關(guān)關(guān)系如圖4所示。
圖4 真實(shí)值與近紅外預(yù)測值之間的相關(guān)圖
基于近紅外光譜和模型集群分析對毛滌混紡織物中滌綸含量進(jìn)行了快速無損檢測研究,在模型集群分析框架下,剔除了一些異常樣本,并篩選出了關(guān)鍵波長,利用關(guān)鍵波長進(jìn)行偏最小二乘回歸建模,預(yù)測誤差較小,表明近紅外光譜結(jié)合模型集群分析適合于毛滌混紡織物中纖維成分的快速、無損檢測,而且能達(dá)到令人滿意的檢測精度,為今后混紡織物的快速無損檢測提供了新的選擇。
同時(shí),在本研究中注意到混紡織物樣品復(fù)雜度較大,成分含量跨度同樣較大,下一步計(jì)劃開展分段動態(tài)建模研究,以進(jìn)一步提高預(yù)測準(zhǔn)確率。
[1]桂家祥,耿響,要磊,等.基于近紅外光譜法的棉/滌混紡紡織物中棉含量快速檢測[J].紡織學(xué)報(bào),2012,33(4):55-59.
[2]王京力,耿響,桂家祥.基于近紅外光譜法快速檢測滌氨織物的纖維含量[J].上海紡織科技,2013,41(5):45-48.
[3]鐘浩,楊偉江.運(yùn)用近紅外光譜定量分析紡織面料成分的可行性探討[J].中國纖檢,2008(2):46-47.
[4]馮紅年,甘彬,金尙忠.棉滌混合紡織面料含量的近紅外光譜檢測[J].激光與紅外,2005,35(10):768-770.
[5]虞學(xué)鋒.服裝產(chǎn)品纖維成分含量項(xiàng)目質(zhì)量狀況分析[J].中國纖檢,2014(10):28-29.
[6]陸婉珍.現(xiàn)代近紅外光譜分析技術(shù)[M].北京:中國石化出版社,2006.
[7]梁逸曾.白灰黑復(fù)雜多組份分析體系及其化學(xué)計(jì)量學(xué)算法[M].長沙:湖南科學(xué)技術(shù)出版社,1996:32-36.
[8]王動民,金尙忠,陳華才,等.棉-滌混紡面料中棉含量的近紅外光譜分析[J].光學(xué)精密工程,2008,16(11):2051-2054.
[9]朱洪亮,楊萌,張琦.棉/氨混紡織物氨綸含量快速分析方法研究[J].中國纖檢,2011(24):54-58.
[10]耿響,桂家祥,要磊,等.近紅外光譜快速檢測技術(shù)在紡織領(lǐng)域的應(yīng)用[J].上海紡織科技,2013,41(4):25-27.
[11]王京力,桂家祥,耿響,等.近紅外光譜檢測用纖維含量樣品準(zhǔn)確度研究[J].上海紡織科技,2013,41(9):51-54.
[12]柴金朝,金尙忠.光譜預(yù)處理對棉滌混紡面料近紅外定量模型的影響[J].中國計(jì)量學(xué)院學(xué)報(bào),2008,19(4):325-328.
[13]梁逸曾,許青松.復(fù)雜體系儀器分析-白灰黑分析體系及其多變量解析方法[M].北京:化學(xué)工業(yè)出版社,2012.
[14]CAO D S,LIANG Y Z,XU Q S.A new strategy of outlierdetection for QSAR/QSPR[J].Journal of Computational Chemistry,2009,31(3):592-602.
[15]KHAJEH A,MODARRESS H,ZEINODDINI-MEYMAND H.Application of modified particle swarm optimization as anefficient variable selection strategy in QSAR/QSPR studies[J].Journal of Chemometrics,2012,26(11-12):598 -603.
(編輯:徐柳)
Study on rapid determination of polyester content in polyester/wool based on near infrared spectroscopy and model population analysis
LUO Jun1,WU Shuhuan1,NIE Fengming1,XU Min1,F(xiàn)AN Wei2,LIANG Yizeng3
(1.Guangzhou Fibre Product Testing and Research Institute,Guangzhou 511447,China;2.College of Bioscience and Biotechnology,Hunan Agricultural University,Changsha 410128,China;3.College of Chemistry and Chemical Engineering,Central South University,Changsha 410083,China)
Near-infrared spectroscopy as a rapid,non-destructively testing technique,has been widely used in the fiber product testing field.93 polyester/wool samples were collected.Model population analysis method was employed to detect the outlier and select key variables after preprocessingthespectrabySavitsky-Golayderivativemethod.Partialleastsquares(PLS)calibration models were established by the optimal conditions to predict the content of polyester. Correlation coefficient of determination r2,root-mean-square error of cross-validation(RMSECV)and root-mean-square error of prediction(RMSEP)were used to evaluate the quality of the model. The best models showed satisfactory predictions as measured by the r2,RMSECV and RMSEP values:0.982 7,3.26 and 3.34.The prediction results were better than the whole spectra The results showed that the method was suitable for the fast and reliable determination of the content of polyester in polyester/wool product.
near-infrared spectroscopy;model population analysis;polyester/wool;PLS
A
1674-5124(2016)08-0044-04
10.11857/j.issn.1674-5124.2016.08.009
2015-12-28;
2016-02-19
國家自然科學(xué)基金項(xiàng)目(21275164);國家質(zhì)檢總局科技計(jì)劃項(xiàng)目(2013QK290);廣州市海珠區(qū)科技計(jì)劃項(xiàng)目(2013-cg-08)
羅峻(1983-),男,廣東廣州市人,博士,主要從事紡織品檢測新技術(shù)研發(fā)、新型檢測儀器研發(fā)工作。
范偉(1983-),男,河北邢臺市人,博士,主要從事光譜分析與化學(xué)計(jì)量學(xué)研究。