湯菲菲 姚燕 邵玉濤
摘要:馬克隆值是評(píng)價(jià)棉纖維品質(zhì)的一個(gè)重要指標(biāo),提出一種基于Gaussian軟件的波長(zhǎng)篩選方法,以期提高紅外光譜法測(cè)定棉纖維馬克隆值的準(zhǔn)確性。采用基于哈特里-福克方程(簡(jiǎn)稱HF)的從頭算計(jì)算法、半經(jīng)驗(yàn)分子軌道AM1方法和密度泛函理論DFT對(duì)棉纖維分子進(jìn)行量子化學(xué)計(jì)算,并將計(jì)算結(jié)果與棉纖維紅外光譜圖進(jìn)行比較分析,從而得到最優(yōu)理論計(jì)算方法及其基組,進(jìn)而通過(guò)分析該最優(yōu)理論紅外光譜圖得到特征波長(zhǎng)。該方法篩選出的特征波長(zhǎng)為3 727~3 567、3 005~2 700、1 250~1 000 cm-1。分別利用此特征波長(zhǎng)與連續(xù)投影法(SPA)選出的特征波長(zhǎng)建立偏最小二乘(PLS)模型,對(duì)比分析的結(jié)果表明,使用Gaussian軟件DFT密度泛函理論的B3LYP/6-311+G* *方法可以較為準(zhǔn)確地得到最優(yōu)光譜圖,該理論光譜波長(zhǎng)篩選方法可以優(yōu)選出高信噪比的波長(zhǎng)?;贕aussian軟件的波長(zhǎng)篩選方法能夠簡(jiǎn)化紅外建模步驟并提高紅外光譜定量模型的性能。
關(guān)鍵詞:棉花;纖維品質(zhì);纖維分子結(jié)構(gòu);馬克隆值;Gaussian軟件;量子化學(xué);波長(zhǎng)篩選;模型優(yōu)化;效果驗(yàn)證
中圖分類號(hào): O657.33 ?文獻(xiàn)標(biāo)志碼: A ?文章編號(hào):1002-1302(2019)07-0207-03
棉花是我國(guó)重要的戰(zhàn)略物資,是僅次于糧食的第二大類農(nóng)作物,在農(nóng)業(yè)經(jīng)濟(jì)格局中具有重要地位。棉花質(zhì)量的好壞對(duì)于其價(jià)格、生產(chǎn)工藝成本以及后續(xù)產(chǎn)品的質(zhì)量起著至關(guān)重要的作用。馬克隆值是反映棉花纖維細(xì)度與成熟度的綜合指標(biāo),且會(huì)對(duì)成紗工藝、質(zhì)量及織物質(zhì)量產(chǎn)生很大的影響,是棉花貿(mào)易、棉紡工程的重要指標(biāo)。
傳統(tǒng)棉纖維馬克隆值的測(cè)量需要借助Y145C型氣流儀、便攜式氣流儀等儀器[1],這種檢驗(yàn)方法不僅費(fèi)時(shí)費(fèi)力,而且由于個(gè)人經(jīng)驗(yàn)的不同以及把握的標(biāo)準(zhǔn)不同,容易出現(xiàn)人為誤差。紅外光譜是現(xiàn)代結(jié)構(gòu)化學(xué)和分析化學(xué)最常用和不可缺少的工具,具有測(cè)試迅速、操作方便、重復(fù)性好、靈敏度高、不損壞樣本結(jié)構(gòu)等優(yōu)點(diǎn),因此被廣泛應(yīng)用于科學(xué)研究的各個(gè)領(lǐng)域[2]。但紅外光譜對(duì)于復(fù)雜對(duì)象待測(cè)組分的特征吸收頻率會(huì)受到其他組分的干擾,得到的冗余信息較多,從而影響吸收峰位置、強(qiáng)度,甚至峰的形狀,進(jìn)而影響模型的預(yù)測(cè)精度。因此,進(jìn)行光譜定量分析時(shí),必須選擇與待測(cè)組分相關(guān)的高信息量波長(zhǎng),以降低其他組分帶來(lái)的噪聲干擾[3]。Gaussian軟件是一個(gè)成熟、界面友好的量子化學(xué)軟件,可執(zhí)行各類不同精度和理論檔次的量化計(jì)算,并可進(jìn)行分子和化學(xué)反應(yīng)性質(zhì)的理論預(yù)測(cè)。因此,可以利用Gaussian軟件模擬紅外光譜并在進(jìn)行紅外光譜試驗(yàn)之前篩選出特征波長(zhǎng),縮小可用的光譜區(qū)范圍,節(jié)約試驗(yàn)時(shí)間,提高模型預(yù)測(cè)精度。
本研究提出在進(jìn)行紅外光譜試驗(yàn)之前利用Gaussian軟件對(duì)理論模擬光譜進(jìn)行波長(zhǎng)篩選,在最優(yōu)波段運(yùn)用紅外光譜測(cè)量馬克隆值的方法,以期縮短紅外光譜試驗(yàn)的時(shí)間,減少冗余光譜信息,提高預(yù)測(cè)模型的精度。采用3種方法對(duì)棉纖維分子進(jìn)行量子化學(xué)計(jì)算,將計(jì)算結(jié)果與實(shí)際試驗(yàn)光譜圖進(jìn)行對(duì)比分析,從而得到最優(yōu)的理論計(jì)算方法及其基組,并得到與實(shí)際試驗(yàn)較為吻合的理論紅外光譜圖,通過(guò)分析該理論紅外光譜圖進(jìn)一步得到棉纖維分子的頻帶分配信息,進(jìn)而由頻帶分配信息得出特征波長(zhǎng);分別將該特征波長(zhǎng)與連續(xù)投影法(SPA)選擇的特征波長(zhǎng)建立偏最小二乘(PLS)模型,并對(duì)模型優(yōu)化效果進(jìn)行驗(yàn)證。
1 紅外吸收光譜原理解析
紅外吸收光譜是由分子振動(dòng)、轉(zhuǎn)動(dòng)能級(jí)的躍遷所形成的[4]。在有機(jī)分子中,不同基團(tuán)選擇性地吸收不同頻率的紅外輻射,引起分子的能量變化,發(fā)生不同振動(dòng)能級(jí)的躍遷,形成獨(dú)特的紅外吸收光譜。絕大多數(shù)有機(jī)化合物和無(wú)機(jī)離子的基頻吸收帶出現(xiàn)在中紅外光譜區(qū),由于基頻振動(dòng)是紅外光譜中吸收最強(qiáng)的振動(dòng),因此該區(qū)被廣泛應(yīng)用于化合物分析、結(jié)構(gòu)分析和其他化學(xué)過(guò)程的定性定量分析中[5]。本研究對(duì)棉纖維結(jié)構(gòu)以及內(nèi)部分子振動(dòng)的分析也在中紅外區(qū)域進(jìn)行。
2 Gaussian軟件的使用
Gaussian軟件作為強(qiáng)大的工具,可以研究許多化學(xué)領(lǐng)域的課題,也正是因?yàn)樵撥浖谟?jì)算分子振動(dòng)頻率方面具有較高的精度,本研究采用該軟件對(duì)棉纖維分子進(jìn)行結(jié)構(gòu)優(yōu)化和紅外振動(dòng)光譜的模擬計(jì)算。整個(gè)計(jì)算過(guò)程為利用GaussView 5.0、Chemdraw/Chem 3D、Hyperchem等繪圖軟件繪制輸入文件[6],選擇合適的基組對(duì)該文件進(jìn)行幾何優(yōu)化,幾何優(yōu)化的目的是尋找分子穩(wěn)定的幾何形態(tài),即將建立的模型優(yōu)化到一個(gè)能量極小的點(diǎn)上[7];然后使用相同的基組選擇合適的方法進(jìn)行頻率計(jì)算[8],并通過(guò)GaussView 5.0顯示計(jì)算結(jié)果。
整個(gè)理論計(jì)算過(guò)程如圖1所示,通過(guò)該過(guò)程能夠在理論上得到較為準(zhǔn)確的分子理論振動(dòng)譜。
3 棉纖維的紅外光譜理論解析
3.1 基組的選擇
采用GaussView 5.0軟件繪制棉纖維分子結(jié)構(gòu)圖,并分別采用哈特里-??朔匠蹋℉F)從頭算理論、AM1半經(jīng)驗(yàn)理論和DFT密度泛函理論對(duì)棉纖維分子進(jìn)行量子化學(xué)計(jì)算[7]。每種理論計(jì)算方法的幾何優(yōu)化和頻率計(jì)算均在相同的理論水平和基組上完成,HF方法選擇的基組是HF/6-31G(d),DFT方法選取的基組為B3LYP/6-311+G(d,p),一般表示為B3LYP/6-311+G* *[9]。計(jì)算結(jié)果沒(méi)有虛頻出現(xiàn),說(shuō)明得到的分子結(jié)構(gòu)是一個(gè)穩(wěn)定的構(gòu)象。棉纖維分子結(jié)構(gòu)如圖2所示。
吸光度分別采用HF、AM1、DFT方法算出的結(jié)果,EXP代表的是試驗(yàn)光譜,根據(jù)式(1)、式(2)可得到理論計(jì)算光譜。圖3代表的是在紅外光譜指紋區(qū)(1 330~400 cm-1)使用3種不同方法計(jì)算出的結(jié)果以及實(shí)際試驗(yàn)得到的棉纖維吸光度信息,圖4代表的是在紅外光譜特征區(qū)(4 000~1 330 cm-1)使用3種不同方法計(jì)算出的結(jié)果以及實(shí)際試驗(yàn)得到的棉纖維吸光度信息。
由圖3、圖4可知,利用DFT密度泛函理論的B3LYP/6-311+G* *方法所得到的計(jì)算結(jié)果在吸收峰數(shù)量、波形形狀以及頻率位置、吸光度上與試驗(yàn)吸收峰最為接近,而HF、AM1方法得到的吸收譜與試驗(yàn)結(jié)果相差較大,這可能與理論本身精度不夠或選取的基組偏小有關(guān)。相對(duì)于HF和AM1方法,DFT采用了B3LYP/6-311+G* *較大基組,并有效地考慮了電子交換和電子相關(guān)能量,因而有較高的計(jì)算正確率。
3.2 基于最優(yōu)光譜圖的特征波長(zhǎng)篩選
從圖5、圖6可以看出,Gaussian軟件鑒定基團(tuán)的結(jié)果與理論結(jié)果是很符合的,且理論光譜(DFT)與試驗(yàn)光譜的變化趨勢(shì)大體相同,只是存在一定程度的偏移,主要原因?yàn)椋?)試驗(yàn)是在常溫下進(jìn)行的,而理論計(jì)算在絕對(duì)零度的條件下進(jìn)行,隨著溫度的升高,棉纖維的吸收峰強(qiáng)度也會(huì)增強(qiáng)[11];(2)理論計(jì)算時(shí)采用的是單分子模型,只能得到分子內(nèi)的振動(dòng)模式,而忽略了分子之間的范德華力、氫鍵弱作用力以及晶格振動(dòng)等。因此,理論計(jì)算結(jié)果與試驗(yàn)結(jié)果不可能完全相符,但可從另一角度驗(yàn)證吸收峰來(lái)源判斷的正確性。
纖維素大分子的官能團(tuán)主要是羥基(—OH)、亞甲基(—CH2)和醚鍵[R—O—R(R′)]。從圖5、圖6可以看出,在4 000~400 cm-1范圍內(nèi),棉纖維最強(qiáng)的紅外吸收帶在1 060 cm-1 附近,在其兩側(cè)有很多弱的肩峰,在2 855、2 932、3 647 cm-1處也有較強(qiáng)的紅外吸收帶。根據(jù)紅外光譜基團(tuán)吸收帶的數(shù)據(jù)可知,一般情況下,羥基、亞甲基、醚鍵的實(shí)際吸收帶分別為 3 630、2 900、1 100 cm-1左右。結(jié)合基團(tuán)吸收頻率與分子振動(dòng)之間的關(guān)系,可以得出棉纖維分子的頻帶分配結(jié)果(表1)。根據(jù)吸光度波長(zhǎng)篩選方法[12]可得到,選取的特征波段為 3 727~3 567、3 005~2 700、1 250~1 000 cm-1,波長(zhǎng)點(diǎn)個(gè)數(shù)為715個(gè)。
3.3 特征波長(zhǎng)篩選方法有效性檢驗(yàn)
連續(xù)投影算法(SPA)是一種使矢量空間共線性最小化的前向變量選擇算法,其優(yōu)勢(shì)在于提取全波段的幾個(gè)特征波長(zhǎng),能夠消除原始光譜矩陣中冗余的信息,可用于光譜特征波長(zhǎng)的篩選。近年來(lái),國(guó)內(nèi)外學(xué)者在利用光譜分析技術(shù)檢測(cè)作物和食品中某些重要成分的含量時(shí),采用連續(xù)投影算法進(jìn)行有效波長(zhǎng)的選取[13]。作為對(duì)比,本研究采用連續(xù)投影算法提取特征波長(zhǎng),分別建立偏最小二乘模型,以驗(yàn)證基于Gaussian軟件波長(zhǎng)篩選方法的有效性。試驗(yàn)收集了30個(gè)棉纖維樣本,隨機(jī)選擇25個(gè)樣本為訓(xùn)練集,5個(gè)為測(cè)試集,采用大容量棉花纖維測(cè)試儀(HVI)[14]測(cè)得棉纖維樣本的馬克隆值,并使用美國(guó)Thermo Fisher Scientific公司生產(chǎn)的Nicolet系列NEXUS670型號(hào)的傅里葉變換紅外光譜儀測(cè)量30個(gè)樣本的紅外吸收光譜。紅外試驗(yàn)在室溫(20~23 ℃)環(huán)境下進(jìn)行,光譜儀的掃描方式為漫反射方式,分辨率為8 cm-1,自動(dòng)掃描32次,記錄其平均光譜。
對(duì)試驗(yàn)數(shù)據(jù)分別進(jìn)行偏最小二乘回歸,由結(jié)果(圖7)可知,SPA算法優(yōu)選的波長(zhǎng)為13個(gè),此時(shí)的預(yù)測(cè)平均標(biāo)準(zhǔn)偏差(RMSE)最小,為0.16,2種不同波長(zhǎng)篩選方法得到的預(yù)測(cè)結(jié)果對(duì)比如表2所示。SPA方法提取出了13個(gè)特征波段,分別為1 060、1 087、1 248、2 757、2 790、2 855、2 932、2 853、3 002、3 621、3 647、3 696、3 705 cm-1,它們均分布在本研究方法篩選出的特征波段中,由表2可知,采用SPA方法預(yù)測(cè)相關(guān)系數(shù)達(dá)到0.825,表明該算法確實(shí)提取了建模所需要的有用信息,簡(jiǎn)化了模型的計(jì)算,但是與之相比,本研究提出的波長(zhǎng)篩選方法建立的模型預(yù)測(cè)精度更高。
4 結(jié)論
本研究提出一種基于理論吸收光譜篩選出最優(yōu)波長(zhǎng)并測(cè)定馬克隆值的新方法,該方法利用Gaussian軟件采用DFT密度泛函理論的B3LYP/6-311+G* *基組得到最優(yōu)光譜圖,分別將該方法篩選出的特征波長(zhǎng)與SPA法得到的特征波長(zhǎng)建立PLS模型,通過(guò)比較相關(guān)系數(shù)以及均方根誤差可知,該方法能夠有效地篩選出有用的特征波長(zhǎng)信息,且選擇效果優(yōu)于經(jīng)典的連續(xù)投影法。通過(guò)理論模擬紅外吸收光譜進(jìn)行波長(zhǎng)篩選,并在篩選出的波長(zhǎng)范圍內(nèi)進(jìn)行后續(xù)的紅外光譜試驗(yàn),可簡(jiǎn)化建模計(jì)算,提高棉纖維馬克隆值的預(yù)測(cè)精度。
參考文獻(xiàn):
[1]孟莉莉. 棉花檢驗(yàn)中的馬克隆值測(cè)試方法[J]. 中國(guó)纖檢,2014(7):78-79.
[2]楊新河,王麗麗,黃建安,等. 傅里葉變換紅外光譜鑒別黑茶樣品[J]. 食品科學(xué),2012,33(14):203-205.
[3]陳藝芳. 可見(jiàn)-近紅外-中紅外光譜用于人血清白蛋白分析的方法研究[D]. 廣州:暨南大學(xué),2016.
[4]黃 莉. 紅外光譜結(jié)合模式識(shí)別技術(shù)在微量車漆物證分析中的應(yīng)用[J]. 法制與社會(huì),2016(35):273,277.
[5]岳飛亨. 基于太赫茲波的持久性有機(jī)物檢測(cè)技術(shù)研究[D]. 杭州:浙江大學(xué),2012.
[6]顏志剛. 基于太赫茲時(shí)域光譜技術(shù)的生物分子和農(nóng)藥分子的檢測(cè)技術(shù)研究[D]. 杭州:浙江大學(xué),2008.
[7]Yu W,Yang L,Zhang T L,et al. Crystal structure and geometry-optimization study of 4-methyl-3′,5′-dinitor-4′-methyl benzylidene aniline[J]. Journal of Molecular Structure,2006,794(1/2/3):255-260.
[8]胡皆漢,葉金星,程國(guó)寶,等. β-欖香烯振動(dòng)光譜的量子化學(xué)從頭計(jì)算[J]. 光譜學(xué)與光譜分析,2001,21(2):163-168.
[9]Fischer B M,Walther M,Uhd Jepsen P. Far-infrared vibrational modes of DNA components studied by terahertz time-domain spectroscopy[J]. Physics in Medicine and Biology,2002,47(21):3807-3814.
[10]Yu B,Zeng F,Yang Y,et al. Torsional vibrational modes of tryptophan studied by terahertz time-domain spectroscopy[J]. Biophysical Journal,2004,86(3):1649-1654.
[11]趙永會(huì),顧丹丹,馮俊霞,等. 二維紅外光譜法分析纖維素[J]. 理化檢驗(yàn)(化學(xué)分冊(cè)),2015,51(11):1497-1500.
[12]梁 瑜. 基于吸光度的波長(zhǎng)篩選方法用于近紅外光譜定量模型的優(yōu)化[J]. 電子測(cè)試,2016(21):62-64.
[13]劉明博,唐延林,李曉利,等. 水稻葉片氮含量光譜監(jiān)測(cè)中使用連續(xù)投影算法的可行性[J]. 紅外與激光工程,2014,43(4):1265-1271.
[14]馬浩彩,郝秀美. 使用美棉紡細(xì)號(hào)紗棉結(jié)的控制[J]. 棉紡織技術(shù),2011,39(3):142-144.程 欣,林 立,林樂(lè)靜,等. 4種槭樹(shù)種子油脂肪酸組成及含量比較[J]. 江蘇農(nóng)業(yè)科學(xué),2019,47(7):220-224.