張 敏 楊 進(jìn) 付海燕 鄒 坤 楊天鳴
(1.天然產(chǎn)物開發(fā)與利用湖北省重點(diǎn)實(shí)驗(yàn)室(三峽大學(xué)),湖北 宜昌 4430022.中南民族大學(xué)藥學(xué)院,武漢 430074)
川續(xù)斷Dipsacus Asperoides C.Y.Cheng et T.M.Ai來源于川續(xù)斷科Dipsae[1],又名川斷.廣泛分布于四川、湖北等地.川續(xù)斷是傳統(tǒng)中藥,具有補(bǔ)肝腎,強(qiáng)筋骨,續(xù)折傷,止崩漏的功效,臨床上主要用于腰膝酸軟,風(fēng)濕麻痹,跌撲損傷等[2].為了有效控制續(xù)斷中藥材的質(zhì)量,本實(shí)驗(yàn)采用近紅外漫反射光譜的方法對(duì)不同產(chǎn)地的川續(xù)斷進(jìn)行了鑒別.
2009年7~8月份在湖北長(zhǎng)陽、千佛山、云南麗江等地收集川續(xù)斷藥材4種,經(jīng)艾鐵民教授鑒定為川續(xù)斷Dipsacus Asperoides C.Y.Cheng et T.M.Ai,具體見表1.
AntarisⅡ傅立葉變換近紅外光譜儀(美國(guó)Thermo Nicolet公司),配有積分球漫反射采樣系統(tǒng)、InGaAs檢測(cè)器和石英樣品杯,Result軟件用于光譜的采集.所有算法的編寫和數(shù)據(jù)處理均在Matlab環(huán)境.
DFF-100手提式高速中藥粉碎機(jī)(溫嶺市林大機(jī)械有限公司),200目標(biāo)準(zhǔn)檢驗(yàn)篩(篩孔200目,孔徑0.074,浙江上虞市五四紗篩廠),DZF-6021真空干燥箱(上海一恒科技儀器有限公司),DHS20-1多功能紅外水分儀(上海天平儀器廠).
表1 樣品信息表
測(cè)定方式:積分球漫反射;掃描次數(shù):50次;掃描范圍:10000~4000cm-1,全部樣品經(jīng)去泥沙、清洗干凈,在60℃下真空干燥24 h,用中藥粉碎機(jī)粉碎后過200目篩,取約1g置測(cè)量杯中,以金箔為參比,按實(shí)驗(yàn)條件進(jìn)行掃描,每個(gè)樣品重復(fù)50次,求平均光譜.共收集了200個(gè)樣品.所有平均光譜均以每個(gè)樣品采集順序進(jìn)行標(biāo)記.
川續(xù)斷藥材的 NIR原圖譜、多元散射校正(MSC)圖譜、二階導(dǎo)數(shù)(SD)圖譜如圖1所示.
圖1 川續(xù)斷藥物的NIR原圖譜、多元散射校正(MSC)圖譜、二階導(dǎo)數(shù)(SD)圖譜
從原始譜圖可以看出,4種不同產(chǎn)地的原始近紅外光譜有相似的吸收模式,各樣品的特征信息很難從峰位、峰強(qiáng)、峰形方面直觀鑒別,其主要差別在于相對(duì)強(qiáng)度不同.這是由于樣品因產(chǎn)地的不同,主要化合物的種類及含量會(huì)有差異.但是,由于光譜的相似性和相關(guān)性,必須依靠化學(xué)模式識(shí)別方法從光譜數(shù)據(jù)中提取相關(guān)化學(xué)信息,才能實(shí)現(xiàn)其鑒別.另外原始圖譜中還存在一定的基線漂移和傾斜,這可能測(cè)量樣品時(shí)因樣品及樣品顆粒不均、散射和各種噪聲及物理擾動(dòng)等使光譜之間產(chǎn)生差異,且可能在不同波長(zhǎng)點(diǎn)處存在對(duì)光譜不同程度的影響.因此,在建立模式識(shí)別分類模型前,對(duì)川續(xù)斷樣品原始光譜進(jìn)行了MSC以克服測(cè)量光的波長(zhǎng)及樣品顆粒的大小和折射率等物理性質(zhì)使光譜散射所導(dǎo)致的差異,通過SD光譜消除基線漂移的影響和基線傾斜所造成的誤差,從圖1(c)中可見光譜分辨峰能得到改善.
在建立PLSDA訓(xùn)練模型之前,將數(shù)據(jù)進(jìn)行均值中心化.將4種不同產(chǎn)地的川續(xù)斷藥物通過隨機(jī)劃分為訓(xùn)練集和預(yù)測(cè)集,具體數(shù)量見表1.
PLSDA模型用第j個(gè)元素為1,其余元素均為0的矢量fj編碼樣品類別,第 j類樣品用fj編碼.訓(xùn)練集樣本的類別矢量構(gòu)成類別矩陣.其中,每一行為一個(gè)樣品的類別矢量,并用每一列對(duì)光譜矩陣進(jìn)行PLSA回歸,由所得到的回歸矩陣與未知樣品的光譜矩陣即可計(jì)算獲得預(yù)測(cè)樣品類別矩陣,然后根據(jù)估計(jì)的類別矩陣中的最大元素出現(xiàn)在類別矢量的位置判定未知樣品的類別.因此對(duì)于200個(gè)4種川續(xù)斷樣品,采用PLSDA模型可將4種分別編碼為f1(1,0,0,0);f2(0,1,0,0);f3(0,0,1,0);f4(0,0,0,1),對(duì)于每個(gè)樣品的產(chǎn)地,PLSDA使用以上虛擬碼關(guān)聯(lián)整個(gè)光譜變量,可獲得與被測(cè)組分或性質(zhì)相關(guān)的特征數(shù)據(jù)矩陣.對(duì)原始光譜數(shù)據(jù)以及經(jīng)過MSC和SD預(yù)處理過的光譜數(shù)據(jù)分別進(jìn)行PLSDA建模,每個(gè)PLSDA模型取隱變量為6時(shí)能獲得最小的模型學(xué)習(xí)和預(yù)測(cè)錯(cuò)判數(shù).
圖2分別顯示了選擇隱變量為6時(shí),PLSDA模型基于原始光譜數(shù)據(jù)的4種川續(xù)斷樣品訓(xùn)練結(jié)果和預(yù)測(cè)結(jié)果.模型對(duì)樣品的訓(xùn)練和預(yù)測(cè)正確率達(dá)到100%,結(jié)果較為滿意.
圖3分別為選擇隱變量為6時(shí),PLSDA模型基于經(jīng)過MSC光譜處理的4類川續(xù)斷樣品訓(xùn)練結(jié)果和預(yù)測(cè)結(jié)果.從訓(xùn)練集樣本和預(yù)測(cè)集樣本的各自虛擬編碼值,可以看到,對(duì)于每類的來自不同產(chǎn)地的續(xù)斷植物樣品其特征區(qū)分與對(duì)原始光譜數(shù)據(jù)建模的結(jié)果類似,但是對(duì)于相同產(chǎn)地的川續(xù)斷樣品間的訓(xùn)練和預(yù)測(cè)結(jié)果均得以改善,訓(xùn)練和預(yù)測(cè)結(jié)果均完全正確.
圖3 4種川續(xù)斷樣品PLSDA模型MSC光譜虛擬編碼歸屬樣品類別圖
當(dāng)選擇隱變量為6時(shí),PLSDA模型基于經(jīng)過二階導(dǎo)數(shù)光譜處理的4類川續(xù)斷樣品訓(xùn)練結(jié)果和預(yù)測(cè)結(jié)果顯示在圖4.訓(xùn)練和預(yù)測(cè)結(jié)果訓(xùn)練和預(yù)測(cè)結(jié)果正確率都達(dá)到100%.
對(duì)于PLSDA模型在取隱變量為6時(shí)對(duì)原始光譜以及不同的光譜預(yù)處理方法所得模型的訓(xùn)練和預(yù)測(cè)的鑒別結(jié)果列于表2.
表2 PLSDA在不同光譜預(yù)處理?xiàng)l件下的訓(xùn)練和預(yù)測(cè)結(jié)果
綜上結(jié)果證明經(jīng)過多元散射校正(MSC)和二階導(dǎo)數(shù)(SD)處理的近紅外光譜的PLSDA模型能夠完全準(zhǔn)確判別以上不同產(chǎn)地的川續(xù)斷,結(jié)果令人滿意.為川續(xù)斷的安全用藥和規(guī)范中藥材市場(chǎng)提供了一種有效的檢測(cè)手段.
本實(shí)驗(yàn)運(yùn)用近紅外漫反射技術(shù)獲取了4種川續(xù)斷樣品在4000~10000 cm-1之間的近紅外光譜信息,通過采用偏最小二乘判別分析方法,建立了不同產(chǎn)地川續(xù)斷的鑒別模型.結(jié)果表明,利用MSC和SD處理近紅外圖譜后,PLSDA建立的模型預(yù)測(cè)準(zhǔn)確率達(dá)到100%,實(shí)現(xiàn)了運(yùn)用近紅外光譜技術(shù)和化學(xué)模式識(shí)別方法相結(jié)合快速、準(zhǔn)確地鑒別不同產(chǎn)地的川續(xù)斷,為對(duì)川續(xù)斷的用藥安全,提供了一種新的有價(jià)值的檢測(cè)手段.
[1]肖培根,李大鵬,楊世林.新編中藥志[M].北京:化學(xué)工業(yè)出版社,2002:932.
[2]王一濤,王家葵,楊 奎,等.續(xù)斷的藥理學(xué)研究[J].中藥藥理與臨床,1996,12(3):20-23.