喬亞麗, 劉 喆, 沈愛金, 郭志謀, 劉艷芳, 陳相銀, 徐 青, 梁鑫淼
(1. 中國科學(xué)院大連化學(xué)物理研究所, 中國科學(xué)院分離分析化學(xué)重點(diǎn)實(shí)驗(yàn)室, 遼寧 大連 116023; 2. 中國科學(xué)院大學(xué), 北京 100049; 3. 北京三和藥業(yè)有限公司, 北京 100049)
穿山甲(中藥名)為鱗鯉科動(dòng)物穿山甲的鱗甲,具有活血消癥、通經(jīng)下乳、消腫排膿的功效,用于治療乳汁不通、癰腫瘡毒、風(fēng)濕痹痛等癥[1],現(xiàn)代醫(yī)學(xué)研究發(fā)現(xiàn)穿山甲對(duì)惡性腫瘤有一定程度的治療效果[2,3]。穿山甲的傳統(tǒng)動(dòng)物基源僅限于中華穿山甲(Manispentadactyla)(也稱穿山甲)。中華穿山甲為國家一級(jí)保護(hù)動(dòng)物,野生數(shù)量極少,人工飼養(yǎng)技術(shù)尚不成熟,致使穿山甲藥用資源匱乏,市場價(jià)格大幅增長[4]。為此,多種其他穿山甲屬物種的穿山甲大量充斥市場,包括馬來穿山甲、印度穿山甲、樹穿山甲和南非穿山甲[5,6],嚴(yán)重影響了穿山甲臨床用藥的科學(xué)性和準(zhǔn)確性,因此,明確穿山甲的動(dòng)物基源非常必要。另外,在實(shí)際生產(chǎn)中,會(huì)根據(jù)經(jīng)驗(yàn)對(duì)穿山甲進(jìn)行等級(jí)分類,但其量化的分類標(biāo)準(zhǔn)一直空缺,且尚未見到相關(guān)研究。
穿山甲主要成分為角蛋白,同時(shí)含有硬脂酸、膽固醇等脂溶性成分和Si、Al等微量元素[7,8]。劉遜等[9]同時(shí)運(yùn)用性狀鑒別分析、基于膽固醇的薄層色譜分析以及以環(huán)二肽為特征指標(biāo)的質(zhì)譜分析,對(duì)不同基源穿山甲炮制品進(jìn)行鑒別。譚永梅等[10]以薄層色譜法對(duì)比分析了穿山甲中的氨基酸成分。劉瀟瀟等[11]采用液相色譜-質(zhì)譜聯(lián)用,分析不同基源穿山甲中的特征肽段。其中,性狀鑒別在針對(duì)非典型甲片或是破碎甲片時(shí),種間分辨能力有限;薄層色譜分辨率低,而質(zhì)譜成本高難以普及。另外,膽固醇或是過度分解的氨基酸并不能代表穿山甲專屬特征,而少量的肽段也不足以反映穿山甲的整體輪廓。部分學(xué)者提出利用特異性DNA條碼追蹤鑒定穿山甲基源[12,13],但其繁雜的DNA提取及分析過程并不適合作為中藥質(zhì)量監(jiān)測的常規(guī)手段。中藥指紋圖譜能夠全面綜合地反映中藥化學(xué)組成的整體輪廓,體現(xiàn)中藥多成分協(xié)同作用的基本特性,已成為中藥來源和品質(zhì)研究的重要手段[14,15]。在具體應(yīng)用時(shí),相似度評(píng)價(jià)是最基本和最簡單的反映指紋譜相關(guān)性的數(shù)據(jù)分析方法。但在進(jìn)行小類別分析時(shí),基于統(tǒng)計(jì)學(xué)理論的判別分析有更高的數(shù)據(jù)處理能力,已廣泛應(yīng)用于天然產(chǎn)物的分類鑒別[16-19]。
本文同時(shí)收集了不同等級(jí)的中華穿山甲及多種其他基源的穿山甲,擬通過建立穿山甲的色譜指紋譜,結(jié)合相似度評(píng)價(jià)和判別分析,探討其在等級(jí)及基源鑒別方面的可行性,為提高其臨床用藥科學(xué)性和準(zhǔn)確性提供新的思路。
Waters Alliance高效液相色譜儀(2695梯度泵,2998二極管陣列檢測器,自動(dòng)進(jìn)樣器,柱恒溫系統(tǒng),Empower色譜工作站)。苯丙氨酸、酪氨酸和色氨酸標(biāo)準(zhǔn)品均為分析標(biāo)準(zhǔn)品(≥98%),來自上海源葉生物科技有限公司。
乙腈(色譜純,Meryer),三氟乙酸(色譜純,Sigma-Aldrich),實(shí)驗(yàn)用水為Milli-Q純水系統(tǒng)生成;其余試劑均為分析純。
本研究共收集了不同等級(jí)的中華穿山甲24批,其他種屬穿山甲4批,甲片具體信息見表1,所有甲片均來自北京三和藥業(yè)。
表 1 甲片批號(hào)、基源及等級(jí)
取穿山甲,搗碎打粉過3號(hào)篩。精密稱取甲片粉末2 g,置于125 mL具塞錐形瓶中,加入1 mol/L HCl 30 mL, 100 ℃條件下加熱回流1 h,放冷,加入1 mol/L HCl補(bǔ)足減失的重量,搖勻,取上清液過0.45 μm孔徑的聚醚砜濾膜,續(xù)濾液即為供試品溶液。
色譜柱為Waters Symmetry 300 C18(150 mm×4.6 mm, 5 μm,沃特世科技(上海)有限公司),流動(dòng)相A為0.1%(v/v)三氟乙酸/水,流動(dòng)相B為0.1%(v/v)三氟乙酸/乙腈,流速為1 mL/min,柱溫為30 ℃,洗脫梯度:0~50 min, 0~30%B; 50~51 min, 30%B~90%B; 51~60 min, 90%B。紫外檢測波長為280 nm。進(jìn)樣量為10 μL。
1.4.1相似度評(píng)價(jià)
相似度評(píng)價(jià)是指紋譜分析的基本手段,其中余弦相似度是常用相似度之一,具體計(jì)算見式(1)[20]:
(1)
其中,A為樣本指紋譜峰面積構(gòu)成的向量,S為對(duì)照指紋譜各峰面積構(gòu)成的向量。余弦相似度反映的是樣品化學(xué)成分與對(duì)照指紋圖譜化學(xué)成分在分布比例上的相似程度,其特點(diǎn)是峰面積越大峰計(jì)算權(quán)重越大,易對(duì)小峰造成掩蔽作用,更適用于大類別樣品的區(qū)分。
為了消除大峰對(duì)小峰的掩蔽作用,可先對(duì)樣本進(jìn)行歸一化處理,再進(jìn)行相似度計(jì)算,所得相似度為比率定性相似度[15],此方法更適用于小類別樣品的區(qū)分,具體計(jì)算見式(2)[15]:
(2)
其中Ai為樣本指紋譜峰面積構(gòu)成的向量的第i個(gè)分量,n為樣本峰個(gè)數(shù),Si為對(duì)照指紋譜峰面積構(gòu)成的向量的第i個(gè)分量。
考慮到穿山甲的等級(jí)區(qū)分相比于種屬鑒別屬于小類別區(qū)分,小峰的差異同樣重要,本文統(tǒng)一采用比率定性相似度作為評(píng)價(jià)標(biāo)準(zhǔn)。
1.4.2判別分析
判別分析又稱“分辨法”,是在分類確定的條件下,根據(jù)研究對(duì)象的特征值判別其類型歸屬問題的一種多變量統(tǒng)計(jì)分析方法,通過參數(shù)調(diào)整及模型訓(xùn)練,可使樣品判錯(cuò)率達(dá)到最小。支持向量機(jī)(support vector machine, SVM)是一種常用判別分析模型,其利用支持向量對(duì)樣本進(jìn)行學(xué)習(xí)并處理未知樣品,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,有良好的統(tǒng)計(jì)規(guī)律和泛化能力,數(shù)學(xué)表述見式(3)和(4)[21]。
(3)
(4)
yj(wTxj+b)=1
(5)
對(duì)于非線性、高維度數(shù)據(jù),核函數(shù)引入的支持向量機(jī)可以很大程度上克服“維數(shù)災(zāi)難”的問題,具有獨(dú)特的優(yōu)勢[22]。其中,sigmoid感知核為一種常用核函數(shù),其數(shù)學(xué)表達(dá)式見式(6)[21]:
(6)
其中,x為樣本峰面積構(gòu)成的數(shù)據(jù)矩陣。
本文中使用python 3.7作為編程語言,借用scikit-learn 0.22.1編寫以sigmoid為核函數(shù)的核支持向量機(jī)模型,正則化參數(shù)設(shè)為10,使用十折交叉驗(yàn)證對(duì)模型進(jìn)行驗(yàn)證并可視化預(yù)測結(jié)果。
2.1.1提取條件的考察
穿山甲的主要成分為角蛋白,高溫、高酸條件下蛋白質(zhì)容易發(fā)生水解,產(chǎn)生質(zhì)量不一的肽段,本文分別對(duì)穿山甲的提取溶劑、提取方式和提取時(shí)間進(jìn)行考察。分別以水、0.2 mol/L HCl、0.5 mol/L HCl、1 mol/L HCl為提取劑,加熱回流1 h,前3種條件下的提取效果基本一致,當(dāng)HCl濃度達(dá)到1 mol/L時(shí),提取效果明顯改善,可以獲取更多的指紋信息(見圖1a)。提取方式考察結(jié)果表明,超聲提取到的物質(zhì)明顯減少(見圖1b),因此采用加熱回流提取法。當(dāng)提取時(shí)間縮短為0.5 h時(shí),提取效果下降(見圖1c)。
圖 1 不同(a)提取溶劑、(b)提取方式、(c)提取時(shí)間下的穿山甲色譜圖Fig. 1 Chromatograms of Squama Manis under different (a) extraction solvent, (b) extraction mode, and (c) extraction time Column: Symmetry 300 C18 (150 mm×4.6 mm, 5 μm). Mobile phase A: 0.1% (v/v) trifluoroacetic acid (TFA) in water, mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient elution: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
2.1.2色譜條件的考察
為了獲得最佳的分離體系和分離條件,我們分別對(duì)色譜柱、流動(dòng)相體系、檢測波長和流動(dòng)相梯度條件進(jìn)行了考察。
首先考察Unitrary C4 300 (150 mm×4.6 mm, 5 μm,華譜科儀(北京)科技有限公司)、Symmetry 300 C4 (150 mm×4.6 mm, 5 μm,沃特世科技(上海)有限公司)和Symmetry 300 C18 3種類型色譜柱對(duì)穿山甲供試液的分離能力,結(jié)果表明,穿山甲供試液在Symmetry 300 C18色譜柱上具有更好的選擇性和色譜峰形(見圖2)。
圖 2 不同色譜柱上的穿山甲色譜圖Fig. 2 Chromatograms of Squama Manis on different columns Mobile phase A: 0.1% (v/v) TFA in water; mobile phase B: 0.1% (v/v) TFA in acetonitrile. Gradient condition: 0-40 min, 0-50%B; 40-60 min, 50%B-95%B.
在Symmetry 300 C18色譜柱上考察不同的流動(dòng)相體系,包括三氟乙酸-乙腈-水、磷酸二氫鈉/高氯酸鈉(pH 4)-乙腈-水、磷酸二氫鈉/高氯酸鈉(pH 6)-乙腈-水,結(jié)果表明三氟乙酸-乙腈-水體系下的分離效果最佳。
對(duì)比230、254、280、300 nm下的色譜圖,結(jié)果表明280 nm波長下色譜峰響應(yīng)普遍更高,故選其為檢測波長。
為了進(jìn)一步改善分離效果,對(duì)流動(dòng)相梯度進(jìn)行了考察,不同梯度下的色譜分離結(jié)果見圖3。綜合考慮主要色譜峰(6~30 min)的分辨率、分離度和保留時(shí)間,條件c為最佳梯度條件。
圖 3 不同梯度條件下的穿山甲色譜圖Fig. 3 Chromatograms of Squama Manis under different gradient conditions Column: Symmetry 300 C18. Mobile phase A: 0.1% (v/v) TFA in water, mobile phase B: 0.1% (v/v) TFA in acetonitrile. a. 0-40 min, 0-50%B; 40-60 min, 50%B-95%B. b. 0-50 min, 0-40%B; 50-51 min, 40%B-90%B; 51-60 min, 90%B. c. 0-50 min, 0-30%B; 50-51 min, 30%B-90%B; 51-60 min, 90%B.
取12批中華穿山甲一等品,制備其供試液,按照1.3節(jié)色譜條件進(jìn)行分析,采集指紋譜(見圖4a)。對(duì)所有色譜圖進(jìn)行統(tǒng)一積分,將其CDF格式數(shù)據(jù)文件導(dǎo)入到“中藥色譜指紋譜相似度系統(tǒng)”(2004A版),采用平均數(shù)法,時(shí)間窗設(shè)置為0.1,經(jīng)多點(diǎn)校正和全峰自動(dòng)匹配生成對(duì)照指紋譜(見圖4c)。綜合各一等品指紋譜出峰情況,選取出峰時(shí)間一致性較高、分離度較好的17個(gè)峰為共有峰。以共有峰的絕對(duì)面積為原始數(shù)據(jù),計(jì)算各指紋譜與對(duì)照指紋譜間的相似度(公式(2)),如表2所示,一等品樣品指紋譜與對(duì)照指紋譜的相似度均大于0.98,表明該指紋譜穩(wěn)定可靠,可用于后續(xù)質(zhì)量評(píng)價(jià)。
圖 4 (a)12批一等品、(b)12批統(tǒng)貨穿山甲的色譜指紋譜和(c)對(duì)照指紋圖譜Fig. 4 (a,b ) Chromatographic fingerprints of the 24 batches of Squama Manis (a. First-class samples, b. General samples) and (c) the reference fingerprint Peaks 1-17: common peaks.
表 2 穿山甲樣品指紋譜與對(duì)照指紋譜之間的相似度
以S106批次甲片色譜圖的5號(hào)色譜峰(見圖4)為例考察方法的系統(tǒng)適應(yīng)性,由圖4可得到該色譜峰的塔板數(shù)大于6 000,拖尾因子為1.02,與4號(hào)峰的分離度為1.51,表明該方法的系統(tǒng)適應(yīng)性很好。
處理批號(hào)為S106的穿山甲,按照1.3節(jié)色譜條件對(duì)其進(jìn)行分析,系統(tǒng)考察方法的精密度、日內(nèi)日間重復(fù)性和樣品穩(wěn)定性,以5號(hào)峰(見圖4c)為參照峰,計(jì)算所有共有峰的相對(duì)峰面積和相對(duì)保留時(shí)間的RSD值。
精密度試驗(yàn)中,供試品溶液連續(xù)進(jìn)樣6針,各共有峰相對(duì)保留時(shí)間的RSD為0.02%~0.08%,相對(duì)峰面積的RSD為0.57%~2.99%。
重復(fù)性試驗(yàn)包括日間重復(fù)性和日內(nèi)重復(fù)性,首先平行處理6份S106批次穿山甲用于評(píng)價(jià)日內(nèi)重復(fù)性,各共有峰相對(duì)保留時(shí)間的RSD為0.05%~0.12%,相對(duì)峰面積的RSD為0.46%~4.10%;連續(xù)3天,每天平行處理6份S106批次穿山甲評(píng)價(jià)日間重復(fù)性,各共有峰相對(duì)保留時(shí)間的RSD為0.05%~0.45%,相對(duì)峰面積的RSD為2.45%~4.98%。
分別于供試液制備后0、2、4、8、12和24 h將其注入液相色譜儀進(jìn)行分析檢測,各共有峰相對(duì)保留時(shí)間的RSD為0.23%~0.80%,相對(duì)峰面積的RSD為0.44%~4.32%,表明樣品供試液在24 h內(nèi)穩(wěn)定性良好。
以上結(jié)果表明該方法穩(wěn)定,符合指紋譜要求。
2.5.1不同基源穿山甲相似度評(píng)價(jià)
為了考察穿山甲指紋圖譜對(duì)基源鑒定的適用性,對(duì)4種其他基源穿山甲處理并分析。將上述甲片的指紋譜與中華穿山甲對(duì)照指紋譜導(dǎo)入到相似度系統(tǒng),指紋譜對(duì)比圖見圖5,其中南非穿山甲(c)和馬來穿山甲(d)與中華穿山甲(e)均有很高的相似度,主觀判斷很難鑒別其基源。利用指紋譜系統(tǒng)中導(dǎo)出的共有峰數(shù)據(jù),計(jì)算馬來穿山甲、南非穿山甲、樹穿山甲、印度穿山甲指紋譜與中華穿山甲對(duì)照指紋譜的相似度(公式(2)),相似度結(jié)果依次為0.776、0.676、0.641、0.349,相似程度均較低。因此,通過相似度評(píng)價(jià),可以快速區(qū)分中華穿山甲與其他種屬穿山甲。
圖 5 不同種屬穿山甲甲片的色譜指紋譜Fig. 5 Chromatographic fingerprints of scales from different species of Manis a. Manis tricuspis; b. Manis crassicaudata; c. Manis temminckii; d. Manis javanica; e. Manis pentadactyla.
2.5.2不同等級(jí)中華穿山甲相似度評(píng)價(jià)
為了考察穿山甲指紋圖譜對(duì)等級(jí)鑒定的適用性,取12批中華穿山甲統(tǒng)貨,按照實(shí)驗(yàn)方法對(duì)其進(jìn)行處理并分析,指紋譜見圖4b。按照公式(2),以共有峰的絕對(duì)面積為原始數(shù)據(jù),計(jì)算12批統(tǒng)貨的指紋譜與對(duì)照譜之間的相似度,結(jié)果見表2。就整體水平而言,一等品的平均相似度為0.994, RSD值為0.23%;統(tǒng)貨平均相似度為0.988, RSD值為1.31%,一等品整體品質(zhì)優(yōu)于統(tǒng)貨。對(duì)于單獨(dú)個(gè)體,不同等級(jí)之間相似度存在嚴(yán)重的交叉現(xiàn)象,相似度評(píng)價(jià)難以對(duì)穿山甲質(zhì)量等級(jí)作出判斷。相似度評(píng)價(jià)對(duì)小類別區(qū)分的局限性在文獻(xiàn)中多有提及,對(duì)此需要采用數(shù)據(jù)處理能力更強(qiáng)的方法對(duì)數(shù)據(jù)做進(jìn)一步的分析。
以12批一等品甲片和12批統(tǒng)貨甲片的共有峰絕對(duì)面積為原始數(shù)據(jù),質(zhì)量等級(jí)為甲片標(biāo)簽,建立sigmoid核函數(shù)支持向量機(jī)判別模型。由十折交叉驗(yàn)證對(duì)模型進(jìn)行訓(xùn)練并驗(yàn)證,模型的無偏差預(yù)測正確率高達(dá)為95.83%,其可視化結(jié)果見圖6。由于該模型通過多維空間內(nèi)的超平面對(duì)甲片進(jìn)行分類,在二維平面上不能看到明顯的分類界限,判別結(jié)果通過不同顏色的小球表示。其中,A、B批次甲片的模型分類結(jié)果與其甲片標(biāo)簽完全一致,只有S批次的S104、ST05甲片的模型預(yù)測結(jié)果與其標(biāo)簽不同。上述批次偏向性提示我們,模型的出錯(cuò)率很可能來源于人為因素造成的標(biāo)簽錯(cuò)誤,而非模型自身??傊?該模型的分類能力明顯高于相似度評(píng)價(jià),其判別結(jié)果與實(shí)際等級(jí)分類高度一致,在穿山甲等級(jí)分類方面可行性很高。
圖 6 基于色譜指紋譜的穿山甲等級(jí)判別結(jié)果Fig. 6 Discriminant classification of Squama Manis based on chromatographic fingerprints
中藥指紋譜是中藥質(zhì)量評(píng)價(jià)的重要手段,可以準(zhǔn)確反映中藥化學(xué)成分的分布比例及含量高低。中藥指紋譜的數(shù)據(jù)分析方法可以分為兩類,其一為相似度評(píng)價(jià),該方法是指紋譜評(píng)價(jià)的基本手段,常用于大類別區(qū)分;其二為基于統(tǒng)計(jì)學(xué)分析的化學(xué)計(jì)量學(xué)分析,該方法對(duì)非線性、高維度的復(fù)雜數(shù)據(jù)有更高的分析能力,常用于小類別區(qū)分。在基源鑒別時(shí),其他基源穿山甲與中華穿山甲的相似度均不高于0.776,根據(jù)相似度結(jié)果可快速、有效鑒別中華穿山甲的基源。在等級(jí)區(qū)分時(shí),鑒于數(shù)據(jù)的復(fù)雜性,相似度評(píng)價(jià)只能在樣品的整體水平上體現(xiàn)其趨勢,不能對(duì)個(gè)體樣品做出正確判斷;判別分析則是先根據(jù)現(xiàn)有分類標(biāo)準(zhǔn)建立數(shù)學(xué)模型,再將其用于未知樣品的分類,出錯(cuò)率大大降低。經(jīng)十折交叉驗(yàn)證,判別模型的無偏差準(zhǔn)確率可高達(dá)95.83%,說明該模型用于穿山甲等級(jí)區(qū)分具有很高的可行性。綜上,本研究建立了穿山甲的色譜指紋譜并確認(rèn)了其在基源鑒別和等級(jí)區(qū)分應(yīng)用上的可行性,為提高穿山甲臨床用藥的科學(xué)性和準(zhǔn)確性提供新思路。