唐金蘭,陸燕飛,包一麟,趙遠(yuǎn),尚林偉,尹建華*
(1 南京航空航天大學(xué)生物醫(yī)學(xué)工程系,南京 211106;2 中國科學(xué)院大學(xué)附屬腫瘤醫(yī)院(浙江省腫瘤醫(yī)院),中國科學(xué)院腫瘤與基礎(chǔ)醫(yī)學(xué)研究所,杭州 310022)
乳腺癌是威脅婦女生命健康的最常見的惡性腫瘤之一[1]。目前,常用的臨床檢查方法主要有影像學(xué)檢查、乳腺纖維導(dǎo)管鏡檢查、穿刺活檢和腫瘤標(biāo)志物檢測等。影像學(xué)檢查有包括乳腺鉬靶檢查、超聲檢查、CT檢查和MRI掃描等[2]。這些常用的乳腺癌診斷方法存在各方面的優(yōu)勢及不足[3],譬如,常用于無創(chuàng)診斷的影像學(xué)方法難于實現(xiàn)組織中主要成分變化的檢測和研究[2-3];拉曼光譜可實現(xiàn)成分變化檢測和分子結(jié)構(gòu)研究,然而其信號通常較弱,且容易受到樣本熒光的影響[4]。因此,仍然需要一種準(zhǔn)確、高效的乳腺癌檢測方法,并可以在分子水平或微觀水平探索癌變機制,獲取原位的癌變信息。
傅里葉變換紅外(FTIR)光譜作為一種物理化學(xué)分析技術(shù),在物理、化學(xué)和生物學(xué)領(lǐng)域得到了廣泛的應(yīng)用。在藥物、血漿、微生物和臨床病理學(xué)的研究中,它已被證明是一種靈敏的、方便的、具有較好重現(xiàn)性的技術(shù)[5-8]。然而,F(xiàn)TIR光譜實際檢測中往往通過使用不同的測量附件來適應(yīng)各種檢測對象[9]。當(dāng)前,衰減全反射(ATR)附件在紅外光譜測試中應(yīng)用十分廣泛,它無需對樣本進(jìn)行預(yù)處理,不破壞樣本,還可以檢測小顆粒樣本,簡化實驗步驟。其原理是入射紅外光在晶體和樣本界面發(fā)生衰減全反射,此時晶體表面的消逝波進(jìn)入樣本淺表面發(fā)生指數(shù)式的衰減吸收,進(jìn)而使反射光攜帶一定的樣本信息。樣本淺表面(微米級深度)含水量較小,對整體光譜的影響大大降低[10]。特別是,通過光纖耦合ATR附件可以靈活地應(yīng)用于遠(yuǎn)程/外置樣本的實時及微小接觸面的紅外光譜檢測[11-12]。
此外,紅外光譜可以揭示生物組織的分子構(gòu)成和構(gòu)象,其光譜特征也可以反映分子間和分子內(nèi)部的相互作用以及含量變化[5],利于進(jìn)行疾病的分析和檢測。因此,采用紅外光譜技術(shù)可有效檢測分析組織中蛋白質(zhì)二級結(jié)構(gòu),特別是對分子幾何形狀和氫鍵模式的微小變化高度敏感的酰胺I帶進(jìn)行分析,將對蛋白質(zhì)二級結(jié)構(gòu)組成和構(gòu)象變化的研究非常有用[13]。
乳腺組織的癌變往往伴隨著組織中蛋白質(zhì)的組成、構(gòu)象、結(jié)構(gòu)的改變,通常每種蛋白質(zhì)的二級結(jié)構(gòu)是不同類型二級結(jié)構(gòu)的組合,組合形式復(fù)雜多樣,并且,不同種類蛋白質(zhì)中每種二級結(jié)構(gòu)所占的比例不同[14]。因此本研究主要是通過使用自制的空心光纖(HOF)-ATR探針耦合FTIR光譜儀對健康和癌變?nèi)橄俳M織進(jìn)行測量,對所得紅外譜圖的酰胺I帶進(jìn)行光譜處理和分析,以研究健康和癌變組織的二級結(jié)構(gòu)差異,并提供一種從分子水平上分析乳腺組織癌變機理、進(jìn)行原位檢測和精確識別乳腺癌的有效方法。
實驗所用的人體乳腺組織樣本由江蘇省腫瘤醫(yī)院提供,所有患者均被告知并同意這項研究。本次實驗所用樣本來自12名女性患者,總共9個癌變?nèi)橄俳M織和9個健康乳腺組織(部分患者僅提供癌變組織)。在實驗室對新鮮樣本表面脂肪組織進(jìn)行清理,即用于HOF-ATR-FTIR光譜采集。
2.2.1中紅外空心光纖ATR耦合探頭
本文采用如圖1(A)所示的實驗室自制的HOF-ATR探頭[11,14]對樣本組織進(jìn)行檢測。圖1(B)為截錐形 ATR 晶體設(shè)計圖,選擇ZnSe晶體作為探頭材料,外形為錐形圓臺,即后段為圓柱,前段為截頭圓錐(圓臺),上錐面與下錐面直徑分別為0.75 mm、2.5 mm,底部錐角為70°。光纖可以在困難的條件或是復(fù)雜的作業(yè)現(xiàn)場進(jìn)行遠(yuǎn)程工作。利用全反射的原理將光束保留在光纖內(nèi),并且沿著光纖方向前進(jìn)。選擇型號為HWEA7501200的中紅外空心光纖作為入射和出射光纖,波長范圍為2.9~10.6 μm,光纖的內(nèi)徑為750 μm、玻璃層外徑為950 μm、緩沖層外徑為1200 μm。
圖1 (a)HOF-ATR 探頭結(jié)構(gòu)示意圖和(b)截錐形 ATR 晶體的設(shè)計圖
2.2.2數(shù)據(jù)采集
光譜信號收集時使用FTIR光譜儀(VERTEX70, Bruker),配備了一個單點液氮制冷碲汞鎘(MCT)探測器,對樣本進(jìn)行HOF-ATR-FTIR光譜采集。首先檢測背景光譜,然后將HOF-ATR探針緊貼在組織表面進(jìn)行光譜采集。光譜采集范圍是4000~744 cm-1,掃描64次,分辨率為4 cm-1,每個樣本至少取5個位置進(jìn)行光譜檢測。
采集141條光譜后,對之進(jìn)行基線校正和10點平滑處理,再基于酰胺I帶(1700~1600 cm-1)進(jìn)行進(jìn)一步分析。其中,酰胺I帶各子峰的峰位根據(jù)相應(yīng)的二階導(dǎo)數(shù)譜以及傅里葉去卷積譜結(jié)果確定,然后用Origin8.6軟件對酰胺I帶光譜進(jìn)行Gaussian函數(shù)擬合以驗證峰位準(zhǔn)確性。
根據(jù)酰胺I帶中包含的5種蛋白質(zhì)二級結(jié)構(gòu)的光譜波數(shù)范圍,從曲線擬合圖中選擇屬于二級結(jié)構(gòu)波數(shù)范圍內(nèi)的、有效的子峰。把有效的子峰面積之和記為1,分別計算5種二級結(jié)構(gòu)面積所占的比例,即可得到乳腺組織酰胺I帶中各種二級結(jié)構(gòu)的含量[9],例如α-螺旋的含量可以用公式1計算:
α-螺旋=
(1)
式(1)中S表示面積,Sα-螺旋、Sβ-折疊、Sβ-轉(zhuǎn)角、S非典型螺旋和S無規(guī)卷曲分別表示為α-螺旋、β-折疊、β-轉(zhuǎn)角、非典型螺旋和無規(guī)卷曲5種二級結(jié)構(gòu)的面積,通過這個公式可以分別計算出健康和癌變?nèi)橄俳M織光譜酰胺I帶中α-螺旋、β-折疊、β-轉(zhuǎn)角、非典型螺旋和無規(guī)卷曲的含量。
每條光譜均進(jìn)行基線校正處理。在Unscrambler X軟件(CAMO Software, Inc., Woodbridge, NJ)中將收集的141個FTIR光譜作為光譜矩陣用于PLS-DA。共五個患者的75條光譜被選作訓(xùn)練集,其中健康對照組光譜33條,癌變組織光譜42條。分別選取酰胺I帶(1700~1600 cm-1)和全波長光譜(4000~744 cm-1)構(gòu)建兩個PLS-DA模型以識別乳腺組織。在這項研究中,當(dāng)計算的光譜分?jǐn)?shù)小于1.5時,該光譜將被視為來自癌變組織,否則被視為來自健康組織。應(yīng)用留一交叉驗證法(LOOCV)分別衡量兩個PLS-DA分類模型的性能。選擇決定系數(shù)R-square(取值范圍0~1)和均方根誤差值RMSE以衡量穩(wěn)定性,決定系數(shù)越大且越接近1,同時其均方根誤差值越小,該模型的穩(wěn)定性越好。然后,將來自另外四個病人的總共66條光譜(其中健康對照組28條,癌變組38條)作為預(yù)測集,以比較兩個判別模型的預(yù)測效果。
圖2所示分別為健康和癌變?nèi)橄俳M織的原始HOF-ATR-FTIR光譜經(jīng)基線校正和十點平滑處理后得到的在1800~1000 cm-1范圍的光譜圖。發(fā)現(xiàn)兩條譜線的一些特征譜帶發(fā)生了位移或強度、線寬的變化。其中,癌變樣本中1740 cm-1(υC=O)[15]處峰強度明顯弱于健康樣本,表明其對應(yīng)的特征成分脂肪在發(fā)生癌變時發(fā)生了明顯損耗。與核酸相關(guān)的吸收帶[15]則自1100 cm-1紅移至1086 cm-1,表明核酸中磷酸基團的氫鍵化程度增加。1162 cm-1吸收帶是糖類C-O伸縮振動(υC-O)與蛋白質(zhì)中絲氨酸、蘇氨酸或酪氨酸R基團中的C-OH振動的重疊譜帶[15],該譜帶相對強度變?nèi)?,意味著隨著癌細(xì)胞的分裂,大量的糖作為營養(yǎng)物質(zhì)被消耗;該譜帶同時發(fā)生藍(lán)移,則歸因于蛋白質(zhì)中的C-OH的相關(guān)氫鍵斷裂[13],其結(jié)果可能誘發(fā)β-折疊含量的減少。另一方面,癌變?nèi)橄俳M織在蛋白相關(guān)特征帶1636 cm-1雖然沒有發(fā)生明顯的位移[15],但是吸收強度和帶形相比于健康乳腺組織卻發(fā)生了明顯變化。詳細(xì)的光譜與特征成分變化分析可見作者的最新工作[16]。這些結(jié)果表明,脂肪、核酸和蛋白等主要生物成分的變化是組織癌變最重要的光譜學(xué)特征。其中,由于酰胺I帶1636 cm-1富含蛋白質(zhì)二級結(jié)構(gòu)信息[9],因此本文主要針對酰胺I帶進(jìn)行蛋白質(zhì)二級結(jié)構(gòu)變化研究。
圖2 健康和癌變?nèi)橄俳M織的典型HOF-ATR-FTIR光譜(1800-1000 cm-1)
圖3分別是健康組織和癌變組織在1700-1600 cm-1的典型原始譜圖(a)、二階導(dǎo)數(shù)譜(b)和傅里葉去卷積譜(c),由圖可知,酰胺I帶應(yīng)由多個子峰組成。無論是健康組織還是癌變組織,其二階導(dǎo)數(shù)譜和傅里葉去卷積譜幾乎對稱,二階導(dǎo)數(shù)譜的極小值和和傅里葉去卷積譜的極大值波數(shù)位置基本一致,具有“對稱相似性”。
圖3 健康(a)和癌變(b)乳腺組織的酰胺I帶(1700-1600 cm-1)的典型原始譜圖(a)、二階導(dǎo)數(shù)譜(b)和傅里葉變換去卷積譜(c)
結(jié)合二階導(dǎo)數(shù)譜和去卷積譜對樣本的紅外光譜酰胺I帶進(jìn)行擬合與分峰,圖4列出乳腺組織酰胺I帶的典型原始譜圖(a)、各擬合子譜(b)和擬合計算譜(c),每個光譜擬合的殘差(Residuals)均小于0.005,且擬合后曲線與原始數(shù)據(jù)的相關(guān)系數(shù)(R-square)均大于0.99(越接近1表示其擬合效果越好)。對酰胺I帶的各子峰歸屬如下:1620~1640 cm-1可以認(rèn)為是β-折疊;1640~1650 cm-1被分配為無規(guī)卷曲;1650-1659 cm-1為α-螺旋;非典型螺旋結(jié)構(gòu)在1660-1669 cm-1,含三股螺旋、310螺旋和超螺旋等;1670-1700 cm-1則是β-轉(zhuǎn)角[17-19]。此外,1606 cm-1和1618 cm-1附近的子峰是側(cè)鏈振動吸收形成的,不歸屬于β-折疊。
圖4 健康(a)和癌變(b)乳腺組織酰胺I帶的典型紅外光譜(a)、各擬合子譜(b)和擬合計算譜(c)
擬合后計算的各二級結(jié)構(gòu)(β-折疊、無規(guī)卷曲、α-螺旋、非典型螺旋和β-轉(zhuǎn)角)的含量平均值如圖5(A)所示??砂l(fā)現(xiàn),健康乳腺組織酰胺I帶二級結(jié)構(gòu)含量由大到小排列依次為β-折疊(0.415±0.013)、α-螺旋(0.207±0.010)、非典型螺旋(0.177±0.012)、無規(guī)卷曲(0.118±0.008)和β-轉(zhuǎn)角(0.082±0.020);而癌變?nèi)橄俳M織中酰胺I帶二級結(jié)構(gòu)含量由大到小的順序為β-折疊(0.372±0.011)、α-螺旋(0.227±0.006)、β-轉(zhuǎn)角(0.164±0.019)、非典型螺旋(0.151±0.007)和無規(guī)卷曲(0.087±0.010)。兩者的含量大小排列相近,最多的為β-折疊和α-螺旋,總含量超過百分之五十;不同在于無規(guī)卷曲、β-轉(zhuǎn)角和非典型螺旋有排列差異。
圖5 健康和癌變?nèi)橄俳M織的二級結(jié)構(gòu)平均含量(a)和平均含量比值(b)的對比
比較健康/癌變?nèi)橄俳M織中酰胺I帶各二級結(jié)構(gòu)的含量,發(fā)現(xiàn)癌變?nèi)橄俳M織的β-折疊、無規(guī)卷曲和非典型螺旋含量均低于健康乳腺組織,而α-螺旋和β-轉(zhuǎn)角含量高于健康乳腺組織。
健康乳腺組織和癌變?nèi)橄俳M織的蛋白質(zhì)二級結(jié)構(gòu)含量差異主要來自于組織中各類蛋白質(zhì)含量的差異性。乳腺組織包含實質(zhì)成分和結(jié)締組織為主的間質(zhì)成分,而結(jié)締組織主要成分包括以α-螺旋為主的α-角蛋白、以β-折疊結(jié)構(gòu)為主的絲心蛋白和以非典型螺旋為主的膠原蛋白。因此,非典型螺旋的減少預(yù)示著膠原蛋白的減少[20-21]。相對于健康組織,癌變?nèi)橄俳M織中非典型螺旋含量低于健康乳腺組織,表明癌變?nèi)橄俳M織中膠原蛋白的含量低于健康組織,這是由于受病變影響,癌變組織失去了健康結(jié)構(gòu)中所特有的纖維結(jié)構(gòu)。癌變時蛋白合成增加以及脂質(zhì)含量減少[16,22],據(jù)此推測在膠原蛋白減少及β-折疊結(jié)構(gòu)為主的絲心蛋白也在減少的同時,所增加的蛋白合成應(yīng)主要是α-角蛋白。推測正是因為α-角蛋白(堅韌有彈性)的增加,從而導(dǎo)致異變的乳腺組織腫大硬結(jié)成瘤,同時絲心蛋白(決定其分子伸展)的減少則可能導(dǎo)致該部分組織甚至附屬的皮膚發(fā)生粘連褶皺等病理現(xiàn)象。
蛋白質(zhì)不同二級結(jié)構(gòu)的含量比值也可以用來描述蛋白質(zhì)二級結(jié)構(gòu)的組成的差異性。由圖5(B)可見,相對于健康乳腺組織,癌變?nèi)橄俳M織的α-螺旋含量升高,β-折疊和非典型螺旋含量減少,所以其α-螺旋/β-折疊的含量比值相應(yīng)有明顯增長,而非典型螺旋/α-螺旋比值減小。此外,α-螺旋和β-轉(zhuǎn)角的含量都有升高,且β-轉(zhuǎn)角/α-螺旋比值增大,可以推測出在癌變過程中α-螺旋的增長幅度小于β-轉(zhuǎn)角。通過比較得出,健康和癌變?nèi)橄俳M織中蛋白質(zhì)二級結(jié)構(gòu)的含量構(gòu)成有顯著的區(qū)別,從而可以用多種參數(shù)來表示蛋白質(zhì)的各二級結(jié)構(gòu)組成、變化強弱的具體差異。依據(jù)這些參數(shù)可進(jìn)一步原位區(qū)別健康和癌變?nèi)橄侔┙M織,理解其癌變過程。
表1所示是訓(xùn)練組進(jìn)行PLS-DA的分類和交叉驗證結(jié)果。當(dāng)選擇酰胺I帶建立判別模型時,訓(xùn)練組準(zhǔn)確率93.3%,交叉驗證組準(zhǔn)確率89.3%,而采用全波長光譜建立的判別模型訓(xùn)練組和交叉驗證的準(zhǔn)確率都達(dá)到100%。另外,根據(jù)兩種模型的RMSE和R-square值判斷,采用全光譜建立的模型穩(wěn)定性更好。表2所示為預(yù)測組的PLS-DA分類結(jié)果。由表2可見,由酰胺I帶建立的判別模型識別準(zhǔn)確率只有81.8%,而采用全光譜建立的模型識別準(zhǔn)確率達(dá)到97.0%。此外,只采用酰胺I帶建立的模型出現(xiàn)假陽性的概率較大。
表1 訓(xùn)練組分類結(jié)果
表2 預(yù)測組分類結(jié)果
以上分類識別的結(jié)果表明,雖然酰胺I帶含有大量的蛋白質(zhì)二級結(jié)構(gòu)的信息,但只選擇該波長范圍建立判別模型的效果明顯低于采用全光譜的效果,這是由于癌變過程中不僅有蛋白質(zhì)的變化,還有其他主要生物成分如核酸、脂質(zhì)和碳水化合物的變化。因此,單獨依靠酰胺I帶的變化去分辨癌變和健康組織顯然是不充分和不全面的。采用全光譜綜合計量癌變過程中蛋白質(zhì)等多組分的變化才更可能實現(xiàn)精確判別癌變組織。
采用HOF-ATR-FTIR光譜技術(shù)研究乳腺組織的蛋白質(zhì)(酰胺I帶)二級結(jié)構(gòu),發(fā)現(xiàn)癌變組織和健康組織的各二級結(jié)構(gòu)含量和相應(yīng)比值有顯著差異。同時,隨著乳腺癌變時膠原蛋白和絲心蛋白的減少,α-角蛋白合成明顯增加,可能進(jìn)而引起癌變病理。雖然酰胺I帶包含大量蛋白質(zhì)的二級結(jié)構(gòu)信息,但單獨選擇該波長范圍的光譜建立判別模型,其識別率及模型穩(wěn)定性都低于采用全波長光譜建立的模型,這是由于癌變過程中還涉及其他主要生物成分如核酸、脂肪以及碳水化合物的變化。由此可見,對乳腺組織癌變的HOF-ATR-FTIR光譜研究不僅有助于深入理解乳腺組織發(fā)生癌變時蛋白質(zhì)的構(gòu)象變化,也提供了一種從分子水平上分析乳腺組織癌變機理、原位檢測和精確識別乳腺癌變的有效方法。