王 芳、趙東波、蔣 玲、徐 莉、孫海軍、劉云飛*
1. 南京林業(yè)大學信息科學技術學院、江蘇 南京 210037 2. 南京大學化學工程學院、江蘇 南京 210023 3. 南京林業(yè)大學現(xiàn)代分析測試中心、江蘇 南京 210037 4. 三江學院電子信息工程學院、江蘇 南京 210012
RNA堿基的太赫茲光譜和拉曼光譜特征研究
王 芳1、4、趙東波2、蔣 玲1、徐 莉3、孫海軍3、劉云飛1*
1. 南京林業(yè)大學信息科學技術學院、江蘇 南京 210037 2. 南京大學化學工程學院、江蘇 南京 210023 3. 南京林業(yè)大學現(xiàn)代分析測試中心、江蘇 南京 210037 4. 三江學院電子信息工程學院、江蘇 南京 210012
應用傅里葉紅外光譜儀和激光拉曼光譜儀測試了RNA堿基在太赫茲波段(1~10 THz)的紅外和拉曼光譜、同時結合Guassian09軟件和周期性邊界條件下基于能量的分塊方法(PBC—GEBF)、分析了RNA堿基晶體的紅外和拉曼光譜特征、得到了所有特征峰位置及其對應的振動模式、且計算光譜與測試光譜一致吻合、表明堿基粉末樣品為無定形晶體結構。通過對紅外光譜的分析可知、在太赫茲波段、腺嘌呤和鳥嘌呤都有6個紅外活性振動模式、胞嘧啶和尿嘧啶分別為6個和3個紅外活性振動模式、與實驗結果相比、除了鳥嘌呤6.35 THz處的弱吸收峰沒能重現(xiàn)、4.83和5.39 THz處的吸收峰簡并; 胞嘧啶4.3和4.79 THz處吸收峰簡并; 尿嘧啶3.32和3.82 THz處的吸收峰簡并外、其他吸收峰的位置和強度均被準確地模擬重現(xiàn)。通過對拉曼光譜的分析可知、理論和實驗光譜基本一致、除了尿嘧啶3.52和4.48 THz處特征峰簡并; 鳥嘌呤7.26和8.03 THz、3.57、4.02、4.49、4.89和5.98 THz處特征峰簡并外、其他特征峰的位置和強度均被準確的模擬重現(xiàn)。通過對特征峰的分析和辨認、可知在1~10 THz、RNA堿基的振動模式均來源于晶格內分子的集體振動、分子間的氫鍵和弱相互作用力對振動模式的貢獻很大、進一步分析可知、在1~5.5 THz、其振動模式來自所有原子參與的集體振動、在5.5~10 THz、振動模式來自于部分原子參與的集體振動。此項研究對揭示RNA堿基在構成生物大分子結構、生物大分子鑒定以及太赫茲波段光譜的形成機制等方面、具有重要的理論和實際參考價值。
RNA堿基; 太赫茲光譜; 拉曼光譜; PBC-GEBF
核糖核酸(ribonucleic acid、RNA)存在于大多數(shù)已知的植物病毒和部分動物病毒以及一些噬菌體中、由磷酸、五碳糖和堿基組成、是生物遺傳訊息的中間載體、并參與蛋白質合成及基因表達調控。而作為RNA重要組成部分的堿基(腺嘌呤、鳥嘌呤、胞嘧啶、尿嘧啶)、通過氫鍵配對形成RNA獨特的單鏈長分子結構。太赫茲(THz)光譜和拉曼光譜都是研究分子結構的有效手段。THz光譜測定的是紅外光子照射到物質分子上、因分子振動、轉動所產生的共振吸收光譜、適用于紅外活性分子測量; 而拉曼光譜測定的分子共振散射光譜、適應于紅外非活性分子測量。太赫茲光譜和拉曼光譜在研究上具有互補性、是生物大分子鑒定和結構研究的重要手段[1-2]。閆慧[3]等利用太赫茲時域光譜技術(terahertz time domain spectroscopy、THz-TDS)結合贗勢平面波密度泛函方法、開展了DNA堿基分子中胞嘧啶和胸腺嘧啶的太赫茲光譜研究、獲得了0.1~3.5 THz范圍內所有的紅外活性模式。Fisher等[4]利用太赫茲時域光譜技術和密度泛函理論、對DNA堿基的紅外吸收譜進行了分析研究、獲得了0.5~4.0 THz范圍內的所有吸收峰位置、并對胸腺嘧啶的吸收峰進行了辨認。Nishizawa[5]等利用太赫茲波探測器、獲得了0.4~5.8 THz范圍內五種堿基的吸收譜。這些文獻報道的實驗數(shù)據(jù)、為RNA/DNA堿基分子結構及振動模式研究提供了依據(jù)、但選取不同的分子動力學模型、其計算出的理論值與實驗結果有較大偏差。本工作應用周期性邊界條件下基于能量的分塊方法(generalized energy-based fragmentation approach under periodic boundary conditions,PBC-GEBF)[6-11]計算RNA堿基晶體的晶格參數(shù)、晶格能、幾何結構、振動及轉動光譜等、并與太赫茲光譜(1~10 THz)和拉曼光譜(3~10 THz)的測試結果進行比對、發(fā)現(xiàn)在太赫茲波段(1~10 THz)、RNA堿基的遠紅外和拉曼光譜的理論值和實驗值一致吻合。此研究為揭示RNA堿基在生物大分子構成中的作用及生物大分子鑒定等方面提供非常重要的信息。
1.1 儀器
拉曼光譜儀為美國Themor公司的DXR532型激光拉曼光譜儀、儀器配置532和780 nm雙激光器系統(tǒng)、本研究選擇的780 nm激光器; 樣品點激光功率控制精度0.1 mW; 拉曼頻移范圍:100~3 300 cm-1(3~99 THz); 空間分辨率優(yōu)于1 μm; 光譜重復性:≤±0.2 cm-1; 帶有智能的OMNIC軟件、可用于光譜分析與處理。
實驗使用為德國Bruker 公司的VERTEX 80V型傅里葉紅外光譜儀、頻譜范圍為:15 500~10 cm-1; 儀器配置3個分束器:6、25和50 μm、實驗中選擇6 μm分束器、有效頻率范圍為:680~30 cm-1(0.9~20.4 THz); 真空環(huán)境下的分辨率可達2 cm-1; 信噪比優(yōu)于50 000∶1(峰-峰值)。
1.2 樣品制備與方法
實驗中使用的腺嘌呤A(adenine)、尿嘧啶U(uracil)、胞嘧啶C(cytosine)、鳥嘌呤G(guanine)均購于Sigma-Aldrich公司、樣品均為白色或類白色粉末、使用前沒有進一步提純處理。由于樣品在太赫茲波段的吸收很強、在進行紅外光譜測試前、將純樣品粉末(純度≥99%)與聚乙烯粉末以1∶10的質量比混合均勻后壓成0.5~1 mm厚的薄片、直徑為13 mm。同時制備純聚乙烯樣品薄片作為測試背景、純聚乙烯樣品的質量需與測試樣品中聚乙烯含量(質量)相同、這樣可以排除聚乙烯吸收的影響。拉曼光譜的測試相對簡單、只需將純樣品粉末置于載玻片上、然后再蓋上一塊載玻片、將樣品壓平后置于拉曼顯微鏡下、調整焦距尋找最佳測試點即可完成拉曼光譜的測試。
利用Guassian09[12]軟件、并應用密度泛函理論(density functional theory、DFT)對RNA堿基晶體進行結構優(yōu)化和頻率計算、使用B3LYP雜化泛函和6-311++G(d,p)基組、計算結果無虛頻。在計算過程中引入基于能量分塊和考慮周期性邊界條件的PBC-GEBF方法、將分子晶體的能量和振動光譜的計算劃分為一系列較小的分子團簇、“分而治之”、大大的節(jié)約了計算成本、計算光譜的擬合半寬高為4 cm-1。
RNA堿基中胞嘧啶晶體屬于正交晶系、其他堿基晶體均屬正斜晶系、其中腺嘌呤單晶胞中含有8個分子、其他堿基的單晶胞均由4個分子組成。RNA特有的尿嘧啶(uracil,U)的單分子和單晶胞結構如圖1所示、其晶胞結構中含有豐富的N—H…O和C—H…O氫鍵。理論計算中使用的堿基晶胞幾何結構均來自于劍橋晶體庫(cambridge structural database、CSD)、對應的refcode分別為:腺嘌呤(KEMDOW)、尿嘧啶(URACIL)、胞嘧啶(CYTSIN)、鳥嘌呤(KOBFUD)。
圖1 尿嘧啶的單分子和單晶胞結構
表1為RNA堿基的晶格參數(shù)理論值和實驗值的對比結果、采用PBC-GEBF及基于贗勢平面波(pseudo-potential plane wave、PPW)的VASP方法[13]對晶格參數(shù)進行理論預測、從表1可以看出、理論值和實驗值基本相符、且PBC-GEBF預測較VASP預測更接近實驗值、說明PBC-GEBF方法的計算結果更為準確、誤差在2%以內、為本研究的首選方法。原子編號參見圖1。除了尿嘧啶的C3—N6—H11鍵角的理論值和實驗值相差了0.6°、腺嘌呤的N1—C2—H11和N3—C2—H11鍵角的理論值和實驗值相差了0.1°、其余的鍵長和鍵角的理論值和實驗值幾乎為零偏差、偏差產生的原因是因為在晶體環(huán)境中形成了氫鍵網絡導致的結構差異、但是所有偏差都在合理的范圍之內、進一步說明了計算結果的可靠性。
表1 RNA堿基晶格參數(shù)的理論值(基于PBC-GEBF及基于贗勢平面波的VASP方法)和實驗值的對比結果、實驗數(shù)據(jù)已加粗
Table 1 Comparison of lattice parameters of RNA nucleobases which predicted by PBC-GEBF and VASP,respectively,with the experimental data as reference in bold
Basesa/?b/?c/?α/(°)β/(°)γ/(°)A*7.907.897.8922.2422.2422.247.437.457.4589.590.090.0113.0113.2113.290.190.090.0G3.613.553.559.729.699.7016.4216.3416.3590.090.090.095.895.795.790.490.090.0C13.0313.3613.049.519.709.493.803.853.8190.490.090.090.190.090.090.190.090.0U11.9011.9411.9412.4412.3812.383.593.653.6689.890.090.0119.5120.9120.990.290.090.0
* Data in the first row corresponding to each nucleobase predicted by VASP and the second predicted by PBC-GEBF
3.1 RNA堿基太赫茲光譜
RNA堿基太赫茲光譜的實驗結果和理論計算結果見圖2。
由圖2可以看出、RNA堿基的實驗光譜[圖2(a)]和其晶體結構的計算光譜[圖2(b)]有著相似的吸收剖面、表明RNA堿基粉末狀樣品屬于無定形晶體結構。但實驗光譜相對理論光譜有一定的頻移、這是因為實驗光譜是在室溫下測得、而理論計算出的光譜是在低溫(0 K)條件下模擬得到。另外、實驗數(shù)據(jù)基于分子的固態(tài)結構、而理論模擬基于氣相結構。在1~10 THz頻段、應用PBC-GEBF方法計算RNA堿基晶體的紅外共振吸收光譜、得到腺嘌呤和鳥嘌呤都有6個紅外活性振動模式、胞嘧啶和尿嘧啶分別為6個和3個紅外活性振動模式。與實驗結果相比、除了鳥嘌呤6.35 THz處的吸收峰沒能重現(xiàn)、4.83和5.39 THz處的吸收峰簡并; 胞嘧啶4.3和4.79 THz處吸收峰簡并; 尿嘧啶3.32和3.82 THz處的吸收峰簡并、其他吸收峰的位置和強度均被準確地模擬重現(xiàn)。在這里需要說明的是:理論計算中、無論什么樣的分子團簇(二聚體、三聚體、四聚體等等)均不能精確地描述分子晶體的整體性能、這也是造成理論結果和實驗結果有一定偏差的原因。從圖2還可以看出、RNA堿基在太赫茲波段的吸收峰均顯示為較寬的吸收包絡、這與分子內基團的振動吸收有很大的區(qū)別。分析認為、太赫茲波段的振動特性均來自于分子的集體振動、這一結果可以從理論計算得到的振動模式中得到驗證。表2列出了尿嘧啶太赫茲光譜中所有吸收峰位置和對應的振動模式。
圖2 RNA堿基晶體在1~10 THz波段的傅里葉紅外光譜(a)與理論光譜(b)對比
表2 尿嘧啶晶體在太赫茲波段所有紅外活性振動模式
Abbreviations: γ:stretching; β:bending; α:rocking; as γ:asymmetrical stretching; sγ:symmetrical stretching; W:wagging; T:twisting; S:scissoring; DB:ring deformation (bending); DS:ring deformation (stretching); RB:ring breathing; BT:butterfly torsion; TS,translation; ①—⑧:Molecular number in the unit cell; The content in brackets is vibration modes of the ring; Ignore the distinction between single and double bonds
圖3給出了尿嘧啶3.37 THz處的振動模型。RNA堿基所有分子結構、紅外吸收峰對應的振動模式和模型以及動態(tài)視頻見補充材料。
3.2 RNA堿基拉曼光譜
拉曼光譜作為紅外光譜的有力補充、同樣可以得到分子振動、轉動信息、還可以顯示紅外光譜不能顯示或者比較弱的吸收峰、常被用于分子結構的定性或定量分析。圖4為RNA堿基在3~10 THz范圍拉曼光譜理論和實驗值、使用PBC-GEBF方法計算得到的拉曼光譜與實驗結果吻合、其特征峰基本一致、除了尿嘧啶3.52和4.48 THz處特征峰簡并; 鳥嘌呤7.26和8.03 THz、3.57、4.02、4.49、4.89和5.98 THz處特征峰簡并外、其他特征峰的位置和強度均能準確的模擬重現(xiàn)、可以用解釋太赫茲光譜的方法說明這一現(xiàn)象。作為紅外光譜的一種補充手段、對RNA堿基晶體在太赫茲波段的拉曼光譜進行了研究。在4~10 THz、拉曼光譜呈現(xiàn)弱特征峰、肉眼難以看清、為此對該區(qū)域進行了放大處理、見圖5。表3給出了尿嘧啶的拉曼特征譜理論和實驗值、并對所有特征峰進行了指認、給出了對應的振動模式。
圖4 RNA堿基晶體在3~10 THz波段拉曼光譜的實驗(a)和理論(b)結果對比
圖5 RNA堿基晶體在4~10 THz波段拉曼光譜的理論(a)與實驗(b)結果對比,實驗結果中尿嘧啶和胞嘧啶的強度被放大了5倍
Fig.5 Theoretical (a) and experimental (b) spectra (Raman) of 4 RNA nucleobase crystals in the frequency range from 4~10 THz. The intensity of experimental results for cytosine and uracil (b) were magnified 5 times
表3 尿嘧啶晶體在太赫茲波段所有拉曼活性振動模式
Abbreviations: γ:stretching; β:bending; α:rocking; as γ:asymmetrical stretching; sγ:symmetrical stretching; W:wagging; T:twisting; S:scissoring; DB:ring deformation (bending); DS:ring deformation (stretching); RB:ring breathing; BT:butterfly torsion; TS:translation; ①—⑧:Molecular number in the unit cell; The content in brackets is vibration modes of the ring; Ignore the distinction between single and double bonds
應用傅里葉紅外光譜儀和激光拉曼光譜儀測試了4種RNA堿基在太赫茲波段的遠紅外和拉曼光譜、并利用PBC-GEBF方法結合Guassian09 軟件對RNA堿基晶體結構的振動光譜進行了計算、得到了所有特征峰位置及其對應的振動模式、理論和實驗結果相一致。拉曼光譜作為紅外光譜的有力補充、在對RNA堿基振動光譜分析時、發(fā)揮了很大的優(yōu)勢、從RNA堿基太赫茲波段的振動光譜看出、在1~10 THz波段、所有振動模式均來源于分子的集體振動、分子間的氫鍵和弱相互作用對振動模式的貢獻很大。從RNA堿基紅外活性振動模式可以看出、1~5.5 THz的振動模式一般來源于所有原子參與的集體振動、5.5~10 THz的振動模式來自于部分原子參與的集體振動、這與拉曼光譜觀測到的結果一致。這說明、隨著振動頻率的增加、振動模式由分子的集體振動向基團的振動過渡。
[1] Michalska,Katarzyna,et al. Journal of Molecular Structure,2016,1115: 136.
[2] Al-Zoubi N,Koundourellis J E,Malamataris S,et al. Journal of Pharmaceutical & Biomedical Analysis,2002,29(3): 459.
[3] YAN Hui,FAN Wen-hui,et al(閆 慧、范文慧、等). Spectroscopy and Spectral Analysis(光譜學與光譜分析),2013,33(10): 2612.
[4] Fischer B M,Walther M,UhdJepsen P. Physics in Medicine and Biology,2002,47(21): 3807.
[5] Nishizawa J、Sasaki T,Suto K,et al. Optics Communications,2005,244(1-6): 469.
[6] Li Shuhua,Li Wei,Fang Tao. Journal of the American Chemical Aociety,2005,127(19): 7215.
[7] Li Wei,Li Shuhua,Jiang Yuansheng. Journal of Physical Chemistry,2007,111(11): 2193.
[8] Li S,Li W,Ma J. Accounts of Chemical Research,2014,47(9): 2712.
[9] Fang T,Li W,Gu F,et al. Journal of Chemical Theory and Computation,2015,11(1): 1.
[10] Svensson M,Humbel S,Froese R D J,et al. Journal of Physical Chemistry,1996,100: 19357.
[11] Fang Tao,Jia Junteng,Li Shuhua. Journal of Physical Chemistry,2016,120(17): 2700.
[12] Frisch M J,Trucks G W,Schlegel H B,et al. Gaussian 09,Revision D.01,Gaussian,Inc.,Wallingford CT,2013.
[13] Kresse G,Furthmuller J. Comput. Mater,Sci. Physical Review B Condensed Matter,1996,6: 15.
[14] Mahapatra S,Nayak S K,Prathapa S J,et al. Crystal Growth and Design,2008,8: 1223.
[15] Stewart R F,Jensen L H. Acta Crystallographica,1967,23: 1102.
[16] Barker D L,Marsh R E. Acta Crystallographica,1964,17(12): 1581.
[17] Guille K,Clegg W. Acta Crystallographica,Section C: Crystal Structure Communications,2006,62: o515.
*Corresponding author
Research on THz and Raman Spectra of RNA Nucleobases
WANG Fang1,4、ZHAO Dong-bo2、JIANG Ling1、XU Li3、SUN Hai-jun3、LIU Yun-fei1*
1. College of Information Science and Technology,Nanjing Forestry University,Nanjing 210037,China 2. School of Chemistry and Chemical Engineering,Nanjing University,Nanjing 210023,China 3. Advanced Analysis and Testing Center,Nanjing Forestry University,Nanjing 210037,China 4. School of Electronic and Information Engineering,Sanjiang University,Nanjing 210012,China
The Infrared and Raman spectra of RNA nucleobases in terahertz (THz) band (1~10 THz) were detected with Fourier transform infrared spectroscopy (FTIR) and Raman spectroscopy. The position of all the characteristic peaks and corresponding vibration modes of RNA nucleobase crystals were obtained with Guassian09 software and energy-based fragmentation approach under periodic boundary conditions (PBC-GEBF) method. The computational results were verified to be in accordance with experimental data,which indicated that the powder of RNA nucleobases is amorphous crystal structure. The infrared spectra demonstrated that adenine,guanine and cytosine all have 6 infrared active vibrational modes,while uracil only has 3. Comparing to experimental results,the position and intensity of the absorption peaks were nicely corroborated by the predicted spectrum,except that one weak vibrational frequency at 6.35 THz is missing and two peaks (4.83 and 5.39 THz) merge in the predicted spectrum of guanine; two peaks in 4.3 and 4.79 THz merge into a single one in the calculated spectrum of cytosine; the peaks of thymine in 3.32 and 3.82 THz merged. The computational results of Raman spectra were also verified to be in line with the experimental data. The position and intensity of the characteristics peaks were exactly simulated except that two peaks of guanine in 3.52 and 4.48 THz merged; two peaks in 7.26 and 8.03 THz merge and five peaks (3.57,4.02,4.49,4.89,5.98 THz) merge in the calculated spectrum of guanine. Through the analysis and identification of the characteristic peaks,it is indicated that the vibration modes of DNA nucleobases in 1~10 THz were derived from collective vibration of molecules in the lattice. The intermolecular hydrogen bond and the weak interaction force contribute greatly to the vibration modes. In addition,as the frequency increases to over 5.5 THz,the vibration modes will change from the atoms collective vibration to some atoms vibration. This research has important theoretical and practical reference value to reveal the effect of RNA nucleobases in the areas of RNA molecular structure constitution,biological macromolecules identification and terahertz spectra formation mechanism and biological inheritance.
RNA nucleobases; THz spectra; Raman spectra; PBC-GEBF
Jun. 22,2016; accepted Sep. 28,2016)
2016-06-22、
2016-09-28
國家自然科學基金項目(31170668、31200541)、江蘇省自然科學基金項目(2012417)、江蘇省優(yōu)勢學科(PAPD)、江蘇高校品牌專業(yè)建設工程項目(TAPP)資助
王 芳、1984年生、南京林業(yè)大學博士研究生 e-mail:582536573@qq.com *通訊聯(lián)系人 e-mail:lyf@njfu.com.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)12-3863-07