倪志華
(福建生物工程職業(yè)技術(shù)學(xué)院 保健營養(yǎng)學(xué)系,福建 福州 350008)
藥用植物人參和三七的密碼子用法分析
倪志華
(福建生物工程職業(yè)技術(shù)學(xué)院 保健營養(yǎng)學(xué)系,福建 福州 350008)
采用高頻密碼子分析法,對人參屬藥用植物人參(PanaxginsengC. A. Mey.)和三七[PanaxNotoginseng (Burk.) F. H. Chen]的蛋白質(zhì)編碼基因序列(coding DNA sequence,CDS)進行了同義密碼子相對使用頻率(relative frequency of synonymous coden,RFSC)分析,確定了人參高頻密碼子6個和三七高頻密碼子7個。將人參和田七的密碼子使用頻率進行比較,結(jié)果顯示兩者的密碼子偏愛性具有較高的一致性。分析結(jié)果為外源基因在人參和三七中的表達(dá)提供參考。
人參;三七;高頻密碼子;密碼子偏愛性
密碼子是核酸與蛋白質(zhì)聯(lián)系的紐帶,是生物體內(nèi)遺傳信息傳遞的基本環(huán)節(jié)。編碼天然蛋白質(zhì)20種氨基酸的密碼子共有61種,每種氨基酸可由1~6個密碼子編碼,所以存在簡并性。密碼子的這種簡并性特征造成了不同物種的密碼子使用偏愛性不同,即編碼同一個氨基酸的密碼子在不同物種中具有不同的使用頻率。這種現(xiàn)象會導(dǎo)致外源基因在宿主細(xì)胞中的表達(dá)量降低。分析表達(dá)外源基因物種的密碼子用法,可為提高外源基因在該物種中的表達(dá)提供依據(jù)。
人參(Panax ginseng C. A. Mey.,簡稱為P.g)和三七(Panax Notoginseng (Burk.) F. H. Chen,簡稱為P.N)同為五加科人參屬珍貴藥材,古即有“南三七,北人參”之說法,千百年來一直被醫(yī)家廣泛運用。人參含有人參皂苷、人參多糖等多種物質(zhì),可增強機體對各種應(yīng)激刺激的非特異抵抗力,具有抗衰老、免疫調(diào)節(jié)、降血糖、保肝護肝、抗腫瘤等多種醫(yī)療保健功效[1];三七含有三七皂苷、三七多糖等多種物質(zhì),具有滋補強壯、止血、活血化瘀、消腫止痛、抗肝炎、降壓、降血脂、降血糖、抗衰老等多方面的藥理作用和保健功能[2,3]。目前,基因工程等方面的研究已經(jīng)在人參和三七中得到開展,如人胰島素已在人參愈傷組織細(xì)胞中成功表達(dá)[4],鯊烯合酶基因在三七根、莖、蘆頭中的轉(zhuǎn)錄表達(dá)研究[5],人參SQS基因的干擾載體構(gòu)建及轉(zhuǎn)化人參愈傷組織[6],人參愈傷組織的PSY基因遺傳轉(zhuǎn)化[7]等。為在翻譯水平提高外源基因的表達(dá)提供參考,本研究對人參和三七的密碼子用法進行了分析。
1.1 人參、三七基因樣本的獲取
人參、三七基因序列由GeneBank(http://www.ncbi.nlm. nih.gov/genbank)中獲得,樣本選擇原則如下[8]:(1)樣本為全長蛋白質(zhì)編碼基因序列(coding DNA sequence,CDS);(2)對于基因家族成員仍包含于分析樣本內(nèi);(3)不包括非植物基因序列(如質(zhì)粒、細(xì)菌、真菌、病毒、轉(zhuǎn)座子等基因序列);(4)不包括在葉綠體與線粒體中翻譯的基因。
1.2 人參、三七蛋白質(zhì)編碼基因序列的同義密碼子相對使用頻率(relative frequency of synonymous codon,RFSC)的計算
相對同義密碼子使用頻率反映的是樣本中各個同義密碼子的使用頻率。計算式為某一密碼子在樣本中的實際觀察數(shù)與該密碼子對應(yīng)的氨基酸在樣本中的實際觀察數(shù)的比值。它避免了由于樣本選擇中各基因的長短與氨基酸豐度的影響。
1.3 高頻密碼子(High-frequency codon,HF)的確定
根據(jù)RFSC的計算結(jié)果,利用高頻密碼子分析法[9]來篩選人參和三七的偏愛密碼子。如某一密碼子相對同義密碼子使用頻率單值超過60%或者超過該組同義密碼子平均占有頻率的1.5倍的密碼子即為高頻密碼子。
1.4 人參和三七密碼子偏愛性比較
用1/1 000(即在1 000個密碼子中出現(xiàn)的次數(shù))代表密碼子在編碼基因總密碼子中出現(xiàn)的頻率,統(tǒng)計人參和三七各密碼子的1/1 000并進行數(shù)據(jù)比較,比值如在0.50~2.00之間,表示兩物種對該密碼子的偏愛性較為接近,反之則差別較大[10]。
2.1 人參、三七高頻密碼子(HF)的確定
按照1.1中樣本選擇原則進行篩選后,獲得人參全長CDS總數(shù)為57個、三七全長CDS總數(shù)為29個(表1),根據(jù)1.2所述的計算方法,對人參57個基因共16 509個密碼子、三七29個基因共13 781個密碼子的RFSC分別進行了統(tǒng)計,結(jié)果如表2所示(Count為每種密碼子在所統(tǒng)計的所有基因中出現(xiàn)的次數(shù))。根據(jù)1.3所述的篩選標(biāo)準(zhǔn),篩選出人參高頻密碼子6個(含終止密碼子1個),它們是TGA(終止子)、GTT(編碼Val)、AAT(編碼Asn)、GAT(編碼Asp)、GAA(編碼Glu)和AGA(編碼Arg);三七高頻密碼子7個(含終止密碼子1個),它們是TGA(終止子)、ATT(編碼Ile)、GCT(編碼Ala)、CAT(編碼His)、CAA(編碼Gln)、GAT(編碼Asp)和AGA(編碼Arg)。
表1 人參、三七密碼子分析的基因樣本
表2 人參、三七蛋白編碼序列的同義密碼子相對使用頻率(RFSC)和高頻密碼子(HF)
(續(xù)表2)
2.2 人參和三七的密碼子偏愛性比較
人參(P.g)和三七(P.N)的密碼子使用頻率和偏愛性的比較結(jié)果如表3所示。
從表3可以看出,人參和三七各密碼子出現(xiàn)頻率的比值均在0.50~2.00之間,即人參和三七的密碼子偏愛性基本一致。
表3 人參與三七密碼子偏愛性比較表
(續(xù)表3)
遺傳密碼子是生物體生存的根本,研究其使用對基因表達(dá)及蛋白質(zhì)的工作原理具有重要意義。在密碼子的使用上,影響因素很多[11-14]。傳統(tǒng)的密碼子用法計算方法為高表達(dá)優(yōu)越密碼子分析法[15],此法計算方法十分繁瑣,且對于目的生物遺傳背景要求高,分析起來十分不便。采用高頻密碼子分析法,方法簡便、快速、可靠[9]。
本研究通過分析比較人參和三七各密碼子的使用頻率,發(fā)現(xiàn)兩者的密碼子偏愛性存在較高的一致性,這符合其較近的親緣關(guān)系。同時兩者之間高頻密碼子的使用又不完全相同,雖然樣本庫的大小會造成高頻密碼子的計算誤差,但也表明物種在進化過程中同屬不同物種間密碼子的使用存在“搖擺性”的變化。通過利用三七和人參密碼子偏愛性存在較高的一致性,可將設(shè)計的含人參偏愛密碼子的外源基因轉(zhuǎn)入三七中,從而可能實現(xiàn)高效表達(dá)。利用這種“通用性”可以減少重復(fù)性、節(jié)約資源、節(jié)省時間,對加快三七在基因工程方面的研究有十分重要的意義。
[1]黎陽,張鐵軍,劉素香,等.人參化學(xué)成分和藥理研究進展[J].中草藥,2009,40(1):164-附2.
[2]魏君嫻,杜元沖.三七現(xiàn)代科學(xué)研究及應(yīng)用[M].昆明:云南科技出版社,1996:1.
[3]鄭光植,楊崇仁.三七生物學(xué)及其應(yīng)用[M].北京:科學(xué)出版社,1994:1.
[4]汪春義,戚鳳春,陳桂玲,等.表達(dá)人胰島素的人參愈傷組織細(xì)胞系的建立[J].中國生物制品學(xué)雜志,2007,20(11): 818-820.
[5]吳耀生,朱華,李珅,等.三七鯊烯合酶基因在三七根,莖,蘆頭中的轉(zhuǎn)錄表達(dá)與三萜皂苷合成[J].中國生物化學(xué)與分子生物學(xué)報,2007,23(12):1000-1005.
[6]蔣世翠,張明哲,王義,等.人參SQS基因的干擾載體構(gòu)建及轉(zhuǎn)化人參愈傷組織[J].吉林大學(xué)學(xué)報:理學(xué)版,2011, 49(6):1136-1140.
[7]何秀霞,于源華,張勇,等.人參愈傷組織的PSY基因遺傳轉(zhuǎn)化[J].植物學(xué)通報,2008,25(8):579-584.
[8]Paul M S, Elizabeth C. Synonymous cedon usage in Sacharanyces cerevisiae[J]. Yeast, 1991(7): 657-678.
[9]林濤,倪志華,沈明山,等.高頻密碼子分析法及其在煙草密碼子分析中的應(yīng)用[J].廈門大學(xué)學(xué)報(自然科學(xué)版),2002,41(5):551-554.
[10]胡桂兵,張上隆,徐昌杰,等.柑橘密碼子用法分析[J].果樹學(xué)報,2006,23(3):479-485.
[11]Karlin S, Mrazek J. What drives codon choices in human genes[J]. J Mol Biol, 1996, 262: 459-472.
[12]Sharp P M, Li W H. An evolutionary perspective on synonymous codon usage in unicellular organisms[J]. J Mol Evo1, 1986, 24: 28-38.
[13]Duret L. tRNA gene number and codon usage in the C.elegansgenome are co-adapted for optimal translation of highly expressed genes[J]. Trends Genet, 2000, 16: 287-289.
[14]Gu W J, Zhou T, et al. The relationship between synonymous codon usage and protein structure inEscherichia coli and Homo sapiens[J]. Biosystems, 2004, 73(2): 89-97.
[15]Frank W. The efective number of codons usage used in a gene[J]. Gene, 1990, 87: 23-29.
(責(zé)任編輯、校對:李春香)
Analysis of Codon Usage in Panax Ginseng C. A. Mey. and Panax Notoginseng (Burk.) F. H. Chen
NI Zhi-hua
(Department of Nutrition and Health Sciences, Fujian Vocational College of Bioengeering, Fuzhou 350008, China)
Fifty-seven coding DNA sequences(CDS) in Panax ginseng C. A. Mey. and twenty-nine coding DNA sequences(CDS) inPanax Notoginseng (Burk. )F. H. Chen were used to analyze the relative frequency of synonymous codon(RFSC), and 6 high-frequency codons in Panax ginseng C. A. Mey. and 7 high-frequency codons in Panax Notoginseng (Burk. ) F. H. Chen were revealed by high-frequency codon analysis.When the frequency of codon usage of Panax ginseng C. A. Mey. was compared to Panax Notoginseng(Burk.) F. H. Chen, we found that the codon preference was identical in the two species.The data can be consulted to the research of exogene expression in Panax ginsengC. A. Mey. and Panax Notoginseng (Burk. ) F. H. Chen.
Panax ginseng C. A. Mey.; Panax Notoginseng (Burk.)F. H. Chen; high-frequency condon; Condon preference
R282.2
A
1009-9115(2012)05-0054-04
2012-07-24
倪志華(1979-),男,福建福州人,碩士,助教,研究方向為微生物與生化藥學(xué)。