李娟,李莉,張國范
(1.中國科學院海洋研究所,山東 青島 266071;2.中國科學院研究生院,北京 100049)
海灣扇貝組織蛋白酶L基因編碼區(qū)的克隆和分析
李娟1,2,李莉1,張國范1
(1.中國科學院海洋研究所,山東 青島 266071;2.中國科學院研究生院,北京 100049)
通過cDNA末端快速擴增技術(shù)(RACE), 從海灣扇貝(Argopecten irradians)中克隆得到了組織蛋白酶L基因(AiCL)的編碼區(qū)全
長,為1 095 bp, 推測編碼364個氨基酸。經(jīng)比對與分析發(fā)現(xiàn)蛋白序列中存在4個組織蛋白酶L活性位點保守氨基酸:Q164, C170, H309, N329;6個極為保守的半胱氨酸殘基:C167,C201,C210,C243,C302,C351。預(yù)測其N端17個氨基酸為信號肽序列,C端ASYPTV可能也是分泌信號。AiCL成熟蛋白分子由219個氨基酸構(gòu)成,前體肽的切割位點預(yù)計在A145和M146之間。序列同源性分析中,AiCL蛋白序列與軟體動物同源蛋白最為相似,序列一致性在50%以上,在系統(tǒng)進化樹中與其它無脊椎動物組織蛋白酶L聚合到一起。通過SWISS-MODEL構(gòu)建的AiCL成熟蛋白三維模型表明該蛋白空間結(jié)構(gòu)高度保守。根據(jù)其序列特征,推測AiCL可能具有水解多種肌蛋白的活性。
海灣扇貝;組織蛋白酶L基因;克??;序列分析
組織蛋白酶(cathepsin)是一類主要存在于溶酶體的蛋白水解酶,與核糖核酸酶、β-葡萄糖醛酸酶、乙酰基轉(zhuǎn)移酶以及其他的蛋白酶一起參與溶酶體介導的蛋白質(zhì)的消化及轉(zhuǎn)化過程[1]。“組織蛋白酶”一詞1920年被首次使用,它們幾乎存在于所有生物,包括病毒、細菌、植物、動物。這一酶家族包括半胱氨酸蛋白酶(L型等)、絲氨酸蛋白酶(A型、G型等)以及天冬氨酸蛋白酶(D型、E型等)[2]。研究發(fā)現(xiàn)組織蛋白酶L (cathepsin L)能夠水解多種蛋白質(zhì),包括肌球蛋白、肌動蛋白、細胞溶質(zhì)蛋白、膠原及彈力蛋白[3]。高等動物中,組織蛋白酶L在胞內(nèi)和胞外很多重要的生理、病理過程中起作用,被認為參與抗原呈遞、組織再生、腫瘤的侵染轉(zhuǎn)移、骨質(zhì)的吸收溶解、寄生蟲感染等過程[4-7]。水生動物中關(guān)于組織蛋白酶L的研究還相對較少。在甲殼動物中,該酶在各組織普遍表達,而消化器官中表達水平最高,可能主要消化食物為機體提供營養(yǎng)。在基圍蝦(Metapenaeus ensis)中還發(fā)現(xiàn)其卵母細胞核中存在未活化的組織蛋白酶L酶原,但對其功能并不很清楚[8]。組織蛋白酶在對蝦的蛻皮過程中可能起重要的作用,組織蛋白酶L基因也被認為是對蝦生長相關(guān)基因[9]。而在水產(chǎn)品加工方面,組織蛋白酶L強大的蛋白水解能力是影響魚糜品質(zhì)的罪魁禍首[10,11]。目前,貝類中組織蛋白酶L的分子水平研究還鮮見報道。
海灣扇貝(Argopecten irradians)自然分布于美國的東海岸和墨西哥灣沿岸,于1982年首次成功引入我國,之后又多次引種,現(xiàn)已成為我國主要海水養(yǎng)殖貝類之一[12,13]。其扇貝柱的品質(zhì)與口感可能會受到閉殼肌內(nèi)殘留組織蛋白酶L的影響。本研究通過cDNA末端快速擴增技術(shù)(RACE)從海灣扇貝中克隆得到了組織蛋白酶L基因(AiCL)編碼區(qū)全長,并通過序列分析發(fā)現(xiàn)其與許多物種同源序列有相同特征,在進化上十分保守,可能具有水解多種肌蛋白的活性。
取稚貝軟體部加液氮冷凍并研磨,使用Trizol(Invitrogen)提取總RNA ,并經(jīng)1.0%瓊脂糖凝膠電泳檢測。以2 μg總RNA為模板,加入Oligo dT(10uM) 1 μl,70 °C熱變性5 min,冰浴2 min,迅速加入MLV Reaction Buffer 5μl, dNTP(2.5mM) 5μl, RNase inhibitor(TaKaRa)1μl, M-MLV 反轉(zhuǎn)錄酶(Promega) 1 μl, 于42 °C反轉(zhuǎn)錄1 h, 95 °C 5 min滅活反轉(zhuǎn)錄酶。
對本實驗室所構(gòu)建的海灣扇貝均一化cDNA文庫進行隨機大規(guī)模測序并比對分析,獲得一條注釋為組織蛋白酶L的EST,長為663 bp。
1.2.1 AiCL編碼區(qū)3’端確認 通過DNAssist2.2將已有的AiCL的EST進行編碼區(qū)分析,發(fā)現(xiàn)其具有與Blastx預(yù)測為組織蛋白酶L編碼框吻合的終止密碼子TGA,初步確認該EST具有完整的編碼區(qū)3’端序列。
1.2.2 AiCL 5’RACE模板制備 用PCR產(chǎn)物純化試劑盒(TaKaRa)純化cDNA。以末端轉(zhuǎn)移酶(TdT,TaKaRa)為cDNA加尾:cDNA 10 μl, 5×TdT buffer 5 μl, dCTP(10mM)0.5 μl, BSA buffer(0.1%) 6.25 μl, 于94°C 保溫3 min,然后置于冰上,再加入:TdT 酶 1 μl, 37°C保溫10 min, 65°C 10 min失活TdT。
1.2.3 AiCL 5’RACE PCR擴增 使用Primer Premier 5.0根據(jù)AiCL的EST序列設(shè)計兩條反向引物:AiCL gsp R1(5’-TGTAAGGGTACTCAGATTC CGACTCAA-3’)和AiCL gsp R2 (5’-CAAGAG CACCAG TTGTACTAAATGACC-3’),用于AiCL 5’RACE PCR擴增。以加尾cDNA為模板,AiCL gsp R1和Oligo(dG) -adaptor (5’-GGCCACGCGTCGAC TAGTACG10-3’)為引物進行第1次PCR,PCR反應(yīng)程序為:94°C 2min預(yù)變性,94 °C 40s, 60°C(-1°C/循環(huán)) 50s, 72 °C 2min, 10個循環(huán); 94 °C 40s, 50 °C 50s, 72°C 2min, 25個循環(huán), 最后72°C延伸10 min。將第一次PCR產(chǎn)物稀釋20倍,取1 μl作為模板進行巢式PCR,引物為AiCL gsp R2和AP(5’-GGCCACGCGTCGACTAGTAC-3’),PCR反應(yīng)條件同樣采用前面所使用的touchdown PCR程序。
1.2.4 PCR產(chǎn)物的克隆與測序 (1)PCR產(chǎn)物純化:PCR 產(chǎn)物在1.2%的瓊脂糖凝膠中進行電泳,經(jīng)過凝膠成像系統(tǒng)(VDS)觀察照相后切下特異目的條帶,用PCR產(chǎn)物凝膠回收試劑盒(Axygen)回收,方法參考試劑盒說明手冊,最后將產(chǎn)物溶解于TE中,-20°C保存?zhèn)溆谩?/p>
(2)連接T載體與轉(zhuǎn)化及陽性克隆篩選:使用 pMD18-T vector(TaKaRa) 16℃過夜連接PCR產(chǎn)物。取10 μl的連接產(chǎn)物轉(zhuǎn)化大腸桿菌DH5α感受態(tài)細胞。感受態(tài)細胞的制備和轉(zhuǎn)化參照分子克隆實驗指南(第三版)的方法進行。在含有Amp、IPTG和X-gal的LB平板上培養(yǎng)過夜后挑出白色菌落,篩選陽性克隆。將含陽性質(zhì)粒的單菌落擴大培養(yǎng),進行測序。
所測得的序列去掉載體序列后進行拼接,進行BLAST(http://www.ncbi.nlm.nih.gov)比對,并通過NCBI網(wǎng)站工具ORF finder進行編碼區(qū)的預(yù)測,確認獲得了完整AiCL編碼區(qū)序列。根據(jù)所測得的cDNA序列推導其氨基酸序列,利用Expasy網(wǎng)站(http://www.expasy.ch)提供的蛋白質(zhì)組和序列分析工具ProtParam軟件進行蛋白質(zhì)基本物理化學參數(shù)分析,通過SWISS-MODEL對其進行結(jié)構(gòu)預(yù)測,使用SMART軟件預(yù)測功能域,利用SingalP程序(http://genome.cbs.dtu.dk/services/SignalP-2.0/)分析是否存在信號肽。將不同物種的組織蛋白酶通過ClustalX進行比對,進行相似性同源性分析(http://www.bioinformatics.org/sms/), 使用Mega3.1軟件進行系統(tǒng)進化樹的構(gòu)建。
圖1 AiCL基因編碼區(qū)及其所推測的氨基酸序列。起始密碼子ATG、終止密碼子TGA以方框標注,N端信號肽和4個酶活性位點保守氨基酸以下劃線標注,前體肽的切割位點以“|”表示Fig.1 Nucleotide sequence and the deduced amino acid sequence of AiCL.The translation initiation codon ATG and terminal codon TCA are boxed, and the signal peptide of N terminal and four conserved amino acid residues for enzyme activity are underlined, and the potential cleavage site is indicted by “|”
圖 2 AiCL與其它物種的組織蛋白酶L多序列比對結(jié)果。一致性和相似度高的部分以陰影表示。物種來源及GenBank序列號見表1Fig.2 Alignment of AiCL with cathepsin L sequences from other species.The conserved parts are shadowed.The species and GenBank accession numbers are given in Tab.1
表 1 AiCL 與其它物種組織蛋白酶L的相似性和一致性Tab.1 Identities and similarities of AiCl compared with different cathepsins
圖 3 組織蛋白酶系統(tǒng)進化樹。AiCL的位置以灰色三角表示Fig.3 Phylogenetic tree of cathepsins.AiCL is emphasized by a grey triangle
圖 4 SWISS-MODEL預(yù)測的AiCL三維模型Fig.4 3D-model of AiCL predicted by SWISS-MODEL
所獲得AiCL的cDNA序列長1 203 bp, 其中5’非編碼區(qū)為76 bp,3’非編碼區(qū)為32 bp。cDNA序列中編碼區(qū)長1 095 bp, 編碼364個氨基酸,通過ProtParam軟件預(yù)測其蛋白分子量為41.2kD,等電點為4.98。通過NCBI的Conserved Domain Database比對,發(fā)現(xiàn)根據(jù)cDNA序列所翻譯的蛋白序列中存在組織蛋白酶L活性位點的4個保守氨基酸:Q164, C170, H309, N329,它們對成熟蛋白空間結(jié)構(gòu)和功能的穩(wěn)定起著重要的作用[2]。通過SingalP預(yù)測在第17和18個氨基酸之間有一個信號肽的切割位點,而根據(jù)序列比對結(jié)果推測形成成熟蛋白時前體肽的切割位點在A145和M146之間(圖1)。這與其它物種中成熟的有活性組織蛋白酶L的N端所具有高度保守的脯氨酸殘基的特征相符,位于切割位點周圍的氨基酸P147可以起到預(yù)防N端蛋白水解的作用[14]。AiCL的成熟蛋白分子由219個氨基酸構(gòu)成,預(yù)測等電點較前體肽略有下降,為4.52。從序列比對結(jié)果中還發(fā)現(xiàn)6個極為保守的半胱氨酸殘基,分別為:C167,C201,C210,C243,C302,C351,根據(jù)同源序列中相應(yīng)位置的結(jié)構(gòu),它們能夠形成3對二硫鍵:C167-C210,C201-C243,C302 -C351[15](圖2)。在AiCL蛋白序列的C端存在ASYPTV,而在哺乳動物中其同源的ASYPLV被認為是一個細胞分泌的信號序列[16]。序列同源性分析中,AiCL蛋白序列與另外兩種軟體動物的組織蛋白酶L的同源性最高,序列一致性在50%以上;與脊椎動物的組織蛋白酶L序列一致性大多在40%至50%,而與鳥類的序列同源性略低;與其它兩種組織蛋白酶H和B型的序列一致性最低,分別在35%左右和15%左右(詳見表1)。此外,根據(jù)序列比對結(jié)果,通過Mega3.1軟件利用鄰接法(Neighbor-joining)構(gòu)建了系統(tǒng)進化樹(圖3)。從圖中可以看出,H型和B型組織蛋白酶都各自形成獨立分枝,AiCL與其它物種的組織蛋白酶L聚合到一起,組成了一個分枝。在L型組織蛋白酶這一分支中,無脊椎動物和脊椎動物的組織蛋白酶L清晰的分為兩個區(qū)域。通過SWISS-MODEL構(gòu)建了AiCL成熟蛋白的三位立體結(jié)構(gòu)(圖4),雖然與其它組織蛋白酶L在序列上有所不同,但在空間結(jié)構(gòu)卻高度相似[17-20]。
綜上所述,本研究通過RACE技術(shù)克隆得到了海灣扇貝組織蛋白酶L基因編碼區(qū)全長,經(jīng)序列比對與分析發(fā)現(xiàn)該基因的蛋白序列與許多物種同源序列十分相似,具有多個組織蛋白酶L的特征結(jié)構(gòu)。這表明該基因在進化上比較保守。已有研究表明木瓜蛋白酶的半胱氨酸蛋白酶家族可能早在真核生物和原核生物分離之前就存在了,并且L、H、B型組織蛋白酶跨物種的高度保守性提示它們通過基因復(fù)制演變而來[21]。海灣扇貝組織蛋白酶L很可能在功能上與其同源蛋白相似,具有水解多種肌肉相關(guān)蛋白的能力。近年來越來越多的證據(jù)表明組織蛋白酶可能參與非caspase介導的細胞凋亡過程[22]。細胞凋亡又是免疫調(diào)節(jié)的中心環(huán)節(jié),各種免疫細胞的代謝過程大多通過細胞凋亡實現(xiàn)[23]。而隨著對無脊椎動物組織蛋白酶L日益增多的研究,人們發(fā)現(xiàn)這種蛋白水解酶可能在無脊椎動物的免疫反應(yīng)中具有重要的作用[24]。在受鰻弧菌(Vibrio anguillarum)刺激后,中華絨鰲蟹(Eriocheir sinensis)組織蛋白酶L的表達量發(fā)生顯著變化[25];相似的,溶藻弧菌(Vibrio alginolyticus)會引起合浦珠母貝(Pinctada fucata)組織蛋白酶L的急劇變化[15]。貝類組織蛋白酶L的多種功能有待我們進一步通過實驗證實。
[1]Mellman I.Endocytosis and molecular sorting [J].Annual Review of Cell and Developmental Biology, 1996, 12: 575-625.
[2]Lecaille F, Kaleta J, Bromme D.Human and parasitic papain-like cysteine proteases: Their role in physiology and pathology and recent developments in inhibitor design [J].Chemical Reviews, 2002, 102(12): 4459-4488.
[3]Chauhan S S, Goldstein L J, Gottesman M M.Expression of cathepsin L in human tumors [J].Cancer Research, 1991, 51(5): 1478-1481.
[4]Kos J, Werle B, Lah T, et al.Cysteine proteinases and their inhibitors in extracellular fluids: markers for diagnosis and prognosis in cancer [J].The International Journal of Biol ogical Markers, 2000, 15(1): 84-89.
[5]Lindeman J H, Hanemaaijer R, Mulder A, et al.Cathepsin K is the principal protease in giant cell tumor of bone [J].The American Journal of Pathology, 2004, 165(2): 593-600.
[6]Sloane B F, Honn K V.Cysteine proteinases and metastasis [J].Cancer Metastasis Reviews, 1984, 3(3): 249-263.
[7]Sloane B F, Rozhin J, Hatfield J S, et al.Plasma membraneassociat--ed cysteine proteinases in human and animal tumors [J].Experimental Cell Biology, 1987, 55(4): 209-224.
[8]Hu K J, Leung P C.Shrimp cathepsin L encoded by an intronless gene has predominant expression in hepatopancreas, and occurs in the nucleus of oocyte [J].Comparative Biochemistry and Physiology.Part B, Biochemistry & Molecular Biology, 2004, 137(1): 21-33.
[9]Glenn K L, Grapes L, Suwanasopee T, et al.SNP analysis of AMY2 and CTSL genes in Litopenaeus vannamei and Penaeus monodon shrimp [J].Animal Genetics, 2005, 36(3): 235-236.
[10]Akpinar O, An H.Purification and determination of inhibitory activity of recombinant soyacystatin for surimi application [J].Molecular Nutrition & Food Research, 2005, 49(3): 247-255.
[11]Jiang S T, Lee B L, Tsao C Y, et al.Mackerel Cathepsins B and L Effects on Thermal Degradation of Surimi [J].Journal of Food Science, 1997, 62(2): 310-315.
[12]張福綏,何義朝,劉祥生, 等.海灣扇貝的引種、育苗與試養(yǎng) [J].海洋與湖沼, 1986, 17(5): 367-374.
[13]張福綏,何義朝,楊紅生.海灣扇貝引種工程及其綜合效應(yīng) [J].中國工程科學, 2002, 2(2): 30-35.
[14]Wang B, Shi G P, Yao P M, et al.Human cathepsin F.Molecular cloning, functional expression, tissue localization, and enzymatic characterization [J].The Journal of Biological Chemistry, 1998, 273(48): 32000-32008.
[15]Ma J, Zhang D, Jiang J, et al.Molecular characterization and expression analysis of cathepsin L1 cysteine protease from pearl oyster Pinctada fucata [J].Fish & Shellfish Immunology, 2010, 29(3): 501-507.
[16]Chauhan S S, Ray D, Kane S E, et al.Involvement of carboxyterminal amino acids in secretion of human lysosomal protease cathepsin L [J].Biochemistry, 1998, 37(23): 8584-8594.
[17]Lewis S D, Johnson F A, Shafer J A.Effect of cysteine-25 on the ionization of histidine-159 in papain as determined by proton nuclear magnetic resonance spectroscopy.Evidence for a his-159-Cys-25 ion pair and its possible role in catalysis [J].Biochemistry, 1981, 20(1): 48-51.
[18]Rawlings N D, Barrett A J.Evolutionary families of peptidases [J].The Biochemical Journal, 1993, 290 (1): 205-218.
[19]Schr?der E, Phillips C, Garman E, et al.X-ray crystallographic structure of a papain-leupeptin complex [J].FEBS Letters, 1993, 315(1): 38-42.
[20]Gillmor S A, Craik C S, Fletterick R J.Structural determinants of specificity in the cysteine protease cruzain [J].Protein Science : A Publication of the Protein Society, 1997, 6(8): 1603-1611.
[21]Berti P J, Storer A C.Alignment/phylogeny of the papain superfamily of cysteine proteases [J].Journal of Molecular Biology, 1995, 246(2): 273-283.
[22]Chwieralski C E, Welte T, Buhling F.Cathepsin-regulated apoptosis [J].Apoptosis, 2006, 11(2): 143-149.
[23]Krammer P H.CD95's deadly mission in the immune system [J].Nature, 2000, 407(6805): 789-795.
[24]S?derh?ll K, Cerenius L.Role of the prophenoloxidase-activating system in invertebrate immunity [J].Current Opinion in Immunology, 1998, 10(1): 23-28.
[25]Li W W, Jin X K, He L, et al.Molecular cloning, characterization, expression and activity analysis of cathepsin L in Chinese mitten crab, Eriocheir sinensis [J].Fish & Shellfish Immunology, 2010, 29(6):1010-1018.
Cloning and sequence analysis of cathepsin L gene from bay scallopArgopecten irradians
LI Juan1,2, LI Li1, ZHANG Guo-fan1
(1.Institute of Oceanology, Chinese Academy of Sciences, Qingdao 266071, China; 2.Graduate University of Chinese Academy of Sciences, Beijing 100049, China)
The complete open reading frame (ORF) of cathepsin L was obtained from bay scallop (Argopecten irradians) by RACE technique.The ORF was of 1 095 bp, encoding 364 amino acids.Four conserved residues for enzyme activity (Q164, C170, H309, N329) and six preserved cysteines were found in the protein sequence.17 amino acids of N terminal were predicted to be the signal peptide and the sequence ASYPTV at C terminal was found to be a possible signal sequence.The mature protein of AICL contained 219 amino acids and the potential cleavage site was between A145 and M146.Analysis indicated AiCL shared the highest identities (>50%) with molluscan cathepsin Ls.It clustered with other invertebrate cathepsin Ls in the phylogenetic tree.The 3D-model predicted by SWISS-MODEL demonstrated that cathepsin L was conserved in tertiary structure.Collectively, data showed that AiCL was likely to catalyze the hydrolysis of multiple muscle related proteins.
Bay scallop (Argopecten irradians); Cathepsin L gene; cloning; sequence analysis
S917
A
1001-6932(2011)03-0338-06
2010-11-08;收修改稿日期:2011-01-10
國家高技術(shù)研究發(fā)展計劃(863計劃,2010AA10A401);國家自然基金(30800842);國家公益性行業(yè)(農(nóng)業(yè))科研專項(3-53)。
李娟(1981-),博士研究生,研究方向:海洋生物學。電子郵箱:lijuan@qdio.ac.cn。
張國范,研究員。電子郵箱:gfzhang@qdio.ac.cn。