吳 宇,王榮平,朱 偉,范新陽,滕曉紅,苗永旺**
(1.云南農業(yè)大學 動物科學技術學院,云南 昆明 650201;2.云南農業(yè)大學 動物遺傳育種研究所,云南 昆明 650201;3.云南農業(yè)職業(yè)技術學院 畜牧獸醫(yī)學院,云南 昆明 650212)
甲狀腺激素應答(thyroid hormone responsive,THRSP)基因的編碼蛋白Spot14 (又稱S14)最初由SEELIG 等[1]鑒定自大鼠肝臟的體外翻譯產(chǎn)物,是Spot14 家族的重要成員之一。在該家族中,還有1 個與其序列高度同源的蛋白——Spot14 相關蛋白(Spot14-R,MIG12)[2]。Spot14 家族成員包含3個保守區(qū)域,即N 末端的疏水區(qū)、中間的疏水區(qū)和C 末端的亮氨酸拉鏈區(qū)[2-4]。Spot14 和Spot14-R 依賴亮氨酸拉鏈結構形成同二聚體(Spot14/Spot14 和Spot14-R/Spot14-R)或異二聚體(Spot14/Spot14-R)參與基因的表達調控[4-6]。目前NCBI數(shù)據(jù)庫中已有普通牛、水牛、瘤牛、野牛、綿羊、山羊等主要??苿游锛皢畏羼劇㈦p峰駝、馬、驢、人、小鼠、雞等非牛科動物的THRSP基因序列信息,有研究表明該基因參與奶牛和山羊的乳脂合成過程,并與奶牛乳脂率和乳品質有關[7-10]。
雖然已有一些關于??莆锓NTHRSP基因的研究,但對于??萍倚骉HRSP 分子特征及功能的深入比較分析鮮有報道。本研究從NCBI 和Ensembl 數(shù)據(jù)庫下載了主要??莆锓N和非??莆锓NTHRSP基因及對應的編碼氨基酸序列,進一步采用比較基因組學和生物信息學分析方法對??莆锓N該基因轉錄區(qū)的結構、編碼區(qū)(coding sequence,CDS)的核苷酸組成、密碼子使用偏好性 (codon usage bias,CUB)、編碼產(chǎn)物的氨基酸組成、理化特性、結構特征、功能修飾位點、參與的生物學路徑、分子功能和系統(tǒng)發(fā)育關系進行全面預測和分析,旨在闡明牛科物種THRSP基因的分子特征及功能差異,為其表達調控研究提供參考。
從NCBI (https://www.ncbi.nlm.nih.gov/)和Ensembl (https://asia.ensembl.org/index.html)數(shù)據(jù)庫中下載普通牛、水牛、牦牛、雜交牛、綿羊、山羊等牛科物種的THRSP基因及對應的編碼氨基酸序列;利用NCBI 網(wǎng)站中的在線Blast 程序(https://blast.ncbi.nlm.nih.gov/Blast.cgi)進行同源搜索,獲取與牛科THRSP同源的非??莆锓N序列;從NCBI網(wǎng)站的Genome 數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/genome/?term=)中下載各物種的基因組GTF格式數(shù)據(jù)用于分析。對所有序列進行比對和核對,篩除不完整或可能存在錯誤的序列,進一步對剩余的可靠序列(表1)進行分析。
表1 本研究所用序列Tab.1 Sequences used in this study
使用NCBI 數(shù)據(jù)庫中的ORF Finder 程序(ht-tps://www.ncbi.nlm.nih.gov/orffinder/)查找已下載的各物種THRSP基因開放閱讀框(open reading frame,ORF),以確定每條序列的完整CDS,使用Lasergene 軟件包(DNAStar Inc.,USA)中的Edit-Seq 程序分析各物種THRSP基因CDS 的堿基組成。在NCBI 數(shù)據(jù)庫中下載牛科和非??莆锓N的基因組數(shù)據(jù),并提取THRSP基因的轉錄本信息;使用TBtools[11]軟件對各物種THRSP基因的轉錄本信息進行完整化處理,進一步使用在線軟件Gene Structure Display Server 2.0 (http://gsds.gaolab.org/)呈現(xiàn)各物種THRSP基因的轉錄區(qū)結構,包括非翻譯區(qū)(untranslated region,UTR)、外顯子和內含子。
使用Codon 程序(http://codonw.sourceforge.net/)進行各物種THRSP基因的 CUB 分析,包括相對同義密碼子使用度(relative synonymous codon usage,RSCU)、有效密碼子數(shù) (effective number of codons,ENc 值)、GC 含量和密碼子第3 位的GC 含量(GC of silent 3rd codon position,GC3s),其中,GC3s 為除了蛋氨酸、色氨酸和終止密碼子外,G 和C 出現(xiàn)在密碼子第3 個位置的頻率。
利用1.1 節(jié)的編碼氨基酸序列,使用在線程序ProtParam (http://web.expasy.org/protparam/)預測不同物種THRSP 蛋白的分子質量和理論等電點;使用SignalP5.0 (https://services.healthtech.dtu.dk/service.php?SignalP-5.0)預測信號肽;使用TMHMM version 2.0 (http://www.cbs.dtu.dk/services/TMHMM/)預測跨膜結構域;使用ProtScale (http://web.expasy.org/ protscale/)預測疏水性;使用PROSITE (https://prosite.expasy.org/prosite.html)預測功能修飾位點;使用ProtComp 9.0 (http://linux1.softberry.com/berry.phtml)分析各物種THRSP蛋白的亞細胞定位;分別使用SOPMA (https://npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_sopma.html)和SWISS-MODEL (https://beta.swissmodel.expasy.org/)分析牛科物種THRSP 蛋白的二級結構和三維結構,蛋白三維結構基于同源建模法,以小鼠Spot 14 蛋白模板(3ont.1.A)為最佳模型構建;使用STRING (https://cn.string-db.org/)分析蛋白相互作用關系;使用NCBI Batch Web CD-Serach Tool (https://www.ncbi.nlm/cdd/)預測各物種THRSP 的保守結構域;使用在線軟件Meme Suite[12](https://meme-suite.org)分析各物種THRSP 保守基序;使用TBtools[11]軟件的Gene Structure View (Advance)工具整合上述分析結果。
使用Lasergene 軟件包(DNAStar Inc.,USA)中的MegAlign 程序分析各物種THRSP基因CDS及編碼氨基酸的序列一致性;使用MEGA 7[13]軟件輸出序列間的差異位點,進一步選用該軟件中的最大似然法,基于優(yōu)化出的T92+G 和GTT+G+F 模型分別構建核苷酸序列和氨基酸序列的系統(tǒng)發(fā)育樹,每個節(jié)點處的支持率采用Bootstrap 方法進行評估(10 000 次重復)。
2.1.1 CDS 核苷酸組成和轉錄區(qū)結構
??婆c非??撇溉閯游镩gTHRSP基因CDS的核苷酸組成相似,但與非哺乳動物雞的THRSP基因CDS 核苷酸組成差異較大,且表現(xiàn)出屬內相似性較高的特點;牛科動物中牛屬和羊屬動物的屬內核苷酸組成相似性更高,水牛與牛屬和羊屬動物之間存在較大差異(表2)。不同物種THRSP基因的轉錄區(qū)結構存在差異,尤其是內含子長度和UTR 長度的差異;除了駱駝科和馬科物種包含2 個可變剪接轉錄本外,其他物種都只包含1 個可變剪接轉錄本;驢THRSP基因包含3 個外顯子和2 個內含子,只有外顯子2 編碼蛋白質,而其他物種的THRSP基因都由2 個外顯子和1 個內含子組成,且只有外顯子1 編碼蛋白質(圖1)。
圖1 ??莆锓N及非牛科物種THRSP 轉錄區(qū)的結構Fig.1 Structure of THRSP gene in the species of Bovidae and non-Bovidae
2.1.2THRSP基因CDS 的CUB 分析
由表3 可知:水牛THRSP基因對20 種密碼子具有偏好性(RSCU>1),普通牛THRSP基因RSCU>1 的密碼子有22 種,雜交牛有18 種,牦牛有20 種,綿羊和山羊分別有22 和21 種,人和雞都有23 種,小鼠有24 種。水牛與其他??莆锓N共同偏好使用的密碼子有20 種,且對CUG、AGC、CCC、CGG、ACC、GUG、AUC等密碼子的偏好性較強,水牛與其他牛科物種的RSCU 值差異較大。??莆锓N編碼蛋氨酸和色氨酸的密碼子RSCU 值都為1。由表4 可知:THRSP基因ENc 值呈現(xiàn)屬內相似、屬間差異大的特點,且ENc 值總體偏小,范圍在33.95~44.22。??莆锓NTHRSP基因ENc 值接近20,與其他非??苿游锎嬖谳^大差異,表明THRSP基因在??莆锓N中的CUB較強;THRSP基因GC3s 值范圍為0.741~0.832,均大于0.5,說明THRSP基因中的密碼子比較偏好以G/C 結尾;GC 含量范圍為0.581~0.625,表明各物種THRSP基因CDS 序列中G+C 堿基的含量大于A+T 堿基的含量。
表3 牛科及非??莆锓NTHRSP 基因密碼子的RSCU 值Tab.3 RSCU values of THRSP gene codons in Bovidae and non-Bovidae
表4 THRSP 基因密碼子ENc、GC3s 頻率和GC 含量Tab.4 ENc,GC3s frequency and GC content of THRSP gene codons
2.2.1 理化特性
??莆锓NTHRSP 蛋白的理化特性較為相似,都為定位于細胞核的親水性蛋白質,不含跨膜區(qū)和信號肽,水牛與其他??莆锓N的極性氨基酸含量、脂肪族指數(shù)、親水性總平均值等指標差異較大;??莆锓NTHRSP 的理化特性與雞的差異最大,其次是人和小鼠(表5)。
表5 ??莆锓N及非??莆锓NTHRSP 理化特性Tab.5 Physicochemical characteristics of THRSP in the species of Bovidae and non-Bovidae
2.2.2 THRSP 基序組成模式和保守結構域
THRSP 具有4 種不同類型的基序組成模式(圖2):模式a 包含motif1~5,模式b 比模式a 缺少motif5 和motif3,模式c 包含motif1~4,模式d只包含motif1 和motif2。除普通牛和彎角劍羚外,其他牛科物種THRSP 基序組成都為模式a類型,與非牛科哺乳動物THRSP 基序模式相似,但牛科與雞差異較大。THRSP 蛋白包含2 種保守結構域,??莆锓N中普通牛、雜交牛和牦牛以及除了原麝和雞以外的其他非??莆锓N的THRSP 保守結構域為Spot_14,水牛、山羊、綿羊、彎角劍羚、四川羚羊、原麝和雞的保守結構域為Spot_14 超家族,??莆锓N及其他非牛科動物保守結構域的位置大致相同。
圖2 ??坪头桥?莆锓NTHRSP 的Motif 組成和保守結構域Fig.2 Motif composition and conserved domains of THRSP in the species of Bovidae and Non-Bovidae
2.2.3 牛科物種THRSP 功能修飾位點
??莆锓NTHRSP 蛋白功能修飾位點有2 種,即酪蛋白激酶Ⅱ磷酸化位點和蛋白激酶C 磷酸化位點;人和小鼠比??莆锓N多了N-豆蔻?;稽c和N-糖基化位點,雞比??莆锓N多了N-豆蔻酰化位點、亮氨酸拉鏈結構以及cAMP 和cGMP 依賴性蛋白激酶磷酸化位點;??莆锓N及其他非牛科哺乳動物相同功能磷酸化位點所處的位置相似,與雞的差異較大(圖3)。
圖3 ??莆锓NTHRSP 蛋白功能修飾位點Fig.3 Functional modification site of THRSP protein in the species of Bovidae
表2THRSP基因CDS 核苷酸組成
Tab.2 Nnucleotide composition ofTHRSPCDS %
注:物種及其基因序列號對應的物種中文名見表1;下同。Note: The Chinese names of species and accession number of gene sequences are shown in Tab.1;the same as below.
2.2.4 二級結構和三維結構
??莆锓N間THRSP 蛋白二級結構元件的氨基酸比例相似,與其他非??苿游锏牟町愝^大(表6)。水牛、牦牛和四川羚羊的THRSP 蛋白三維結構與模板3ont.1.A 的覆蓋率為96% (AA:7~156),一致性為72.00%;雜交牛、綿羊和山羊的三維結構與模板3ont.1.A 的一致性為73.33%,覆蓋率為96% (AA:1~156);普通牛和彎角劍羚的三維結構與模型模板3ont.1.A 的一致性和覆蓋率分別為73.33%和100% (AA:1~150)(圖4)。
圖4 牛科物種THRSP 蛋白的三維結構Fig.4 Three-dimensional structures of THRSP protein in the species of Bovidae
表6 THRSP 蛋白4 種二級結構的氨基酸占比Tab.6 Amino acid proportion of four secondary structures in THRSP protein %
2.2.5 蛋白互作、參與的生物學路徑和分子功能
各牛科物種與THRSP 相互作用的蛋白質不盡相同,其中脂肪酸合成酶、甘油-3-磷酸酰基轉移酶、乙酰輔酶A 合成酶2 和RAS 癌基因家族成員是與THRSP 互作的蛋白質(圖5)。這些蛋白分子主要與脂肪酸的合成和β-氧化、蛋白質代謝和轉運、跨細胞膜或細胞器的物質轉運、溶酶體與吞噬體的融合、囊泡介導的物質運輸?shù)壬飳W過程有關。THRSP 蛋白主要參與脂類的生物合成(GO:0046890)、脂肪酸代謝(GO:0006631)、乙酰輔酶A 代謝(GO:0006084)、?;o酶A 的生物合成(GO:0071616)等生物學過程,其分子功能主要與脂肪酸合酶活性(GO:0004312)和蛋白質同源二聚化活性(GO:0042803)相關。
圖5 ??莆锓NTHRSP 互作蛋白網(wǎng)絡Fig.5 Interaction protein network of THRSP in the species of Bovidae
2.2.6 序列一致性和系統(tǒng)發(fā)育分析
??莆锓NTHRSP基因包含2 種長度的CDS(471 和453 bp),其編碼產(chǎn)物相差6 個氨基酸。??莆锓N間THRSP基因CDS 及編碼氨基酸序列的一致性高,其中核苷酸序列一致性為93.2%~96.9%,氨基酸序列一致性為91.3%~94.0%;??莆锓N與非??撇溉閯游锏男蛄幸恢滦暂^低,核苷酸和氨基酸的序列一致性分別為78.6%~95.3%和72.0%~94.6%;??婆c雞的序列一致性最低,核苷酸和氨基酸的序列一致性分別為51.0%~52.8%和32.2%~35.5% (圖6)。序列差異位點分析表明:位點c.79C、c.162T、c.191A、c.226A、c.423G 和c.466G 是區(qū)分牛屬動物與水牛、羊屬動物的核苷酸位點;位點c.91A、c.157A、c.180T、c.222A、c.253C、c.288C 和c.423T 是區(qū)分水牛與牛屬、羊屬動物的核苷酸位點;水牛特有的氨基酸位點為p.31S、p.59T、p.74I 和p.85Q;p.54H、p.64N、p.76M、p.96E 和p.156V 是區(qū)分牛屬動物與水牛、羊屬動物的氨基酸位點;p.57T 和p.90L是區(qū)分羊屬動物與水牛、牛屬動物的氨基酸位點(圖7)。
圖6 ??坪头桥?莆锓NTHRSP 基因核苷酸(a)及編碼氨基酸(b)的序列一致性Fig.6 Consistency of THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae
圖7 ??坪头桥?莆锓NTHRSP 基因核苷酸(a)及編碼氨基酸(b)序列的差異位點Fig.7 Difference sites in THRSP nucleotides (a) and their encoded amino acid (b) sequences in the species of Bovidae and non-Bovidae
基于各物種THRSP基因核苷酸和編碼氨基酸序列構建的系統(tǒng)發(fā)育樹聚類關系相似,??莆锓N聚為一大支,其中水牛和牛屬動物聚為一小支,羊屬動物聚為單獨的一小支;非??撇溉閯游锞蹫橐恢?圖8)。
圖8 基于核苷酸序列(a)和氨基酸序列(b)構建的牛科和非??莆锓NTHRSP 系統(tǒng)進化樹Fig.8 Phylogenetic trees of THRSP between the species of Bovidae and non-Bovidae based on the sequences of nucleotide (a) and amino acid (b)
??萍倚竽転槿祟愄峁┴S富的肉類、乳制品等畜產(chǎn)品,同時具有役用價值,在農業(yè)生產(chǎn)中具有重要地位。研究表明:THRSP基因與奶牛和山羊乳脂肪酸的從頭合成、雜交牛的肌內脂肪和韓國牛的肌肉脂肪酸種類及胴體性狀相關,是調節(jié)??萍倚笾铣傻闹匾δ芑颍欢?,目前關于該基因的研究主要涉及普通牛和山羊等少部分??萍倚骩7-8,14-15],對其他??萍倚蟮难芯旷r有報道?;诖?,本研究采用比較基因組學和生物信息學分析方法對牛科家畜THRSP基因及其編碼產(chǎn)物的理化特性和結構特征、蛋白互作以及參與的生物學路徑與功能等進行了深入的比較分析,旨在闡明??苿游颰HRSP 在分子特征及功能上的差異。
本研究表明:??莆锓N間THRSP基因CDS的長度存在差異,但堿基組成和CUB 一致性高,其編碼蛋白的理化特性、二級結構、3-D 結構、基序組成模式、保守結構域、功能位點等高度相似,但呈現(xiàn)屬間差異,與其他非??莆锓N也具有一定的相似性;系統(tǒng)發(fā)育分析表明:??芓HRSP 蛋白序列聚為一大支,表明??圃摰鞍椎墓δ芨鼮橄嗨???梢?,THRSP基因在??萍胺桥?撇溉閯游镏泄δ鼙J?,但??萍倚箝g的功能更為相似。已有研究發(fā)現(xiàn):THRSP基因主要表達于肝臟、乳腺、皮下脂肪等組織,它能調節(jié)脂肪酸合成基因的轉錄,參與這些組織中脂肪酸的從頭合成過程[2-3,8,16-17]。敲低Spot14 小鼠的乳腺中三酰甘油(triacylglycerol,TAG)含量顯著降低,表明Spot14 是泌乳期小鼠乳腺脂肪酸從頭合成所必需[2];Spot14 還與泌乳期小鼠乳腺中中鏈脂肪酸(medium chain fatty acids,MCFA)的合成以及脂肪從頭合成關鍵酶(fatty acid synthase,FASN)基因的表達相關[18];Spot14 對人乳腺癌細胞的增殖和乳脂合成具有促進作用,敲低Spot14 還會誘導細胞凋亡[19]。THRSP基因的表達還與牛肌肉[15]、脂肪[14]以及奶牛乳品質有關[7,9-10]。如:韓國牛THRSP基因的多態(tài)性位點與肌肉大理石紋評分、脂肪酸組成及胴體性狀相關聯(lián)[15];夏洛萊?!梁伤固古<戎舅岷颗cTHRSP基因的表達量正相關[14];與低乳脂率奶牛相比,高乳脂率奶牛乳腺THRSP的mRNA和蛋白的相對表達量顯著升高,且過表達牛乳腺上皮細胞中的THRSP基因,TAG含量顯著增加,并上調FASN、過氧化物酶體增殖物激活受體γ (peroxisome proliferator-activated receptor γ,PPARγ)和固醇調節(jié)元件結合蛋白1(sterol regulatory element binding protein 1,SREBP1)等重要脂肪生成酶基因的表達,提示THR-SP基因能通過調節(jié)脂代謝基因的表達進而調節(jié)乳脂合成過程,其在乳腺中的表達量可能是奶牛乳脂率的標志[7];THRSP基因在山羊皮下脂肪組織的表達量最高,在乳腺的相對表達水平極低,但泌乳高峰期的表達量顯著高于干奶期,對調節(jié)山羊乳腺上皮細胞的脂肪酸從頭合成和去飽和過程具有重要作用[8]。
本研究還表明:??莆锓NTHRSP 定位于細胞核,無跨膜區(qū)和信號肽序列,包含1 個Spot_14或Spot_14 超家族保守結構域,參與的生物學過程主要與脂類的生物合成、脂肪酸代謝、乙酰輔酶A 代謝、?;o酶A 的生物合成等相關,分子功能主要與脂肪酸合酶活性及蛋白質同源二聚化活性相關;與之互作的蛋白質分子主要與脂肪酸的合成和β-氧化、蛋白質代謝和轉運、跨細胞膜或細胞器的物質轉運、溶酶體與吞噬體的融合、囊泡介導的物質運輸?shù)壬飳W過程有關。因此,推測THRSP基因可能與牛科物種脂肪酸的合成過程相關,特別是參與了乳脂合成過程的調節(jié)。
??莆锓NTHRSP基因轉錄區(qū)的結構、CDS長度、堿基組成及其編碼產(chǎn)物的理化特性和結構有一定差異,但具有較高的一致性。??芓HRSP 蛋白均是定位于細胞核的親水蛋白質,含有1 個Spot_14 或Spot_14 超家族保守結構域,參與的生物學過程主要與脂類的生物合成有關,分子功能主要與脂肪酸合酶活性及蛋白質同源二聚化活性相關。推測THRSP 蛋白參與了??莆锓N脂合成(包括乳脂合成)的調節(jié)。