李豐田,趙艷嬌,張曉鷹,白文林,黨云龍,郭 丹*
(1.遼寧省現(xiàn)代農(nóng)業(yè)生產(chǎn)基地建設(shè)工程中心,遼寧 遼陽111000;2.沈陽農(nóng)業(yè)大學(xué),沈陽110866)
遼寧絨山羊原產(chǎn)于遼寧省東南部山區(qū),是我國絨山羊品種中產(chǎn)絨量最高的優(yōu)良品種,屬絨肉兼用型品種[1]。遼寧省畜牧科學(xué)研究院新培育的遼寧絨山羊絨肉兼用新品系種羊具有體格高大、遺傳性能穩(wěn)定、生長速度快等優(yōu)勢[2]。隨著生物技術(shù)的發(fā)展,對參與肌肉生長發(fā)育過程基因的研究越來越深入。關(guān)于肌肉的生長發(fā)育機制,國內(nèi)外的研究主要集中在基因?qū)τ诩∪饧毎恼{(diào)控表達等方面[3]。胰島素樣生長因子(IGF2基因)作為調(diào)控肌肉生長發(fā)育的主效基因,對遼寧絨山羊肌肉細胞的生長分化起到關(guān)鍵的調(diào)控作用[4]。文章從分子生物學(xué)的角度闡述了IGF2對遼寧絨山羊肌肉生長發(fā)育的調(diào)節(jié),為遼寧絨山羊“絨肉兼用”品系分子育種工作提供理論依據(jù)。
遼寧絨山羊健康成年公羊13只,由遼寧省現(xiàn)代農(nóng)業(yè)生產(chǎn)基地建設(shè)工程中心畜牧業(yè)生產(chǎn)加工流通部提供。
對遼寧絨山羊7種不同組織的總RNA采用TRIzol法進行提取。提取后的RNA使用RNAfree Dnase I(TaKaRa,大連)處理,避免產(chǎn)生污染。
總RNA反轉(zhuǎn)錄體系:PrimeScript RT Enzyme Mix 2μL,RT Primer Mix 2μL,PrimeScript Buffer 2 8μL,RNase Free Dh 208μL。PCR反應(yīng)程序:37℃15 min,85℃5 s,4℃5 min。后將合成的cDNA于-20℃冷凍保存,備用。
以NCBI公布的山羊IGF2的編碼區(qū)序列(GenBankNM_001287041.1)為參考設(shè)計特異性引物,對遼寧絨山羊的IGF2基因5′調(diào)控區(qū)和編碼區(qū)進行擴增,引物序列見表1。
表1 IGF2基因擴增引物序列及退火溫度
測序結(jié)果采用DNAMan 6.0生物軟件進行拼接,得到最終目的序列。將目的序列與GenBank中不同物種的相應(yīng)基因序列進行比對分析,確定基因序列結(jié)構(gòu)。 然后利用DNAStar、DNAMan 6.0、MEGA 7.0、BLAST、BioEdit、SOPMA、Methprimer等軟件與GenBank中其他物種的序列進行比較分析。從GenBank中獲取的部分動物IGF2基因編碼區(qū)的信息見表2,用于物種間序列的比對分析。
表2 部分動物的IGF2基因編碼區(qū)的基本信息
經(jīng)過分析發(fā)現(xiàn),用特異性設(shè)計引物擴增的遼寧絨山羊IGF2基因序列長2 090 bp,包括5′調(diào)控區(qū)、編碼區(qū),編碼區(qū)長540 bp。將克隆出的遼寧絨山羊序列與山羊序列進行對比發(fā)現(xiàn),第263 bp處發(fā)生A/T突變,974位發(fā)生堿基缺失突變,A缺失。
將克隆出的遼寧絨山羊IGF2序列與其他動物進行對比分析,遼寧絨山羊與山羊的同源性高達99.8%,與其他物種相比IGF2基因的同源性分別是綿羊99.0%、樂至黑山羊99.0%、黃牛98.0%、牦牛97.0%、水牛98.0%、豬93.0%、馬91.0%。通過以上動物之間的比對發(fā)現(xiàn),作為調(diào)控肌肉生長發(fā)育的基因,IGF2在部分偶蹄目動物和奇蹄目動物中不僅是在物種內(nèi)高度保守,在種間也同樣高度保守,在進化過程中趨于穩(wěn)定。
采用NJ法構(gòu)建包括遼寧絨山羊在內(nèi)的部分物種的分子系統(tǒng)進化樹(見圖1)和親緣關(guān)系(見圖2)。
整個系統(tǒng)進化樹有三個明顯的大分支:第一類分支包括遼寧絨山羊、藏山羊。樂至黑山羊、山羊、綿羊、黃牛和牦牛均是偶蹄目反芻動物。遼寧絨山羊和藏山羊、樂至黑山羊、山羊均屬于同一分支且遺傳距離非常接近,與綿羊遺傳距離略有差異,但均屬于同一分支。黃牛和牦牛有著較近的遺傳距離,屬第一類分支的一類小分支。而豬和馬分別構(gòu)成了第二類和第三類大分支。遼寧絨山羊和藏山羊從生產(chǎn)性能上均屬于產(chǎn)絨型山羊,按照傳統(tǒng)的系統(tǒng)分類法屬于同一類物種,這個聚類結(jié)果與傳統(tǒng)的生物學(xué)系統(tǒng)分類法基本一致。
通過在線網(wǎng)站RNAfold WebServer分析遼寧絨山羊IGF2基因mRNA序列的二級結(jié)構(gòu)。IGF2基因序列最優(yōu)堿基對二級結(jié)構(gòu)自由能為-3 096.13 J/mol,二級結(jié)構(gòu)中心結(jié)構(gòu)的最小自由能為-2 125.82 J/mol,總體結(jié)構(gòu)的自由能熵為-3 212.33 J/mol,整體多樣性指標為476.16。
對遼寧絨山羊IGF2編碼區(qū)總長度進行開放閱讀框的分析,編碼區(qū)總長度為540 bp,共編碼179個氨基酸,其構(gòu)成及比例見表3。
表3 遼寧絨山羊IGF2基因編碼區(qū)氨基酸組成
經(jīng)過ExPASy-ProtParam分析結(jié)果表明,IGF2基因編碼蛋白相對分子質(zhì)量為19 654.41,等電點為8.84。序列中Ala使用頻率最高,頻率為11.7%,其次是Leu,使用頻率為10.6%;其他氨基酸使用頻率為0.6%~10.1%;Pyl和Sec均沒有使用。負電荷氨基酸殘基總數(shù)為19個,正電荷氨基酸殘基總數(shù)為24個,原子組成為860個碳原子、1 364個氫原子、250個氮原子、258個氧原子、10個硫原子。根據(jù)軟件預(yù)測,其體外半衰期為30 h,不穩(wěn)定系數(shù)為62.91(大于40為不穩(wěn)定蛋白),脂肪族氨基酸指數(shù)為73.18,其蛋白質(zhì)氨基酸殘基親疏水性總和為-0.220,說明遼寧絨山羊IGF2編碼蛋白質(zhì)疏水性較弱且不穩(wěn)定。
遼寧絨山羊IGF2基因序列在-317,-883,-963,-1 908 bp處可能存在潛在啟動子序列,在-1 921 bp處僅發(fā)現(xiàn)1個TAT-box。
利用Methprimer在線分析IGF2的CpG島,發(fā)現(xiàn)IGF2基因5′調(diào)控區(qū)存在明顯的飾CpG島。島區(qū)域GC含量大于50%,長度超過100 bp。這種GC含量的差異性對IGF2基因表達以及調(diào)控、基因突變都可能起著很重要的作用。IGF2的5′調(diào)控區(qū)有3個CpG島,分別在-22~-839 bp、-867~-177 bp、-1 175~-1 773 bp處,大小分別為818,305,599 bp?;蜣D(zhuǎn)錄必備條件之一是啟動子區(qū)中的CPG島處于未甲基化狀態(tài),而CpG序列中C的甲基化有可能導(dǎo)致基因轉(zhuǎn)錄水平受到抑制。說明該CpG島區(qū)域?qū)GF2的基因表達有著重要作用。
根據(jù)IGF2蛋白質(zhì)信號肽分析發(fā)現(xiàn),存在明顯的信號肽序列,在第24和25氨基酸之間的C值最大,信號肽切割概率為45%。S值是蛋白質(zhì)序列信號肽區(qū)域與其他區(qū)域的評估值,高分值區(qū)域是信號肽切割位點前的區(qū)域,而低分值區(qū)域是信號肽切割位點后大約30個氨基酸殘基區(qū)域或者是非分泌蛋白的N-末端區(qū)域。Mature Chain Sequence預(yù)測位置在19~179 bp處,屬于分泌性蛋白,判斷遼寧絨山羊的IGF2基因存在信號肽序列。
對遼寧絨山羊IGF2基因編碼的179個氨基酸的蛋白成熟序列進行疏水區(qū)預(yù)測,遼寧絨山羊IGF2基因編碼蛋白的而C端有一定的疏水性,N端具很強親水性,位于分子內(nèi)部;中間部分親水性較強。從總體上講,該蛋白的親水性比疏水性強,而疏水區(qū)相對較少。推測這些親水區(qū)對IGF2蛋白形成重要的功能結(jié)構(gòu)域發(fā)揮一定的作用[5]。
對遼寧絨山羊IGF2編碼蛋白的保守結(jié)構(gòu)域進行預(yù)測。在179個氨基酸殘基組成的IGF2編碼蛋白的序列中,存在67個氨基酸殘基組成的轉(zhuǎn)錄生長因子前肽超家族的基序以及56個氨基酸殘基組成的轉(zhuǎn)錄生長因子超家族的基序,都有很高的保守性。
通過在線軟件SOPMA對IGF2編碼蛋白二級結(jié)構(gòu)進行預(yù)測,結(jié)果發(fā)現(xiàn):序列預(yù)測圖中IGF2蛋白二級結(jié)構(gòu)中主要是由38.50%α螺旋(h)、11.73%伸展鏈(e)、11.17%β轉(zhuǎn)角(t)和38.55%隨機線圈螺旋(c)組成。從氨基酸的對應(yīng)序列可以看出,整個蛋白結(jié)構(gòu)出現(xiàn)了2個大峰,可見α螺旋結(jié)構(gòu)出現(xiàn)的集中區(qū)域相對比較明顯。
將測序推導(dǎo)出的含有179個氨基酸殘基的遼寧絨山羊IGF2基因編碼的蛋白序列,用SWISSMODEL軟件進行同源性搜索,利用高同源性建立三維結(jié)構(gòu)模板。結(jié)果表明:與遼寧絨山羊IGF2蛋白同源性最高的是蛋白因子D11 bound IGF-II(5131.1.A)同源性達到94.03%?;?131.1.A的三維結(jié)構(gòu)建立三維結(jié)構(gòu)模型,其含有多個α螺旋結(jié)構(gòu)域,該三維空間結(jié)構(gòu)的預(yù)測結(jié)果與二級結(jié)構(gòu)的預(yù)測結(jié)果相一致。
遼寧絨山羊IGF2基因編碼區(qū)序列總長度為540 bp??寺⌒蛄兄械?63 bp處發(fā)生A/T突變,974位發(fā)生A堿基缺失突變。通過不同物種之間的親緣關(guān)系進化樹分析發(fā)現(xiàn),IGF2基因在物種之間是比較保守的,不同目之間的也有80%以上的相似度。對IGF2的啟動子序列和CpG島進行預(yù)測,發(fā)現(xiàn)IGF2僅含有一個TATA-box,3個CpG島;并預(yù)測了mRNA的二級結(jié)構(gòu)的化學(xué)性質(zhì)。利用軟件對IGF2的信號肽和蛋白質(zhì)親水性進行分析發(fā)現(xiàn),IGF2有信號肽序列,屬于分泌蛋白。IGF2基因編碼179個氨基酸序列,構(gòu)成的蛋白質(zhì)相對分子質(zhì)量是19 654.41。對其二級結(jié)構(gòu)和結(jié)構(gòu)域進行預(yù)測,發(fā)現(xiàn)其固定的結(jié)構(gòu)域具有高度保守的特點,并預(yù)測了三維結(jié)構(gòu)。