龔文滔,潘向春,蔡佳麗,王祎菲,李加琪,張 哲,袁曉龍
(1.華南農(nóng)業(yè)大學(xué)動物科學(xué)學(xué)院,廣東省農(nóng)業(yè)動物基因組學(xué)與分子育種重點實驗室,國家生豬種業(yè)工程技術(shù)研究中心,廣州 510642;2.嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實驗室茂名分中心,茂名 525000)
表觀遺傳學(xué)是指基因活性或功能的可遺傳變化現(xiàn)象,與DNA序列本身的變化無關(guān)。作為研究最廣泛的表觀遺傳機制之一,DNA甲基化是一種不改變DNA序列順序的堿基修飾[1],且廣泛參與哺乳動物多種生物學(xué)進程,包括轉(zhuǎn)錄活性調(diào)節(jié)[2-3]、X染色體失活[2]、基因組印跡[2,4]和染色體穩(wěn)定性[4]。在哺乳動物中,DNA甲基化主要發(fā)生在CpG位點的胞嘧啶上,并在細(xì)胞分裂過程中被穩(wěn)定遺傳[5],而DNA甲基化的發(fā)生離不開甲基轉(zhuǎn)移酶(DNMT)的催化作用。DNMT可將甲基從S-腺苷-L-甲硫氨酸轉(zhuǎn)移到胞嘧啶的第5個碳原子上,從而形成甲基化胞嘧啶[6]。目前哺乳動物中主要發(fā)現(xiàn)4種類型的DNMT,分別為DNMT1、DNMT3A、DNMT3B、DNMT3L[7]。DNMT1主要用于維持基因組的DNA甲基化狀態(tài);DNMT3A和DNMT3B具有從頭甲基化的功能,即對非甲基化的DNA進行甲基化修飾;DNMT3L可增強DNMT3A和DNMT3B的催化活性,促進DNA的從頭甲基化過程[8-9]。
DNMT參與哺乳動物的生長發(fā)育和疾病等多種生物學(xué)活動。有研究表明,敲除DNMT1或DNMT3B后,小鼠在妊娠期中死亡,而敲除DNMT3A后,小鼠在出生后4周齡死亡[10]。Liao等[11]使用CRISPR/Cas9基因組編輯技術(shù)敲除人類胚胎干細(xì)胞中的DNA甲基化轉(zhuǎn)移酶,結(jié)果發(fā)現(xiàn)DNMT1的缺失導(dǎo)致人類胚胎干細(xì)胞的快速死亡。此外,DNMT1、DNMT3A和DNMT3B在轉(zhuǎn)錄和翻譯水平上的過表達(dá)會降低抑癌基因的表達(dá)水平,從而導(dǎo)致惡性腫瘤的發(fā)生,如結(jié)腸癌、肺癌、膠質(zhì)母細(xì)胞瘤、血液系統(tǒng)惡性腫瘤、前列腺癌和乳腺癌[12]。Rhee等[13]表明,同時抑制DNMT1和DNMT3B的表達(dá)可使結(jié)直腸癌模型中的抑癌基因整體低甲基化并被重新激活,進而導(dǎo)致腫瘤細(xì)胞增殖減少。以上結(jié)果表明,DNMT廣泛參與哺乳動物生物學(xué)活動的調(diào)控過程。
目前,關(guān)于豬DNMT基因家族的系統(tǒng)研究鮮見報道。本研究以豬為研究對象,利用生物信息學(xué)方法鑒定豬全基因組范圍的DNMT基因家族,并對豬DNMT基因家族成員進行染色體定位、理化性質(zhì)、二級結(jié)構(gòu)預(yù)測、亞細(xì)胞定位、基因結(jié)構(gòu)、保守基序、系統(tǒng)進化和種間共線性分析,探討DNMT基因家族在母豬性腺軸初情啟動過程前、中、后的基因表達(dá)水平,旨在為進一步探究豬DNMT基因家族功能與調(diào)節(jié)機制提供參考。
從Ensembl數(shù)據(jù)庫(https:∥asia.ensembl.org/info/data/ftp/index.html)中下載豬的全基因組序列文件、基因注釋文件、蛋白質(zhì)序列文件。從Pfam網(wǎng)站(https:∥pfam.xfam.org/)下載DNMT家族的隱馬爾科夫模型(HMM)文件(PF00145),利用Hammer軟件中的hmmsearch程序搜索豬蛋白質(zhì)序列文件,進而鑒定DNMT基因家族成員。基于Hammer軟件的鑒定結(jié)果,利用BLASTP程序進行第2次DNMT基因家族鑒定。將Hammer軟件和BLASTP程序的鑒定結(jié)果合并,得到候選DNMT基因家族成員。通過CDD網(wǎng)站(https:∥www.ncbi.nlm.nih.gov/Structure/ bwr psb/bwrpsb.cgi)進行保守結(jié)構(gòu)域分析,剔除候選DNMT基因家族成員中不含DNMT特征結(jié)構(gòu)域的序列,最終得到豬DNMT家族成員。從基因注釋文件中獲得豬DNMT基因的位置信息,并通過TBtools[14]繪制豬DNMT基因的染色體定位圖。
基于基因注釋文件,使用TBtools展示DNMT基因家族成員的UTR及內(nèi)含子信息。通過MEME網(wǎng)站(https:∥meme-suite.org/meme/tools/meme)對DNMT基因家族成員進行保守基序(motif)分析,其中motif數(shù)量設(shè)置為10個,其余參數(shù)選擇默認(rèn),最后通過TBtools得到可視化圖形。
從Ensembl數(shù)據(jù)庫中下載人、小鼠和牛的全基因組序列文件、基因注釋文件、蛋白質(zhì)序列文件,然后使用Hammer軟件和BLASTP軟件初步鑒定人、小鼠和牛的DNMT基因家族成員,再通過CDD網(wǎng)站進行保守結(jié)構(gòu)域分析,以獲得人、小鼠和牛的DNMT基因家族成員。使用Mega 10.1.7軟件對豬、人、小鼠和牛的DNMT蛋白質(zhì)序列進行多重比對,并基于距離參數(shù)的鄰接法構(gòu)建系統(tǒng)進化樹,設(shè)自展值為1 000,其他參數(shù)則按默認(rèn)設(shè)置?;谪i、人、小鼠和牛的基因序列文件和基因注釋文件,使用TBtools的One Step MCScanX功能進行物種間的共線性分析,并使用TBtools的Dual Systeny Plot for MCScanX功能進行可視化。
利用ExPASy在線工具(https:∥web.expasy.org/compute_pi/)分析豬DNMT基因家族成員的蛋白質(zhì)特性,預(yù)測蛋白質(zhì)的分子質(zhì)量和等電點;利用SOPMA在線工具(https:∥npsa-prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page =npsa_sopma.html)預(yù)測DNMT蛋白的二級結(jié)構(gòu);利用PSORT在線工具(https:∥wolfpsort.hgc.jp/)進行DNMT蛋白的亞細(xì)胞定位分析。
從NCBI數(shù)據(jù)庫(https:∥www.ncbi.nlm.nih.gov/)中獲取母豬下丘腦、垂體、卵巢的RNA-Seq數(shù)據(jù)(登錄號:PRJEB39729)[15],其中每種組織都包含初情啟動前、初情啟動、初情啟動后的轉(zhuǎn)錄組數(shù)據(jù),共下載27個轉(zhuǎn)錄組數(shù)據(jù)。對轉(zhuǎn)錄組數(shù)據(jù)進行質(zhì)控后,利用HISAT2軟件[16]將轉(zhuǎn)錄組數(shù)據(jù)比對到參考基因組,隨后利用Stringtie軟件[17]估計基因的表達(dá)量,以基因最長轉(zhuǎn)錄本的表達(dá)量作為該基因的表達(dá)水平,從而獲得DNMT基因家族所有成員的表達(dá)水平。根據(jù)DNMT基因表達(dá)量的TPM值,利用R語言繪制出基因表達(dá)熱圖。
利用Hmmer軟件和BLASTP軟件從豬基因組上共鑒定出5個DNMT基因家族成員,并將其命名為PigDNMT1、PigDNMT2、PigDNMT3、PigDNMT4和PigDNMT5,其長度介于13 726~80 213 bp,其中3個基因位于參考基因組的正鏈,2個基因位于參考基因組的負(fù)鏈(表1)。由圖1可知,PigDNMT1、PigDNMT2、PigDNMT3、PigDNMT4和PigDNMT5基因分別位于2、3、13、14、17號染色體上,每條染色體都只包含1個DNMT基因。
通過MEME在線工具進行保守基序分析,結(jié)果如圖2所示,PigDNMT1和PigDNMT2僅包含1個motif,PigDNMT3包含6個motif,而PigDNMT2和PigDNMT5包含10個相同的motif且排列順序一致?;蚪Y(jié)構(gòu)分析結(jié)果顯示,大部分DNMT基因含有多個CDS區(qū)域,僅PigDNMT4含有2個CDS區(qū)域;此外,還發(fā)現(xiàn)PigDNMT1、PigDNMT3和PigDNMT5缺少3′-UTR(圖2)。從豬DNMT基因家族進化樹的角度分析發(fā)現(xiàn),PigDNMT1和PigDNMT4、PigDNMT2和PigDNMT5的親緣關(guān)系較近(圖2)。整體而言,同一分支上的DNMT基因在motif數(shù)量上相似,但在基因結(jié)構(gòu)上差異較大。
圖2 豬DNMT基因家族結(jié)構(gòu)特征
本研究使用Hammer和BLASTP軟件在人、小鼠、牛中分別鑒定出6、7、5個DNMT基因(表2),并結(jié)合5個豬DNMT基因構(gòu)建系統(tǒng)進化樹,結(jié)果如圖3所示,23個DNMT基因可分成Class Ⅰ、Class Ⅱ和Class Ⅲ 3個亞族,其中Class Ⅰ亞族可被進一步細(xì)分為Class Ⅰ-a和Class Ⅰ-b亞族。在4個亞族中,Class Ⅰ-a亞族的DNMT基因數(shù)量最多,共有14個DNMT基因,其中包含PigDNMT1、PigDNMT3和PigDNMT4;Class Ⅰ-b共有5個DNMT基因,其中包含PigDNMT5;Class Ⅱ亞族共有3個DNMT基因,其中包含PigDNMT2;而Class Ⅲ亞族的DNMT基因數(shù)量最少,僅包含CattleDNMT5。此外,根據(jù)豬與人、小鼠、牛的進化關(guān)系發(fā)現(xiàn),豬與牛的DNMT基因家族親緣關(guān)系更近。
表2 人、小鼠和牛DNMT基因家族成員基本信息
圖3 豬、人、小鼠和牛DNMT基因家族的系統(tǒng)進化樹
為了進一步了解豬DNMT基因家族的進化關(guān)系,使用TBtools的One Step MCScanX功能對豬、人、小鼠和牛中DNMT基因家族進行物種間的共線性分析。如圖4所示,豬和人、小鼠、牛之間具有4對直系同源DNMT基因,其中PigDNMT1、PigDNMT2、PigDNMT3、PigDNMT4都能在人、小鼠和牛中鑒定到相應(yīng)的直系同源基因,只有PigDNMT5無法在其他3個物種中檢測出直系同源基因。
圖4 豬、人、小鼠和牛DNMT基因家族的共線性分析
豬DNMT基因家族成員的蛋白長度在228(PigDNMT4)~1 706 個氨基酸(PigDNMT1)之間;分子質(zhì)量介于26 133.32(PigDNMT4)~192 267.80 u(PigDNMT1)之間;而蛋白等電點最小為6.00(PigDNMT3),最大為9.06(PigDNMT4),其中2個DNMT蛋白呈酸性(等電點<7),3個DNMT蛋白呈堿性(等電點>7)(表3)。二級結(jié)構(gòu)預(yù)測結(jié)果顯示,豬DNMT基因家族蛋白的二級結(jié)構(gòu)主要由無規(guī)則卷曲組成,隨后依次為α-螺旋、β-轉(zhuǎn)角、延伸鏈。亞細(xì)胞定位分析發(fā)現(xiàn),豬DNMT基因家族蛋白全部定位于細(xì)胞核中(表4)。
表3 豬DNMT蛋白的理化性質(zhì)
表4 豬DNMT蛋白的二級結(jié)構(gòu)預(yù)測和亞細(xì)胞定位
對豬性腺軸初情啟動前、初情啟動、初情啟動后的轉(zhuǎn)錄組數(shù)據(jù)進行分析,結(jié)果如圖5所示,PigDNMT2、PigDNMT3、PigDNMT4和PigDNMT5基因在性腺軸初情啟動過程中都處于低表達(dá)狀態(tài),而PigDNMT1表達(dá)量明顯高于其他4個基因,且在初情啟動過程的不同組織中發(fā)生不同的變化。在初情啟動過程的下丘腦組織中,PigDNMT1基因表達(dá)量先升高后降低;在初情啟動過程的垂體組織中,PigDNMT1基因表達(dá)量逐漸升高;在初情啟動過程的卵巢組織中,PigDNMT1基因表達(dá)量逐漸下降。
H,下丘腦;P,垂體;O,卵巢;Pre,初情期啟動前;In,初情期啟動中;Post,初情期啟動后
在豬生長發(fā)育過程中,DNMT可能通過影響DNA甲基化狀態(tài)和形成過程而參與多種生物學(xué)機制,但是在豬中對于DNMT基因家族的系統(tǒng)分析還不全面。本研究利用生物信息學(xué)方法在豬基因組上共鑒定出5個DNMT基因,基因數(shù)目低于人(6個)和小鼠(7個),而與牛(5個)一致,這可能與基因組的大小及基因的丟失和保留事件有關(guān)[18]。豬DNMT基因家族進化樹和保守基序分析發(fā)現(xiàn),PigDNMT2和PigDNMT5的親緣關(guān)系較近,且具有相同數(shù)量和排列順序的motif,說明這2個基因在進化過程中具有較高保守性,推測PigDNMT2和PigDNMT5可能具有相似的基因功能。從基因結(jié)構(gòu)的整體而言,豬DNMT基因家族成員之間的基因結(jié)構(gòu)差異較大,如基因長度(13 726~80 213 bp)和CDS區(qū)長度(1 137~5 081 bp),這與雞NLRs基因家族和杜蘭落花生球蛋白基因家族的基因結(jié)構(gòu)分析結(jié)果一致[19-20]。另有研究表明,各成員間基因結(jié)構(gòu)的差異可能與基因進化過程中出現(xiàn)重復(fù)、插入和缺失等突變現(xiàn)象有關(guān)[21]?;蚬簿€性分析發(fā)現(xiàn),豬和人、小鼠、牛之間都具有4對直系同源DNMT基因,說明4個物種之間具有較強的共線性關(guān)系,而從4個物種的系統(tǒng)進化樹分析結(jié)果中可以看出,豬與牛的DNMT基因家族親緣關(guān)系更近。亞細(xì)胞定位分析結(jié)果顯示,5個豬DNMT蛋白處于細(xì)胞核中。彭忠明等[22]也在毛竹中發(fā)現(xiàn)7個DNMT蛋白定位于細(xì)胞核中,這些結(jié)果表明DNMT可能是在細(xì)胞核內(nèi)參與生物學(xué)進程。
基因表達(dá)模式與其生物學(xué)功能高度相關(guān)。本研究揭示了母豬性腺軸組織中DNMT基因家族在初情啟動前、初情啟動、初情啟動后中的表達(dá)模式,結(jié)果表明PigDNMT1表達(dá)量在下丘腦、垂體和卵巢組織中隨著初情啟動過程而發(fā)生不同的變化,如垂體組織中的PigDNMT1表達(dá)量在初情啟動過程中逐漸上升,而卵巢組織中的PigDNMT1表達(dá)量在初情啟動過程中逐漸下降。性腺軸可通過調(diào)節(jié)激素分泌驅(qū)動雌性動物的初情啟動[23-24],進一步說明PigDNMT1可能在母豬初情啟動過程中發(fā)揮重要的調(diào)控作用,這與前人關(guān)于DNMT基因可能通過調(diào)控促性腺激素釋放激素(GnRH)的表達(dá)而參與母羊初情啟動的調(diào)控相符合[25]。另外有研究表明,DNA甲基化參與哺乳動物初情啟動的調(diào)控過程[26-27]。Lomniczi等[26]給大鼠注射DNA甲基化抑制劑之后,大鼠下丘腦中的胚胎外胚層發(fā)育(Eed)基因和染色盒同源物7(Cbx7)基因的表達(dá)水平上升,啟動子的甲基化水平下降,并且大鼠的陰道開放延遲,未達(dá)到初情期,表明DNA甲基化在大腦的神經(jīng)內(nèi)分泌中起作用,通過抑制初情期啟動所需的基因(如吻素1(Kiss1)基因)控制青春期。Zhou等[27]研究發(fā)現(xiàn),DNA甲基化可通過調(diào)節(jié)R-脊椎蛋白2(RSPO2)的表達(dá)水平影響卵泡發(fā)育進而影響母豬的初情啟動。綜合以上結(jié)果及DNMT在DNA甲基化狀態(tài)和形成過程中的作用,說明豬DNMT基因家族中的PigDNMT1可能通過影響性腺軸關(guān)鍵基因的DNA甲基化參與母豬初情啟動的調(diào)控過程,這對于母豬初情啟動調(diào)控機制研究具有重要的參考價值,但PigDNMT1在母豬初情啟動過程中的作用機制需要進一步研究和分析。
本研究利用生物信息學(xué)方法在豬基因組上共鑒定出5個DNMT基因,并發(fā)現(xiàn)PigDNMT2和PigDNMT5在進化過程中具有較高保守性。共線性和進化樹分析結(jié)果表明,豬、人、小鼠和牛的DNMT基因間存在較強的共線性關(guān)系,但豬與牛的DNMT基因家族親緣關(guān)系更近。此外,性腺軸組織中的PigDNMT1在初情啟動過程中呈現(xiàn)出不同的表達(dá)模式。本研究可為深入解析豬DNMT基因家族功能提供一些參考。