付言峰, 李 蘭, 趙為民, 方曉敏, 李碧俠, 王學(xué)敏, 周李生, 任守文
(1.江蘇省農(nóng)業(yè)科學(xué)院畜牧研究所/農(nóng)業(yè)部種養(yǎng)結(jié)合重點(diǎn)實(shí)驗(yàn)室/江蘇省農(nóng)業(yè)種質(zhì)資源保護(hù)與利用平臺(tái),南京 210014;2.江蘇省農(nóng)業(yè)科學(xué)院動(dòng)物免疫工程研究所,南京 210014)
產(chǎn)仔數(shù)是豬育種中母豬生產(chǎn)性能測(cè)定的一個(gè)重要指標(biāo),也是一個(gè)十分重要的繁殖性狀和經(jīng)濟(jì)性狀[1-2]。由于豬的產(chǎn)仔數(shù)性狀遺傳力(0.10~0.15)非常低和性別限制,所以用傳統(tǒng)的選擇手段進(jìn)行豬產(chǎn)仔數(shù)的育種比較困難[3-4]。產(chǎn)仔數(shù)受許多因素的影響,其中胚胎附植是一個(gè)重要影響因素,因?yàn)榇蟛糠峙咛?huì)在豬胚胎附植期(妊娠13~24 d)死亡,所以這一時(shí)期成為影響豬產(chǎn)仔數(shù)的重要時(shí)期,如何減少這一時(shí)期的胚胎死亡成為亟待解決的問(wèn)題[5]。
豬胚胎附植開(kāi)始于妊娠第12~14天[5-6],在第18 天進(jìn)入附植高峰[7],在第24天左右結(jié)束[8]。在胚胎附植過(guò)程中,卵巢分泌一些物質(zhì),使子宮發(fā)育到胚胎附著的接受狀態(tài),胚泡再根據(jù)子宮內(nèi)膜附植點(diǎn)的信號(hào)著床[9]。在妊娠30 d時(shí),用6頭高育種值母豬和6頭低育種值母豬進(jìn)行了卵巢基因表達(dá)分析,鑒定了27個(gè)差異表達(dá)基因與豬產(chǎn)仔數(shù)QTL緊密關(guān)聯(lián)[10]。另外,在胚胎附植過(guò)程中給母豬注射雌激素,鑒定出一些由于破壞妊娠而導(dǎo)致的異常基因表達(dá)[11]。盡管胚胎附植對(duì)產(chǎn)仔數(shù)有影響,但目前人們對(duì)豬的胚胎附植準(zhǔn)確調(diào)控機(jī)制了解甚少。梅山豬是優(yōu)秀的高繁中國(guó)本土品種[12],具有產(chǎn)仔數(shù)多、泌乳能力強(qiáng)、肉質(zhì)鮮美等優(yōu)點(diǎn),妊娠第30天的梅山豬胚胎死亡率(21%)比大白豬(45%)低很多[13],這就說(shuō)明,高繁母豬的胚胎附植率更高[14-15]。近年來(lái),高通量測(cè)序技術(shù)的迅速發(fā)展,為人們進(jìn)一步挖掘豬胚胎附植關(guān)鍵基因提供了新的途徑[16]。
本研究以梅山豬為試驗(yàn)動(dòng)物,利用轉(zhuǎn)錄組測(cè)序(RNA sequencing, RNA-seq)分析豬胚胎附植卵巢中期和后期差異表達(dá)基因,獲得了一些有意義的結(jié)果。
試驗(yàn)動(dòng)物來(lái)自于江蘇農(nóng)林職業(yè)技術(shù)學(xué)院梅山豬保種場(chǎng),以胚胎附植期的梅山豬母豬(第5~7胎次)為研究對(duì)象,按豬場(chǎng)常規(guī)進(jìn)行飼喂和管理,同時(shí)在自由采食及飲水條件下,注意進(jìn)行疾病的防治和行為體況的觀察。在同場(chǎng)、相同管理?xiàng)l件下進(jìn)行單圈飼養(yǎng),進(jìn)行同期發(fā)情處理,用相同種公豬配種兩次,以最后一次配種為0 d計(jì),在妊娠第18(附植中期)和24 天(附植后期)進(jìn)行屠宰,各屠宰2頭,采集卵巢組織樣,立即放置于液氮保存。
采用TRIzol /氯仿方法[17]從豬卵巢組織中提取總RNA,之后用超微量紫外分光光度計(jì)(Thermo NANODROP 2000 Spectrophotometer, USA)檢測(cè)RNA濃度,再用1.5%的瓊脂糖電泳檢測(cè)RNA完整性。RNA質(zhì)量評(píng)估標(biāo)準(zhǔn):OD260 nm/OD280 nm值為1.8~2.2,OD260 nm/OD230 nm為1.7~2.2,RNA電泳出現(xiàn)18S和28S兩條帶,條帶清晰,無(wú)降解(圖略)。
采用illumina Hiseq2000測(cè)序平臺(tái)的雙端100 bp 測(cè)序模式對(duì)樣本進(jìn)行高通量測(cè)序。原始數(shù)據(jù)經(jīng)過(guò)引物與adaptor序列去除,最終保留高質(zhì)量的堿基片段。保留的序列(remained reads)片段用于后續(xù)RNA-Seq進(jìn)行模塊分析。轉(zhuǎn)錄組測(cè)序流程:1)根 據(jù)堿基質(zhì)量控制與過(guò)濾及Read長(zhǎng)度范圍控制對(duì)原始數(shù)據(jù)進(jìn)行質(zhì)量控制篩查;2)與參考基因組(NCBI,SusscrofaScrofa11.1)進(jìn)行外顯子、內(nèi)含子、UTR非編碼區(qū),上、下游調(diào)控區(qū)進(jìn)行基因組比對(duì),進(jìn)而進(jìn)行基因表達(dá)量分析和基因差異表達(dá)分析。差異基因表達(dá)分析以后,又分成兩個(gè)流程:1)依次進(jìn)行轉(zhuǎn)錄本預(yù)測(cè)識(shí)別、基因結(jié)構(gòu)模型的識(shí)別優(yōu)化、轉(zhuǎn)錄本表達(dá)量計(jì)算分析、轉(zhuǎn)錄本差異表達(dá)分析、轉(zhuǎn)錄本功能預(yù)測(cè)和蛋白結(jié)構(gòu)域分析;2)生物通路(代謝通路和信號(hào)轉(zhuǎn)導(dǎo)通路)分析預(yù)測(cè)、GO分子功能注釋和GO功能富集度分析,采用KEGG(kyoto encyclopedia of genes and genomes,www.genome.jp/kegg/)生物通路數(shù)據(jù)庫(kù)進(jìn)行富集度分析(enrichment analysis)。
將樣本預(yù)處理后,序列與參考基因組序列進(jìn)行全基因組序列比配,計(jì)算序列的全基因組覆蓋情況和RNA的表達(dá)量。序列比配需要考慮到RNA結(jié)構(gòu)特點(diǎn),采用Tophat軟件完成基因組比配。比配參數(shù)和比配的條件:1)允許2個(gè)錯(cuò)配堿基模式;2)允許每個(gè)read測(cè)序序列最多20個(gè)最優(yōu)比配記錄;3)考慮可變剪切情況,分割片段區(qū)域(segment) 的分段長(zhǎng)度設(shè)定等于read長(zhǎng)度的1/2;4)允許分段內(nèi)錯(cuò)配堿基數(shù)目最多2 bp;5)最大插入和刪除長(zhǎng)度設(shè)定為3 bp;6)可變剪接位置比配要求0錯(cuò)配,即保證完全比配;7)最小異構(gòu)體比例系數(shù)(min isoform-fraction)設(shè)定為0.15。該設(shè)置含義:如果有跨越2個(gè)外顯子的跳躍(junction)由S個(gè)測(cè)序片段所覆蓋,假設(shè)讓外顯子A的平均測(cè)序深度為D,比B的平均測(cè)序深度高。如果S/D<設(shè)定的最小異構(gòu)體比例系數(shù)(設(shè)置為0.15),則不認(rèn)為當(dāng)前存在外顯子跳躍(junction)存在。8)最小內(nèi)含子長(zhǎng)度(minimum intron length)設(shè)置為50 bp;9)最大內(nèi)含子長(zhǎng)度(maximum intron length)設(shè)置為50 kb; 10)對(duì)跳躍(junction)探測(cè)的比配條件允許最多40個(gè)最優(yōu)比配記錄,允許2 bp錯(cuò)配。
采用將序列拼裝比配在基因組序列上,并通過(guò)統(tǒng)計(jì)學(xué)方法估算編碼RNA表達(dá)量及用于后續(xù)樣本差異表達(dá)量比較分析。通過(guò)Tophat軟件對(duì)cDNA、mRNA轉(zhuǎn)錄組測(cè)序數(shù)據(jù)(RNA-Seq)reads的基因組比配,獲得可針對(duì)剪切位點(diǎn)比配的基因組比配數(shù)據(jù)(spliced alignments)。對(duì)于兩端測(cè)序片段(paired-end RNA-Seq);通過(guò)參考基因區(qū)域內(nèi)比配read標(biāo)準(zhǔn)化算法(Cufflinks軟件,版本號(hào):2.2.1)對(duì)每個(gè)片段做獨(dú)立比配處理,該算法在拼接過(guò)程中將疊加的比配片段進(jìn)行聯(lián)通,最后估計(jì)拼接轉(zhuǎn)錄本的豐度,即表達(dá)量。RNA表達(dá)量計(jì)算采用FPKM計(jì)算度量指標(biāo)(FPKM- fragments per kilobase of transcript extro per million fragments mapped)。FPKM含義:以每百萬(wàn)比配序列每1 kb長(zhǎng)度作RNA表達(dá)量指標(biāo),其中轉(zhuǎn)錄本長(zhǎng)度和總比配read數(shù)目用于歸一化表達(dá)量數(shù)值。在差異表達(dá)分析部分所計(jì)算的表達(dá)量,筆者采用的參數(shù)設(shè)置是考慮基于RNA注釋坐標(biāo)兼容并符合比配要求的read序列,即compatible-hits-norm模式(兼容比配表達(dá)量計(jì)算模式)。
筆者將試驗(yàn)樣本(條件)之間的lg ratio與其中某個(gè)條件表達(dá)量的lg值作比較。假設(shè)轉(zhuǎn)錄本a和b表達(dá)量的比值為Y (Y=FPKMa/FPKMb),兩條件下表達(dá)量的比值Y的對(duì)數(shù)值(lgY)可以作為檢驗(yàn)統(tǒng)計(jì)量,采用負(fù)伯努利分布計(jì)算檢驗(yàn)統(tǒng)計(jì)量T(T=E (lgY)/Var (lgY), E為期望值,Var為變異方差),得出差異表達(dá)顯著值。此計(jì)算轉(zhuǎn)錄本的差異表達(dá)方法和計(jì)算表達(dá)量的方法具有高度的靈敏性。
轉(zhuǎn)錄組測(cè)序數(shù)據(jù)質(zhì)量系列評(píng)估結(jié)果表明,胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)的組織樣測(cè)定出的序列中,常見(jiàn)基因序列按照占比大小,卵_18 d樣品:外顯子編碼序列(CDS_exons,42.81%)、內(nèi)含子(introns,16.82%)、3′-外顯子非翻譯區(qū)(3′UTR_exons,8.03%)和5′-外顯子非翻譯區(qū)(5′UTR_exons 5.82%),卵_24 d樣品:CDS_exons(47.60%)、3′UTR_exons (7.63%)、Introns (7.18%)和5′UTR_exons (5.93%)。
基因組各分段測(cè)序數(shù)量分布結(jié)果表明,兩個(gè)樣品(卵_18 d和卵_24 d)的曲線(xiàn)圖基本一致,都是先升高后降低,峰值出現(xiàn)的地方一致,測(cè)序數(shù)(read number)從基因全長(zhǎng)(5′→3′)5%左右陡增,在40%的時(shí)候有一個(gè)急速降低,隨之到70%的時(shí)候達(dá)到峰值,然后快速下降。即轉(zhuǎn)錄組測(cè)序覆蓋了基因組95%(從5%~100%)的序列,且在覆蓋的基因組中,每一段的測(cè)序數(shù)量大都在200 000~350 000(圖1 A, B)。A、T、G、C 4堿基頻率結(jié)果表明,兩個(gè)樣品(卵_18 d和卵_24 d)所測(cè)序列前10個(gè)堿基的核苷酸頻率波動(dòng)比較大,之后趨于平穩(wěn),其中卵_18 d的C和G兩堿基的核苷酸頻率始終高于A和T兩堿基,平均高于0.2(圖1 C);卵_24 d的A、T、G和C堿基的核苷酸頻率則始終纏在一起,維持在0.24~0.26(圖1 D)。
A、B. 卵_18 d和卵_24 d基因組各分段測(cè)序數(shù)量分布;C、D. 卵_18 d和卵_24 d基因測(cè)序序列A、T、G和C 4堿基頻率A, B.Quantity distribution of reads for genome of ovary_18 d and ovary_24 d;C, D.Frequency of A, T, G, C for reads of ovary_18 d and ovary_24 d圖1 質(zhì)量控制分析Fig.1 Results of quality control analysis
RNA-seq可以獲得基因組序列的類(lèi)別:正義外顯子、反義外顯子、正義內(nèi)含子、反義內(nèi)含子、正義3′-非編碼區(qū)、反義3′-非編碼區(qū)、正義5′-非編碼區(qū)、反義5′-非編碼區(qū)、正義編碼序列、反義編碼序列、正義下游1 kb、反義下游1 kb、正義上游1 kb和反義上游1 kb,14類(lèi)別在餅形圖中按順時(shí)針依次排列(圖2 A, B)。表明,胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)兩個(gè)樣品的測(cè)序結(jié)果中,各類(lèi)別所占比例有相同,也有不同。其中,相同點(diǎn):正義外顯子和反義外顯子類(lèi)別所占比例最大,且份額基本相等,二者之和(全部外顯子)約占總類(lèi)別1/3,其次為反義編碼序列和正義編碼序列;不同點(diǎn):卵_18 d的正義內(nèi)含子和反義內(nèi)含子所占比例(10%,9%)比卵_24 d的(7%,7%)大,同時(shí)卵_18 d的正義上游1 kb和反義上游1 kb所占比例(4%,3%)比卵_24 d的大(3%,3%)。
RNA-seq分別獲得胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)組織樣14 579 752和13 119 531個(gè)測(cè)序序列(reads)。其中卵_18 d在6號(hào)染色體中得到的reads最多,其次是14、1、7、16、M、2號(hào)染色體;卵_24 d在1號(hào)染色體中得到的reads最多,其次是7、14、M、2、4、6號(hào)染色體(圖2 C, D),這說(shuō)明卵巢在豬胚胎附植兩個(gè)時(shí)期reads所在位置有較大的差異,即兩個(gè)時(shí)期的表達(dá)基因存在較大的差異。正義序列(sense reads)指的是基因組正義鏈中的比配序列數(shù)量,反義序列(antisense reads)指的是基因組反義鏈中的比配序列數(shù)。結(jié)果表明,胚胎附植期卵_18 d和卵_24 d兩個(gè)組織樣的表達(dá)基因檢測(cè)到的外顯子序列最多,即大部分檢測(cè)的基因都在豬胚胎附植中期和后期發(fā)揮著作用,且附植中期的主效調(diào)控基因可能位于6號(hào)染色體,附植后期的主效調(diào)控基因可能位于1號(hào)染色體。
A、C.卵_18 d;B、D.卵_24 dA, C. Ovary_18 d; B,D.ovary_24 d圖2 轉(zhuǎn)錄組測(cè)序獲得的基因組序列分類(lèi)(A、B)和在基因組各染色體測(cè)到的序列數(shù)量(C、D)Fig.2 Classification (A,B)of genomic sequence and genome alignment counts distribution(C,D) in each chromosome by RNA-seq
豬胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)兩個(gè)組織樣分別檢測(cè)出16 159個(gè)和16 373個(gè)有表達(dá)量的基因,卵_18 d和卵_24 d的基因表達(dá)量最高值分別為2.96×106和2.97×106,基因表達(dá)量最低值分別為3.44×10-231和1.05×10-260,平均值分別為955.31和1 075.62。這些結(jié)果表明,豬胚胎附植后期卵巢(卵_24 d) 相較于中期卵巢(卵_18 d),有更多的基因表達(dá),且基因的表達(dá)量更高(無(wú)論是平均數(shù)還是峰值);卵_18 d有1 198個(gè)基因的表達(dá)量高于100,卵_24 d的為1 357個(gè);卵_18 d有316個(gè)基因的表達(dá)量高于500,卵_24 d的為394個(gè);卵_18 d有159個(gè)基因的表達(dá)量高于1 000,卵_24 d的為209個(gè);卵_18 d有46個(gè)基因的表達(dá)量高于1 000,卵_24 d的為53個(gè)。
兩個(gè)組織樣中最高表達(dá)量的基因是同一個(gè)基因,為EN19669,位于線(xiàn)粒體中(序列位點(diǎn):6 443~6 509),該基因在卵_18 d和卵_24 d中的表達(dá)量:2.96×106和2.97×106。兩個(gè)組織樣中表達(dá)量最高的已知基因也相同:MT-ATP8,位于線(xiàn)粒體染色體中(序列位點(diǎn):8 958~9 162),在卵_18 d和卵_24 d中的表達(dá)量:129 142和104 391。卵_18 d組織樣中表達(dá)量排前13位的基因均位于線(xiàn)粒體中,表達(dá)量第14位(染色體中第1位)的位于14號(hào)染色體中,為EN11278(序列位點(diǎn):79 769 815~79 769 890),表達(dá)量前50位的基因中,有35個(gè)基因位于線(xiàn)粒體中。卵_24 d組織樣中表達(dá)量排前12位的基因均位于線(xiàn)粒體中,表達(dá)量第13位(染色體中第1位)的位于14號(hào)染色體中,為EN11278基因(與卵_18 d相同),表達(dá)量前50位的基因中,有34個(gè)基因位于線(xiàn)粒體中。兩個(gè)時(shí)期卵巢組織樣中表達(dá)量前50位的基因中,線(xiàn)粒體基因占了≥60%,即線(xiàn)粒體基因很可能在豬胚胎附植調(diào)控中發(fā)揮著重要作用。
分析豬胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)兩個(gè)組織樣之間有2 682個(gè)顯著差異表達(dá)基因(P<0.05),包含1 998個(gè)上調(diào)基因和684個(gè)下調(diào)基因(圖3A);顯著差異表達(dá)基因中又包含684個(gè)極顯著差異表達(dá)基因(P<0.01,q<0.05),分別為581個(gè)上調(diào)基因和103個(gè)下調(diào)基因(卵_24 d相較于卵_18 d) (圖3A, B, D)。圖3C中卵_18 d和卵_24 d樣品檢測(cè)出差異表達(dá)基因的表達(dá)量均呈中間大、兩頭小的分布,且前者的平均表達(dá)量低于后者?;鹕綀D表明,卵_18 d和卵_24 d之間有比較多的顯著差異表達(dá)基因(紅點(diǎn))(圖3 D),熱圖表明豬胚胎附植卵巢中期和后期差異表達(dá)基因的mRNA表達(dá)量大多為10~100(101~102)(圖3 E)。
卵_18 d和卵_24 d之間差異最大的基因?yàn)镋N19684,位于線(xiàn)粒體中(序列位點(diǎn):12 805~12 864),差異最大的染色體基因?yàn)镋N11278,位于14號(hào)染色體中(序列位點(diǎn):79 769 815~79 769 890),差異最大的已知基因?yàn)門(mén)IMP1,位于X染色體中(序列位點(diǎn):42 058 788~42 110 182)。
對(duì)胚胎中期和后期的卵巢組織差異表達(dá)基因進(jìn)行GO功能富集,生物學(xué)過(guò)程結(jié)果表明(圖4A):卵巢兩個(gè)時(shí)期之間的差異表達(dá)基因有2 954個(gè)富集的生物學(xué)過(guò)程(BP),其中前38個(gè)為顯著富集(P<0.05),前12位(P=0)顯著富集的生物學(xué)過(guò)程分別為內(nèi)皮細(xì)胞活化、蛋白絲氨酸/蘇氨酸磷酸酶活性的調(diào)節(jié)、硫酸乙酰肝素蛋白多糖分解代謝過(guò)程、建立平面極性的蛋白質(zhì)定位、膜組件、維持蛋白質(zhì)在質(zhì)膜中的位置、長(zhǎng)鏈脂肪酸代謝過(guò)程、過(guò)氧化物酶體的長(zhǎng)鏈脂肪酸輸入、雙鏈斷裂修復(fù)的正調(diào)控、蛋白多糖的分解代謝過(guò)程、硫化合物分解代謝過(guò)程和維持蛋白質(zhì)在膜中的位置。
細(xì)胞學(xué)分區(qū)結(jié)果表明(圖4),卵巢兩個(gè)時(shí)期(胚胎附植中期和后期)之間的差異表達(dá)基因有381個(gè)富集的細(xì)胞學(xué)分區(qū)(CC),其中前19個(gè)為顯著富集(P<0.05),前13位(P=0)顯著富集的細(xì)胞學(xué)分區(qū):含液泡膜的共生體、含液膜的共生體、宿主細(xì)胞質(zhì)、宿主細(xì)胞部分、宿主細(xì)胞內(nèi)部分、宿主細(xì)胞質(zhì)部分、體外空間、宿主細(xì)胞內(nèi)區(qū)域、宿主細(xì)胞、其他有機(jī)體、其他有機(jī)體細(xì)胞和其他有機(jī)體部分。分子功能結(jié)果表明,卵巢兩個(gè)時(shí)期之間的差異表達(dá)基因有630個(gè)富集的分子功能(MF),其中前16個(gè)為顯著富集(P<0.05),前6位(P=0)顯著富集的分子功能分別為FAD-AMP裂解酶(環(huán)化)活性、三磷酸酶活性、過(guò)氧化物酶體脂肪?;?CoA轉(zhuǎn)運(yùn)蛋白活性、長(zhǎng)鏈脂肪酸轉(zhuǎn)運(yùn)蛋白活性、脂肪?;D(zhuǎn)運(yùn)蛋白活性和脂肪?;?CoA轉(zhuǎn)運(yùn)蛋白活性。
Pathway (生物通路)分析采用KEGG(kyoto encyclopedia of genes and genomes,www.genome.jp/kegg/)生物通路數(shù)據(jù)庫(kù)進(jìn)行富集度分析(enrichment analysis)。對(duì)卵巢組織胚胎中期和后期的差異表達(dá)基因進(jìn)行生物通路(pathway)分析,結(jié)果表明(圖5),卵巢兩個(gè)時(shí)期(胚胎附植中期和后期)之間的差異表達(dá)基因在185條生物通路上存在差異,其中有7條生物通路上存在極顯著差異(P<0.01),它們依次為PI3K-Akt信號(hào)通路、Hippo信號(hào)通路、晝夜周期、乙型肝炎通路、2-氧代羧酸代謝、HIF-1信號(hào)通路和化學(xué)致癌作用系統(tǒng),接下來(lái)(0.3
A~E.上調(diào)和下調(diào)基因數(shù)、差異基因mRNA表達(dá)量散點(diǎn)圖、盒形圖、火山圖和熱圖A-E.Number of up-regulated DEGs and down-regulated DEGs,scatter plots of DEGs mRNA expression intensity, box plots,volcano, heat maps圖3 豬胚胎附植中期(卵_18 d)和后期(卵_24 d)卵巢組織差異表達(dá)基因分布Fig.3 Distribution of differentially expressed genes (DEGs) between ovary_18 d and ovary_24 d
提高胚胎附植時(shí)期胚胎存活率是提高豬產(chǎn)仔數(shù)的一個(gè)重要措施[14-15],另外豬的胚胎附植階段比人長(zhǎng)很多,且沒(méi)有侵入子宮上皮細(xì)胞,這使豬成為一個(gè)很好的模式動(dòng)物,用于研究人的胚胎附植期相關(guān)疾病[18]。研究胚胎附植需要找到這一繁殖活動(dòng)的關(guān)鍵調(diào)控基因,RNA-seq(轉(zhuǎn)錄組測(cè)序)技術(shù)為這個(gè)研究提供了新的機(jī)會(huì)[19]。豬的胚胎附植開(kāi)始于妊娠第13~14 天,妊娠第18~24 天附植完成[5,8]。本研究中,成功測(cè)定了梅山豬妊娠第18 天(胚胎附植中期)和第24 天(胚胎附植后期)卵巢組織樣中的差異表達(dá)基因,這些結(jié)果可以幫助人們了解關(guān)鍵基因調(diào)控豬胚胎著床,發(fā)現(xiàn)更多的影響胎仔數(shù)的候選基因,這些基因可以用于動(dòng)物育種中的標(biāo)記輔助選擇(MAS)[20]。
圖4 豬胚胎附植中期(Day 18)和后期(Day 24)卵巢組織差異表達(dá)基因的GO注釋分布Fig.4 GO annotation distribution of differential expression genes between ovary_18 d and ovary_24 d detected by RNA-seq
圖5 豬胚胎附植中期(Day 18)和后期(Day 24)卵巢組織差異表達(dá)基因的生物通路注釋Fig.5 Pathway annotation distribution of differential expression genes between tissues of ovary_18 d and ovary_24 d detected by RNA-seq
外顯子和內(nèi)含子測(cè)序比對(duì)結(jié)果表明,胚胎附植期卵_18 d和卵_24 d兩個(gè)組織樣的表達(dá)基因檢測(cè)到的外顯子序列最多,即大部分檢測(cè)的基因都在豬胚胎附植中期和后期發(fā)揮著作用,且附植中期的主效調(diào)控基因有可能在6號(hào)染色體,附植后期的主效調(diào)控基因有可能在1號(hào)染色體。研究表明,在豬6號(hào)染色體上可能存在影響窩產(chǎn)仔數(shù)的QTL[21]和一個(gè)可終止胎兒發(fā)育的基因或基因群[22];影響豬產(chǎn)仔數(shù)的雌激素受體基因(ESR)和胰島素樣生長(zhǎng)因子受體(IGF1R)均位于1號(hào)染色體上[23],且ESR與IGF1R基因的表達(dá)量與排卵數(shù)呈顯著相關(guān)[24]。
基因表達(dá)量結(jié)果表明,豬胚胎附植后期卵巢(卵_24 d) 相較于中期卵巢(卵_18 d),有更多的基因表達(dá),且基因的表達(dá)量更高;兩個(gè)時(shí)期卵巢組織中表達(dá)量前50位的基因中,線(xiàn)粒體基因占了60%以上,即線(xiàn)粒體基因在豬胚胎附植調(diào)控中發(fā)揮著重要作用。兩個(gè)組織樣中最高表達(dá)量的基因是同一個(gè)基因,為EN19669,表達(dá)量最高的已知基因也相同,為MT-ATP8,兩個(gè)基因均位于線(xiàn)粒體中。MT-ATP8的功能為參與ATP的合成從而為細(xì)胞發(fā)育提供能量[25]。線(xiàn)粒體是哺乳動(dòng)物卵子發(fā)生和早期胚胎發(fā)育中的發(fā)育調(diào)節(jié)的一個(gè)連接點(diǎn)[26],動(dòng)態(tài)調(diào)節(jié)線(xiàn)粒體在胚胎植入前和胚胎干細(xì)胞中發(fā)揮作用[27]。在小鼠中,高水平的線(xiàn)粒體代謝對(duì)頭部發(fā)育至關(guān)重要[28]。差異表達(dá)基因分析結(jié)果表明,豬胚胎附植中期卵巢(卵_18 d)和后期卵巢(卵_24 d)兩個(gè)組織樣之間有2 682個(gè)顯著差異表達(dá)基因(P< 0.05),包含1 998個(gè)上調(diào)基因和684個(gè)下調(diào)基因;顯著差異表達(dá)基因中又包含684個(gè)極顯著差異表達(dá)基因(P<0.05,Q<0.05),包含581個(gè)上調(diào)基因和103個(gè)下調(diào)基因。這說(shuō)明附植中期和后期卵巢組織同一基因的表達(dá)量出現(xiàn)了很大的變化,85%的基因表達(dá)上調(diào),這些上調(diào)的基因很可能與母豬妊娠建立有關(guān)[16]。
前3位顯著富集的生物學(xué)過(guò)程:內(nèi)皮細(xì)胞活化、蛋白絲氨酸/蘇氨酸磷酸酶活性的調(diào)節(jié)、硫酸乙酰肝素蛋白多糖分解代謝過(guò)程,研究表明,這幾種生物學(xué)過(guò)程對(duì)胚胎植入過(guò)程中的胚胎生長(zhǎng)和母體組織重構(gòu)是必不可少的[29-30];細(xì)胞學(xué)區(qū)分為宿主細(xì)胞質(zhì)、宿主細(xì)胞部分、宿主細(xì)胞內(nèi)部分,這與豬卵巢內(nèi)卵泡成熟和排卵的生理活動(dòng)相一致;分子功能:FAD-AMP裂解酶(環(huán)化)活性、三磷酸酶活性、過(guò)氧化物酶體脂肪?;?CoA轉(zhuǎn)運(yùn)蛋白活性。胚胎附植是一種磷脂酸結(jié)合過(guò)程,由各種激素調(diào)節(jié)胎兒發(fā)育和改變母體的生理機(jī)能,以支持懷孕[31]。卵巢兩個(gè)時(shí)期(胚胎附植中期和后期)之間的差異表達(dá)基因在185條 生物通路上存在差異,其中前3位極顯著差異的生物通路依次為PI3K-Akt信號(hào)通路、Hippo信號(hào)通路、晝夜周期。
本研究結(jié)果表明,豬胚胎附植中期的主效調(diào)控基因有19%位于6號(hào)染色體,附植后期的主效調(diào)控基因有14%位于1號(hào)染色體;相對(duì)于附植中期,卵巢更側(cè)重于胚胎附植后期的調(diào)控;線(xiàn)粒體基因在豬胚胎附植調(diào)控中發(fā)揮著重要作用;卵巢附植中期和后期差異表達(dá)基因功能以?xún)?nèi)皮細(xì)胞活化為主,生物通路以PI3K-Akt信號(hào)通路為主。