王金金,馬啟峰,倪志勇,范術(shù)麗*
(1.新疆農(nóng)業(yè)大學(xué)農(nóng)學(xué)院,新疆 烏魯木齊 830052;2.中國農(nóng)業(yè)科學(xué)院棉花研究所/ 棉花生物學(xué)國家重點實驗室,河南 安陽 455000)
棉花是紡織工業(yè)的主要原料,是最大的天然纖維來源,對我國及世界的經(jīng)濟都起著重要作用[1]。棉纖維的分化和起始是影響棉花產(chǎn)量和品質(zhì)的重要因素,開花前或開花當天所形成的突起以后發(fā)育成長纖維,開花后3 d 形成的突起發(fā)育成短絨,因此纖維原始細胞突起的時間、多少直接決定棉花的品質(zhì)和產(chǎn)量[2-4]。通過對突變體研究,目前比較接受的觀點是棉花的短絨主要受顯性光子基因N1或隱形光子基因n2控制[5]。Wan 等[6]通過轉(zhuǎn)基因方法驗證N1基因就是Gh-MML3_A12,該基因組位點的反義鏈也轉(zhuǎn)錄,形成順式天然反義轉(zhuǎn)錄本,進而影響短絨的形成。自1973年Kohel 報道N1基因以來[7],經(jīng)歷 43年后終于將該基因克隆得到并進行功能驗證,而同樣控制短絨的n2基因至今未克隆得到。
microRNA(miRNA)是一種單鏈不編碼蛋白的小分子RNA,在真核生物基因表達調(diào)控中有著廣泛的作用。秀麗隱桿線蟲中的lin-4 是第一個被發(fā)現(xiàn)的miRNA[8],由于miRNA 長度只有20~24 nt (nucleotide),且作用時間短暫,具有一定的隱蔽性[9],直到 2002年,miRNA 在模式植物擬南芥中首次被報道[10]。植物中的miRNA 大部分位于基因間隔區(qū)[11],miRNA 的生物合成過程包括轉(zhuǎn)錄、加工和復(fù)合體裝載3個基本過程,是一個復(fù)雜而精細的過程[12]。miRNA 經(jīng)由 RNA 聚合酶Ⅱ轉(zhuǎn)錄和核酸內(nèi)切酶(DICER-LIKE1,DCL1)切割,再由S- 腺苷甲硫氨酸的甲基轉(zhuǎn)移酶 (HUA ENHANCER1,HEN1) 進行甲基化修飾,形成成熟miRNA[13-15]。成熟體miRNA招募 AGO(Argonaute)蛋白并形成復(fù)合體 (miRNA-induced silencing complex,RISC)[11]。最后 RISC 通過切割靶標mRNA 或是抑制靶標翻譯來負調(diào)控編碼基因的表達[11,16]。
在棉花中,miRNA 參與許多生物合成和代謝過程,包括胚胎的形態(tài)學(xué)建成、棉纖維和花器官的發(fā)育、病蟲害脅迫和高溫高鹽干旱脅迫應(yīng)答[17-24]。Barozai 等[25]用擬南芥中已知 pre-miRNA比對棉花EST 數(shù)據(jù)庫的方法鑒定了22個miRNA,屬于13個家族 ,其中有7個 miRNA(miR160、164、827、829、836、845和865) 第一次在棉花中被發(fā)現(xiàn)。Wang 等[26]以EST 數(shù)據(jù)庫為參考,通過同源基因搜索和實時定量PCR 驗證方法檢測出49個MiRNA 家族的73個 miRNA。隨著高通量測序技術(shù)的快速發(fā)展,Gong 等[27]用深測序方法從二倍體雷蒙德氏棉和亞洲棉中分別鑒定出 122個和127個miRNA,其中有 33個屬于保守miRNA。Liu 等[28]利用高通量測序方法從海島棉胚珠和纖維中得到47個保守MiRNA 家族、7個新的 miRNA,其中 miR160、miR167、miR171、miR172和miR827 在棉纖維起始階段表達量高,說明這些miRNA 可能參與纖維發(fā)育過程。
利用小RNA 測序技術(shù)在棉花中挖掘miRNA 基因的報道已越來越多[29-31]。新鄉(xiāng)小吉無絨有絮是一種有長纖維無短絨突變體,其表型與顯性光籽突變體N1類似,2002年在新鄉(xiāng)小吉無絨無絮棉田里發(fā)現(xiàn)[32]。目前對陸地棉纖維突變體的研究大多集中在徐州142 無絨無絮、顯性光籽突變體N1和隱形光籽突變體n2中[6,33-34]。本研究以新鄉(xiāng)小吉及其無絨有絮突變體開花當天的胚珠為材料,構(gòu)建小RNA 文庫,通過生物信息學(xué)的方法對小RNA 進行分離和鑒定,挖掘纖維起始相關(guān)的小RNA 及其靶基因,為纖維起始相關(guān)基因的篩選及今后棉纖維發(fā)育研究奠定基礎(chǔ)。
試驗所用的材料為新鄉(xiāng)小吉的野生型(Wild type,WT)及其無絨有絮突變體(Fuzzless mutant,F(xiàn)LM)(圖1),其中新鄉(xiāng)小吉無絨有絮是一種有長纖維無短絨突變體,屬于纖維起始發(fā)育突變體。新鄉(xiāng)小吉與新鄉(xiāng)小吉無絨有絮的成熟種子表面僅存在一個表型的差異,即短絨的有無,且這兩個材料為近等基因系。材料種植于河南安陽中國農(nóng)業(yè)科學(xué)院棉花研究所試驗基地,每個小區(qū)單行種植,3 次重復(fù),常規(guī)大田管理。摘取兩個材料開花當天的胚珠,立即投入到液氮中,之后放于-70 ℃超低溫冰箱保存。進行3 次生物學(xué)重復(fù)。新鄉(xiāng)小吉的野生型開花當天胚珠的3個生物學(xué)重復(fù)分別為 WT-1、WT-2和WT-3,新鄉(xiāng)小吉無絨有絮突變體開花當天胚珠的3個生物學(xué)重復(fù)分別為 FLM-1、FLM-2和FLM-3。
采用Trizol RNA試劑盒 (Invitrogen,CA,USA) 分別提取兩個材料開花當天胚珠總RNA。用 Bioanalyzer 2100(Agilent,CA,USA)和 RNA 6000 Nano LabChip Kit(Agilent,CA,USA) 測 定總RNA 的質(zhì)量及純度,以保證后期測序的RNA樣品的合格性。
圖1 新鄉(xiāng)小吉WT(A 和C)和新鄉(xiāng)小吉無絨有絮FLM(B 和D)的表型Fig.1 Phenotype of WT(A and C)and FLM(B and D)
樣品檢測合格后,使用TruSeq Small RNA Sample Prep Kits(Illumina,San Diego,USA)試劑盒構(gòu)建文庫。利用連接酶在小RNA 兩端連上特異性的接頭,反轉(zhuǎn)錄合成cDNA。之后經(jīng)PCR 擴增,用一定濃度的PAGE 膠對PCR 產(chǎn)物切膠回收,最后溶于EB 溶液,完成文庫構(gòu)建。質(zhì)檢后在Illumina Hiseq2500 測序平臺測序。對 Illumina 測序所得原始數(shù)據(jù)進行過濾,首先去除接頭及低質(zhì)量的測序片段,并篩選出長度在20~25 nt 的序列。同時盡可能去除 mRNA、rRNA、tRNA、snRNA、snoRNA 等非 miRNA 序列,最后剩余的數(shù)據(jù)即Clean reads,用于后續(xù)小RNA 數(shù)據(jù)分析,這樣即完成小RNA 測序(Small RNA sequencing,sRNA-seq)工作。
將Clean reads 與miRBase 數(shù)據(jù)庫中收錄的已知miRNA 前體序列進行比對,從而鑒定已知miRNA 的詳細表達情況,同時得到miRNA 前體序列的長度及二級結(jié)構(gòu)等信息。利用miRDeep2軟件預(yù)測新的miRNA[35]。對6個樣本中已知和新miRNA 進行表達量的統(tǒng)計,并通過TPM(Transcripts per kilobase of exon model per million mapped reads)對全部miRNA 的表達量進行歸一化處理。算法公式:TPM=mapped readcount/Total reads×106。差異表達的 miRNA 的篩選標準為P≤0.05,且 |log2Fold change|≥1。
結(jié)合差異表達的miRNA 與陸地棉遺傳標準系TM-1 的基因序列信息,利用TargetFinder 軟件對已知和新miRNA 進行靶基因預(yù)測[36]。結(jié)合測序數(shù)據(jù),進一步利用Blast 軟件對篩選出的差異靶基因序列與功能注釋數(shù)據(jù)庫Gene Ontology(GO)及KEGG 代謝通路數(shù)據(jù)庫比對,最終獲得差異靶基因的詳盡注釋信息。
為了驗證小RNA 測序數(shù)據(jù)的可靠性,隨機選取 4個 miRNA(gra-MIR3476-p3、pc-5p-579-2660、tcc-miR172a_R+1_2ss1GA11TG、tcc-miR403a) 進行熒光定量PCR (Quantitative reverse transcription polymerase chain reaction,qRT-PCR)驗證。根據(jù)所選miRNA 的序列,設(shè)計特異性的引物。選擇snRNA U6 作為內(nèi)參,利用 Trizol RNA 試劑盒(Invitrogen,USA) 分別提取 WT和FLM 開花當天胚珠的總 RNA。利用 TransScript miRNA First-Strand cDNA Synthesis SuperMix(TransGen Biotech Inc.,Beijing,China)試劑盒反轉(zhuǎn)錄成 cDNA,用得到的相應(yīng)cDNA 作為模板進行熒光定量PCR 驗證。利用Transgene 公司的TransStart? Top Green qPCR SuperMix 試劑盒對特定miRNA進行表達量分析。所選miRNA 的相對表達量采用 2-△△Ct法計算,設(shè)有 3 次技術(shù)重復(fù)。
本研究構(gòu)建6個文庫進行小RNA 測序,其中包括3個生物學(xué)重復(fù)。結(jié)果顯示,6個文庫中共獲得82 761 288 條Reads,經(jīng)嚴格過濾后得到55 403 828 條 Clean reads。6個文庫 Clean reads 在5 949 810~12 157 913 條之間。過濾比例在52.74%~74.54%之間,平均為66.24%。
其中堿基GC 含量最高的是在FLM-1 樣本中達41.97%,最低的在WT-3 中為39.65%,平均為41.07%,符合基因組中的GC 含量(表1)。
表1 樣本數(shù)據(jù)信息Table 1 Information of sample data
miRNA 長度在不同物種間分布有所差異,在擬南芥和棉花中分布最多的為24 nt[37-38],大豆和番茄中分布最多的為21 nt[39-40]。本研究中6個文庫中無論在野生型新鄉(xiāng)小吉還是在突變體新鄉(xiāng)小吉無絨有絮,miRNA 的長度主要分布在20~25 nt,在 24 nt 出現(xiàn)高峰,所占比例最高,最高達76.7%,與之前報道的一致,其他長度的miRNA 所占比例較低(圖2)。
對原始下機的測序數(shù)據(jù)進行過濾和篩選。共獲得 459個 miRNA,其中 301個 miRNA 可以比對到miRNA 數(shù)據(jù)庫中,屬于保守miRNA,158個miRNA 屬于新預(yù)測的 miRNA。利用 RNAfold 軟件對新預(yù)測的miRNA 的前體二級結(jié)構(gòu)進行預(yù)測,結(jié)果顯示它們均具有標志性的莖環(huán)結(jié)構(gòu)。301個保守 miRNA 屬于 52個家族;459個 miRNA中,相對于 WT,有 236個 miRNA 在 FLM 中上調(diào)表達,223個miRNA 下調(diào)表達。
圖2 miRNA 的長度分布Fig.2 Length distribution of miRNA
將獲得的 459個miRNA 用DEGseq 軟件進行差異表達分析,采用TPM 法將數(shù)據(jù)歸一化處理后,篩選出P≤0.05 且 |log2Fold change|≥1 的miRNA,兩個材料中共篩選出13個差異表達的miRNA,包括兩個新預(yù)測的miRNA(PC-5p-1049_1739、PC-5p-579_2660); 其中有 5個miRNA 在突變體材料FLM 中上調(diào)表達,8個miRNA 下調(diào)表達。又對檢測得到的13個差異表達的miRNA 進行家族分析,探索其所屬的MiRNA 家族在其它物種中的存在情況,可以了解miRNA 在進化關(guān)系上的保守性。13個差異表達的 miRNA 中 4個屬于 MiR171_1 家族,2個屬于MiR172 家族,MiR159、MiR166、MiR403 家族的各有 1個,另外 4個 miRNA 屬于未知家族(表2)。
近些年,高通量測序技術(shù)迅速發(fā)展,隨之miRNA 靶基因的預(yù)測也快速發(fā)展,產(chǎn)生了很多預(yù)測miRNA 靶基因的軟件,有助于研究miRNA的具體功能。本研究利用針對植物物種的預(yù)測軟件TargetFinder 對顯著差異的13個miRNA 進行靶基因預(yù)測,最后有161個靶基因被預(yù)測到,其中7個miRNA 的39個靶基因有注釋,這些靶基因側(cè)重于編碼 HD-ZIP(Homeodomain-leucine zipper)、GRAS (Gibberellic acid insensitive,Repressor of GAI,Scarecrow)、AP2(APETALA2)家族的轉(zhuǎn)錄因子,并且這些靶基因的功能集中在轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控階段,說明miRNA 在轉(zhuǎn)錄或轉(zhuǎn)錄后進程中調(diào)控轉(zhuǎn)錄因子相關(guān)基因來影響棉花纖維的起始發(fā)育(表3)。
對上述靶基因進行GO 數(shù)據(jù)庫注釋,結(jié)果顯示這些差異miRNA 的161個靶基因共涉及38個GO term。其中生物學(xué)進程中富集基因數(shù)最多的是細胞分化 (55 genes)、生物學(xué) 過 程(34 genes)、花藥發(fā)育 (24 genes)、花器官發(fā)育(23 genes)。說明這些靶基因參與細胞分化、花藥和花器官的發(fā)育。本試驗所用材料為開花當天的胚珠,而胚珠是花器官中的一部分,胚珠外表皮細胞發(fā)育成纖維,說明預(yù)測的這些靶基因很可能參與到棉花纖維的起始階段。細胞組分中富集基因數(shù)最多的為膜的整體成分(49 genes)、細胞膜(37 genes)、細胞質(zhì)(33 genes)。分子功能中富集基因最多的為金屬離子結(jié)合(41 genes)、蛋白結(jié)合(37 genes)、ATP 結(jié)合(29 genes)(如圖3 所示)。說明這些差異miRNA 的靶基因主要在細胞質(zhì)和細胞膜上與金屬離子及一些蛋白等結(jié)合轉(zhuǎn)錄激活調(diào)控下游基因,進而調(diào)控纖維發(fā)育過程。
圖3 預(yù)測的靶基因GO 功能分類圖Fig.3 GO classification of predicted target genes
為驗證miRNA 測序結(jié)果的準確性,采用加尾法熒光定量的方法檢測gra-MIR3476-p3、pc-5p-579-2660、tcc-miR172a_R+1_2ss1GA11TG、tcc-miR403a 這 4個 miRNA 的表達趨勢。4個miRNA 的相對表達量采用2-△△Ct法計算,設(shè)有 3次技術(shù)重復(fù),結(jié)果顯示 gra-MIR 3476-p3、
pc-5p-579-2660、tcc-miR172a_R+1_2ss1GA11TG在兩個樣本中達到了極顯著差異水平,tcc-miR403a 在兩個樣本中差異顯著,并且熒光定量中miRNA 的表達量變化趨勢與測序數(shù)據(jù)結(jié)果一致(圖4),說明本研究中的測序數(shù)據(jù)真實可靠。
表2 13個差異表達的miRNA 的信息Table 2 Information of 13 different expression miRNA
表3 7個差異表達的miRNA 的靶基因Table 3 Target genes of 7 different expression miRNA
表3 (續(xù))Table 3 (Continued)
圖 4 差異表達的miRNA 的qRT-PCR 驗證Fig.4 qRT-PCR validation of differential expression miRNA
miRNA 作為一種重要的基因表達調(diào)控因子,廣泛參與植物的生長和發(fā)育、形態(tài)學(xué)建成及其它耐鹽耐旱耐高溫等脅迫信號的響應(yīng)。隨著生物信息學(xué)和生物技術(shù)的不斷發(fā)展,已有研究表明,miRNA 參與到棉花纖維發(fā)育過程中[41]。
Zhang 等[42]發(fā)現(xiàn)miR396 的靶標為胼胝質(zhì)合酶,并且在子葉、果枝嫩葉、花蕾、雌蕊與心皮(0 DPA)、花瓣 (0 DPA)、胚珠 (0 DPA)、胚珠 (2 DPA)、纖維(20 DPA)中均表達,表明 miR396 在棉花纖維分化和發(fā)育中起重要作用。Kwak 等[43]通過對徐州142 和徐州142 無絨無絮突變體測序發(fā)現(xiàn),miR165/166、miR167、miR172 在突變株中表達更高。Liu 等[28]利用深度測序方法從海島棉得到 47個保守 miRNA 家族、7個新的 miRNA,發(fā) 現(xiàn) miR160、miR167、miR171、miR172、miR827 在纖維發(fā)育起始階段高表達。Naoumkina等[29]發(fā)現(xiàn)miR159 和miR164 在極短纖維突變體纖維細胞中的表達量較高,并且miR164 的靶標NAC(Gh_D11G0347)在纖維細胞中下調(diào)表達。
已有研究證明 MYB(Myeloblastosis)、NAC(NAM/ ATAF /CUC)和 HD-ZIP(Homeodomainleucine zipper) 這些轉(zhuǎn)錄因子的家族成員對棉花纖維發(fā)育具有一定的影響。本研究中,除靶基因Gh_A05G2939 外,差異表達的 cme-miR166i_R-1_1ss18CT 的靶基因均為HD-ZIP 家族轉(zhuǎn)錄因子,從轉(zhuǎn)錄水平上負調(diào)控靶基因。Walford 等[44]發(fā)現(xiàn)HD-ZIP 轉(zhuǎn)錄因子家族的一個基因GhHD-1 在胚珠和纖維發(fā)育早期表達量較高,當沉默該基因時纖維起始期推遲;過表達該基因時,種子表面起始的纖維數(shù)量增多。本研究中cme-miR166i、ghr-miR166b、gma-miR166a、gra-MIR166c 等屬于MiR166 家族的 miRNA 的靶基因均為 HD-ZIP類轉(zhuǎn)錄因子,說明該轉(zhuǎn)錄因子可能參與到纖維發(fā)育過程中。mtr-miR171c_1ss19AT 和tcc-miR171d_1ss1TC 同屬于 MiR171 家族,其靶基因均為GRAS 家族轉(zhuǎn)錄因子,這也是首次在棉花胚珠中發(fā)現(xiàn)GRAS 家族轉(zhuǎn)錄因子,具體功能需進一步實驗驗證。
Wan 等[6]用圖位克隆方法定位到顯性光子基因N1即GhMML3_A12,該基因組位點的正反兩條鏈都轉(zhuǎn)錄,形成順式天然反義轉(zhuǎn)錄本對,進而影響短絨的形成;Wu 等[33]克隆出控制長纖維發(fā)育的基因Li3即GhMML4_D12,該基因影響長纖維的形成。這兩個基因都編碼MYB 類的轉(zhuǎn)錄因子,進而影響短絨或長纖維的形成。Guan 等[41]證實 miR828和miR858 的靶基因為GhMYB2D,當GhMYB2D與miR828 的結(jié)合位點發(fā)生突變,可以恢復(fù)gl1 突變體的表型,說明miR828 通過靶向負調(diào)控GhMYB2D來影響葉表皮毛和纖維的發(fā)育。Wu 等[45]發(fā)現(xiàn)一個MYB 轉(zhuǎn)錄因子 Gh-Myb25 在纖維起始期特定表達,將該轉(zhuǎn)錄因子轉(zhuǎn)化到煙草后,煙草葉表皮毛數(shù)目相比野生型增多,并且表皮毛的分枝數(shù)量也有所增加。本研究中 ghr-miR172、gra-MIR166c、mesmiR319a、ppe-miR159、PC-3p-89741 這些 miRNA的靶基因均為MYB 類轉(zhuǎn)錄因子,gma-miR828a的靶基因也為MYB 類轉(zhuǎn)錄因子,與Guan 等[41]的研究結(jié)果一致。ghr-miR164、gma-miR164a、gra-MIR164a、mdm-miR164a 等 MiR164 家族的 miRNA 的靶基因大多數(shù)為 NAC 類轉(zhuǎn)錄因子。gma-miR164a 的其中一個靶基因Gh_D11G0347,與 Naoumkina 等[29]的研究一致,說明 miR164 通過調(diào)控該基因來影響棉花纖維起始發(fā)育。
除上述轉(zhuǎn)錄因子外,本研究還發(fā)現(xiàn)miR156的靶標 SPL 轉(zhuǎn)錄因子、MiR171 家族的靶基因GRAS 家族轉(zhuǎn)錄因子及其他一些靶標非特異的轉(zhuǎn)錄因子。其中發(fā)現(xiàn)ptc-miR167f 的一個靶基因Gh_D13G0769,該基因編碼FEZ 蛋白,屬于NAC轉(zhuǎn)錄因子家族,與擬南芥基因AT1G26870 同源,在擬南芥中調(diào)控根細胞分裂[46],說明該基因在頂端生長中起著重要作用,有可能調(diào)控棉纖維細胞的分化發(fā)育。miRNA 靶向調(diào)控轉(zhuǎn)錄因子來調(diào)控棉花纖維細胞的分化的機理還需要進一步的實驗驗證。
植物激素在細胞分裂與伸長、組織與器官分化、開花與結(jié)實、成熟與衰老、休眠與萌發(fā)以及離體組織培養(yǎng)等方面起著重要作用,對棉花纖維發(fā)育也有一定的影響。有研究表明生長素(Auxin,IAA)、油菜素內(nèi)酯(Brassinolide,BR)、乙烯(Ethylene)和赤霉素(Gibberellin,GA)等植物激素對棉花纖維的起始和伸長發(fā)育至關(guān)重要。
Zhang 等[47]用轉(zhuǎn)基因方法提高纖維起始期胚珠表皮的生長素含量,與野生型相比轉(zhuǎn)基因株系的胚珠表皮纖維細胞分化增多,衣分和纖維產(chǎn)量也得到了提高。本研究中 ath-miR160a、gmamiR160a 、tcc-miR160b 、tcc-miR167c 、ghrmiR167a、gma-miR167e 等的靶基因大部分為生長素響應(yīng)因子,說明MiRNA160 家族和MiRNA167 家族通過靶向調(diào)控生長素合成和代謝相關(guān)基因來調(diào)控棉花纖維細胞的發(fā)育。Yang 等[48]在TM-1 早期胚珠EST 庫中富集到一些 BR 合成(SMT1、SMT2s和BR6OX)以及信號傳導(dǎo)(BRI1s、BAK1s、BES1s、CPD) 途徑相關(guān)基因,說明BR 在纖維起始發(fā)育中也起著一定的作用。本研究中 gma-miR159d 的兩個靶基因Gh_A01G1454、Gh_D01G1695,編碼 BR 信號激酶,可能通過調(diào)控BR 信號通路中的基因來間接影響棉花胚珠細胞的分化。
本研究結(jié)合高通量測序技術(shù)和生物信息學(xué)分析方法對新鄉(xiāng)小吉的野生型及其無絨有絮突變體0 DPA 的胚珠進行了小RNA 測序,共得到459個 miRNA,包括 301個保守 miRNA和158個新預(yù)測的miRNA。篩選出13個差異表達的miRNA,并進行了靶基因預(yù)測和分析,發(fā)現(xiàn)這些靶基因側(cè)重于編碼 HD-ZIP、GRAS、AP2 家族的轉(zhuǎn)錄因子,功能集中在轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控階段。對靶基因進行GO 注釋發(fā)現(xiàn),這些靶基因參與細胞分化、花藥發(fā)育、花器官發(fā)育等生物學(xué)過程。miRNA 通過負調(diào)控靶標轉(zhuǎn)錄因子和激素相關(guān)基因來影響纖維細胞的起始發(fā)育。該研究不僅為進一步深入研究miRNA 在纖維起始過程中的作用提供了豐富的資源,也為闡明棉花纖維突起的機制奠定了基礎(chǔ)。