王傳琦,孔穩(wěn)穩(wěn),李晶
東北農(nóng)業(yè)大學(xué) 生命科學(xué)學(xué)院,黑龍江 哈爾濱 150030
轉(zhuǎn)錄因子(transcription factor,TF)又稱反式作用因子,是直接或間接與基因啟動(dòng)子區(qū)域中順式作用元件發(fā)生特異性相互作用,并對(duì)基因轉(zhuǎn)錄的起始進(jìn)行調(diào)控的一類蛋白質(zhì)。轉(zhuǎn)錄因子一般具有4個(gè)功能結(jié)構(gòu)域,即DNA結(jié)合區(qū)(DNA-binding domain,DBD)、寡聚化位點(diǎn)區(qū)(oligomerization site,OS)、核定位信號(hào)區(qū)(nuclear location signal,NLS)和轉(zhuǎn)錄調(diào)控區(qū)(transcription regulation domain,TRD)。DNA 結(jié)合區(qū)是轉(zhuǎn)錄因子識(shí)別并結(jié)合于各種順式因子的一段氨基酸序列,可與靶位點(diǎn)專一性結(jié)合;寡聚化位點(diǎn)區(qū)是不同轉(zhuǎn)錄因子間發(fā)生相互作用的功能域;核定位信號(hào)可將轉(zhuǎn)錄因子定位于細(xì)胞核內(nèi)的某些區(qū)域;轉(zhuǎn)錄調(diào)控區(qū)決定著轉(zhuǎn)錄因子對(duì)靶基因的調(diào)控特征,可分為轉(zhuǎn)錄激活域(activation domain,AD)和轉(zhuǎn)錄抑制域(repression domain,RD),對(duì)靶基因的轉(zhuǎn)錄起激活或抑制作用。
自植物中最早的玉米轉(zhuǎn)錄因子被報(bào)道以來(lái)[1],已發(fā)現(xiàn)植物中存在大量轉(zhuǎn)錄因子。根據(jù)模式植物擬南芥信息資源庫(kù)TAIR提供的數(shù)據(jù)分析,擬南芥基因組中包含27 235個(gè)編碼蛋白的基因,其中2000個(gè)以上編碼轉(zhuǎn)錄因子,約占基因總數(shù)的5%~10%,明顯高于果蠅(4.7%)和線蟲(chóng)(3.6%)[2]。轉(zhuǎn)錄因子的數(shù)量和種類繁多,表明了植物轉(zhuǎn)錄調(diào)控的特殊性和復(fù)雜性。目前已從高等植物中分離鑒定出數(shù)百種轉(zhuǎn)錄因子,有些轉(zhuǎn)錄因子參與調(diào)控植物細(xì)胞和組織的形成,是植物形態(tài)建成的關(guān)鍵調(diào)節(jié)因子,如bHLH轉(zhuǎn)錄因子家族[3-4]。大量轉(zhuǎn)錄因子與植物抗逆性密切相關(guān),可調(diào)控植物體感受干旱、高鹽、低溫和病原等信號(hào)相關(guān)基因的表達(dá),在植物抗逆反應(yīng)中發(fā)揮重要作用,如bZIP類轉(zhuǎn)錄因子[5-6]。轉(zhuǎn)錄因子還可對(duì)植物次生代謝產(chǎn)物的合成和分解進(jìn)行調(diào)節(jié),影響次生代謝產(chǎn)物的合成、分解及時(shí)空分布,如MYB轉(zhuǎn)錄因子家族[7-8]。
由于轉(zhuǎn)錄因子在植物生長(zhǎng)發(fā)育、形態(tài)建成及對(duì)外界環(huán)境變化的反應(yīng)中起重要的作用,在植物基因表達(dá)調(diào)控研究中轉(zhuǎn)錄因子一直備受關(guān)注。我們結(jié)合近年來(lái)植物轉(zhuǎn)錄因子的研究進(jìn)展,歸納分析了高等植物轉(zhuǎn)錄因子研究的主要策略和最新的技術(shù)方法,可為植物轉(zhuǎn)錄因子的鑒定、功能分析及靶基因研究提供理論和技術(shù)上的參考。
隨著生物信息學(xué)的迅速發(fā)展,各種分子生物學(xué)數(shù)據(jù)庫(kù)提供了大量核苷酸和氨基酸序列,對(duì)這些序列進(jìn)行分析和計(jì)算,已成為發(fā)現(xiàn)新基因和預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)最快捷有效的方法。常用的大型生物學(xué)數(shù)據(jù)庫(kù)NCBI、EBI和DDBJ等都能提供植物轉(zhuǎn)錄因子的相關(guān)數(shù)據(jù)。另外還有許多轉(zhuǎn)錄因子的專用數(shù)據(jù)庫(kù),如 TRANSFAC(http://www.gene-regulation.com/pub/databases.html#transfac)和 PlnTFDB(http://plntfdb.bio.uni-potsdam.de/v3.0/)等。TRANSFAC是關(guān)于轉(zhuǎn)錄因子在基因啟動(dòng)子上結(jié)合位點(diǎn)的數(shù)據(jù)庫(kù)[9],而PlnTFDB是系統(tǒng)收錄植物轉(zhuǎn)錄因子的數(shù)據(jù)庫(kù)[10-11]。模式植物通常有自己專屬的轉(zhuǎn)錄因子數(shù)據(jù)庫(kù),如擬南芥轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)RARTF(http://rarge.gsc.riken.jp/rartf/)、AGRIS(http://arabidopsis.med.ohio-state.edu/AtTFDB/)和 DATF(http://datf.cbi.pku.edu.cn/),每個(gè)數(shù)據(jù)庫(kù)都有自己的分類方式,并對(duì)這些轉(zhuǎn)錄因子的功能結(jié)構(gòu)和作用位點(diǎn)都進(jìn)行了詳細(xì)的描述[12]。水稻也有自己專門的轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)DRTF(http://drtf.cbi.pku.edu.cn/)[13]。這些數(shù)據(jù)庫(kù)對(duì)植物轉(zhuǎn)錄因子的研究有重要的指導(dǎo)作用。
大多數(shù)轉(zhuǎn)錄因子的序列具有保守性,這些保守結(jié)構(gòu)域(conserved domains,CD)使得用生物信息學(xué)方法進(jìn)行轉(zhuǎn)錄因子的預(yù)測(cè)和功能鑒定成為可能。早期研究中常利用已知轉(zhuǎn)錄因子的核酸序列作為探針,與cDNA文庫(kù)進(jìn)行雜交來(lái)篩選轉(zhuǎn)錄因子,這種方法耗時(shí)、費(fèi)力。現(xiàn)在可以利用生物信息學(xué)來(lái)研究一個(gè)未知的序列是否屬于轉(zhuǎn)錄因子。DBD是轉(zhuǎn)錄因子最主要的保守區(qū)域,其次還有AD或RD。在漫長(zhǎng)的進(jìn)化過(guò)程中,這些區(qū)域的氨基酸序列變化都很小,確保了轉(zhuǎn)錄因子功能的準(zhǔn)確行使??梢?jiàn)保守區(qū)是確定一種蛋白質(zhì)是否是轉(zhuǎn)錄因子并鑒定其功能和類型的關(guān)鍵。通常一個(gè)轉(zhuǎn)錄因子含有1個(gè)DBD和1個(gè)AD或RD。只含有1個(gè)DBD的轉(zhuǎn)錄因子一般具有轉(zhuǎn)錄抑制活性,如CPC和TRY[14]。也有些轉(zhuǎn)錄因子含有2個(gè)DBD,如RAV1家族成員,同時(shí)含有AP2-ERF和B3等2個(gè)DBD[15]。目前已有很多轉(zhuǎn)錄因子保守結(jié)構(gòu)域數(shù)據(jù)庫(kù)及分析軟件,比較常用的如歐洲生物信息研究院(EBI)提供的 InterProScan(http://www.ebi.ac.uk/Tools/interProScan/)[16]。如果是在一系列蛋白質(zhì)中尋找已知或未知的轉(zhuǎn)錄因子CD,則可利用MEME數(shù) 據(jù) 庫(kù) (http://meme.sdsc.edu/meme/intro.html)[17]。SALAD(http://salad.dna.affrc.go.jp/salad/en/)是 專 門針對(duì)植物蛋白質(zhì)建立的數(shù)據(jù)庫(kù),包含了MEME中的CD數(shù)據(jù),同時(shí)提供了各種分析軟件和工具。除了CD以外,在其他區(qū)域具有較高同源性的轉(zhuǎn)錄因子功能上冗余的可能性也相對(duì)較大,因此可利用NCBI數(shù)據(jù)庫(kù)的BLAST對(duì)多個(gè)轉(zhuǎn)錄因子的CD及其他序列進(jìn)行同源性分析,以便更準(zhǔn)確地預(yù)測(cè)這些轉(zhuǎn)錄因子的功能。
轉(zhuǎn)錄因子只有在細(xì)胞核中才能發(fā)揮其功能,所以對(duì)候選轉(zhuǎn)錄因子進(jìn)行生物信息學(xué)的亞細(xì)胞定位分析十分重要。某些轉(zhuǎn)錄因子的核定位信號(hào)肽可使其定位于細(xì)胞核內(nèi)。根據(jù)氨基酸序列可以分析和預(yù)測(cè)蛋白質(zhì)的亞細(xì)胞定位。SUBALL數(shù)據(jù)庫(kù)(http://www.plantenergy.uwa.edu.au/suba2/)[18]可 提 供 大 量 蛋 白 質(zhì)定位的實(shí)驗(yàn)數(shù)據(jù),并通過(guò)10種不同的計(jì)算程序來(lái)計(jì)算和預(yù)測(cè)蛋白質(zhì)的亞細(xì)胞定位。還有一些其他的計(jì)算軟件如 TargetP(http://www.cbs.dtu.dk/services/Tar?getP/)[19]、SubLoc(http://bioinfo.tsinghua.edu.cn/Sub?Loc/)[20]和 WoLF PSORT(http://wolfpsort.org/)[21]等 。這些數(shù)據(jù)庫(kù)和軟件給植物轉(zhuǎn)錄因子亞細(xì)胞定位研究提供了極大的便利,但有時(shí)不同計(jì)算方法可能會(huì)得出不同的預(yù)測(cè)結(jié)果,最終的結(jié)論還必須通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證。
轉(zhuǎn)錄因子對(duì)下游靶基因的表達(dá)起調(diào)控作用,而轉(zhuǎn)錄因子基因自身的表達(dá)也可能受到其他調(diào)節(jié)因子的調(diào)控。和其他基因一樣,轉(zhuǎn)錄因子基因的編碼區(qū)上游含有各種順式調(diào)控元件來(lái)接受調(diào)控因子的作用。這些順式作用元件的相關(guān)數(shù)據(jù)可通過(guò)AGRIS ATCISDB(http://arabidopsis.med.ohio-state.edu/Atcis?DB)和 PLACE(http://www.dna.affrc.go.jp/PLACE/)獲得。
microRNA(miRNA)是影響轉(zhuǎn)錄因子基因表達(dá)的重要因素,它是一種長(zhǎng)18~24 nt的非編碼小RNA,可以在轉(zhuǎn)錄及轉(zhuǎn)錄后水平對(duì)基因的表達(dá)進(jìn)行調(diào)節(jié)。研究表明,擬南芥已知miRNA的候選靶基因中35%編碼轉(zhuǎn)錄因子,這些miRNA在擬南芥生長(zhǎng)發(fā)育和形態(tài)建成中起至關(guān)重要的作用[22]。除了miRNA外,其他形式的小RNA也參與轉(zhuǎn)錄因子的調(diào)控。擬南芥的ASRP數(shù)據(jù)庫(kù)(http://asrp.cgrb.oregonstate.edu/)提供包括siRNA、ta-siRNA及miRNA在內(nèi)的所有小RNA信息,是研究轉(zhuǎn)錄因子自身表達(dá)調(diào)控的有力工具。
許多轉(zhuǎn)錄因子并不能獨(dú)自行使功能,它們需要與其他蛋白形成復(fù)合體或被激酶磷酸化激活,如MADS家族[18]和MYB家族[23]通常會(huì)形成蛋白質(zhì)復(fù)合體。EBI(http://www.ebi.ac.uk/)提供了大量經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證或計(jì)算機(jī)預(yù)測(cè)的蛋白質(zhì)-蛋白質(zhì)相互作用的數(shù)據(jù)。模式植物擬南芥蛋白質(zhì)間相互作用的信息還可從 TAIR(http://www.arabidopsis.org/)和 AtPID(http://www.megabionet.org/atpid/webfile/)等數(shù)據(jù)庫(kù)中獲得。
轉(zhuǎn)錄因子可通過(guò)激活或抑制實(shí)現(xiàn)對(duì)下游靶基因轉(zhuǎn)錄的調(diào)控,利用瞬間轉(zhuǎn)化技術(shù)可對(duì)轉(zhuǎn)錄因子的調(diào)控特性進(jìn)行分析[24]。具體方法是構(gòu)建2種植物表達(dá)載體(圖1),一種是效應(yīng)載體,可高水平表達(dá)待研究轉(zhuǎn)錄因子和一個(gè)外源DBD的融合基因,外源DBD可以采用來(lái)源于酵母的GAL4DB。另一種是報(bào)告載體,有2種不同情況:一種是用于檢測(cè)轉(zhuǎn)錄因子是否具有激活活性的報(bào)告載體A(active),載體包含一個(gè)特異性啟動(dòng)子和一個(gè)報(bào)告基因,該啟動(dòng)子須含有可以與效應(yīng)載體中的DBD特異性結(jié)合的順式作用元件。當(dāng)效應(yīng)載體和報(bào)告載體同時(shí)轉(zhuǎn)入植物細(xì)胞后,效應(yīng)載體中的DBD與報(bào)告載體中啟動(dòng)子特異性結(jié)合,如果報(bào)告基因表達(dá)量增加,則說(shuō)明該轉(zhuǎn)錄因子具有激活活性。另一種是用于檢測(cè)轉(zhuǎn)錄因子是否具有抑制活性的報(bào)告載體R(repress),載體須含有一個(gè)組成型強(qiáng)啟動(dòng)子如花椰菜花葉病毒(CaMV)35S啟動(dòng)子和一段與效應(yīng)載體中的DBD特異性結(jié)合的順式作用元件及報(bào)告基因。將其與效應(yīng)載體同時(shí)轉(zhuǎn)入植物細(xì)胞后,如果報(bào)告基因表達(dá)量降低,則說(shuō)明該轉(zhuǎn)錄因子具有抑制活性。報(bào)告基因可以采用綠色熒光蛋白(GFP)、β-葡萄糖苷酸酶(GUS)或螢光素酶(LUC)等基因。瞬間轉(zhuǎn)化可采用基因槍法、電轉(zhuǎn)化法、PGE處理法及農(nóng)桿菌介導(dǎo)法,在幾小時(shí)或幾天后可觀察到報(bào)告基因的表達(dá)情況[25-26]。其中,農(nóng)桿菌介導(dǎo)的煙草葉片瞬間轉(zhuǎn)化經(jīng)濟(jì)、便捷、高效。
另外,瞬間轉(zhuǎn)化分析也可用于驗(yàn)證轉(zhuǎn)錄因子與靶基因啟動(dòng)子之間的識(shí)別特性。在待測(cè)靶基因的啟動(dòng)子序列下游加上報(bào)告基因,和轉(zhuǎn)錄因子一起轉(zhuǎn)入植物組織,觀察報(bào)告基因的表達(dá),如果報(bào)告基因的表達(dá)發(fā)生預(yù)期改變,則可確定兩者之間存在特異性的識(shí)別。
鑒定轉(zhuǎn)錄因子生理功能最直接的方法是觀察轉(zhuǎn)錄因子基因表達(dá)發(fā)生改變時(shí)植物的表型。通常利用基因過(guò)量表達(dá)和基因功能缺失突變體,觀察植物外部形態(tài)、生理代謝和對(duì)某些特殊外界環(huán)境的反應(yīng)是否發(fā)生改變,分析該轉(zhuǎn)錄因子的功能。
基因功能增加可采用超表達(dá)法,即在目的轉(zhuǎn)錄因子基因前加入一個(gè)組成型強(qiáng)啟動(dòng)子如CaMV 35S啟動(dòng)子,使轉(zhuǎn)錄因子大量表達(dá);如果待研究轉(zhuǎn)錄因子具有轉(zhuǎn)錄激活活性,則還可將其與一個(gè)外源的轉(zhuǎn)錄激活域相融合,如來(lái)自皰疹病毒的VP16-AD,使其激活活性增強(qiáng),從而促進(jìn)下游基因的大量表達(dá),相當(dāng)于將轉(zhuǎn)錄因子基因過(guò)量表達(dá)。2006年,Ichikawa等在模式植物擬南芥中建立了基因過(guò)量表達(dá)的高通量分析系統(tǒng)FOX-hunting system(Full-length cDNA Over-eXpressing gene hunting system)[27]。 FOX-hunting system首先創(chuàng)建待研究植物全長(zhǎng)cDNA文庫(kù),將均一化的全長(zhǎng)cDNA在擬南芥中過(guò)量表達(dá),篩選具有顯著表型變化的轉(zhuǎn)基因植株,再通過(guò)基因組PCR分離鑒定引起表型變化的基因,進(jìn)一步確定其功能[27-29]。擬南芥的FOX轉(zhuǎn)基因株系目前可通過(guò)RIKEN Plant Science Center獲得(http://pfgweb.psc.riken.jp/index.html)。Fujita等在研究大量轉(zhuǎn)錄因子時(shí)采用小規(guī)模的FOX-hunting system方法,將43種逆境誘導(dǎo)的轉(zhuǎn)錄因子全長(zhǎng)cDNA混合轉(zhuǎn)入擬南芥,在篩選到的耐鹽株系中鑒定出轉(zhuǎn)錄因子AtbZIP60的逆境信號(hào)轉(zhuǎn)導(dǎo)功能[30]。
圖1 轉(zhuǎn)錄因子調(diào)控活性的鑒定
35S啟動(dòng)子驅(qū)動(dòng)的某些對(duì)植物早期生長(zhǎng)發(fā)育起重要作用的轉(zhuǎn)錄因子會(huì)引起致死效應(yīng),這種情況下可采用基因誘導(dǎo)表達(dá)法,即將植物轉(zhuǎn)錄因子基因置于誘導(dǎo)型啟動(dòng)子下游,如酒精誘導(dǎo)啟動(dòng)子[31],目的基因只有在酒精誘導(dǎo)處理的條件下才會(huì)表達(dá),正常條件下不對(duì)植物生長(zhǎng)發(fā)育造成影響。也可將轉(zhuǎn)錄因子與激素受體系統(tǒng)相融合。如將植物轉(zhuǎn)錄因子與糖皮質(zhì)激素受體(glucocorticoid receptor,GR)或雌激素受體(estrogen,ER)相融合[32-33],無(wú)配體結(jié)合時(shí)轉(zhuǎn)錄因子活性受到抑制,施與此類激素后,轉(zhuǎn)錄因子活性得以恢復(fù)。
基因功能增加表型分析已在鑒定基因功能上得到廣泛應(yīng)用,但它也有一定的局限性。很多轉(zhuǎn)錄因子是以蛋白復(fù)合體的形式行使功能的,只過(guò)量表達(dá)其中一個(gè)蛋白質(zhì),植物不會(huì)產(chǎn)生明顯的表型變化。另外,轉(zhuǎn)錄因子的過(guò)量表達(dá)并不總是引起下游基因的變化,因?yàn)橛行┗虻谋磉_(dá)是轉(zhuǎn)錄因子和其他因素共同作用的結(jié)果。
與基因功能增加相比,基因功能缺失的表型能更好地體現(xiàn)基因的生理功能?;蚬δ苋笔蛔凅w通??赏ㄟ^(guò)插入法和反義RNA抑制法獲得。插入法是在目的基因中插入DNA片段,使其無(wú)法正常表達(dá),包括轉(zhuǎn)座子插入法、T-DNA插入法和同源重組插入法。最常見(jiàn)的是T-DNA插入法,目前擬南芥人工突變體中有很多是通過(guò)該法獲得的,這些突變體可通過(guò)擬南芥生物學(xué)資源中心(Arabidopsis Biologi?cal Resource Center,ABRC)或歐洲擬南芥種質(zhì)中心(European Arabidopsis Stock Centre,NASC)查詢并購(gòu)買。T-DNA插入的局限性是基因編碼區(qū)序列太短時(shí),T-DNA插入的幾率較小,插入非編碼區(qū)或內(nèi)含子區(qū)域時(shí)不一定會(huì)引起基因表達(dá)的完全缺失,只是使基因表達(dá)水平降低。反義RNA或RNA干擾(RNAi)技術(shù)是指將基因全部或部分的反向序列轉(zhuǎn)入植物,所表達(dá)的RNA與目的mRNA相配對(duì)形成雙鏈mRNA,從而導(dǎo)致mRNA的降解或抑制翻譯。
人工 miRNA(artificial microRNA,amiRNA)是近年興起的特異性引發(fā)基因沉默的有效方法[34-35],可用于抑制一個(gè)或幾個(gè)相關(guān)基因的表達(dá)。與傳統(tǒng)的RNAi相比,amiRNA來(lái)源于一個(gè)短的莖環(huán)結(jié)構(gòu),只產(chǎn)生一個(gè)單一的小RNA,能更加精準(zhǔn)地抑制靶基因的表達(dá)。目前已有軟件Web MicroRNA designer(http://weigelword.org)可用于amiRNA序列的設(shè)計(jì)[34]。
利用基因缺失來(lái)研究轉(zhuǎn)錄因子功能的最大挑戰(zhàn)是,某些同一家族的轉(zhuǎn)錄因子因具有相似的DNA結(jié)合域,可調(diào)控相同的下游基因的表達(dá),產(chǎn)生功能的冗余,單一基因的敲除很難產(chǎn)生明顯表型。嵌合抑制基因沉默技術(shù)(chimeric repressor gene-silencing technology,CRES-T)[36]可解決這一難題。CRES-T是在轉(zhuǎn)錄因子基因上融合一個(gè)經(jīng)過(guò)修飾的抑制結(jié)構(gòu)域,并使其過(guò)量表達(dá)。這個(gè)嵌合的轉(zhuǎn)錄因子結(jié)合到靶基因啟動(dòng)子上可以有效地抑制基因的轉(zhuǎn)錄,并且使結(jié)合到該啟動(dòng)子上的其他轉(zhuǎn)錄因子的激活作用失效,這相當(dāng)于敲除了結(jié)合到同一啟動(dòng)子區(qū)域的所有轉(zhuǎn)錄因子,得到明顯表型的幾率大大增加。當(dāng)然,對(duì)于抑制基因表達(dá)的植物轉(zhuǎn)錄因子,CRES-T技術(shù)是不適用的,抑制結(jié)構(gòu)域的嵌合對(duì)于具有抑制作用的轉(zhuǎn)錄因子實(shí)際上起到了基因功能增加的效果。
轉(zhuǎn)錄因子行使生理功能的過(guò)程十分復(fù)雜,涉及到所調(diào)控的靶基因、相關(guān)下游基因及與其他轉(zhuǎn)錄因子的相互作用。轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)的建立和組學(xué)研究的應(yīng)用,能使轉(zhuǎn)錄因子研究更加深入和系統(tǒng)。
在轉(zhuǎn)錄因子及其靶基因和相關(guān)的下游基因之間建立相互聯(lián)系的網(wǎng)絡(luò)系統(tǒng),能更全面清楚地了解轉(zhuǎn)錄因子的功能。傳統(tǒng)的遺傳學(xué)方法通過(guò)基因過(guò)表達(dá)或缺失突變體的異常表型來(lái)分析轉(zhuǎn)錄因子的功能,能夠使這些異常表型得以全部或部分恢復(fù)的基因就是與該轉(zhuǎn)錄因子密切相關(guān)的下游基因。如擬南芥FUL基因編碼MADS-box轉(zhuǎn)錄因子,ful突變體會(huì)表現(xiàn)出充滿種子的短角果性狀,如果將這個(gè)突變體中的 INDEHISCENT(IND)、SHATTERPROOF1(SHP1)和SHP2基因敲除,突變體的異常表型會(huì)在很大程度上得以修復(fù)。該修復(fù)現(xiàn)象表明ful突變體中IND、SHP1和SHP2基因的表達(dá)量升高,說(shuō)明IND、SHP1和SHP2基因是FUL轉(zhuǎn)錄因子調(diào)控的下游基因,且FUL對(duì)三者的表達(dá)具有抑制調(diào)控作用[37]。
酵母單雜交是一種高通量鑒定轉(zhuǎn)錄因子與靶基因之間關(guān)系的方法。根據(jù)轉(zhuǎn)錄因子與順式作用元件結(jié)合調(diào)控報(bào)告基因表達(dá)的原理,以一系列待研究的啟動(dòng)子中的順式作用元件為誘餌,篩選含有轉(zhuǎn)錄因子的cDNA文庫(kù)[38]。傳統(tǒng)酵母單雜交方法耗時(shí)費(fèi)力,且從啟動(dòng)子序列中確定順式作用元件十分復(fù)雜。Deplancke等對(duì)此法進(jìn)行了改良,以啟動(dòng)子中500 bp區(qū)域替代順式作用元件為誘餌,篩選只包含轉(zhuǎn)錄因子的cDNA文庫(kù),效率大大提高[39]。如擬南芥中CCA1 HIKING EXPEDITION/TCP21可直接調(diào)控CIRCADIAN CLOCK ASSOCIATED 1(CCA1)的表達(dá)就是通過(guò)該方法鑒定出來(lái)的[40]。這種改良的酵母單雜交方法在轉(zhuǎn)錄因子調(diào)控網(wǎng)絡(luò)研究中潛力巨大。
染色體免疫沉淀(chromatin immunoprecipita?tion,ChIP)是研究體內(nèi)蛋白質(zhì)與DNA相互作用的有效方法,可用于轉(zhuǎn)錄因子靶基因的篩選。ChIP是在活細(xì)胞狀態(tài)下用甲醛固定蛋白質(zhì)-DNA復(fù)合物,然后用酶切或超聲波把染色體分離并打碎為一定大小的片段,利用特異性的抗體結(jié)合染色體片段上轉(zhuǎn)錄因子,沉淀蛋白質(zhì)-DNA復(fù)合物,通過(guò)水解釋放復(fù)合體中DNA,得到目的DNA片段的序列信息。ChIP與基因芯片相結(jié)合的ChIP-chip技術(shù)應(yīng)用范圍更加廣泛,可用于轉(zhuǎn)錄因子靶基因的高通量篩選。將ChIP獲得的DNA序列與基因芯片雜交,可實(shí)現(xiàn)基因組范圍內(nèi)的靶基因啟動(dòng)子的篩選,如果有可能獲得專門應(yīng)用于ChIP-Chip技術(shù)中的啟動(dòng)子芯片,則篩選的效率更高[41-42]。
此外,還有一種嵌合轉(zhuǎn)錄因子技術(shù)也可用于靶基因的鑒定。在轉(zhuǎn)錄因子上融合一個(gè)激活域,如VP16-AD和一個(gè)誘導(dǎo)受體,如GR或ER,將融合基因轉(zhuǎn)入植物,用相應(yīng)的誘導(dǎo)激素處理轉(zhuǎn)基因植株,轉(zhuǎn)錄因子便會(huì)表現(xiàn)活性,促進(jìn)靶基因的表達(dá),同時(shí)與靶基因密切相關(guān)的下游基因的表達(dá)也會(huì)發(fā)生變化。用基因芯片技術(shù)對(duì)比分析激素處理前后基因轉(zhuǎn)錄水平,可以鑒定出靶基因和相關(guān)的下游基因,但這種情況下無(wú)法將靶基因和相關(guān)的下游基因區(qū)分開(kāi)來(lái)。如果用誘導(dǎo)激素和環(huán)己酰亞胺(cycloheximide,CHX,一種蛋白質(zhì)合成抑制劑)同時(shí)處理,則轉(zhuǎn)錄因子被激活,促進(jìn)靶基因的表達(dá),由于CHX的作用,新的蛋白質(zhì)無(wú)法合成,新形成的靶基因mRNA無(wú)法翻譯成蛋白質(zhì),由其引起的相關(guān)下游基因的表達(dá)不會(huì)受到影響[43]。用基因芯片技術(shù)對(duì)比分析處理前后基因的轉(zhuǎn)錄水平,即可獲得轉(zhuǎn)錄因子直接作用的靶基因的相關(guān)信息。
對(duì)模式植物擬南芥來(lái)說(shuō),還可以通過(guò)查詢相關(guān)數(shù)據(jù)庫(kù),如 AGRIS(Arabidopsis Gene Regulatory In?formation Server,http://arabidopsis.med.ohio-state.edu/)了解基因轉(zhuǎn)錄調(diào)控的相關(guān)信息。AGRIS數(shù)據(jù)庫(kù)包含擬南芥轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)(AtTFDB)、擬南芥順式作用元件數(shù)據(jù)庫(kù)(AtcisDB)和擬南芥調(diào)控網(wǎng)絡(luò)數(shù)據(jù)庫(kù)(AtRegNet)。其中AtTFDB和AtcisDB主要提供轉(zhuǎn)錄因子及其啟動(dòng)子的相關(guān)信息,而AtRegNet能分析轉(zhuǎn)錄因子與其靶基因的調(diào)控關(guān)系,并可繪制網(wǎng)絡(luò)圖譜。此外,AtRegNet還開(kāi)發(fā)了ReIN(Regulatory Networks Interaction Module)工具軟件(http://arabi?dopsis.med.ohio-state.edu/REIN),這個(gè)軟件可將上述3個(gè)數(shù)據(jù)庫(kù)的資料加以整合,并可根據(jù)用戶的要求計(jì)算并建立擴(kuò)展的基因調(diào)控網(wǎng)絡(luò)[44]。
組學(xué)研究?jī)?nèi)容龐大,包括基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白組學(xué)、代謝組學(xué)和表型組學(xué)等。在植物中,轉(zhuǎn)錄水平的調(diào)控對(duì)基因表達(dá)起重要作用,有些轉(zhuǎn)錄因子是多種重要生理活動(dòng)的關(guān)鍵調(diào)控因子,其基因突變會(huì)引起靶基因以外的調(diào)控網(wǎng)絡(luò)中大量基因的改變。通過(guò)轉(zhuǎn)錄組、蛋白質(zhì)組、代謝組及表型組的研究,可更全面地揭示轉(zhuǎn)錄因子的生理功能。進(jìn)一步將CRES-T、ChIP、基因芯片等技術(shù)應(yīng)用于組學(xué)研究,為轉(zhuǎn)錄因子功能分析提供了新的途徑。
[1]Paz-Ares J,Ghosal D,Wienand U,et al.The regulatory c1 locus of Zea mays encodes a protein with homology to myb proto-oncogene products and with structuralsimilarities to transcriptional activators[J].EMBO J,1987,6(12):3553-3558.
[2]Riechmann J L,Heard J,Martin G,et al.Arabidopsis tran?scription factors:genome-wide comparative analysis among eu?karyotes[J].Science,2000,290(5499):2105-2110.
[3]Finkelstein R R,Lynch T J.The Arabidopsis abscisic acid re?sponse gene ABI5 encodes a basic leucine zipper transcrip?tion factor[J].Plant Cell,2000,12(4):599-610.
[4]張全琪,朱家紅,倪燕妹,等.植物bHLH轉(zhuǎn)錄因子的結(jié)構(gòu)特點(diǎn)及其生物學(xué)功能[J].熱帶亞熱帶植物學(xué)報(bào),2011,19(1):84-90.
[5]Singh K,Foley R C,O?ate-Sánchez L.Transcription factors in plant defense and stress responses[J].Curr Opin Plant Bi?ol,2002,5(5):430-436.
[6]才華,朱延明,柏錫,等.野生大豆GsbZIP33基因的分離脅迫耐性分析[J].分子植物育種,2011,9(4):397-401.
[7]S?nderby I E,Burow M,Rowe H C,et al.A complex inter?play of three R2R3 MYB transcription factors determines the profile of aliphatic glucosinolates in Arabidopsis[J].Plant Physiol,2010,153(1):348-363.
[8]李宗艷,李名揚(yáng).調(diào)控植物類黃酮生物合成的轉(zhuǎn)錄因子研究進(jìn)展[J].南京林業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,35(5):129-134.
[9]Matys V,Fricke E,Geffers R,et al.TRANSFAC:transcrip?tionalregulation,from patterns to profiles[J].Nucleic Acids Res,2003,31(1):374-378.
[10]Ria?o-Pachón D M,Ruzicic S,Dreyer I,et al.PlnTFDB:an integrative plant transcription factor database[J].BMC Bioinfor?matics,2007,8:42.
[11]Pérez-Rodríguez P,Ria?o-Pachón D M,Corrêa L G,et al.PlnTFDB:updated content and new features of the plant tran?scription factor database[J]. Nucleic Acids Res, 2010,38:D822-D827.
[12]Mitsuda N,Ohme-Takagi M.Functional analysis of transcrip?tion factors in Arabidopsis[J].Plant Cell Physiol,2009,50(7):1232-1248.
[13]Gao G,Zhong Y,Guo A,et al.DRTF:a database of rice transcription factors[J].Bioinformatics,2006,22(10):1286-1287.
[14]Simon M,Lee M M,Lin Y,et al.Distinct and overlapping roles of single-repeat MYB genes in root epidermal patterning[J].Dev Biol,2007,311(2):566-578.
[15]Kagaya Y,Ohmiya K,Hattori T.RAV1,a novel DNA-bind?ing protein,binds to bipartite recognition sequence through two distinct DNA-binding domains uniquely found in higher plants[J].Nucleic Acids Res,1999,27(2):470-478.
[16]Quevillon E,Silventoinen V,Pillai S,et al.InterProScan:pro?tein domains identifier[J].Nucleic Acids Res,2005,33:W116-W120.
[17]Bailey T L,Williams N,Misleh C,et al.MEME:discovering and analyzing DNA and protein sequence motifs[J].Nucleic Acids Res,2006,34:W369-W373.
[18]Heazlewood JL,Verboom R E,Tonti-FilippiniJ,etal.SUBA:the Arabidopsis subcellular database[J].Nucleic Acids Res,2007,35:D213-D218.
[19]Emanuelsson O,Nielsen H,Brunak S,et al.Predicting subcel?lular localization of proteins based on their N-terminal amino acid sequence[J].J Mol Biol,2000,300(4):1005-1016.
[20]Hua S,Sun Z.Support vector machine approach for protein subcellular localization prediction[J].Bioinformatics,2001,17(8):721-728.
[21]Horton P,Park K J,Obayashi T,et al.WoLF PSORT:protein localization predictor[J].Nucleic AcidsRes,2007,35:W585-W587.
[22]Larue C T,Wen J,Walker J C.A microRNA-transcription factor module regulates lateral organ size and patterning in Arabidopsis[J].Plant J,2009,58(3):450-463.
[23]Zimmermann I M,Heim M A,Weisshaar B,et al.Comprehen?sive identification of Arabidopsis thaliana MYB transcription factors interacting with R/B-like BHLH proteins[J].Plant J,2004,40(1):22-34.
[24]Ohta M,Matsui K,Hiratsu K,et al.Repression domains of class II ERF transcriptional repressors share an essential mo?tif for active repression[J].Plant Cell,2001,13(8):1959-1968.
[25]黃澤軍,黃榮峰,黃大昉.植物轉(zhuǎn)錄因子功能分析方法[J].農(nóng)業(yè)生物技術(shù)學(xué)報(bào),2002,10(3):295-300.
[26]Ueki S,Lacroix B Krichevsky A,et al.Functional transient genetic transformation of Arabidopsis leaves by biolistic bom?bardment[J].Nat Protoc,2009,4(1):71-77.
[27]Ichikawa T,Nakazawa M,Kawashima M,et al.The FOX hunting system:an alternative gain-of-function gene hunting technique[J].Plant J,2006,48(6):974-985.
[28]耿微,高野哲夫,柳參奎.FOX Hunting System—一種新的基因功能篩選技術(shù)[J].分子植物學(xué)育種,2010,8(4):810-817.
[29]Higuchi M,Kondou Y,Ichikawa T,et al.Full-length cDNA overexpressorgene hunting system(FOX hunting system)[J].Methods Mol Biol,2011,678:77-89.
[30]Fujita M,Mizukado S,Fujita Y,et al.Identification of stress?tolerance-related transcription-factor genes via mini-scale full-length cDNA over-expressor(FOX)gene hunting system[J].Biochem Biophys Res Commun,2007,364(2):250-257.
[31]Peebles C A,Gibson S I,Shanks J V,et al.Characterization of an ethanol-inducible promoter system in Catharanthus roseus hairy roots[J].Biotechnol Prog,2007,23(5):1258-1260.
[32]Aoyama T,Chua N H.A glucocorticoid-mediated transcription?al induction system in transgenic plants[J].Plant J,1997,11(3):605-612.
[33]Zuo J,Niu Q W,Chua N H.Technical advance:An estrogen receptor-based transactivator XVE mediates highly inducible gene expression in transgenic plants[J].Plant J,2000,24(2):265-273.
[34]Schwab R,Ossowski S,Riester M,et al.Highly specific gene silencing by artificial microRNAs in Arabidopsis[J].Plant Cell,2006,18(5):1121-1133.
[35]Niu Q W,Lin S S,Reyes J L,et al.Expression of artificial microRNAs in transgenic Arabidopsis thaliana confers virus re?sistance[J].Nat Biotechnol,2006,24(11):1420-1428.
[36]Hiratsu K,Matsui K,Koyama T,et al.Dominant repression of target genes by chimeric repressors that include the EAR motif,a repression domain,in Arabidopsis[J].Plant J,2003,34(5):733-739.
[37]Liljegren S J,Roeder A H,Kempin S A,et al.Control of fruitpatterning in Arabidopsis by INDEHISCENT[J].Cell,2004,116(6):843-853.
[38]陳峰,李潔,張貴友,等.酵母單雜交的原理與應(yīng)用實(shí)例[J].生物工程進(jìn)展,2001,21(4):57-62.
[39]Deplancke B,Mukhopadhyay A,Ao W,et al.A gene-cen?tered C.elegans protein-DNA interaction network[J].Cell,2006,125(6):1193-1205.
[40]Pruneda-Paz J L,Breton G,Para A,et al.A functional ge?nomics approach reveals CHE as a component of the Arabi?dopsis circadian clock[J].Science,2009,323(5920):1481-1485.
[41]張娜,尹繼剛,孫高超,等.真核生物轉(zhuǎn)錄因子及其研究方法進(jìn)展[J].動(dòng)物醫(yī)學(xué)進(jìn)展,2009,30(1):75-79.
[42]李敏俐,王薇,陸祖宏.ChIP技術(shù)及其在基因組水平上分析DNA與蛋白質(zhì)相互作用[J].遺傳,2010,32(3):219-228.
[43]Samach A,Onouchi H,Gold S E,et al.Distinct roles of CONSTANS target genes in reproductive development of Ara?bidopsis[J].Science,2000,288(5471):1613-1616.
[44]Yilmaz A,Mejia-Guerra M K,Kurz K,et al.AGRIS:the Arabidopsis gene regulatory information server,an update[J].Nucleic Acids Res,2011,39:D1118-D1122.