孫奮勇
(同濟(jì)大學(xué)附屬第十人民醫(yī)院檢驗(yàn)科,上海 200072)
解碼基因組中的“暗物質(zhì)”
孫奮勇
(同濟(jì)大學(xué)附屬第十人民醫(yī)院檢驗(yàn)科,上海 200072)
長鏈非編碼RNA;功能;microRNA;疾病;診斷;治療
長鏈非編碼RNA(long noncoding RNA,lncRNA)是非編碼RNA家族的重要成員,因其數(shù)量、種類、功能狀況都不明確,又被稱作基因組中的“暗物質(zhì)”。本研究對(duì)其研究價(jià)值、作用的分子機(jī)制、與疾病的關(guān)系進(jìn)行了探討,重點(diǎn)分析了lncRNAs與非編碼RNA家族另一重要成員microRNA的相互關(guān)系,提出了lncRNAs調(diào)控microRNA功能的新假說。目前,關(guān)于lncRNA的研究才剛剛起步,相信不久的將來lncRNA會(huì)成為分子生物研究領(lǐng)域又一顆璀璨的明星。
20世紀(jì)物理學(xué)界最重要的發(fā)現(xiàn)之一,可能就是暗物質(zhì)了,這種難以觀察的物質(zhì)以極大的權(quán)重裹挾著熟知的“明物質(zhì)”的世界,動(dòng)搖著關(guān)于物質(zhì)世界的基本認(rèn)知與規(guī)律。21世紀(jì)初,生命科學(xué)領(lǐng)域中最偉大的發(fā)現(xiàn)毫無疑問是另一種形式的“暗物質(zhì)”:非編碼RNA。之所以稱為“暗物質(zhì)”,是因?yàn)槠鋽?shù)量,種類與功能均不明確,尚缺乏有效的研究手段,然而正是這些“暗物質(zhì)”,卻蘊(yùn)藏著調(diào)控細(xì)胞功能的巨大潛力。
過去10年中,基因組測序獲得的數(shù)據(jù)達(dá)到空前規(guī)模,讓我們對(duì)基因組有了更加深刻的認(rèn)識(shí)。但與所期待的結(jié)果大相徑庭,人、小鼠與線蟲的蛋白編碼基因數(shù)量并沒有太大的差異,有些低級(jí)的多細(xì)胞生命的編碼基因數(shù)量甚至少于單細(xì)胞生命個(gè)體[1]。似乎生物的復(fù)雜程度與編碼基因的數(shù)量沒有明顯的相關(guān)性。那么,生命的復(fù)雜程度究竟由基因組的什么特性來決定呢?有兩方面的證據(jù)似乎可以給出答案:(1)高度復(fù)雜的生命形式往往具有更加大量的非編碼轉(zhuǎn)錄本數(shù)量;(2)在哺乳動(dòng)物基因組中,mRNA只占全部轉(zhuǎn)錄本的2%,剩余98%是非編碼RNA[2]。這些轉(zhuǎn)錄本很可能在細(xì)胞生命活動(dòng)的各個(gè)環(huán)節(jié)中承擔(dān)了極其重要的作用。因此,必須重新思考非編碼RNA在細(xì)胞中的作用。
新一代測序技術(shù)的結(jié)果表明,基因組具有密集轉(zhuǎn)錄的特點(diǎn),其中80%的轉(zhuǎn)錄本為長鏈非編碼RNA(long noncoding RNA,lncRNAs)[3]。長期以來,這些lncRNAs被誤認(rèn)為是轉(zhuǎn)錄的“噪聲”,但有4點(diǎn)證據(jù)表明這些轉(zhuǎn)錄本可能直接參與了細(xì)胞功能的調(diào)控:(1)lncRNAs通常較長(一般大于2 kb,甚至超過100 kb),具有 mRNA樣結(jié)構(gòu),經(jīng)過剪接,具有polyA尾巴與啟動(dòng)子結(jié)構(gòu),分化過程中有動(dòng)態(tài)的表達(dá)與不同的剪接方式;(2)lncRNAs啟動(dòng)子同樣可以結(jié)合轉(zhuǎn)錄因子,如 Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2 與 p53[4],局部染色質(zhì)組蛋白同樣具有特征性的修飾方式與結(jié)構(gòu)特征;(3)大多數(shù)的lncRNAs在組織分化發(fā)育過程中,都具有明顯的時(shí)空表達(dá)特異性,如有人針對(duì)小鼠的1 300個(gè)lncRNAs進(jìn)行研究,發(fā)現(xiàn)在腦組織中的不同部位,lncRNAs具有不同的表達(dá)模式[5];(4)在腫瘤與其他疾病中有特征性的表達(dá)方式。
學(xué)術(shù)界關(guān)于lncRNAs序列保守性的紛爭,一直是影響其功能評(píng)價(jià)的主要矛盾焦點(diǎn)。有研究者認(rèn)為,雖然lncRNAs的序列保守性差,卻具有高度保守的結(jié)構(gòu)特征,而RNA與蛋白質(zhì)的作用主要依賴一些特殊的結(jié)構(gòu)域。2009年,Calin等關(guān)于lincRNA的報(bào)道堪稱非編碼RNA研究領(lǐng)域的里程碑,他們通過對(duì)轉(zhuǎn)錄基因的染色質(zhì)組蛋白的甲基化修飾進(jìn)行高通量解析,分別發(fā)現(xiàn)小鼠與人類基因組中有1 600與3 000種基因間lncRNAs,具有高度保守的序列特性與調(diào)控基因表達(dá)的功能[6]。
目前,已知lncRNAs具有多種功能,其中最重要的是參與了編碼基因表達(dá)調(diào)控的表觀遺傳學(xué)機(jī)制。例如,Hox基因座位能夠轉(zhuǎn)錄數(shù)百種lncRNAs,決定了同源盒基因家族啟動(dòng)子局部染色質(zhì)開放狀態(tài)伴隨發(fā)育軸的時(shí)空特性而改變[7]。其中,由HOXC座位轉(zhuǎn)錄的lncRNA HOTAIR,能夠指導(dǎo)染色質(zhì)結(jié)構(gòu)調(diào)控蛋白PRC2與HOXD家族基因啟動(dòng)子的結(jié)合,抑制后者的轉(zhuǎn)錄。最新的研究表明,超過20%的基因間lincRNAs(large intergenic ncRNA,lincRNA)具有類似功能[8]。
lncRNAs也能直接調(diào)控靶基因的轉(zhuǎn)錄與蛋白的降解。例如,lncRNAs Evf2能夠激活轉(zhuǎn)錄因子Dlx2并招募其結(jié)合Dlx5啟動(dòng)子上的高度保守序列而誘導(dǎo)后者的表達(dá)[9]。Evf2敲除小鼠在發(fā)育早期發(fā)生明顯的GABA能神經(jīng)元數(shù)量的減少,揭示了Evf2在中樞神經(jīng)系統(tǒng)發(fā)育過程中的重要性[9]。再例如 p53 mRNA,除了可以作為翻譯模板,也能夠抑制泛素連接酶mdm2與P53蛋白的結(jié)合,抑制其泛素化降解。研究表明,一些mRNAs與p53 mRNA相似,具有某種特征性的結(jié)構(gòu),具有調(diào)節(jié)性RNA的功能[10]。
某些lncRNAs可能涉及細(xì)胞器的形成與細(xì)胞內(nèi)的轉(zhuǎn)運(yùn)。例如,lncRNAs NRON參與了轉(zhuǎn)錄因子NFAT從胞漿到胞核的轉(zhuǎn)運(yùn)過程[11],而 lncRNAs NEAT/MENε/β則參與了分化細(xì)胞核中亞單位區(qū)域的形成以及某些特殊mRNA的運(yùn)輸[12]。
多數(shù)lncRNAs具有mRNA樣結(jié)構(gòu),提示有可能與ncRNA家族另外一個(gè)重要的成員microRNA有相互作用的可能性。例如,人類染色質(zhì)上有一些在不同物種中極度保守的區(qū)域也能夠轉(zhuǎn)錄出lncRNAs,稱作UCRs(ultraconserved regions encoding ncRNAs),雖然其功能尚不明確,但與人類白血病有密切的關(guān)系,研究表明 miR-155,miR-24,miR-29b,miR-155 能夠靶向調(diào)控4種UCRs[13],促進(jìn)后者的降解。最近,發(fā)現(xiàn)在肝癌中過度表達(dá)的lncRNA HULC,能夠有效結(jié)合miR-372,抑制其與下游靶基因的結(jié)合以促進(jìn)細(xì)胞增殖。籍此,首次提出miRNAs功能調(diào)控的新機(jī)制[14]。Steilz等發(fā)現(xiàn)了極其相似的情況,Herpesvirus saimiri病毒能夠轉(zhuǎn)錄兩種ncRNA HSUR1與HSUR2,結(jié)合宿主細(xì)胞表達(dá)的miR-27a與miR-142-3p,并抑制其功能[15]。β-secreatase的編碼基因BACE1座位能夠轉(zhuǎn)錄一條反義RNA,通過與BACE1 mRNA的3'UTR相結(jié)合,抑制miRNAs對(duì)mRNA的降解[16]。值得注意的是,lncRNAs與miRNA相互作用機(jī)制的提出,為其功能研究指明了新的方向。
越來越多的證據(jù)表明,lncRNAs至少在轉(zhuǎn)錄以及轉(zhuǎn)錄后翻譯水平兩個(gè)層面調(diào)控了蛋白編碼基因的表達(dá),包括一些關(guān)鍵基因。因此,很容易聯(lián)想到lncRNAs與疾病發(fā)生的關(guān)系。事實(shí)表明,lncRNAs表達(dá)的異常能夠?qū)е乱恍?fù)雜疾病的發(fā)生,例如:白血病、結(jié)腸癌、乳腺癌、肝癌、心肌梗死、Alzhemier?。?6]。雙鏈DNA結(jié)合蛋白PSF組成性地抑制原癌基因GAGE6的表達(dá),但是至少有5種lncRNAs能夠結(jié)合PSF而抑制其作用,導(dǎo)致GAGE6表達(dá)水平的增加而成瘤[17]。有研究在白血病細(xì)胞中鑒定到一種lncRNAs是抑癌基因p15的反義轉(zhuǎn)錄本,能夠調(diào)控p15啟動(dòng)子區(qū)域DNA與組蛋白的甲基化狀態(tài),影響p15的表達(dá)[18]。p21基因也具有相似功能的反義lncRNAs。上述結(jié)果提示,存在于數(shù)千種蛋白編碼基因座位上的反義轉(zhuǎn)錄本lncRNAs,極可能通過表觀遺傳學(xué)機(jī)制調(diào)控鄰近編碼基因的表達(dá)。甚至可以得出結(jié)論,導(dǎo)致腫瘤形成的“二次打擊”,很有可能包括lncRNAs的異常,并非只局限于編碼基因。
目前,流行的 GWAS(Genome-wide association study)技術(shù)加速了對(duì)lncRNA致病機(jī)制的認(rèn)識(shí),例如:GWAS研究表明,lncRNAs MIAT與心肌梗死有關(guān);由于染色體缺失導(dǎo)致了LUC7L多聚腺苷酸化的異常,能夠引起鄰近HBA2基因DNA甲基化水平的異常,是引發(fā)α-thalassemia的重要原因。FoxL2基因上游250 kb附近約7.4 kb的一段缺失與Blepharophimosis綜合征的形成密切相關(guān),研究表明這種缺失導(dǎo)致了一條未知功能的lncRNAs PISRT1的基因突變[19]。
有較多的lncRNAs被發(fā)現(xiàn)與疾病形成有關(guān),提示lncRNAs可能是一種有效的疾病診斷標(biāo)志。據(jù)報(bào)道,在前列腺癌組織中鑒定到23種內(nèi)含子lncRNAs與腫瘤的分化程度有密切關(guān)系;HULC在肝癌中呈現(xiàn)明顯的高表達(dá)趨勢,而且在患者血漿中也檢測到高水平的HULC,進(jìn)一步研究表明,正常的結(jié)腸組織與結(jié)腸癌中均不表達(dá)HULC,當(dāng)結(jié)腸癌轉(zhuǎn)移到肝臟中時(shí),則表達(dá)水平明顯增高[20]。有研究針對(duì)22個(gè)正常組織以及133種白血病與其他腫瘤組織進(jìn)行表達(dá)譜系分析,發(fā)現(xiàn)基因組極高保守區(qū)域的非編碼轉(zhuǎn)錄本UREs的表達(dá)水平與腫瘤的組織特異性有明顯的相關(guān)性[11]。
目前,利用lncRNAs作為腫瘤的分子靶點(diǎn)治療腫瘤的報(bào)道還十分罕見。但最近的研究表明乳腺癌細(xì)胞中高表達(dá)的HOTAIR能夠募集PcG蛋白至靶基因的啟動(dòng)子,導(dǎo)致局部的異染色質(zhì)化,抑制靶基因的表達(dá)水平,其中包括HOXD10,該基因具有抑制乳腺癌細(xì)胞轉(zhuǎn)移的重要作用[21]。針對(duì)HOTAIR進(jìn)行siRNA干擾,則能夠明顯抑制乳腺癌細(xì)胞的轉(zhuǎn)移。
lncRNA的研究才剛剛開始,隨著生命科學(xué)技術(shù)的不斷進(jìn)步,特別是新一代測序技術(shù)與基因芯片技術(shù)的廣泛應(yīng)用,將深刻認(rèn)識(shí)lncRNA的功能、機(jī)制,與細(xì)胞分化、組織發(fā)育、疾病形成的內(nèi)在聯(lián)系,相信隨著lncRNAs致病功能的不斷深入發(fā)掘,以其作為治療靶點(diǎn)的臨床實(shí)踐工作將有可能成為現(xiàn)實(shí)。
[1]Taft RJ,Pheasant M,Mattick JS.The relationship between non-protein-coding DNA and eukaryotic complexity[J].Bioessays,2007,29:288-299.
[2]Birney E,Stamatoyannopoulos JA,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447:799-816.
[3]Kapranov P,Cheng J,Dike S,et al.RNA maps reveal new RNA classes and a possible function for pervasive transcription[J].Science,2007,316:1484-1488.
[4] Loh YH,Wu Q,Chew JL,et al.The Oct 4 and Nanog transcription network regulates pluripotency in mouse embryonic stem cells[J].Nat Genet,2006,38:431-440.
[5]Mercer TR,Dinger ME,Sunkin SM,et al.Specific expression of long noncoding RNAs in themouse brain[J].Proc Natl Acad Sci USA,2008,105(2):716-721.
[6]Guttman M,Amit I,Garber M,et al.Chromatin signature reveals over a thousand highly conserved large non-coding RNAs in mammals[J].Nature,2009,458:223-227.
[7]Rinn JL,Kertesz M,Wang JK,et al.Functional demarcation of active and silent chromatin domains in human HOX loci by noncoding RNAs[J].Cell,2007,129:1311-1323.
[8]Dinger ME,Amaral PP,Mercer TR,et al.Long noncoding RNAs in mouse embryonic stem cell pluripotency and differentiation[J]. Genome Res,2008,18:1433-1445.
[9]Feng J,Bi C,Clark BS,et al.The Evf-2 noncoding RNA is transcribed from the Dlx-5/6 ultraconserved region and functions as a Dlx-2 transcriptional coactivator[J].Genes Dev,2006,20:1470-1484.
[10]Dinger ME,Pang KC,Mercer TR,et al.Differentiating protein-coding and noncoding RNA:challenges and ambiguities[J].PLoSComput Biol,2008,4:e1000176.
[11]Willingham AT,Orth AP,Batalov S,et al.A strategy for probing the function ofnoncoding RNAs finds a repressor of NFAT[J].Science,2005,309:1570-1573.
[12]Sasaki YT,Ideue T,Sano M,et al.MENepsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles[J].Proc Natl Acad Sci USA,2009,106(8):2525-2530.
[13]Calin GA,Liu C,F(xiàn)erracin M,et al.Ultraconserved regions encoding ncRNAs are altered in human leukemias and carcinomas[J].Cancer Cell,2007,12:215-229.
[14]Wang J,Liu X,Wu H,et al.CREB upregulates long non-coding RNA,HULC expression through interaction with microRNA-372 in liver cancer[J].Nucleic Acid Research,2010,38(16):5366-5383.
[15]Cazalla D,Yario T,Steitz JA.Down regulation of a host microRNA by a herpesvirus saimirinoncoding RNA[J].Science,2010,328(5985):1563-1566.
[16]FaghihiMA,Modarresi F,Khalil AM,etal.Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of β-secretase expression[J].Nature Medicine,2008,14:723-730.
[17]Li L,F(xiàn)eng T,Lian Y,et al.Role of human noncoding RNAs in the control of tumorigenesis[J].Proc Natl Acad Sci USA,2009,106:12956-12961.
[18]Yu W,Gius D,Onyango P,et al.Epigenetic silencing of tumour suppressor gene p15 by its antisense RNA[J].Nature,2008,451:202-206.
[19]D'Haene B,Attanasio C,Beysen D,et al.Diseasecausing 7.4 kb cis-regulatory deletion disrupting conserved non-coding sequences and their interaction with the FOXL2 promotor:implications for mutation screening[J].PLoSGenet,2009,5:e1000522.
[20]Matouk IJ, Abbasi I, Hochberg A, et al. Highly upregulated in liver cancer noncoding RNA is overexpressed in hepatic colorectal metastasis[J].Eur J Gastroenterol Hepatol,2009,21(6):688-692.
[21]Gupta RA,Shah N,Wang KC,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature,2010,464(7291):1071-1076.
R34
A
1008-0392(2011)01-0001-04
10.3969/j.issn1008-0392.2011.01.001
2010-11-01
上海市科委基礎(chǔ)研究重點(diǎn)項(xiàng)目(10JC1412800)
孫奮勇(1970—),男,博士,教授.E-mail:sunfenyong@263.net
同濟(jì)大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2011年1期