国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

人類長鏈非編碼RNA相關(guān)SNP鑒定與功能預(yù)測的研究進展

2015-09-14 12:47龔靜柳純潔繆小平郭安源
生物技術(shù)通報 2015年11期
關(guān)鍵詞:基因組位點編碼

龔靜 柳純潔 繆小平 郭安源

隨著高通量測序技術(shù)的發(fā)展,人們發(fā)現(xiàn)人類基因組中絕大部分DNA可轉(zhuǎn)錄為RNA,但其中能夠編碼蛋白質(zhì)(Protein-coding)的DNA僅占全基因組很少一部分(約2%)[1],剩余絕大部分DNA也可以轉(zhuǎn)錄為不能翻譯成蛋白質(zhì)的RNA,即非編碼RNA(Non-coding RNA,ncRNA)[2]。 根 據(jù) RNA 長度,非編碼RNA又主要分為短鏈RNA(small RNA,smRNA)和長鏈非編碼RNA(Long non-coding RNA,lncRNA)。smRNA主要包括轉(zhuǎn)錄起始RNA(tiRNA,18 nt)、Piwi蛋 白 相 互 作 用 RNA(piRNA,26-31 nt)、微小 RNA(microRNA,22 nt)、小核仁 RNA(snoRNA,60-300 nt)等。lncRNA是一類長度大于200個核苷酸,不表現(xiàn)蛋白質(zhì)編碼潛能的RNA[3]。lncRNA作為一種ncRNA,一直被認(rèn)為是基因轉(zhuǎn)錄“噪音”而未受重視。然而,最近的研究表明,lncRNA在正常發(fā)育和疾病發(fā)生發(fā)展過程中都扮演著重要的角色,具有豐富的生物學(xué)功能:參與X染色體的失活[4],調(diào)控mRNA的降解[5],參與造血系統(tǒng)及免疫應(yīng)答[6,7]、構(gòu)成細(xì)胞核亞結(jié)構(gòu)的結(jié)構(gòu)骨架[8],作為染色質(zhì)重塑(Chromatin remodeling)調(diào)控因子[9,10]等。

單核苷酸多態(tài)性(Single nucleotide polymorphism,SNP)是指在基因組DNA水平上發(fā)生的單個核苷酸變異所引起的DNA序列多態(tài)性[11,12]。隨著人類基因組計劃和千人基因組(1000 genome)項目的完成[12,13],人類基因組基本趨于完善。目前已知人類基因組大約有30億對堿基,其中可能發(fā)生變異的位點多達88 111767(NCBI dbSNP 142),平均每60個堿基就可能出現(xiàn)一個SNP。研究表明健康個體之間基因組堿基差異大約為0.1%,即兩個隨機個體中每1200-1500個堿基就會有一個差異堿基。這些SNPs不僅是造成健康個體間差異的重要因素,而且大量研究還證實,有些SNP與疾病易感性、藥物敏感性及疾病發(fā)生發(fā)展都有關(guān)系[14,15]。隨著SNP分型技術(shù)的發(fā)展,SNP標(biāo)記的發(fā)現(xiàn)和定位越來越多。相對于以限制性片段長度多態(tài)性為代表的第一代遺傳標(biāo)記和微衛(wèi)星多態(tài)性為代表的第二代遺傳標(biāo)記,SNP具有分布廣泛、數(shù)量多等特點,成為了第三代遺傳標(biāo)記,更加適合于基因性狀及疾病的研究[16]。

既然lncRNA不是垃圾基因,那么lncRNA上的SNP也有可能通過改變lncRNA的功能而成為功能性SNP?;谶@個假設(shè),很多研究者展開了一系列工作并取得了一定的成果。本文擬對這些lncRNA相關(guān)SNP文獻進行綜述,介紹lncRNA相關(guān)SNP的鑒定與功能預(yù)測方法以及相關(guān)生物信息數(shù)據(jù)庫,供相關(guān)研究者參考,以期能夠為研究lncRNA提供新的策略。

1 SNP常用研究方法

目前國內(nèi)外SNP研究方法大致有如下三種。

1.1 分子流行病學(xué)研究

可分為全基因組關(guān)聯(lián)分析(Genome-wide associ-ation study,GWAS)和候選基因策略。其中,GWAS是以全基因組SNP標(biāo)記為研究內(nèi)容進行病例-對照關(guān)聯(lián)分析,以期發(fā)現(xiàn)影響疾病或者復(fù)雜性狀遺傳特征的一種策略,該方法在研究性狀相關(guān)SNP方面已取得了重大成果。美國國家人類基因組研究所(NHGRI)對所有發(fā)表的GWAS文獻進行整理,建立了一個在線實時更新網(wǎng)站(NHGRI GWAS Catalog,https://www.genome.gov/26525384, 現(xiàn) 已 移到EBI http://www.ebi.ac.uk/gwas/),可以按照疾病方便地下載GWAS鑒定的SNP[17]。截止2015年2月,該數(shù)據(jù)庫已收錄了15 000多個與各種性狀相關(guān)的SNP,這些性狀既包括單基因疾病,也包括癌癥、肥胖癥、糖尿病、精神分裂癥、高血壓、老年癡呆癥等復(fù)雜疾?。?8-21]。這些SNP有助于確定基因多態(tài)性與疾病的關(guān)系,解釋個體間表型差異對疾病易感程度,研究不同基因型個體對藥物反應(yīng)差異和指導(dǎo)藥物開發(fā)及臨床合理用藥等。然而,GWAS也存在一定的局限性。雖然GWAS成本有所下降,但仍需耗費大量精力和經(jīng)費。另外,GWAS也并非對所有SNP進行研究,而是先根據(jù)單體型圖譜和連鎖不平衡關(guān)系在全基因組范圍內(nèi)選擇標(biāo)簽SNP(tagSNP),其實驗所發(fā)現(xiàn)的疾病相關(guān)SNP只能代表其連鎖的區(qū)域與疾病有關(guān)系,而真正的“致病”遺傳變異(Causal genetic variants)還有待進一步精細(xì)分析。因此,仍有很多研究者采用候選基因和候選通路策略進行分子流行病學(xué)研究。在GWAS研究還未興起時,傳統(tǒng)的篩選策略發(fā)揮了重要作用,發(fā)現(xiàn)了大量疾病相關(guān)SNP。在后GWAS時代,很多研究者把GWAS發(fā)現(xiàn)的易感區(qū)域作為候選位點,然后對該區(qū)域進行精細(xì)定位或者功能實驗,并獲得了重要的研究成果。

1.2 SNP相關(guān)的生物信息學(xué)研究

生物信息學(xué)(Bioinformatics)作為一門交叉學(xué)科,在SNP的鑒定、注釋、儲存、功能預(yù)測等各個方面發(fā)揮重要功能。如 SAMtools[22]、GATK[23]工具可以從全基因組DNA測序和外顯子DNA測序中鑒定SNP ;ANNOVAR[24]、SIFT[25]、SNPinfo[26]工具 可以對SNP進行注釋,尋找其潛在的功能;dbSNP用于SNP的儲存;plink[27]工具用于SNP與疾病相關(guān)性的分析,miRNASNP[28]、PolymiRTS[29]數(shù)據(jù)庫可以方便地搜索miRNA相關(guān)的數(shù)據(jù)庫等。

1.3 SNP功能實驗

無論是人群研究得到的疾病相關(guān)位點還是生物信息學(xué)預(yù)測的功能性SNP,最終都需要通過分子生物學(xué)實驗探索其具體的生物作用機制。最常用的方法是構(gòu)建野生型和變異型載體,將其轉(zhuǎn)染于細(xì)胞,通過熒光素酶報告基因?qū)嶒烌炞CSNP對基因表達水平的影響,運用RT-PCR,Western blot等方法檢測野生型和變異型細(xì)胞中靶基因mRNA和蛋白質(zhì)表達水平。同時還可以觀察轉(zhuǎn)染后細(xì)胞的生物學(xué)特性的變化:細(xì)胞生長與增殖、細(xì)胞凋亡與細(xì)胞周期分布、細(xì)胞遷移能力等。

2 分子流行病學(xué)發(fā)現(xiàn)的lncRNA相關(guān)SNP

H19基因是最早被發(fā)現(xiàn)的有功能的lncRNA之一,位于人染色體11p15.5,編碼一個2.3 kb的lncRNA。Petry等[30]選取了H19基因上的3個SNP位點,對一個出生隊列中的1696名兒童、822名母親和661名父親進行基因分型。結(jié)果顯示,孩子和母親的H19 2992 C>T SNP基因型與子代出生體重(P=0.03)相關(guān)。母親的基因型也與臍帶血IGF-II 水平相關(guān)(P=0.0003)。Verhaegh 等[31]通過Haploview軟件在H19基因和上游啟動子區(qū)選擇了5個tagSNP,通過病例對照研究,并使用邏輯回歸分析來評估這些SNPs與癌癥風(fēng)險的關(guān)聯(lián),最終發(fā)現(xiàn)rs2839698 TC(OR=0.60,95% CI=0.36-0.99)基 因型可以明顯減少膀胱癌的發(fā)病風(fēng)險。

HOX轉(zhuǎn)錄反義RNA(HOX transcript antisense RNA,HOTAIR)是另一個研究較多的lncRNA。HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募結(jié)合多梳蛋白抑制復(fù)合物2(polycomb repressive complex 2,PRC2), 借 助 PRC2上 3個H3K27 甲 基 轉(zhuǎn) 移 酶 EZH2、SUZ12 和 EED[9], 使另一基因座HOXD上長約40 kb序列轉(zhuǎn)錄沉默,從而使乳腺上皮細(xì)胞傾向于胚胎成纖維細(xì)胞樣表型。HOTAIR上SNP在不同樣本中的病例-對照研究發(fā)現(xiàn),HOTAIR基因上的rs920778與乳腺癌[32]、食管癌[33]、胃癌[34]的發(fā)病風(fēng)險都相關(guān)。在中國濟南和淮安人群中,rs920778 TT攜帶者是CC攜帶者患胃癌風(fēng)險的1.66倍和1.87倍。在中國濟南、石家莊、淮安地區(qū)的人群中,rs920778 TT攜帶者比CC攜帶者患食管癌的風(fēng)險高1.37倍、1.78倍和2.08倍。

3 生物信息學(xué)在lncRNA相關(guān)SNP中的應(yīng)用

lncRNA SNP的確在疾病的發(fā)生發(fā)展中扮演重要角色,那么如何全面地挖掘lncRNA相關(guān)SNP,以及如何在眾多l(xiāng)ncRNA相關(guān)的SNP中篩選一定數(shù)量SNP進行功能實驗還需要借助生物信息學(xué)方法。下面就將生物信息學(xué)在lncRNA相關(guān)SNP中的應(yīng)用展開詳細(xì)綜述。

3.1 lncRNA數(shù)據(jù)資源

lncRNA數(shù)量越多,相關(guān)SNP數(shù)量也越多,選擇不同的lncRNA數(shù)據(jù)庫也會影響SNP的鑒定數(shù)目。因此,我們先對目前可用的lncRNA相關(guān)數(shù)據(jù)庫進行綜述。早期發(fā)現(xiàn)的lncRNA分散在NCBI GenBank、UCSC、Ensembl這些大型數(shù)據(jù)庫中,RNAdb是最早出現(xiàn)的系統(tǒng)性收集ncRNA的數(shù)據(jù)庫,該數(shù)據(jù)庫包含了800多條實驗驗證的ncRNAs以及從人和老鼠的cDNA 中預(yù)測了 20 000多條 ncRNA[35]。lncRNAdb是最早從文獻中人工收集真核生物中l(wèi)ncRNA信息的數(shù)據(jù)庫[36],而GENCODE相對來說是使用較多的一個含有l(wèi)ncRNA數(shù)據(jù)的網(wǎng)站,最新的版本(v22)已含有15 900條lncRNA基因,27 670條長非編碼轉(zhuǎn)錄本[37]。另外一個常用的資源,LNCipedia含有32108條注釋的人類lncRNA轉(zhuǎn)錄本[38],這個數(shù)據(jù)庫預(yù)測了每個轉(zhuǎn)錄本的二級結(jié)構(gòu)及編碼蛋白質(zhì)的可能性;基于蛋白組學(xué)實驗,該數(shù)據(jù)庫還開發(fā)了一個流程用于預(yù)測lncRNA開放閱讀框。NONCODE是中國科學(xué)院生物物理研究所和計算所開發(fā)的一個ncRNA在線資源,現(xiàn)在已更新到V4版本[39,40]。它不僅提供各個轉(zhuǎn)錄本的序列信息,還提供了lncRNA在每個組織的表達量信息。目前NONCODE V4版本中,人類lncRNA基因數(shù)量已有54 073條,轉(zhuǎn)錄本數(shù)量有92343條,小鼠的lncRNA數(shù)量已有46 475條,轉(zhuǎn)錄本數(shù)量有67 628條。lncRNAMap數(shù)據(jù)庫廣泛收集了各個公共資源的RNA-seq數(shù)據(jù),然后用自主開發(fā)的流程進行l(wèi)ncRNA注釋及表達量的計算[41]。該網(wǎng)站提供了不同組織、細(xì)胞系和疾病狀態(tài)下的lncRNA表達信息,以及miRNA-lncRNA相互作用關(guān)系。另外兩個數(shù)據(jù)庫lncRNome[42]和Functional lncRNA[43]數(shù)據(jù)庫通過整合其他數(shù)據(jù)庫資源預(yù)測lncRNA功能。lncRNome含有18 000個人類的lncRNA轉(zhuǎn)錄本,提供的注釋信息包括基因序列、轉(zhuǎn)錄本序列、RNA加工信息、miRNA結(jié)合位點和lncRNA啟動子區(qū)域的表觀修飾信息。該數(shù)據(jù)庫也把遺傳變異的信息加入其中,構(gòu)建了一個基因組瀏覽頁面。Functional lncRNA數(shù)據(jù)庫包含3個子數(shù)據(jù)庫,人工收集了人、小鼠、大鼠的lncRNA信息。除了直接提供lncRNA序列信息的數(shù)據(jù)庫外,許多其它功能的lncRNA數(shù)據(jù)庫也被隨之開發(fā)出來,例如提供表達譜信息、RNA相互作用信息或者提供相關(guān)疾病信息。Starbase v2.0[44](lncRNABase)通過整合大量高通量測序數(shù)據(jù)挖掘RNA/RNA、RNA/蛋白質(zhì)相互作用位點,提供了超過10 000條miRNA-lncRNA相互作用信息。NED網(wǎng)站包含了lncRNA的基因芯片、原位雜交表達量信息、進化保守性及二級結(jié)構(gòu)等信息[45]。

3.2 lncRNA上SNP鑒定

通過比較SNP和lncRNA基因在基因組上的位置,可確定lncRNA上的SNP。lncRNASNP數(shù)據(jù)庫[46](http ://bioinfo.life.hust.edu.cn/lncRNASNP/)是本課題組構(gòu)建的一個lncRNA相關(guān)SNP及其可能功能影響的數(shù)據(jù)庫,其lncRNA數(shù)據(jù)來源于LNCipedia數(shù)據(jù)庫,包括17 436條人類lncRNA基因的32108條轉(zhuǎn)錄本(基因組版本:GRCh37/hg19)。SNP信息來自NCBI dbSNP數(shù)據(jù)庫v138版本。lncRNASNP數(shù)據(jù)庫在lncRNA的外顯子區(qū)域一共發(fā)現(xiàn)了495 729個SNPs。

3.3 lncRNA上SNP功能預(yù)測

3.3.1 SNP對lncRNA二級結(jié)構(gòu)的影響 DNA中SNP的存在導(dǎo)致改變RNA的序列,從而影響RNA的二級結(jié)構(gòu)和高級結(jié)構(gòu)。部分lncRNAs在生物學(xué)過程中扮演支架的角色[3],因此形成正確的空間結(jié)構(gòu)是lncRNAs發(fā)揮功能的基礎(chǔ)。有研究者推斷l(xiāng)ncRNA上的SNP可能影響lncRNA二級結(jié)構(gòu)及其穩(wěn)定性,從而影響lncRNA的表達和功能[47]。常用的RNA二 級 結(jié) 構(gòu) 預(yù) 測 軟 件 有 RNAfold[48]、RNAsoft[49]、Mfold[50]等。lncRNASNP數(shù)據(jù)庫使用 RNAfold預(yù)測lncRNA外顯子上所有SNP對lncRNA二級結(jié)構(gòu)的影響。對于每個SNP,把SNP相應(yīng)位置的堿基由參考基因型轉(zhuǎn)為另一等位基因型,得到突變型轉(zhuǎn)錄本。使用RNAfold對野生型和突變型轉(zhuǎn)錄本進行二級結(jié)構(gòu)預(yù)測,得到預(yù)測的二級結(jié)構(gòu)圖和最小自由能(MFE,ΔG)。ΔΔG=|ΔG 突變 -ΔG 野生 |,即為每個 SNP 造成的能量改變。分析的結(jié)果顯示,SNP造成的平均能量變化為(1.30±1.62)kcal/mol,前10%的能量變化是3.10 kcal/mol。

3.3.2 SNP對miRNA lncRNA相互作用的影響 大量實驗證據(jù)都表明,miRNA也可以在轉(zhuǎn)錄后水平調(diào)控lncRNA的表達或者lncRNA通過與miRNA結(jié)合影響miRNA對靶基因的調(diào)控。Starbase數(shù)據(jù)庫提供了超過10 000條miRNA-lncRNA相互作用信息。miRNA能夠調(diào)控RNA主要取決于miRNA 5'端前8個堿基與靶基因結(jié)合的自由能[51]。如果miRNA與靶基因結(jié)合位點上的SNPs能夠引起自由能的顯著改變或其二級結(jié)構(gòu)的改變,將會影響miRNA與靶序列的有效結(jié)合。對于編碼基因,已有多個數(shù)據(jù)庫系統(tǒng)地預(yù)測了編碼基因3'UTR上影響miRNA與靶基因結(jié)合的 SNP,如 miRNASNP[28]、MicroSNiPer[52]、RNASNP[53]、PolymiRTS[29]、miRdSNP[54]、MirSNP[55],而對于非編碼基因,系統(tǒng)性的數(shù)據(jù)庫還比較少。系統(tǒng)研究影響miRNA與靶基因結(jié)合SNP的方法大致為:(1)選取要研究的基因并獲得其基因組位置(編碼基因或非編碼基因),然后把SNP數(shù)據(jù)比對到這些基因上。(2)對基因上的SNP,截取SNP上下游的基因序列,根據(jù)SNP的等位基因型,得到野生型轉(zhuǎn)錄本和變異型轉(zhuǎn)錄本。(3)利用miRanda[56]、Diana-MicroT[57]、PicTar[58]、TargetScan[56]、MicroInspector[59]等軟件預(yù)測野生型轉(zhuǎn)錄本和變異型轉(zhuǎn)錄本上可能存在的miRNA結(jié)合位點。(4)比較野生型轉(zhuǎn)錄本和變異型轉(zhuǎn)錄本miRNA結(jié)合情況,得到可能影響miRNA與靶基因結(jié)合的SNP。lncRNASNP用miRanda和TargetScan兩種預(yù)測方法分別對lncRNA上的SNP及其上下游25bp的序列進行miRNA靶位點的分析,預(yù)測了大量可能影響miRNA-lncRNA結(jié)合的SNP。多數(shù)SNP既能造成某些miRNA與lncRNA的結(jié)合喪失,同時又能獲得一些新的miRNA結(jié)合位點。lncRNASNP一共預(yù)測262154個SNP可能導(dǎo)致miRNA與lncRNA的結(jié)合喪失,280 012個SNP可能獲得新的miRNA與lncRNA結(jié)合。由于預(yù)測的功能性SNP眾多,該數(shù)據(jù)庫還對SNP設(shè)置了一系列篩選條件。用戶可以根據(jù)SNP所在序列的保守性,miRNA的表達量,影響的miRNA lncRNA結(jié)合實驗支持與否進行篩選。目前人類注釋的miRNA已有2000多條,但是在單個樣本中,每個miRNA的表達量高低不等,約21%的miRNA表達量占總量的90%。剩下的79%表達量很小或者只在特別的組織或者細(xì)胞狀態(tài)下才表達[60]。在研究特定組織時,我們可以只選擇該組織相對高表達的miRNA靶位點上的SNP。對于低表達或者不表達的miRNA,即使存在預(yù)測的功能性SNP,在實際條件中,發(fā)揮的功能也非常有限。

3.4 GWAS與lncRNA SNP

如前文介紹的美國國家人類基因組研究所(NHGRI)對所有發(fā)表的GWAS文獻進行整理,收集了所有基因分型分析P<1×10-5的SNP,并對這些SNP進行了簡單分類,分析(截止到2015年4月7日)發(fā)現(xiàn),大部分GWAS相關(guān)SNP都位于基因間區(qū)和內(nèi)含子區(qū),只有很小一部分位于已知基因的編碼區(qū)(圖1)。如何解析這些非編碼區(qū)的SNP功能是后GWAS研究的一個難點。隨著被發(fā)現(xiàn)的lncRNA日益增加及其功能注釋的越來越多,研究者逐漸把目光投到lncRNA上。早在2011年,Jin等[61]就在GWAS Catalog網(wǎng)站整理的1998個疾病易感區(qū)域中發(fā)現(xiàn)52個易感位點是在lncRNA區(qū)域,風(fēng)險位點在lncRNA上的富集程度(lncRNA上的風(fēng)險位點/lncRNA的總長度)是整個基因組(所有風(fēng)險位點/基因組總長度)的1.5倍,并且發(fā)現(xiàn)這種富集在前列腺癌中更為明顯。當(dāng)時GWAS Catalog收集了33個前列腺癌的獨立風(fēng)險位點,其中有8個在lncRNA基因上。Jin等[61]接下來在兩個前列腺癌GWAS研究中重新觀察lncRNA相關(guān)的SNP與前列腺癌的易感相關(guān)性,發(fā)現(xiàn)93個lncRNA上的SNP與前列腺癌的患病風(fēng)險相關(guān)(P<0.001)。其中有60個落在以前報告的區(qū)域,另外33個SNP分布在10個LD區(qū)域(Linkage disequilibrium region)。對10個LD區(qū)域中各選擇一個SNP進行人群驗證,發(fā)現(xiàn)rs3787016與前列腺癌的發(fā)病風(fēng)險顯著相關(guān),合并人群分析的P值達到7.22E-7。

lncRNASNP利用GWAS Catalog數(shù)據(jù)(截止2014年5月,13 383個疾病相關(guān)tagSNP),發(fā)現(xiàn)142個GWAS鑒定的tagSNP是落在lncRNA基因上,這些SNP涉及到多種疾病。同時也對tagSNP在不同人種中的LD區(qū)域的SNP進行分析,發(fā)現(xiàn)有更多的SNP落在lncRNA區(qū)域。

圖1 GWAS鑒定的SNP在基因組上的區(qū)域分布

3.5 疾病與lincRNA SNP

根據(jù)在基因組上與蛋白編碼基因的相對位置關(guān)系,lncRNA又可分為不同的5個亞類:正義長非編碼RNA、反義長非編碼RNA、雙向的長非編碼RNA、內(nèi)含子長非編碼RNA和基因間長鏈非編碼RNA。其中基因間長鏈非編碼RNA(Long intergenic non-coding RNA,lincRNA)是研究得較多的一類lncRNA。2014年,Li等[62]從6個數(shù)據(jù)庫收集了人類128 407個疾?。ū硇停┫嚓P(guān)的SNP,然后把這些SNP比對到5 700條人類lincRNA,發(fā)現(xiàn)11631個SNP可以比對到3 323條人類的lincRNA上或者其上下游10 kb區(qū)域。進一步把疾病相關(guān)SNP所在的LD區(qū)域中的所有SNP也納入分析,他們發(fā)現(xiàn)了128 785個在lincRNAs附近。他們的研究表明約1/3的lincRNA附近含有疾病相關(guān)的SNP,有些lincRNA甚至包含多達6個疾病相關(guān)SNP。

4 展望

目前,對于lncRNA相關(guān)SNP的研究還處于起始階段。雖然有一些數(shù)據(jù)庫對lncRNA上的SNP進行了系統(tǒng)性的挖掘,但對這些SNP的潛在功能分析還非常有限。除了SNP對lncRNA基因二級結(jié)構(gòu)和miRNA lncRNA結(jié)合的影響外,lncRNA上還可能存在其他功能性SNP,如lncRNA上游也存在許多基因修飾位點和轉(zhuǎn)錄因子結(jié)合位點,這些區(qū)域的SNP也有可能影響lncRNA的基因轉(zhuǎn)錄。另外,lncRNA的功能中包括與miRNA相互結(jié)合和與其它DNA/RNA結(jié)合,因此,理論上還會存在很多非lncRNA上的SNP可能影響lncRNA的功能。例如,在miRNA相關(guān)SNP的研究中,學(xué)者不僅關(guān)注miRNA基因上的SNP,miRNA靶基因上的SNP常常也是研究的重點。最后,lncRNA上SNP功能的實現(xiàn)主要還與lncRNA本身的功能有關(guān),而lncRNA又具有類型多、作用模式多和數(shù)量多的特點,目前對lncRNA進行完善注釋的非常少。因此,研究lncRNA及相關(guān)SNP在疾病中的作用機制,是未來的重要研究方向之一。

[1]Qi P, Du X. The long non-coding RNAs, a new cancer diagnostic and therapeutic goldmine[J]. Modern Pathology:an Official Journal of theUnited States and Canadian Academy of Pathology, Inc, 2013,26(2):155-165.

[2]Birney E, Stamatoyannopoulos JA, Dutta A, et al. Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project[J]. Nature, 2007, 447(7146):799-816.[3]Mercer TR, Dinger ME, Mattick JS. Long non-coding RNAs:insights into functions[J]. Nature Genetics, 2009, 10(3):155-159.[4]Wutz A, Rasmussen TP, Jaenisch R. Chromosomal silencing and localization are mediated by different domains of Xist RNA[J].Nature Genetics, 2002, 30(2):167-174.

[5]Gong C, Maquat LE. lncRNAs transactivate STAU1-mediated mRNA decay by duplexing with 3'UTRs via Alu elements[J]. Nature,2011, 470(7333):284-288.

[6]Carpenter S, Aiello D, Atianand MK, et al. A long noncoding RNA mediates both activation and repression of immune response genes[J]. Science, 2013, 341(6147):789-792.

[7]Han BW, Chen YQ. Potential pathological and functional links between long noncoding RN As and hematopoiesis[J]. Science Signaling, 2013, 6(289):re5.

[8]Clemson CM, Hutchinson JN, Sara SA, et al. An architectural role for a nuclear noncoding RNA:NEAT1 RNA is essential for the structure of paraspeckles[J]. Molecular Cell, 2009, 33(6):717-726.

[9]Gupta RA, Shah N, Wang KC, et al. Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature, 2010, 464(7291):1071-1076.

[10]Tsai MC, Manor O, Wan Y, et al. Long noncoding RNA as modular scaffold of histone modification complexes[J]. Science, 2010,329(5992):689-693.

[11]Carlson CS, Eberle MA, Kruglyak L, et al. Mapping complex disease loci in whole-genome association studies[J]. Nature,2004, 429(6990):446-4 52.

[12]Abecasis GR, Altshuler D, Auton A, et al. A map of human genome variation from population-scale sequencing[J]. Nature, 2010,467(7319):1061-10 73.

[13]Abecasis GR, Auton A, Brooks LD, et al. An integrated map of genetic variation from 1, 092human genomes[J]. Nature, 2012,491(7422):56-65.

[14]Hovhannisyan Z, We iss A, Martin A, et al. The role of HLA-DQ8 beta57 polymorphism in the anti-gluten T-cell response in coeliac disease[J]. Nature, 2008, 456(7221):534-53 8.

[15]Hruska KS, LaMarca ME, Scott CR, et al. Gaucher disease:mutation and polymorphism spectrum in the glucocerebrosidase gene(GBA)[J]. Human Mutation, 2008, 29(5):567-583.

[16]Garvin MR, Sa itoh K, Gharrett AJ. Application of single nucleotide polymorphisms to non-model species:a technical review[J].Molecular Ecology Resources, 2010, 10(6):915-93 4.

[17]Welter D, MacArthur J, Morales J, et al. The NHGRI GWAS Catalog, a curated resource of SNP-trait associations[J]. Nucleic Acids Research, 2014, 42(Database issue):D1001-1006.

[18]Todesco M, Balasubramanian S, Hu TT, et al. Natural allelic variation underlying a major fitness trade-off in A rabidopsis thaliana[J]. Nature, 2010, 465(7298):632-636.

[19]Bochukova EG, Huang N, Keogh J, et al. Large, rare chromosomal deletions associated with severe early-onset obesity[J]. Nature,2010, 463(7281):666-670.

[20]Petukhova L, Duvic M, Hordinsky M, et al. Genome-wide association study in alopecia areata implicates both innate and adaptive immunity[J]. Nature, 2010, 466(7302):113-117.

[21]Lango Allen H, Estrada K, Lettre G, et al. Hundreds of variants clustered i n genomic loci and biological pathways affect human height[J]. Nature, 2010, 467(7317):832-838.

[22]Ramirez-Gonzalez RH, Bonnal R, Caccamo M, et al. Bio-samtools:Ruby bindin gs for SAMtools, a library for accessing BAM files containing high-throughput sequence alignments[J]. Source Code for Biology and Medicine, 2012, 7(1):6.

[23]McKenna A, Hanna M, Ba nks E, et al. The Genome Analysis Toolkit:a MapReduce framework for analyzing next-generation DNA sequencing data[J]. Genome Research, 2010, 20(9):1297-1303.

[24]Wang K, Li M, H akonarson H. ANNOVAR :functional annotation of genetic variants from high-throughput sequencing data[J].Nucleic Acids Research, 2010, 38(16):e164.

[25]Kumar P, Henikoff S, Ng PC. Predicting the effects of coding non-synonymous variants on protein function using the SIFT algorithm[J]. Nature Protocols, 2009, 4(7):1073-1081.

[26]Xu Z, Taylor JA. SNPinfo:integrating GWAS and candidate gene information into functional SNP selection for genetic association studies[J]. Nucleic Acids Research, 2009, 37(Web S erver issue):W600-605.

[27]Purcell S, Neale B, Todd-Brown K, et al. PLINK :a tool set for whole-genome association and population-based linkage analyses[J]. American Journal of Human Genetics, 2007, 81(3):559-575.

[28]Gong J, Tong Y, Zhang HM, et al. Genome-wide identification of SNPs in microRNA genes and the SNP effects on microRNA target binding and biogenesis[J]. Human Mutation, 2012, 33(1):254-263.

[29]Bhattacharya A, Ziebarth JD, Cui Y. PolymiRTS Database 3. 0:linking polymorphisms in microRNAs and their target sites with human diseases and biological pathways[J]. Nucleic Acids Res earch, 2014, 42(Database issue):D86-91.

[30]Petry CJ, Ong KK, Barratt BJ, et al. Common polymorphism in H19 associated with birthweight and cord blood IGF-II levels in humans[J]. BMC Genetics, 2005, 6:22.

[31]Verhaegh GW, Verkleij L, Vermeulen SH, et al. Polymorphisms in the H19 gene and the risk of bladder cancer[J]. EuropeanUrology, 2008, 5 4(5):1118-1126.

[32]Bayram S, Sumbul AT, Batmaci CY, et al. Effect of HOTAIR rs920778 polymorphism on breast cancer susceptibility and clinicopathologic features in a Turkish population[J].Tumour Biology:the journal of the International Society for Oncodevelopmental Biology and Medicine, 2015, 36(5):DOI: 10. 1007/s13277-014-3028-0.

[33]Zhang X, Zhou L, Fu G, et al. The identification of an E SCC susceptibility SNP rs920778 that regulates the expression of lncRNA HOTAIR via a novel intronic enhancer[J].Carcinogenesis, 2014, 35(9):2062-2067.

[34]Pan W, Liu L, Wei J, et al. A functio nal lncRNA HOTAIR genetic variant contributes to gastric cancer susceptibility[J]. Molecular Carcinogenesis, 2015:DOI: 10. 1002/mc. 22261.

[35]Pang KC, Stephen S, Engstrom PG, et al. RNAdb--a comprehensive mammalian noncoding RNA database[J]. Nucleic Acids Research, 2005, 33(Database issue):D125-130.

[36]Quek XC, Thomson DW, Maag JL, et al. lncRNAdb v2. 0:expanding the reference database for functional long noncoding RNAs[J]. Nucleic Acids Research, 2015, 43(Database issue):D168-173.

[37]Derrien T, Johnson R, Bussotti G, et al. The GENCODE v7 ca talog of human long noncoding RNAs:analysis of their gene structure,evolution, and expression[J]. Genome Research, 2012, 22(9):1775-1789.

[38]Volders PJ, Helsens K, Wang X, et al. LNCipedia:a database for annotated human lncRNA transcript sequences and structures[J]. Nucleic Acids Research, 2013, 41(Database issue):D246-251.

[39]Bu D, Yu K, Sun S, et al. NONCODE v3. 0:integrative annotation of long noncoding RNAs[J]. Nucleic Acids Research, 2012, 40(Database issue):D210-215.

[40]Xie C, Yuan J, Li H, et al. NONCODEv4:ex ploring the world of long non-coding RNA genes[J]. Nucleic Acids Research, 2014,42(Database issue):D98-103.

[41]Chan WL, Huang HD, Chang JG. lncRNAMap:a map of putative regulat ory functions in the long non-coding transcriptome[J].Computational Biology and Chemistry, 2014, 50:41-49.

[42]Bhartiya D, Pal K, Ghosh S, et al. lncRNome:a com prehensive knowledgebase of human long noncoding RNAs[J]. Database :the Journal of Biological Databases and Curation, 2013, 2013:bat034.

[43]Niazi F, Valadkhan S. Computational analysis of functional long noncoding RNAs reveals lack of peptide-coding capacity and parallels with 3’UTRs[J]. RNA, 2012, 18(4):825-843.

[44]Li JH, Liu S, Zhou H, et al. starBase v2. 0:decoding miRNA-ceRNA, m iRNA-ncRNA and protein-RNA interaction networks from large-scale CLIP-Seq data[J]. Nucleic Acids Research,2014, 42(Database issue):D92-97.

[45]Dinger ME, Pang KC, Mercer TR, et al. NRED :a database of long noncoding RNA expression[J]. Nucleic Acids Research, 2009,37(Database issue):D122-126.

[46]Gong J, Liu W, Zhang J, et al. lncRNASNP:a d atabase of SNPs in lncRNAs and their potential functions in human and mouse[J].Nucleic Acids Research, 2015, 43(Database issue):D181-186.

[47]Ding J, Lu Q, Ouyang Y, et al. A long noncoding RNA regulates photoperiod-sensitive male sterility, an essential component of hybrid rice[J]. Proceedings of the National Academy of Sciences of theUnited States of America, 2012, 109(7):2654-2659.

[48]Denman RB.Using RNAFOLD to predict the activity of small catalytic RNAs[J]. BioTechniques, 1993, 15(6):1090-1095.

[49]Andronesc u M, Aguirre-Hernandez R, Condon A, et al. RNAsoft:A suite of RNA secondary structure prediction and design software tools[J]. Nucleic Acids Research, 2003, 31(13):3416-3422.

[50]Zuker M. Mfold web server for nucleic acid folding and hybridization prediction[J]. Nucleic Acids Research, 2003, 31(13):3406-3415.

[51]Doench JG, Sharp PA. Specificity of microRNA target selection in translatio nal repression[J]. Genes &Development, 2004, 18(5):504-511.

[52]Barenboim M, Zoltick BJ, Guo Y, et al. MicroSNiPer:a web tool for prediction of SNP effe cts on putative microRNA targets[J].Human Mutation, 2010, 31(11):1223-1232.

[53]Sabarinathan R, Tafer H, Seemann SE, et al. The RNAsnp web server:predicting SNP effects on local RNA seco ndary structure[J]. Nucleic Acids Research, 2013, 41(Web Server issue):W475-479.

[54]Bruno AE, Li L, Kalabus JL, et al. miRdSNP:a database of disease-associated SNPs and microRNA target sites on 3’UTRs of human genes[J]. BMC Genomics, 2012, 13:44.

[55]Liu C, Zhang F, Li T, et al. MirSNP, a database of polymorphisms altering miRNA target sites, identifies miRNA-relate d SNPs in GWAS SNPs and eQTLs[J]. BMC Genomics, 2012, 13:661.

[56]Lewis BP, Burge CB, Bartel DP. Conserved seed pairing, often flanked by adenosines, indicates that thousands of human genes are microRNA targets[J]. Cell, 2005, 120(1):15-20.

[57]Paraskevopoulou MD, Georgakilas G, Kostoulas N, et al. DIANA-microT web server v 5. 0:service integration into miRNA functional analysis workflows[J]. Nucleic Acids Research, 2013,41(Web Server issue):W169-173.

[58]Krek A, Grun D, Poy MN, et al. Combinatorial microRNA target predictions[J]. Nature Genetics, 2005, 37(5):495-500.

[59]Rusinov V, Baev V, Minkov IN, et al. MicroInspector:a w eb tool for detection of miRNA binding sites in an RNA sequence[J].Nucleic Acids Research, 2005, 33(Web Server issue):W696-700.

[60]Gong J, Wu Y, Zhang X, et al. Comprehensive analysis of hum an small RNA sequencing data provides insights into expression profiles and miRNA editing[J]. RNA Biology, 2014, 11(11):1375-1385.

[61]Jin G, Sun J, Isaacs SD, et al. H uman polymorphisms at long noncoding RNAs(lncRNAs)and association with prostate cancer risk[J]. Carcinogenesis, 2011, 32(11):1655-1659.

[62]Ning S, Zhao Z, Ye J, et al. LincSNP:a database of linking disease-associated SNPs to human large intergenic non-coding RNAs[J]. BMC Bioinformatics, 2014, 15:152.

猜你喜歡
基因組位點編碼
鎳基單晶高溫合金多組元置換的第一性原理研究
牛參考基因組中發(fā)現(xiàn)被忽視基因
CLOCK基因rs4580704多態(tài)性位點與2型糖尿病和睡眠質(zhì)量的相關(guān)性
基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達圖像配準(zhǔn)
血清HBV前基因組RNA的研究進展
《全元詩》未編碼疑難字考辨十五則
子帶編碼在圖像壓縮編碼中的應(yīng)用
二項式通項公式在遺傳學(xué)計算中的運用*
Genome and healthcare
紫花白及基因組DNA提取方法的比較