陳曉彤,趙文龍,孫林玉,王文濤,陳月琴
中山大學(xué)生命科學(xué)學(xué)院,廣東 廣州 510275
隨著人類基因組計劃的完成以及ENCODE 計劃的開展,科學(xué)家發(fā)現(xiàn),約75%的基因組可以產(chǎn)生 轉(zhuǎn) 錄 本(Derrien et al.,2012;Djebali et al.,2012)。早期對于蛋白質(zhì)編碼基因的鑒定和注釋主要集中在以ATG起始的能夠編碼至少100個氨基酸的多肽的ORF,因此過去普遍認為,能夠形成遺傳信息最終產(chǎn)物的蛋白質(zhì)編碼基因僅占整個基因組的2%,剩余的轉(zhuǎn)錄本構(gòu)成了非編碼RNA轉(zhuǎn)錄組(Derrien et al.,2012;Djebali et al.,2012;Guttman et al.,2013)。在非編碼RNA 轉(zhuǎn)錄組中,長鏈非編碼RNA 是數(shù)量最多的成員,在各種生物學(xué)過程中扮演了重要的角色,包括維持細胞干性、調(diào)控生長發(fā)育以及參與腫瘤發(fā)生發(fā)展等重大生命活動(Esteller,2011;Hangauer et al.,2013;Wang et al.,2013a;Iyer et al.,2015;Braz?o et al.,2016;Delás et al.,2017)。
隨著轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)等生物信息學(xué)技術(shù)發(fā)展,越來越多的研究表明,一些傳統(tǒng)上被認為不編碼蛋白的RNA 區(qū)域(包括長鏈非編碼RNA以及信使RNA(mRNA,messenger RNA )的5’和3’非翻譯區(qū)(UTR,untranslated region)等)實際上也存在開放閱讀框(ORF,open reading frame)(Orr et al.,2020)。這些開放閱讀框的長度通常小于300 nt(nucleotide),被稱為小開放閱讀框(Orr et al.,2020)。由核糖體印記技術(shù)(ribosome footprint pro‐filing)發(fā)展而來的翻譯組測序(Ribo-Seq,ribosome profiling sequencing),為發(fā)現(xiàn)新的翻譯模式提供了技術(shù)手段(Ingolia et al.,2012)。Ribo-Seq 結(jié)合質(zhì)譜技術(shù)(MS,mass spectrometry),許多sORF 被發(fā)現(xiàn)可以翻譯出長度通常小于100 個氨基酸的小肽(Slavoff et al.,2013)。這些長度短于100個氨基酸的小肽在生物體內(nèi)發(fā)揮重要功能,包括參與個體發(fā)育、肌肉收縮和DNA 修復(fù)等(Lu et al.,2004;Ma et al.,2014;Ma et al.,2016;Olexiouk et al.,2018)。
由于這些非編碼RNA 來源的小肽長期以來被認為并不存在,所以被稱為“幽靈蛋白質(zhì)組”(ghost proteome)或“隱藏的蛋白質(zhì)組”(hidden proteome)(Yang et al.,2019;Cardon et al.,2021)。當(dāng)前,功能性 sORF 的鑒定已成為基因組注釋中的主要挑戰(zhàn),本文將從非編碼RNA 來源小肽的鑒定方法、可編碼小肽的非編碼RNA 種類、小肽的功能等幾個方面來系統(tǒng)綜述這類新發(fā)現(xiàn)的小肽,重點論述這類小肽的功能機制,以期為非編碼RNA 來源小肽的系統(tǒng)鑒定、編碼規(guī)律和功能研究提供新視角。
小肽由于其肽段長度較短,容易降解等特點,難以被傳統(tǒng)翻譯分析方法所捕捉。因此,為了探尋當(dāng)前未注釋和未充分研究的“隱藏蛋白質(zhì)組”,需要更精準的鑒定方法。
翻譯起始的標準掃描模型認為,核糖體與RNA 5’帽結(jié)構(gòu)結(jié)合形成起始前復(fù)合體,該復(fù)合體在mRNA 上掃描,當(dāng)發(fā)現(xiàn)以起始密碼子AUG 為中心的Kozak序列后開始進行翻譯且多肽延伸,直至遇到終止密碼子結(jié)束翻譯,核糖體從轉(zhuǎn)錄本上脫落(Moteki et al.,2002;Sonenberg et al.,2009)。由于翻譯的場所在細胞質(zhì),而核內(nèi)的ncRNA 無法接觸翻譯機器,因此對于具有潛在翻譯能力的ncRNA 的初步篩選是尋找具有m7G 結(jié)構(gòu)且定位于胞質(zhì)的ncRNA(A)。(1)分析ncRNA 序列是否具有7-甲基鳥苷(m7G)帽子結(jié)構(gòu)以及Kozak 序列;(2)利用核質(zhì)分離以及熒光原位雜交(FISH,fluores‐cence in situ hybridization)實驗,檢測ncRNA 是否穩(wěn)定存在于細胞質(zhì)中。
除了標準掃描模型外,核糖體還存在泄露掃描、分流、通讀和內(nèi)部核糖體進入位點(IRES,internal ribosome entry site)等替代翻譯模式,研究發(fā)現(xiàn)多數(shù)真核生物的蛋白質(zhì)編碼基因缺乏最佳的Kozak區(qū)間序列,且翻譯可以在近源起始密碼子(CUG/GUG/ACG 等)處起始(Ivanov et al.,2011;Kearse et al.,2017;Yang et al.,2019;Cao et al.,2020)。Ribo-Seq 從多核糖體復(fù)合物中提取完整的RNA 轉(zhuǎn)錄物,并通過核酸酶處理降解未受核糖體結(jié)合保護的RNA 片段,因此可預(yù)測潛在的sORF(Olexiouk et al.,2018)。因此,通過結(jié)合Ribo-Seq 技術(shù)可以全局鑒定具有潛在翻譯能力的ncRNA。翻譯起始測序(TI-Seq,translation initia‐tion sequencing)通 過lactimidomycin(LTM)或harringtonine (HARR)等翻譯抑制劑誘導(dǎo)核糖體在起始密碼子處阻滯,可預(yù)測起始密碼子,特別是非經(jīng)典起始密碼子(Ingolia et al.,2012)(B)。
一些研究顯示ncRNA 本身可以通過結(jié)合核糖體發(fā)揮翻譯調(diào)控功能(Carrieri et al.,2012;Yoon et al.,2012;Tran et al.,2016)。因此,為了排除核糖體僅停留在ncRNA 上不進行翻譯的情況,需要進一步確認ncRNA 上的開放閱讀框是否能夠進行有效翻譯。通??刹捎靡韵路椒ǎ海?)生物信息學(xué)預(yù)測。通過RNA 編碼預(yù)測工具,例如sORFfinder(Hanada et al.,2010),PhyloCSF(Lin et al.,2011),CPAT(Wang et al.,2013b),CPC/CPC2(Kong et al.,2007;Kang et al.,2017),IRESite(Mokrejs et al.,2006),M6AMRFS(Qiang et al.,2018)等,尋找ncRNA 上潛在的開放閱讀框,并通過查找序列上下區(qū)間中的翻譯調(diào)節(jié)元件(如IRES、m6A修飾等)進行序列的編碼能力預(yù)測(圖1C);(2)保守性分析,功能編碼序列通常表現(xiàn)出較高的跨物種密碼子保守性,雖然lncRNA 保守性比mRNA 低,但通常具有功能活性的蛋白編碼ORF 序列保守性比較高,因此可以通過分析序列片段的保守性來尋找有效ORF(圖1D)。(3)轉(zhuǎn)錄組學(xué)分析。通過Ribo-Seq 測序技術(shù)可以檢測核糖體結(jié)合的ncRNA 轉(zhuǎn)錄本,進一步的生物信息學(xué)分析算法可以對潛在的活躍翻譯ORF實現(xiàn)密碼子分辨率的預(yù)測。
圖1 非編碼RNA來源小肽的鑒定方法Fig.1 Methods for identification of small peptides derived from non-coding RNA
sORF 編碼的小肽通常比蛋白質(zhì)更易降解,ncRNA 如果翻譯了卻沒有產(chǎn)生穩(wěn)定表達的蛋白,那么核糖體通讀產(chǎn)生的小肽可能只是一個副產(chǎn)物。因此對蛋白是否真實表達并且穩(wěn)定存在的檢測非常重要,可通過以下5種方式篩選。(1)質(zhì)譜鑒定。質(zhì)譜技術(shù)提供小肽存在的直接證據(jù),可以鑒定小肽在生理條件下的氨基酸組成以及豐度(圖1E)。(2)標簽肽驗證。在ORF 序列N 或C 末端進行標簽標記,通過蛋白質(zhì)印跡法(western blot)驗證標簽肽是否翻譯。(3)內(nèi)源抗體檢測。生產(chǎn)靶向小肽的特異氨基酸序列抗體,通過western blot 確認小肽的大小是否與預(yù)期相符,在內(nèi)源細胞系樣品中驗證小肽在體內(nèi)條件下是否真實存在(圖1F)。(4)體外翻譯。將ncRNA 全序列經(jīng)過原核/真核體外轉(zhuǎn)錄以及翻譯系統(tǒng),結(jié)合35S同位素放射性自顯影技術(shù),檢測ncRNA 是否可以翻譯小肽以及可以翻譯幾條小肽。(5)開放閱讀框突變。使用起始密碼子突變或者移碼突變,可以確認開放閱讀框及其產(chǎn)生小肽的準確性。
非編碼RNA 在轉(zhuǎn)錄組中占據(jù)極大的比例,形成了高度復(fù)雜的家族,包括長非編碼RNA(lncRNA,long non-coding RNA)、微小RNA(miRNA,microRNA )、環(huán)狀RNA(circRNA,circular RNA )、核 糖 體RNA (rRNA,ribosome RNA)、小 干 擾RNA (siRNA,small interfering RNA)等(Kapranov et al.,2007)。目前對于非編碼翻譯的研究主要集中在包括mRNA 的5’和3’UTR 以及l(fā)ncRNA、pri-miRNA 和circRNA 等非編碼RNA 區(qū)域中(Orr et al.,2020)。
UTR 位 于 成 熟mRNA 兩 端,分 為5’UTR 和3’UTR。過去認為UTR 通常不編碼蛋白質(zhì),主要行使對蛋白質(zhì)編碼區(qū)(CDS,coding sequence)的翻譯調(diào)控功能(圖2A)。隨著越來越多的sORF 在UTR 區(qū)域被發(fā)現(xiàn),人們將位于mRNA 的5’UTR 上的ORF 命名為上游ORF(upORF,upstream ORF),位于3’UTR 的ORF 稱為下游ORF(dORF,down‐stream ORF)(Calvo et al.,2009;Couso et al.,2017;Wu et al.,2020a)。
圖2 可編碼小肽的非編碼RNA種類Fig.2 Classification of non-coding RNA encoding micropeptides
sORF 在5’UTR 中大量存在,根據(jù)終止密碼子的位置,upORF 可分為完全上游ORF(cuORF,completely upstream ORF)和 上 游 重 疊 ORF(uoORF,upstream overlapping ORF)(Calvo et al.,2009;Ye et al.,2015)。目前研究發(fā)現(xiàn),許多具有較長5’UTR 的轉(zhuǎn)錄本的蛋白質(zhì)翻譯水平會顯著下降,upORF 的存在可能會翻譯產(chǎn)生小肽,進而導(dǎo)致核糖體在mRNA 上的提前脫離,通過阻止部分或全部核糖體對CDS 區(qū)的掃描來抑制mRNA 的常規(guī)蛋白翻譯(Calvo et al.,2009;Ye et al.,2015)。當(dāng)然upORF 不一定總會影響CDS 的翻譯,這取決于upORF 的終止密碼子與CDS 區(qū)的距離,以及upORF 前后序列的起始能力強弱(Wagner et al.,2020)。Rodriguez et al.(2019)發(fā)現(xiàn)31% 的神經(jīng)母細胞瘤轉(zhuǎn)錄本中,一共鑒定了4 954 個可翻譯的upORFs,且主要是通過非經(jīng)典起始密碼子起始翻譯,所得小肽可以作為CDS 翻譯的順式調(diào)節(jié)因子。例如,從GADD34 的5’UTR 中的upORF 翻譯而來的SEP 通過C 端保守的3’氨基酸序列介導(dǎo)核糖體釋放從而抑制主CDS 的翻譯(Young et al.,2015)。相比upORF,位于3’UTR 上的dORF 的功能較少被報道,其中一些dORF 的翻譯也被證實參與主CDS 的翻譯調(diào)控中(Couso et al.,2017;Wu et al.,2020b)。例如Wu et al.(2020b)發(fā)現(xiàn)dORF 可作為CDS的翻譯增強子,當(dāng)對dORF的起始密碼子進行突變以抑制其翻譯時,CDS 的表達水平隨之降低,暗示了dORF 編碼的小肽與CDS 翻譯之間存在的聯(lián)系。
相對于其他非編碼RNA,lncRNA 具有數(shù)量眾多并且功能多樣等特點,在可產(chǎn)生小肽的非編碼RNA 中,lncRNA 是最被關(guān)注的一類ncRNA(圖2B)。與其他非編碼RNA 不同的是,大部分lncRNA 與mRNA 有著相似的特點。例如,它們均由RNA 聚合酶Ⅱ轉(zhuǎn)錄出來,轉(zhuǎn)錄完成后均有m7G加帽以及Poly A 加尾的過程,經(jīng)過可變剪切的加工,并且它們都容易在細胞質(zhì)聚集,這些特點使得lncRNA 具備翻譯小肽的潛能(Ruiz-Orera et al.,2014)。目前發(fā)現(xiàn)一些lncRNA 編碼功能小肽,如lncRNA ASHIL-AS1 編碼位于內(nèi)質(zhì)網(wǎng)的小肽APPLE,通過調(diào)控翻譯維持癌細胞高速合成,促進AML發(fā)展(Sun et al.,2021);lncRNA HOXB-AS3編碼保守的53 aa(amino acids)小肽,通過調(diào)節(jié)腫瘤能量代謝來抑制結(jié)直腸癌(CRC,colorectal carcinoma)細胞的生長、集落形成、遷移、侵襲和腫瘤發(fā)生(Huang et al.,2017);LINC00691編碼的小肽SPAR可以調(diào)控肌肉細胞的再生能力等(Matsumoto et al.,2017)。但是也有研究提出質(zhì)疑,認為僅僅是RNA 結(jié)構(gòu)以及核糖體的結(jié)合并不能作為一個轉(zhuǎn)錄本的絕對可翻譯條件,實驗污染會導(dǎo)致核糖體結(jié)合的RNA中不僅有l(wèi)ncRNA,還包括了一些核內(nèi)的非編碼RNA。這些核內(nèi)非編碼RNA 由于空間阻斷缺乏翻譯機會;而采用核糖體釋放速率算法可以將核糖體結(jié)合lncRNA 與翻譯的mRNA 顯著區(qū)分,這暗示了大量與核糖體結(jié)合lncRNA 可能未被真實翻譯(Guttman et al.,2013)。的確,也有研究表明lncRNA可通過結(jié)合核糖體參與mRNA翻譯調(diào)控中,如LincRNA-p21(Yoon et al.,2012)、AS-RBM15(Tran et al.,2016)以及antisense Uchl1(Carrieri et al.,2012)等均結(jié)合在核糖體上,但是不翻譯成小肽,而是以RNA 的形式發(fā)揮翻譯調(diào)控的功能。這些研究表明,功能小肽的準確鑒定仍然具有很大挑戰(zhàn)。
環(huán)狀RNA 是一類共價閉合單鏈RNA,由前體轉(zhuǎn)錄本(pre-RNA)的可變剪接而來,包括內(nèi)含子來源的環(huán)狀RNA 和外顯子來源的環(huán)狀RNA,后者占總環(huán)狀RNA 比重最大(Li et al.,2018)。與經(jīng)典RNA順式剪接不同,外顯子來源環(huán)狀RNA由RNA的反式剪接生成。在成環(huán)過程中,外顯子序列中上游外顯子3’剪切位點同下游外顯子5’剪切位點剪切連接成環(huán)狀結(jié)構(gòu),進而形成成熟的環(huán)狀轉(zhuǎn)錄本(Ashwal-Fluss et al.,2014;Zhang et al.,2014;Ivanov et al.,2015;Starke et al.,2015;Wang et al.,2015)。由此可見,環(huán)狀RNA具有環(huán)化以及部分基因的外顯子序列,因此,具有潛在ORF 的特點,暗示了環(huán)狀RNA 具有翻譯的潛能(圖2C)。此外,大部分環(huán)狀RNA 主要存在于細胞質(zhì)中,在空間上為環(huán)狀RNA 的翻譯提供了可行性(Sinha et al.,2022)。
與mRNA 不同,環(huán)狀RNA 的閉合結(jié)構(gòu)使其缺少5’端m7G 帽子,導(dǎo)致翻譯起始復(fù)合物eIF4F無法結(jié)合并介導(dǎo)核糖體進入環(huán)狀RNA 從而啟動翻譯過程(Jeck et al.,2013;Guo et al.,2014;Schneider et al.,2016)。近年來陸續(xù)有文章報道環(huán)狀RNA 上存在多個開放閱讀框,并且可以通過帽子非依賴途徑實現(xiàn)核糖體進入,這些途徑包括:(1)通過IRES介導(dǎo)的翻譯起始。研究表明,許多環(huán)狀RNA 上存在IRES序列,這些IRES序列可以通過自身結(jié)構(gòu)或者結(jié)合帽子非依賴翻譯起始蛋白來招募核糖體起始翻譯(Yang et al.,2019)。(2)通過m6A 甲基化修飾介導(dǎo)的翻譯起始(Yang et al.,2017a)。研究表明mRNA 5’UTR 上存在的m6A 修飾可以介導(dǎo)帽子非依賴的翻譯起始過程,由于m6A 修飾在環(huán)狀RNA上分布廣泛,環(huán)狀RNA 可以通過m6A 閱讀蛋白YTHDF3 招募翻譯起始復(fù)合物與核糖體從而起始翻譯(Legnini et al.,2017;Pamudurti et al.,2017;Yang et al.,2017a)。
盡管大部分環(huán)狀RNA 自身序列并不是很長,但是由于其共價閉合環(huán)狀的特點,開放閱讀框可以跨過成環(huán)位點直到出現(xiàn)終止密碼子(Liang et al.,2019;Zhang et al.,2021)。因此,一部分環(huán)狀RNA編碼的“小肽”會超過100個氨基酸,包括 SHPRH-146aa(Begum et al.,2018)、AKT3-174aa(Xia et al.,2022)、FBXW7-185aa(Yang et al.,2018)、circDIDO1-529aa(Zhang et al.,2021)和 β-catenin-370aa(Liang et al.,2019)等。然而,很多具有明顯IRES元件和開放閱讀框的環(huán)狀RNA 無法翻譯出蛋白,提示明確環(huán)狀RNA 翻譯規(guī)律仍是一個亟須解決的科學(xué)問題。最近研究發(fā)現(xiàn)環(huán)狀RNA的翻譯亦或受到壓力影響,例如細胞饑餓可以增強circMbl翻譯效果(Pamudurti et al.,2017);熱刺激可以促進包含m6A 的環(huán)狀RNA表達報告基因如綠色熒光蛋白GFP(Yang et al.,2017a)。這些研究進展表明了部分環(huán)狀RNA 翻譯具有一定的時空特異性。
miRNA 的生物發(fā)生包括兩個步驟:(1)通過RNA 聚合酶Ⅱ轉(zhuǎn)錄產(chǎn)生初級miRNA (pri-miRNA)轉(zhuǎn)錄物;(2)由Dicer like 1 (DCL1)蛋白將primiRNA 加工成前體miRNA(pre-miRNA)和最終成熟miRNA(Carthew et al.,2009)。最近研究表明,原始病毒可能含有編碼調(diào)節(jié)性小肽(miPEPs)的短開放閱讀框(圖2D)。這些短肽影響相關(guān)miRNA 的積累(Fang et al.,2017;Lauressergues et al.,2015)。雖然,這種調(diào)節(jié)的分子機制仍未被破譯,但是目前 已 經(jīng) 證 明miPEPs、miPEP171d、miPEP172c、miPEP858a和miPEP165a可以調(diào)節(jié)植物的生長和發(fā)育(Yadav et al.,2021)。
關(guān)于pri-miRNAs 的肽編碼潛力的第一個證據(jù)是:Lauressergues et al.(2015)發(fā)現(xiàn),蒺藜狀苜蓿的pri-miRNA171b 和唐松草的pri-miR165a 含有編碼調(diào)節(jié)肽的sORF。這些短肽特異性地正向調(diào)節(jié)其相應(yīng)成熟miRNA 的積累。MiPEP171b 過表達導(dǎo)致側(cè)根密度降低,與miPEP171b 過表達植株的表型一樣。類似地,miPEP165a 過表達導(dǎo)致根伸長。此外,為了驗證miPEP 過表達和相應(yīng)miRNA 積累之間的正相關(guān)性,同時分析了其他5 種主要miRNAs的 開 放 閱 讀 框。這 些miPEP (miPEP 160b、miPEP164a、miPEP319、miPEP169d 和miPEP171e)的過度表達或外部應(yīng)用導(dǎo)致其相應(yīng)miRNAs的更高積累(Lauressergues et al.,2015)。
核糖體RNA 編碼小肽的報道較少(圖2E)。目前發(fā)現(xiàn)線粒體16S rRNA 編碼的小肽Humanin 參與細胞凋亡等多種生命活動的調(diào)控(Lee et al.,2013)、線粒體12S rRNA 編碼的小肽MOTS-c 可以通過調(diào)控胰島素敏感性來抑制飲食誘導(dǎo)的肥胖(Lee et al.,2015)。
雖然近年來在真核基因轉(zhuǎn)錄本中挖掘出大量的sORF,但是目前已被鑒定的具有體內(nèi)翻譯能力和生物活性的小肽數(shù)量仍非常少(Vitorino et al.,2021)。越來越多的研究證實,小肽在哺乳動物和植物中均有存在,且在多種生物進程中發(fā)揮著重要功能,如RNA 去帽過程、DNA 修復(fù)、壓力通路、凋亡、肌肉形成、代謝穩(wěn)態(tài)、鈣離子穩(wěn)態(tài)等(Yeasmin et al.,2018)。轉(zhuǎn)錄組測序結(jié)果顯示,編碼小肽的非編碼RNA如lncRNA往往在癌癥中異常表達,并可以編碼與患者總生存期和治療反應(yīng)相關(guān)的小肽。這些研究結(jié)果提示非編碼RNA 來源的小肽可能參與癌癥發(fā)生發(fā)展,具有潛在的臨床應(yīng)用價值(Hanahan et al.,2011;Merino-Valverde et al.,2020;Wu et al.,2020b;Ye et al.,2020 ;Prensner et al.,2021)。研究顯示許多小肽在癌癥中失調(diào)表達,通過調(diào)節(jié)增殖、凋亡、代謝和細胞炎癥反應(yīng)影響腫瘤進程(Yang et al.,2017b;Zhang et al.,2018)。在植物中,也發(fā)現(xiàn)可以通過外源合成pri-miRNA來源的小肽來改善植物的農(nóng)藝性狀(Yadav et al.,2021)。
在生理條件下,細胞通過嚴格控制有絲分裂信號來維持正常的結(jié)構(gòu)和穩(wěn)態(tài)。相比之下,癌細胞最突出的特點就是過度的有絲分裂導(dǎo)致的無限增殖以及永生化(圖3A)。最近研究表明,一些小肽參與調(diào)節(jié)了癌細胞的有絲分裂信號傳導(dǎo)(Polycarpou-Schwarz et al.,2018;Pang et al.,2020;Xu et al.,2020;Zheng et al.,2021)。在癌細胞中顯著高表達的小肽通常通過激活信號通路來促進癌細胞增殖。例如,癌癥相關(guān)小整體膜開放閱讀框1(CASIMO1,cancer-associated small integral membrane open reading frame 1)來源于非編碼RNA NR_029453上的一個sORF,在乳腺癌中顯著高表達(Polycarpou-Schwarz et al.,2018)。研究發(fā)現(xiàn)CASIMO1 編碼的小肽SMIM22 與角鯊烯環(huán)氧化酶(SQLE,squalene epoxidase)相互作用,導(dǎo)致SQLE 蛋白積累和脂滴聚集增加,SQLE 蛋白可促進ERK 磷酸化和MAPK 通路激活,進而導(dǎo)致G0 / G1 細胞周期停滯,促進癌細胞增殖。同樣,circPPP1R12A 編碼的功能小肽circPPP1R12A-73aa(PPP1R12A-C),在結(jié)直腸癌組織中顯著增加,通過激活 Hippo-YAP 信號通路促進CRC 生長和轉(zhuǎn)移(Zheng et al.,2021)。LINC00998 編 碼 的 小 肽SMIM30 在肝癌患者中高度表達,SIMM30 與非受體酪氨酸激酶 SRC/YES1 結(jié)合,驅(qū)動其膜錨定和磷酸化,激活下游MAPK 信號通路,促進肝癌細胞在體外和體內(nèi)的增殖和遷移(Pang et al.,2020)。相反,在癌細胞中顯著低表達的小肽則發(fā)揮了抑制癌細胞生長增殖的作用。例如,lncRNA NCBP2-AS2 編碼的小肽KRASIM 與KRAS 蛋白及其蛋白水平相互作用,抑制ERK 信號活性,從而抑制肝細胞癌(HCC,hepatocellular carcinoma)的細胞生長和增殖(Xu et al.,2020)。
圖3 小肽的功能Fig.3 The function of micropeptides
sORFs除了通過調(diào)控信號通路來影響有絲分裂之外,還可以通過其他方式調(diào)節(jié)癌細胞的增殖。例如,lncRNA LINC00467 編碼的ATP 合酶相關(guān)肽(ATP synthase-associated peptide,ASAP),通過與ATP5A 和 ATP5C 相互作用提高 ATP 合酶活性和線粒體耗氧率,從而促進體外和體內(nèi)CRC 細胞增殖(Ge et al.,2021)。LINC-PINT 編 碼 的 小 肽PINT87aa 與forkhead box M1(FOXM1)的 DNA 結(jié)合域結(jié)合,減少其靶基因抑制素2(prohibitin 2,PHB2)的轉(zhuǎn)錄,從而發(fā)揮抗增殖和抗衰老作用(Xiang et al.,2021)。circPINTexon2 編 碼 的PINT87aa直接與聚合酶相關(guān)因子復(fù)合物 (polymerase associated factor complex,PAF1c)相互作用,參與PAF1/RNA Ⅱ 聚合酶復(fù)合物調(diào)控,使RNA 聚合酶Ⅱ在特定癌基因啟動子(如細胞周期蛋白D1、CPEB1、c-MYC 和SOX2)處暫停,從而在體外和體內(nèi)抑制膠質(zhì)母細胞瘤細胞增殖(Zhang et al.,2018)。在結(jié)腸癌中低表達的HOXB-AS3 peptide 可以通過調(diào)控mRNA 的可變剪切來影響癌細胞的生長、轉(zhuǎn)移和侵襲(Huang et al.,2017)。
調(diào)節(jié)細胞死亡和存活之間的平衡對于維持組織穩(wěn)態(tài)至關(guān)重要。細胞凋亡作為一種由基因編程的自主細胞死亡形式,是正常發(fā)育和組織穩(wěn)態(tài)所必需的(Delbridge et al.,2012;Childs et al.,2014;Aubrey et al.,2018)。研究表明,一些非編碼RNA來源的小肽參與細胞凋亡功能調(diào)控。lncRNA LINC00278 編碼小肽YY1BM(Yin Yang 1-binding micropeptide),可在營養(yǎng)剝奪下通過雄激素受體途徑誘導(dǎo)細胞凋亡,在食管鱗狀細胞癌(ESCC,esophageal squamous cell carcinoma)中具有腫瘤抑制活性(Wu et al.,2020c)。在腫瘤內(nèi)注射純化的小肽YY1BM 在異種移植模型中顯示出治療效果,表明其具有作為腫瘤抑制劑的潛力。同樣,胃腸道特異性lncRNA LINC00675 被發(fā)現(xiàn)可編碼小肽FORCP(FOXA1-regulated conserved small protein),在CRC 中顯著低表達。FORCP 定位于內(nèi)質(zhì)網(wǎng)(ER,endoplasmic reticulum),通過與BRI3BP 相互作用從而抑制CRC細胞增殖,并在ER 應(yīng)激下誘導(dǎo)細胞凋亡(Li et al.,2020)。
線粒體是細胞凋亡調(diào)控中心,多數(shù)凋亡刺激因子通過線粒體激活細胞凋亡途徑。Humanin是在線粒體基因組中鑒定出的第一個sORF,由線粒體16S rRNA 編碼,研究發(fā)現(xiàn)Humanin 可通過介導(dǎo)BCL-2蛋白質(zhì)家族的細胞內(nèi)定位來調(diào)節(jié)內(nèi)源性或線粒 體 凋 亡 途 徑(Guo et al.,2003;Luciano et al.,2005;Lee et al.,2013)。Humanin 可上調(diào)BCL-2 的表達并抑制BAX 表達以抑制細胞凋亡(Guo et al.,2003)。此外,Humanin 還可以與其他BCL-2 蛋白家族成員(如BID 和BAX)相互作用,并調(diào)節(jié)它們的易位以抑制凋亡體的產(chǎn)生(Luciano et al.,2005)。PIGBOS 是一種由PIGB 基因的反義鏈RNA 編碼的新型小肽,定位于線粒體外膜,通過CLCC1 蛋白與ER 相互作用,PIGBOS 的下調(diào)通過增加對化學(xué)誘導(dǎo)的UPR 的敏感性來誘導(dǎo)細胞凋亡(Chu et al.,2019)。雖然PIGBOS功能的分子機制尚未被描述,但有理由認為,其可能通過使細胞對未折疊蛋白質(zhì)反應(yīng)(UPR,unfolded protein response)敏感并迫使它們進入細胞凋亡,其在癌細胞中的抑制可能具有治療潛力。
細胞代謝是指細胞通過對葡萄糖、氨基酸、脂肪酸等燃料的分解,產(chǎn)生用于細胞活動的ATP(Judge et al.,2020)。這些過程主要發(fā)生在人體的能量工廠——線粒體中,并需要多種酶和輔助因子的參與(Fernie et al.,2004)。實驗生物學(xué)和生物信息學(xué)分析均表明,小肽在線粒體內(nèi)膜(IMM,inner mitochondrial membrane)上大量富集,參與細胞的代謝活動(Kim et al.,2017)(圖3C)。小肽BRAWNIN 由C12orf73 基因編碼,在心臟和骨骼肌細胞中高度表達并定位于IMM 中(Zhang et al.,2020)。小肽BRAWNIN 通過與UQCRC1 的相互作用來促進呼吸鏈復(fù)合物Ⅲ(CIII,respiratory chain complex Ⅲ)組裝,通過反饋回路調(diào)節(jié)細胞能量狀態(tài)。敲低BRAWNIN 可導(dǎo)致細胞ATP 合成減少,從而促進 AMPK 活化。小肽Mtln 與BRAWNIN類似,在心臟和骨骼肌中高表達,與線粒體三功能蛋白(MTP,mitochondrial trifunctional protein)的亞基HADHB 互作,因此,Mtln 被認為參與脂肪酸氧化的調(diào)節(jié)(Makarewich et al.,2018)。除MTP 外,Mtln 還與心磷脂相互作用,心磷脂對于維持膜完整性和組裝呼吸用多蛋白復(fù)合物至關(guān)重要(Stein et al.,2018)。Mtln 的過表達增加了基礎(chǔ)和最大呼吸速率,減少了糖酵解(Chugunova et al.,2019)。
LncRNA HOXB-AS3被證明可以翻譯產(chǎn)生參與RNA 剪接的53AA 小肽。Huang 及其合作者發(fā)現(xiàn),HOXB-AS3 在結(jié)直腸癌細胞中下調(diào),改變了丙酮酸激酶M(PKM,pyruvate kinase M)前mRNA 的剪接形式,重新表達胚胎同種型PKM2,有利于糖酵解活性;與此同時,HOXB-AS3 來源小肽的表達有利于促進氧化磷酸化的成體亞型(PKM1)的表達。總的來說,HOXB-AS3 來源小肽在結(jié)直腸癌細胞系中的過表達可以通過改變其對葡萄糖代謝的使用而減弱其致癌能力(Huang et al.,2017)。線粒體基因組12s rRNA 上的開放閱讀框編碼的小肽MOTS-c 被發(fā)現(xiàn)在體外可增加葡萄糖攝取、糖酵解活性和AMPK 活化,同時降低耗氧率,改善了與體內(nèi)肥胖相關(guān)的代謝參數(shù)(Lee et al.,2015)。
炎癥是由先天免疫系統(tǒng)發(fā)起的一系列細胞反應(yīng),通過消除病原體以及恢復(fù)細胞和機體穩(wěn)態(tài)來維持宿主健康(El-Kenawi et al.,2017;Evavold et al.,2019;Medzhitov,2008)。已有研究表明,線粒體為免疫細胞識別外來抗原以及合成促炎細胞因子和趨化因子提供能量,在調(diào)節(jié)炎癥反應(yīng)方面起 關(guān) 鍵 作 用(Subramanian et al.,2013;Jo et al.,2016;West et al.,2017;Forrester et al.,2018;Neagu et al.,2019;Andrieux et al.,2021)。小肽在線粒體中的富集也暗示其對細胞炎癥免疫反應(yīng)的調(diào)控作用(Kim et al.,2017)(圖3D)。
炎癥小體是一種大分子蛋白復(fù)合物,其中IL-1β前體通過半胱天冬酶1(caspase 1)轉(zhuǎn)化為生物活性IL-1β,引發(fā)IL-1介導(dǎo)的炎癥(Weber et al.,2010)。線粒體小肽-47(Mm47,mitochondrial micropeptide-47)被發(fā)現(xiàn)在活化的巨噬細胞中差異表達,其對免疫刺激的下調(diào)和線粒體定位使其在Nlrp3 介導(dǎo)的炎性小體反應(yīng)具有調(diào)節(jié)作用(Bhatta et al.,2020)。然而,Mm47 在調(diào)節(jié)Nlrp3 寡聚化程度和OMM 招募方面的分子機制仍然未知。此外,線粒體小肽MOTS-c 和Humanin 也被報道能夠通過調(diào)節(jié)衰老細胞的線粒體活性來加劇衰老相關(guān)分泌表型(SASP,senescence-associated secretory phenotype)的促炎作用(Kim et al.,2018;Mendelsohn et al.,2018)。
在植物中,近年研究發(fā)現(xiàn)pri-miRNA編碼的小肽(miPEPs)發(fā)揮了重要的作用,特別是在農(nóng)藝性狀方面。miR172c 是大豆結(jié)瘤的正向調(diào)節(jié)因子(Wang et al.,2019),其過度表達導(dǎo)致結(jié)節(jié)數(shù)量的增加,抑制則具有相反的效果。Couzigou et al.(2016)表明,用合成的大豆miR172c 前體編碼的小肽miPEP172c 處理大豆可顯著增加根瘤數(shù),而不影響其他根系發(fā)育特征,與在大豆中過量表達miR172c 的結(jié)果一致。進一步研究還發(fā)現(xiàn),用miPEP172c 處理大豆還可以增加了miR172c 的積累,說明小肽miPEP 可以上調(diào)miRNAs 表達(圖3E)。并且,與對照植株相比,經(jīng)miPEP172c處理的植株中ENOD40–1、NIN、NSP1 和Hb2 表達也顯著提高,表明miPEP172c 在植物發(fā)育過程以及植物-微生物相互作用中都發(fā)揮重要作用。這些進展揭示了調(diào)節(jié)性miPEPs 在改善作物農(nóng)藝性狀中的重要性。
類似地,發(fā)現(xiàn)由pri-miR858a 編碼的小肽miPEP858a 調(diào)節(jié)擬南芥類黃酮的生物合成和發(fā)育(Sharma et al.,2020)。外源應(yīng)用合成的miPEP858a可恢復(fù)由miPEP858a 缺失導(dǎo)致的擬南芥植物發(fā)育缺陷。此外,啟動子報告基因分析表明,miPEP858a 具有調(diào)控自身啟動子活性和GUS 基因轉(zhuǎn)錄的作用,暗示miPEPs 具有特定的生物學(xué)功能(圖3F)。
不定根的形成是葡萄無性繁殖的主要障礙。最近的一項研究發(fā)現(xiàn)了外施miR-171d 編碼的小肽miPEP171d1 在不定根形成中的重要作用(Chen et al.,2020)。將外源miPEP171d1 導(dǎo)入歐洲葡萄組培苗中,可促進miR171d 的積累和不定根的發(fā)育(圖3G)。這些結(jié)果顯示了一種新的miRNA 調(diào)節(jié)機制,該機制與其相關(guān)的miPEP 有關(guān)。在擬南芥中,通過對pri-miRNA 來源小肽miPEP164a、miPEP165a和miPEP319a 等的研究(Yadav et al.,2021),發(fā)現(xiàn)這些小肽對植株生長都具有明顯的促進作用。與對照植株相比,噴灑、澆水、堆肥、添加肥料等外施miPEPs 的植株在莖高、早花、花數(shù)增加和花柄高度方面均表現(xiàn)出明顯優(yōu)勢。外源施用miPEPs時,植株內(nèi)的miPEP 總量增加,因此總體上調(diào)節(jié)了相關(guān)miRNAs 的積累。有趣的是,miPEPs 可以在外源施用下發(fā)揮作用,這一發(fā)現(xiàn)將在農(nóng)業(yè)上有廣泛的用途。
在蒺藜苜蓿中外施和過表達miPEP171b 均能使植株內(nèi)的miR171b 表達升高并抑制其靶基因(Lauressergues et al.,2015)(圖3H)。miPEP171b1過表達導(dǎo)致MtmiR171b 累積,從而負調(diào)控靶基因HAM 和HAM2,使植株側(cè)根數(shù)量減少,表明其在根發(fā)育中的重要性。MtmiR171b 和MtmiPEP171b1在煙草中的過表達也具有相似的結(jié)果(Lauresser‐gues et al.,2015)。通過對MtmiORF171b 和Mtmi‐PEP171b1 以及突變ORF MtmiORF171b 的相對表達量發(fā)現(xiàn),MtmiORF171b 對MtmiPEP171b1 的翻譯作用增加了Mtmir171b 的積累(Lauressergues et al.,2015)。外施和過表達MtmiPEP171b1可增加各自pri-miRNAs、pre-miRNAs 和成熟miRNAs 的積累(圖3I)。而用ATT 替代pri-miR171b ORF1 中的ATG 起始密碼子后,仍有少量的miR171b 產(chǎn)生,這表明miPEP171b 充當(dāng)了調(diào)節(jié)介質(zhì)并使相關(guān)的miRNA積累增加(Lauressergues et al.,2015)。
外源miPEPs 如何進入植物細胞內(nèi)是限制其在植物中發(fā)揮功能的重要問題。一般認為,內(nèi)吞作用和被動擴散是miPEPs 內(nèi)化的主要途徑(Ormancey et al.,2020)。在用熒光染料標記MiPEP165a 對擬南芥進行外源處理后,觀察到miPEP165a 能快速進入根冠和分生組織區(qū),而根部其余部分的滲透延遲(Ormancey et al.,2020)。通過研究進入植株體內(nèi)的網(wǎng)格蛋白介導(dǎo)途徑和膜微結(jié)構(gòu)域途徑發(fā)現(xiàn);miPEP165a在根冠、分生組織和根的分化區(qū)是被動進入,而在根細胞成熟區(qū)的進入受到影響。其中,rem1-2 在miPEP 吸收中受到強烈影響。進一步通過使用化學(xué)抑制劑 TyrA23 和 MβCD 分別抑制網(wǎng)格蛋白介導(dǎo)和膜微域途徑。結(jié)果表明,這些分子阻斷了施用miPEP165a 對根長的正向表型效應(yīng)。這說明miPEPs 可能具有局部效應(yīng),而不是系統(tǒng)效應(yīng)。
雖然許多具有sORF 的RNA 曾經(jīng)被歸類為ncRNA,因而在以往的研究中忽視了對這些具有潛在翻譯能力的sORF 鑒定,但是越來越多研究結(jié)果表明具有生物活性的非編碼RNA 來源小肽真實存在并且在生物體內(nèi)發(fā)揮不可替代的功能,使我們重新認識這些非編碼RNA 的功能形式(Lu et al.,2004;Ma et al.,2014;Ma et al.,2016;Olexiouk et al.,2018)。本文總結(jié)了識別、篩選和鑒定sORF的方法,以及編碼小肽的非編碼RNA 種類,揭示了非編碼RNA 來源小肽在生物體內(nèi)的多重作用機制與生物功能。這些進展揭示了非編碼RNA 來源的小肽具有成為抗腫瘤藥物、治療靶點以及腫瘤生物標志物的巨大潛力,例如作為新型抗腫瘤藥物,小肽相比其來源RNA 具有更高的活性,更低的免疫原性和更低的細胞毒性,因此可以合成腫瘤抑制微肽并直接遞送到癌癥組織(Zhu et al.,2018;Bakhti et al.,2022)。由于小肽易于代謝降解的特點,也使在植物中應(yīng)用外源合成小肽相比使用轉(zhuǎn)基因手段和化學(xué)農(nóng)藥具有更高的安全性,將成為一種新的改善植物農(nóng)藝性狀的手段(Yadav et al.,2021)。這些新發(fā)現(xiàn)使研究者開始重新審視過去的非編碼RNA 研究,是否由于技術(shù)限制了對其編碼能力的預(yù)測和驗證?其編碼小肽是否可能發(fā)揮與母體RNA 相似的功能,甚至其母體RNA“表現(xiàn)”出的功能是否實際上由其編碼小肽執(zhí)行?分子研究手段的不斷發(fā)展讓小肽的功能與RNA 自身活性得以區(qū)分,也強調(diào)了在未來的非編碼RNA 研究中分離RNA 功能和小肽功能的必要性。此外,一些研究發(fā)現(xiàn)mRNA 也具有與其編碼蛋白無關(guān)的非編碼功能,例如一種編碼早期減數(shù)分裂誘導(dǎo)蛋白1(Emi1)的mRNA 轉(zhuǎn)錄本,可從其3’UTR 加工成熟一種功能性長非編碼RNA——端粒酶RNA(TER)(Logeswaran et al.,2022)。目前已有定義統(tǒng)一將既能以RNA 形式發(fā)揮功能,又能以蛋白形式發(fā)揮功能 的RNA 稱 為cncRNA (coding and non-coding RNAs),也叫雙功能RNA,包括了具有編碼功能的ncRNA 和具有非編碼功能的mRNA(Kumari et al.,2015)。未來的小肽研究可能會將更多的非編碼RNA列入雙功能RNA的隊伍中。
同時,盡管一些非編碼RNA 來源的小肽的重要功能已經(jīng)被揭示,但是還有許多問題尚未解決。例如,在小肽的篩選和翻譯驗證方面,如何進一步優(yōu)化現(xiàn)有檢測技術(shù)減少假陽性,找到更多可翻譯的小肽?決定sORF 成功翻譯小肽的關(guān)鍵因素是什么?是否有特定的上下文序列決定sORF 能否進行翻譯?無義介導(dǎo)的mRNA 衰變(NMD,nonsensemediated mRNA decay)作為監(jiān)視機制可降解錯誤的mRNA,并對虛假翻譯做出反應(yīng)(Lykke-Andersen et al.,2015;Supek et al.,2021)。含 有sORF 的lncRNA 很可能成為NMD 的目標,那么NMD 靶向lncRNA 的程度如何?同時,在對小肽的功能研究方面,如何系統(tǒng)性大量驗證小肽的不同生理功能?如何克服小蛋白的研究障礙(如蛋白豐度低、不穩(wěn)定、缺乏特異性抗體等)?如何改善和優(yōu)化小肽的結(jié)合親和力和長效呈遞能力來實現(xiàn)小肽在疾病中和植物中的實際應(yīng)用?因此,未來我們不僅僅需要努力擴大和完善小肽檢測技術(shù),還需要繼續(xù)發(fā)展各種各樣的實驗手段來驗證和研究小肽的時空表達模式及生物學(xué)功能,豐富和完善小肽在生物體中發(fā)揮功能的各種分子機制,為利用小肽作為藥物研發(fā)或者農(nóng)作物增產(chǎn)的關(guān)鍵靶點和實際應(yīng)用提供新的思路和方向。