儲金林,馬?,?,鐵璐,李琳琳
1新疆醫(yī)科大學(xué)藥學(xué)院,烏魯木齊 830011;2北京大學(xué)基礎(chǔ)醫(yī)學(xué)院藥理學(xué)系
糖尿病腎病(DKD)是終末期腎病的常見原因,是糖尿病的主要并發(fā)癥之一,嚴重影響糖尿病患者的整體生活質(zhì)量。細胞游離DNA(cfDNA)是由于不同組織細胞死亡而降解的DNA片段釋放到血漿中,攜帶了起源細胞的遺傳和表觀遺傳信息,檢測血漿cfDNA可視為一種“液體活檢”,有利于開展各種相關(guān)診斷,避免有創(chuàng)的組織活檢[1]。5-羥甲基胞嘧啶(5hmC)主要是5-甲基胞嘧啶通過TET酶氧化形成,是活性DNA去甲基化相對穩(wěn)定的中間體,被認為是重要的表觀遺傳特征[2]。研究表明,血漿cfDNA的5hmC譜是癌癥及糖尿病等相關(guān)疾病早期檢測和進展監(jiān)測的有力工具[3-5]。長鏈非編碼RNA(lncRNA)是在轉(zhuǎn)錄和轉(zhuǎn)錄后水平上通過調(diào)控各種機制,從而影響基因表達的重要因子[6-7]。有研究表明,lncRNA基因表達也可能受到表觀DNA修飾的調(diào)控,如DNA甲基化和組蛋白修飾[8-9],而對編碼lncRNA的基因組區(qū)域中潛在5hmC變化的研究較少。2021年2月—2022年2月,我們采用5hmC-Seal測序方法探討DKD患者血漿cfDNA中編碼lncRNA的基因組區(qū)域的關(guān)鍵5hmC改變,再進行l(wèi)ncRNA、miRNA和mRNA的調(diào)控網(wǎng)絡(luò)分析,篩選可能的作用分子,為DKD的后續(xù)機制研究及診療策略奠定基礎(chǔ)。
1.1 標本來源 收集北京大學(xué)第三醫(yī)院收治的2型糖尿?。―M)患者14例,其中男9例、女5例,年齡31~62(47.9±6.9)歲;DKD患者17例,男9例、女8例,年齡32~77(51.1±16.7)歲。DM的診斷依據(jù)美國糖尿病協(xié)會(ADA)2020年發(fā)布的標準[10],DKD的診斷依據(jù)KDIGO 2020臨床實踐指南和2014年中國糖尿病學(xué)會糖尿病腎病防治共識[11]。本研究通過北京大學(xué)第三醫(yī)院倫理委員會審批,受試者均知情同意。
1.2 方法
1.2.1 DKD患者血漿cfDNA的提取 采集DKD患者外周靜脈血2 mL,4℃、1 350 g離心15 min分離血漿,取上清;4℃、13 500 g離心5 min去除白細胞,取上清。使用QIAamp循環(huán)核酸試劑盒(QIAGEN)提取血漿cfDNA。
1.2.2 DKD與DM患者血漿cfDNA中羥甲基化修飾差異表達基因的篩選 采用5hmC-Seal技術(shù)。通過Fragment Analyzer對每個文庫樣本的DNA條帶大小及分布情況進行質(zhì)控,在使用qPCR的方法對文庫進行準確定量后,在NextSeq500測序平臺上進行雙端38-bp高通量測序,測序試劑盒為Illumina公司的Nextseq500/550 High Output Kit v2(75 cycles),每個樣品的測序通量為1.5 Gb,測序條帶大小為38 bp,最后得到文庫中所有DNA片段的堿基序列。接著進行測序數(shù)據(jù)前期處理:先用Trimmomatic軟件去除每個原始FASTQ數(shù)據(jù)一些低質(zhì)量、無用的數(shù)據(jù),來評估序列質(zhì)量,提高后續(xù)分析的效率。用Bowtie2軟件將原始reads數(shù)比對到人類hg19基因組上,并進一步用SAMtools進行篩選以保留與基因組的唯一非重復(fù)匹配,使用bedtools將對端讀取進行擴展并轉(zhuǎn)換為BedGraph格式,并將其歸一化為對齊讀取的總數(shù)量,然后使用UCSC基因組瀏覽器中的bedGraphToBigWig轉(zhuǎn)換為bigwig格式,以便在Integrated Genomics Viewer中進行可視化。使用MACS識別潛在的5hmC富集區(qū)域,使用的參數(shù)為MACS14-p1e-3-f BAM-g hs。 使 用bedtools合 并 峰值,只保留出現(xiàn)在10個樣本以上且小于1 000 bp的峰值區(qū)域。X和Y染色體內(nèi)的5hmC富集區(qū)域被排除,并作為下游分析的輸入。用DEseq2包找出差異基因,篩選條件為|log2FC|>0.5且FDR<0.05(FC為差異表達倍數(shù),即DKD組與DM組差異表達倍數(shù)在1.5倍以上;FDR為校正后的P值)。
1.2.3 DKD患者血漿cfDNA中羥甲基化修飾lncRNA的篩選 采用加權(quán)基因共表達網(wǎng)絡(luò)(WGCNA)程序的R語言包來構(gòu)建差異羥甲基化基因的共表達網(wǎng)絡(luò)。以擬合指數(shù)R2>0.6使得基因之間的連接服從近似無尺度網(wǎng)絡(luò)分布,再繪制出模塊和性狀之間的相關(guān)性熱圖,以通過各個模塊與性狀之間的相關(guān)系數(shù)大小及P<0.05篩選出與DKD顯著相關(guān)的基因模塊,最后計算基因顯著性(GS)和模塊身份(MM),通過設(shè)置GS和MM的取值范圍對network-Screening函數(shù)計算得到的基因列表進行篩選,從而識別和鑒定出關(guān)鍵樞紐基因,并從中篩選關(guān)鍵lncRNA進行后續(xù)分析。
1.2.4 羥甲基化修飾lncRNA細胞定位lncRNA在細胞中具有廣泛的亞細胞分布,這決定了其功能調(diào)控的多樣性,只有定位在細胞質(zhì)中,才能形成ceRNA調(diào)控網(wǎng)絡(luò),從而為理解基因的作用機制提供研究方向。因此我們應(yīng)用 lncLocator(http://www. csbio. sjtu.edu. cn/bioinf/lncLocator/)對 lncRNA 的亞細胞定位進行預(yù)測,尋找lncRNA所在的細胞位置。
1.2.5 靶向miRNA 的羥甲基化修飾lncRNA 篩選 Starbase 在線分析工具數(shù)據(jù)庫主要對高通量測序的CLIP-Seq 測序分析數(shù)據(jù)和降解組測序分析數(shù)據(jù)的整合來尋找miRNA 的靶標,可為探討miRNA的靶標提供可視化過程,該數(shù)據(jù)庫包括大量miRNA-ncRNA、miRNA-mRNA、RBP-RNA 和RNA-RNA 的數(shù)據(jù)。因此,我們利用Starbase(http://starbase. sysu.edu.cn/)預(yù)測lncRNA的靶向miRNA。
1.2.6 羥甲基化修飾lncRNA 診斷價值及表達驗證 對最終的關(guān)鍵lncRNA 進行受試者工作特征曲線(ROC)分析,若曲線下面積(AUC)≥0.8,則認為該基因具有較高的臨床診斷價值。取SPF 級雄性C57BL/6 小鼠 9 只,8 周齡,體質(zhì)量 20~22 g,購自北京華阜康生物科技股份有限公司,飼以蛋白含量為21%的標準飼料塊,不限制飲水飲食。適應(yīng)性飼養(yǎng)2 周后,將小鼠隨機分成 DM 組、DKD 組和對照組各3 只,DM 組和 DKD 組連續(xù) 5 d 腹腔注射 60 mg/kg STZ,對照組腹腔注射檸檬酸鈉緩沖液(pH 4.2~4.5)。96 h 后,斷尾取血,測定血糖濃度,以血糖>16.7 mmol/L為DM造模成功。繼續(xù)飼養(yǎng)16周,以空腹血糖>16.7 mmol/L,蛋白尿、尿素氮、血肌酐水平明顯升高,為DKD 造模成功。取小鼠腎組織,-80 ℃保存。使用TRIzol 試劑提取腎組織總RNA,按試劑盒說明書進行RNA 逆轉(zhuǎn)錄,并進行擴增反應(yīng),目的基因的相對表達量用2-ΔΔCt法計算。
1.2.7 miRNA 靶基因的預(yù)測及功能富集 應(yīng)用miRDB(https:/www. mirdb. org/)和 TargetScan(https://www.targetscan.org/)2 個在線數(shù)據(jù)庫預(yù)測miRNA 的靶向 mRNA。此外,從 NCBI 的 GEO 數(shù)據(jù)庫(Gene Expression Omnibus,https://www. ncbi.nlm.nih.gov/geo/)中下載 mRNA 轉(zhuǎn)錄組測序(RNA-seq)數(shù)據(jù),數(shù)據(jù)編號為 GSE96804,使用相關(guān) R 包找到差異基因(|log2FC|>0.5 且FDR<0.05)。將3 個數(shù)據(jù)庫得到的靶基因取交集作為最后miRNA 靶基因集合。將靶向基因集提交Metascape(https://metascape.org/gp)網(wǎng)站,以P<0.05 為條件進行基因本體(GO)分析。
1.2.8 競爭內(nèi)源性RNA(ceRNA)調(diào)控網(wǎng)絡(luò)(即lncRNA-miRNA-mRNA 調(diào)控網(wǎng)絡(luò))的構(gòu)建 mRNA、lncRNA 和circRNA 任意類型的兩個RNA 分子間只要結(jié)合到相同的miRNA,就可能構(gòu)成ceRNA 對,包括mRNA-mRNA、lncRNA-lncRNA、circRNA-circRNA。ceRNA 分析作為lncRNA 功能研究的一種方式,lncRNA-mRNA 共表達分析結(jié)果結(jié)合miRNA 靶基因數(shù)據(jù)集,基于篩選后競爭性吸附結(jié)合miRNA 進而調(diào)控靶mRNA表達的lncRNA-mRNA和circRNA-mRNA關(guān)系對,對lncRNA 的功能進行預(yù)測。我們使用Cytoscape(3.7.1版)繪制ceRNA網(wǎng)絡(luò),以確定ceRNA網(wǎng)絡(luò)中的lncRNA在疾病中是否有關(guān)鍵作用,調(diào)控關(guān)鍵蛋白。
1.2.9 統(tǒng)計學(xué)方法 使用SPSS17.0 軟件進行數(shù)據(jù)統(tǒng)計與分析,三組間比較采用單因素方差分析,組間兩兩比較采用t檢驗。P<0.05 為差異有統(tǒng)計學(xué)意義。使用Graph Prism 8.3.0 軟件作圖,使用R 語言版本4.1.0進行數(shù)據(jù)分析并生成圖像。
2.1 DKD 患者血漿cfDNA 中羥甲基化修飾差異表達基因的篩選結(jié)果 測序數(shù)據(jù)分析顯示,與DM患者比較,DKD 患者的5hmC 整體分布水平明顯降低。5hmC 主要在轉(zhuǎn)錄起始位點(TSS)和轉(zhuǎn)錄終止位點(TTS)內(nèi)富集,在側(cè)翼區(qū)域耗損(見OSID 碼圖1),說明5hmC 的累積與轉(zhuǎn)錄活性有關(guān)。以|log2FC|>0.5、FDR<0.05 為標準,獲得 DKD 與 DM 的差異基因共1 644個。
2.2 DKD患者血漿cfDNA中羥甲基化修飾lncRNA的篩選結(jié)果 將獲得的差異基因用于樣本的聚類分析,表型熱圖分析結(jié)果見OSID 碼圖2A,無離群樣本。計算DKD 基因間的鄰接矩陣和拓撲矩陣,基于動態(tài)剪切樹法把輸入的差異基因分成3 個模塊,分別用3 種顏色矩形表示,相似度高的基因被聚類到同種顏色的模塊中,結(jié)果見OSID 碼圖2B。為了得到各個模塊與臨床表型之間的關(guān)系,我們對共表達模塊與臨床表型進行關(guān)聯(lián)性分析,以相關(guān)性熱圖表示,結(jié)果見OSID 碼圖2C。結(jié)果顯示與DKD 表型相關(guān)性最強的模塊是藍綠色模塊(r=0.73,P<0.001),總體上與DKD 表型呈正相關(guān)。進一步將藍綠色模塊作為關(guān)鍵模塊進行GS 和MM 分析,藍綠色模塊的GS 與 MM 的相關(guān)系數(shù)r=0.82,P<0.001,結(jié)果見OSID 碼圖 2D,最后通過對 GS 和 MM 設(shè)定條件,以GS>0.7,MM>0.9 的標準來篩選藍綠色模塊中與DKD 相關(guān)性高的關(guān)鍵樞紐基因。由于本研究主要分析和篩選關(guān)鍵羥甲基化修飾lncRNA,故最終獲得15個lncRNA,見表1。
2.3 羥甲基化修飾lncRNA的亞細胞定位 為了分析這些差異lncRNA 是否參與ceRNA 競爭機制,利用lnclocater 網(wǎng)站對其亞細胞定位進行分析,結(jié)果顯示,這15 個關(guān)鍵lncRNA 均定位于細胞質(zhì),大部分lncRNA 預(yù)測分數(shù)都大于0.8,結(jié)果見表1,說明對亞細胞定位的預(yù)測結(jié)果的準確性很高。
表1 羥甲基化修飾lncRNA的亞細胞定位
2.4 lncRNA 靶向miRNA 的預(yù)測結(jié)果 使用Starbase分析工具預(yù)測lncRNA的靶基因miRNA,發(fā)現(xiàn)只有2 個lncRNA 在數(shù)據(jù)庫中有預(yù)測結(jié)果,分別是LINC00641和LINC00863。其羥甲基化水平見OSID碼圖 3 所示,與 DM 患者相比,DKD 患者的 2 個關(guān)鍵lncRNA 羥甲基化水平降低(P均<0.05)。接著以bioComplex>1 為篩選條件,LINC00641 的靶基因有12 個,分別為 hsa-miR-320b、hsa-miR-194-5p、hsamiR-320d、hsa-miR-539-5p、hsa-miR-320c、hsa-miR-153-3p、hsa-miR-378b、hsa-miR-425-5p、hsa-miR-378d、hsa-miR-378a-3p、hsa-miR-378h、hsa-miR-206。LINC00863 的靶基因為hsa-miR-218-5p。最終確定的2個關(guān)鍵lncRNA預(yù)測的靶基因共有13個。
2.5 羥甲基化修飾lncRNA 診斷價值及表達驗證結(jié)果 對篩選得到的2 個關(guān)鍵lncRNA 進行ROC曲線分析,結(jié)果顯示LINC00641 和LINC00863 在本數(shù)據(jù)集中診斷DKD 準確性均滿足AUC≥0.8,具有較好的診斷價值,見OSID 碼圖4。與對照組和DM組 相 比 ,DKD 組 腎 組 織 LINC00863、LINC00641 mRNA 表達水平降低(P均<0.05),見表2。
表2 DKD小鼠腎組織中相關(guān)lncRNA的表達水平()
表2 DKD小鼠腎組織中相關(guān)lncRNA的表達水平()
注:與對照組相比,*P<0.05;與DM組相比,#P<0.05。
組別對照組DM組DKD組LINC00641 1.01±0.16 0.80±0.08 0.57±0.04**#n 3 3 3 LINC00863 1.00±0.16 0.92±0.14 0.66±0.06*#
2.6 miRNA 靶基因的篩選及功能富集結(jié)果 對DKD 腎組織轉(zhuǎn)錄組數(shù)據(jù)進行差異分析(|log2FC|>0.5,F(xiàn)DR<0.05),上調(diào)基因 1 259 個,下調(diào)基因1 386 個,見 DSID 碼圖 5A。使用數(shù)據(jù)庫 miRDB 和TargetScan 分別預(yù)測上述13 個miRNA 的靶向mRNA,然后分別與DKD 轉(zhuǎn)錄組差異基因取交集、去重后,最終得到可在外部數(shù)據(jù)集中驗證出的246個差異靶基因。對這246 個基因進行GO 富集分析,主要與泌尿生殖系統(tǒng)發(fā)育、腎臟發(fā)育、腎系統(tǒng)發(fā)育、腎上皮細胞及后腎的發(fā)育等生物學(xué)途徑相關(guān),見 DSID 碼圖 5B。
2.7 ceRNA 調(diào)控網(wǎng)絡(luò)構(gòu)建結(jié)果 將所得lncRNA、miRNA 與 mRNA 在 Cytoscape3.8.0 中繪制出 ceRNA網(wǎng)絡(luò),共246條通路,261個節(jié)點,259條邊。見OSID碼圖6。
DKD 是一種由于DM 患者長期處于高血糖狀態(tài)引起的慢性腎臟病,其發(fā)病機制復(fù)雜。研究顯示,lncRNA 在多種慢性疾病的進展中起關(guān)鍵作用。動物實驗顯示,使用TGF-β1處理小鼠系膜細胞后,通過lncRNA 啟動子和原癌基因Ets-1 的組蛋白乙酰化,miR-192 與其宿主 lncRNA CJ241444 共同調(diào)節(jié),導(dǎo)致Smads 的富集和lncRNA 以及miR-192 的上調(diào)[12]。KATO 等[13]研究顯示,具有 DKD 相關(guān)功能的關(guān)鍵miRNA(miR-216a和miR-217)由TGF-β1及其宿主lncRNA RP23-298H6.1-001 在系膜細胞中被誘導(dǎo)。其后續(xù)研究顯示,lnc-megacluster(lnc-MGC)是miR-379 簇中近 40 個 miRNA 的 lncRNA 宿主,可在早期DKD 小鼠中促進系膜細胞的細胞外基質(zhì)積累和肥大[14]。在 1 型和 2 型 DM 小鼠的腎小球以及暴露于高糖培養(yǎng)的小鼠系膜細胞中,lnc-MGC 及其幾種駐留miRNA 表達增加,主要是TGF-β1通過涉及內(nèi)質(zhì)網(wǎng)應(yīng)激相關(guān)轉(zhuǎn)錄因子CHOP(C/EBP 同源蛋白)的機制。因此,lnc-MGC 可以增加DKD 中的內(nèi)質(zhì)網(wǎng)應(yīng)激,這反過來可能導(dǎo)致lnc-MGC 的持續(xù)表達,繼續(xù)循環(huán)并可能有助于代謝記憶。值得注意的是,在暴露于高葡萄糖和TGF-β1下,人類系膜細胞中的lnc-MGC 直系同源物也會上調(diào)。這是個重要發(fā)現(xiàn),因為與miRNA 不同,lncRNA 通常在物種間不太保守,這提示該lncRNA 簇可能與人類DKD 相關(guān)。此外,有研究報道,血漿cfDNA 攜帶了起源細胞的遺傳和表觀遺傳信息[1]。所以,本研究基于人血漿來源cfDNA 的羥甲基化修飾lncRNA 在DKD 調(diào)控網(wǎng)絡(luò)中進行初步探索。
本研究通過對DKD及DM 患者血漿cfDNA 進行5hmC 全基因組測序,結(jié)果顯示整體5hmC 信號主要在 TSS 區(qū)域富集,RNA 的轉(zhuǎn)錄始于 TSS,并且 DM 與DKD 患者之間存在顯著差異,表明這些區(qū)域在通過5hmC調(diào)節(jié)疾病基因(如lncRNA基因)表達中發(fā)揮關(guān)鍵作用。使用WGCNA 算法得到與DKD 相關(guān)編碼lncRNA 的關(guān)鍵5hmC 標志物,用這種計算方法的優(yōu)勢是:以生物網(wǎng)絡(luò)構(gòu)建為基礎(chǔ),能夠更加精準的展現(xiàn)生物學(xué)特性;可幾乎覆蓋到人類的所有編碼基因;與已發(fā)表的研究偏倚性較小。該結(jié)果為后續(xù)疾病的深入研究提供了更廣泛的理論基礎(chǔ)。
此外,本研究通過亞細胞定位確定了15 個lncRNA 在細胞質(zhì)中的表達,表明上述lncRNA 可通過ceRNA 機制調(diào)控基因表達參與DKD 的發(fā)病。Starbase 預(yù)測結(jié)果顯示,相關(guān)lncRNA 可通過調(diào)控miRNA 從而影響DKD 中的基因表達,但我們發(fā)現(xiàn)只有2 個lncRNA 在Starbase 數(shù)據(jù)庫中有預(yù)測結(jié)果,分別為 LINC00863 和 LINC00641,同時發(fā)現(xiàn)這 2 個lncRNA 的羥基化水平能很好的區(qū)分DKD 和DM。另外,在DKD小鼠腎臟組織中對這2個lncRNA的表達水平也得到了與預(yù)測一致的實驗驗證結(jié)果。因此,我們認為LINC00863 和LINC00641 很可能成為DKD 診斷的潛在生物標志物和治療靶點。我們進一步對已在小鼠腎組織中得到有效驗證的lncRNA,篩選得到下游調(diào)控miRNA,最后基于數(shù)據(jù)庫預(yù)測上述miRNA 的靶向mRNA,為了得到較為準確的lncRNA-miRNA-mRNA 調(diào)控網(wǎng)絡(luò)圖,我們篩選與外部DKD 轉(zhuǎn)錄組數(shù)據(jù)集差異表達的靶向mRNA,得到具有一定可信度的ceRNA 調(diào)控網(wǎng)絡(luò)圖。但事實上ceRNA 目前還處于一個起步階段,具體的研究案例比較少,本研究只是可視化構(gòu)建了一個基本的網(wǎng)絡(luò),具體的調(diào)控方式還有待繼續(xù)探究。另外,對于最終篩選得到的關(guān)鍵lncRNA文獻報道較少,有研究表明LINC00641 過表達會抑制乳腺癌細胞增殖、遷移和侵襲,可通過海綿化miR-194-5p 抑制乳腺癌細胞增殖、遷移和侵襲[15]。
最后,基于Metascape網(wǎng)站對我們篩選出的基因進行GO 功能富集分析,結(jié)果顯示,主要參與泌尿生殖系統(tǒng)發(fā)育和腎臟發(fā)育通路,說明持續(xù)高血糖的環(huán)境對于腎臟功能及結(jié)構(gòu)會存在一定的不利影響,與DKD的發(fā)病機制息息相關(guān)。
綜上所述,本研究基于臨床樣本數(shù)據(jù),通過對DKD 及 DM 患者的血漿 cfDNA 進行 5hmC-Seal測序,發(fā)現(xiàn)了與DKD 相關(guān)編碼lncRNA 的關(guān)鍵5hmC 標志物,構(gòu)建了完整的ceRNA 調(diào)控網(wǎng)絡(luò),為DKD 分子機制的深入研究提供了嚴謹?shù)臄?shù)據(jù)支持。