肖劍偉, 蔡 旭, 黃新民, 洪易煒, 汪榮盛
(1. 深圳市福田區(qū)風(fēng)濕病專科醫(yī)院風(fēng)濕免疫科,廣東 深圳 518000;2. 上海市光華中西醫(yī)結(jié)合醫(yī)院風(fēng)濕免疫科,上海 200052)
痛風(fēng)性關(guān)節(jié)炎(gouty arthritis,GA)是一種常見的炎癥性關(guān)節(jié)炎,發(fā)作時(shí)常引起患者極大的痛苦。 研究顯示痛風(fēng)患病率從<1%到6.8%不等,其患病率和發(fā)病率在不斷上升[1-2]。GA是由于尿酸單鈉晶體(monosodium urate crystal, MSU)在關(guān)節(jié)和關(guān)節(jié)周圍軟組織中沉積引起[3]。 MSU 誘發(fā)炎癥反應(yīng),刺激局部炎癥細(xì)胞分泌腫瘤壞死因子 (tumor necrosis factor,TNF)-α 和白介素(interleukin,IL)-1β 等炎癥因子,進(jìn)一步加重炎癥[4]。 鑒于目前部分患者對(duì)藥物治療反應(yīng)不佳,因而探索痛風(fēng)發(fā)病的潛在機(jī)制對(duì)于其治療具有重要意義。
長(zhǎng)鏈非編碼RNA(long noncoding RNA, lncRNA)為長(zhǎng)度超過200 個(gè)核苷酸且未翻譯成功能性蛋白質(zhì)的RNA[5],其主要通過在轉(zhuǎn)錄和轉(zhuǎn)錄后水平調(diào)節(jié)下游基因來實(shí)現(xiàn)其調(diào)控功能[6]。 多個(gè)研究動(dòng)物模型研究顯示,lncRNA 可通過調(diào)控炎癥因子分泌等來促進(jìn)或減輕GA 的發(fā)展[7-8]。另一項(xiàng)研究顯示痛風(fēng)患者的外周血單個(gè)核細(xì)胞 (peripheral blood mononuclear cell,PBMC) 中差異表達(dá)的AJ227913 可能參與痛風(fēng)的發(fā)病機(jī)制。 以上研究結(jié)果表明,探索異常表達(dá)的lncRNA 可為痛風(fēng)患者提供有希望的診斷和治療靶點(diǎn)[9]。
本研究從基因表達(dá)綜合 (Gene Expression Omnibus,GEO)數(shù)據(jù)庫(kù)下載痛風(fēng)相關(guān)微陣列數(shù)據(jù)集,基于機(jī)器學(xué)習(xí)的方式識(shí)別痛風(fēng)患者PBMC 中的關(guān)鍵lncRNA, 驗(yàn)證關(guān)鍵lncRNA 表達(dá)情況及l(fā)ncRNA 與炎癥指標(biāo)及尿酸水平的相關(guān)性, 為進(jìn)一步深入了解痛風(fēng)的發(fā)病機(jī)制及診斷和治療提供新方向。
從GEO 數(shù)據(jù)庫(kù)中以“Gout”作為關(guān)鍵詞檢索,得到數(shù)據(jù)集GSE160170(檢測(cè)平臺(tái)為GPL21827),共包含6 個(gè)正常樣本和6 個(gè)痛風(fēng)樣本。 使用Perl 軟件 (版本號(hào)5.36.0)對(duì)GSE160170 數(shù)據(jù)集進(jìn)行基因重注釋,獲取mRNA 及l(fā)ncRNA表達(dá)量。
對(duì)得到的差異lncRNA 表達(dá)譜采用機(jī)器學(xué)習(xí)方法進(jìn)一步篩選關(guān)鍵基因。將數(shù)據(jù)分為訓(xùn)練集及測(cè)試集。使用R 語言中的glmnet 包, 通過LASSO 回歸對(duì)lncRNA 表達(dá)譜進(jìn)行篩選。 然后使用隨機(jī)森林(random forest,RF)方法,設(shè)置參數(shù)ntree=1 000,mtry=3, 取MeanDecreaseGini 排名前5 的基因作為核心基因。 將上述2 種方法計(jì)算的結(jié)果取交集得到關(guān)鍵基因。使用R 軟件ROCR 包繪制lncRNA 的受試者操作特征曲線(receiver operating characteristic curve, ROC 曲線)用于評(píng)估lncRNA 的診斷能力。
將得到的lncRNA 通過R 軟件limma 包,分析其共表達(dá)的蛋白編碼基因,將共表達(dá)基因通過String 網(wǎng)站(https://stringdb.org)進(jìn)行蛋白質(zhì)互作網(wǎng)絡(luò)分析,導(dǎo)入Cytoscape 軟件(版本號(hào)3.8.2),通過cytoHubba 插件篩選HUB 基因。
將得到的共表達(dá)蛋白編碼基因,使用R 軟件“clusterProfiler”包及“org.Hs.eg.db”進(jìn)行GO 富集分析及KEGG 信號(hào)通路分析。 以P<0.05 為差異具有統(tǒng)計(jì)學(xué)意義。
1. 臨床樣本資料: 選取深圳市福田區(qū)風(fēng)濕病??漆t(yī)院風(fēng)濕免疫科符合2012 美國(guó)風(fēng)濕病協(xié)會(huì)制定的痛風(fēng)診斷標(biāo)準(zhǔn),排除合并有惡性腫瘤、發(fā)病前3 d 服用過非甾類藥物或激素類藥物以及嚴(yán)重肝功能、腎功能障礙的患者。納入2021年4—10月確診的急性GA 發(fā)作患者共10 例, 其中男性9例,女性1 例,年齡33~57 歲,平均(40.9±9.2)歲。 收集患者紅細(xì)胞沉降率(erythrocyte sedimentation rate,ESR)、C 反應(yīng)蛋白(C reactive protein,CRP)、IL-6 及血尿酸等臨床資料。按照痛風(fēng)患者性別、年齡比例選擇10 名我院健康體檢者作為對(duì)照組,其中男性8 名,女性2 名,年齡40~56 歲,平均(46.2±5.7) 歲。 2 組之間年齡差異無統(tǒng)計(jì)學(xué)意義 (t=-1.554,P=0.196)。 本研究通過醫(yī)院倫理委員會(huì)審查 (倫理審查編號(hào):FS202110002),研究對(duì)象均自愿參與,簽署知情同意書。
2. 試劑:淋巴細(xì)胞Ficoll-Hypaque 分離液購(gòu)自上海善然生物科技公司,TRIzol 試劑購(gòu)自美國(guó)賽默飛世爾科技公司,PrimeScript RT 逆轉(zhuǎn)錄試劑盒、SYBR Premix Ex Taq Ⅱ熒光定量試劑盒購(gòu)自日本TaKaRa 公司。
3. RNA 提取及實(shí)時(shí)熒光定量PCR(quantitative real-time polymerase chain reaction, qRT-PCR): 使用含有乙二胺四乙酸(ethylene diamine tetraacetic acid, EDTA)的采血管收集對(duì)照組及痛風(fēng)組患者的外周血3 mL,通過Ficoll-Hypaque 密度梯度離心法分離和純化PBMC, 磷酸鹽緩沖液(phosphate buffer solution, PBS)沖洗3 次,置于-80 ℃保存。 各研究對(duì)象取PBMC 約3×106個(gè), 使用TRIzol 試劑從PBMC 中提取總RNA, 并使用NanoDrop One 超微量紫外分光光度計(jì)檢測(cè)RNA 吸光度(A),取A260nm/A280nm值為1.8~2.0 的樣本用于后續(xù)實(shí)驗(yàn)。 RNA 樣本置于-80 ℃保存。
按照PrimeScript RT 逆轉(zhuǎn)錄試劑盒說明書操作。 將2 μL RNA 樣本逆轉(zhuǎn)錄為互補(bǔ)DNA (complementary DNA,cDNA),隨后按照SYBR Premix Ex Taq Ⅱ說明書在Applied Biosystems 7500 實(shí)時(shí)PCR 系統(tǒng)上進(jìn)行qRT-PCR。引物序列由生工生物工程(上海)股份有限公司合成,以甘油醛-3-磷酸脫氫酶(glyceraldehyde 3-phosphate dehydrogenase, GAPDH)為內(nèi)參,其中LINC01465 引物序列(5’- 3’)上游為AAGCAAGCCTGGGCAATG,下游為TAACAAATCACCCTGAAAC;GAPDH引物序列(5’- 3’)上游為GCCCAATACGACCAAATCC,下游為AGCCACATCGCTCAG ACAC。LINC01465 的qRT-PCR 反應(yīng)系統(tǒng)包含2 μL cDNA、正向和反向引物各0.8 μL、10×ROX reference dye Ⅱ0.4 μL、2×SYBR Premix Ex Taq Ⅱ10 μL、RNase Free ddH2O 6 μL, 總體積為20 μL。 循環(huán)參數(shù):97 ℃10 min;95 ℃15 s,62 ℃60 s,共40 個(gè)循環(huán)。 LINC01465 于62 ℃時(shí)使用High Resolution Melting Software v3.0.1 軟件采集熒光信號(hào),并分析熔解曲線。采用2-△△Ct法以GAPDH 為內(nèi)參計(jì)算LINC01465 的表達(dá)水平,并計(jì)算LINC01465 與ESR、CRP、IL-6 及尿酸水平的相關(guān)性。
與健康體檢者對(duì)比,GA 患者共有37 個(gè)lncRNA 差異表達(dá)(見圖1)。
圖1 健康體檢者與GA 患者差異表達(dá)lncRNA
Lasso 回歸篩選得到3 個(gè)關(guān)鍵基因(LINC01465、LINC01355、LINC02100),RF 算 法 篩 選 得 到5 個(gè) 關(guān) 鍵 基 因(FARP1.AS1、LINC01465、FAM242C、IFNG.AS1、PACERR),2 個(gè)結(jié)果取交集,得到潛在生物標(biāo)志物L(fēng)INC01465(見圖2)。ROC 診斷曲線下面積 (area under the curve, AUC)=0.889,P=0.001(見圖3)。
圖2 Lasso 回歸與RF 算法篩選關(guān)鍵基因
圖3 ROC 診斷曲線
共表達(dá)結(jié)果顯示, 共有1 516 個(gè)蛋白編碼基因余LINC01465 共表達(dá)。 HUB 基因篩選結(jié)果顯示, 在整個(gè)網(wǎng)絡(luò)中,缺氧誘導(dǎo)因子1α(hypoxia-inducible factor 1α,HIF1α)、磷脂酰肌醇-3 激酶催化亞基α (phosphoinositide-3 kinase catalytic alpha polypeptide,PIK3CA)、IL-6、 哈維大鼠肉瘤病毒腫瘤基因同源物 (Harvey rat sarcoma viral oncogene homolog, HRAS)、β-連環(huán)素1(β-catenin 1, CTNNB1)處于網(wǎng)絡(luò)核心,其表達(dá)與LINC01465 表達(dá)均呈正相關(guān)(見圖4)。
圖4 LINC01465 共表達(dá)分析及HUB 基因
GO 富集分析結(jié)果顯示,其生物過程(biological process,BP)包括RNA 剪接、氧化磷酸化等,分子功能主要包括抗氧化活性、 還原型煙酰胺腺嘌呤二核苷酸 (reduced nicotinamide adenine dinucleotide,NADH) 脫氫酶活性等功能,細(xì)胞成分顯示主要定位于線粒體內(nèi)膜、呼吸鏈復(fù)合體等(見圖5A)。 KEGG 信號(hào)通路分析顯示主要富集于煙酸和煙酰胺代謝、TNF 信號(hào)通路、PI3K-Akt 信號(hào)通路、 趨化因子信號(hào)通路等代謝及炎癥通路(見圖5B)。
圖5 GO 富集分析及KEGG 信號(hào)通路分析結(jié)果
qRT-PCR 結(jié)果顯示, 在痛風(fēng)患者中LINC01465 表達(dá)明顯升高(P=0.030)(見圖6)。 相關(guān)性分析顯示,LINC01465 表達(dá)與ESR (r=0.658,P=0.030)、CRP (r=0.660,P=0.040)、IL-6(r=0.794,P=0.008) 表達(dá)呈正相關(guān), 與尿酸無相關(guān)性 (r=0.450,P=0.190)(見圖7)。 ROC 診斷曲線顯示AUC=0.860,P=0.001(見圖8)。
圖6 LINC01465 在對(duì)照組及GA 組中qRT-PCR 結(jié)果
圖8 ROC 診斷曲線
機(jī)器學(xué)習(xí)在風(fēng)濕免疫疾病風(fēng)險(xiǎn)因素預(yù)測(cè)、治療愈后效果預(yù)測(cè)等方面得到廣泛應(yīng)用。 筆者通過使用機(jī)器學(xué)習(xí)鑒定類風(fēng)濕關(guān)節(jié)炎的潛在關(guān)鍵基因[10]。另一項(xiàng)研究通過多種機(jī)器學(xué)習(xí)方法,構(gòu)建了系統(tǒng)性紅斑狼瘡風(fēng)險(xiǎn)概率指數(shù),用于狼瘡患者的早期診斷和治療[11]。與傳統(tǒng)通過不同分組尋找差異表達(dá)的方法相比,機(jī)器學(xué)習(xí)的方法能夠更加準(zhǔn)確地識(shí)別出GA 診斷及治療潛在相關(guān)的lncRNA。
目前,GA 的診斷主要依賴于血清尿酸水平的升高。 但研究表明,GA 與高尿酸血癥的相關(guān)性尚不明確。 高尿酸血癥使患者容易出現(xiàn)痛風(fēng)急性發(fā)作, 但也有很多高尿酸血癥患者無明顯癥狀,部分GA 患者尿酸亦無明顯升高[12]。 血液尿酸水平不能預(yù)測(cè)GA 的發(fā)作, 也并非GA 診斷的標(biāo)志物。尋找有效的生物標(biāo)志物,對(duì)GA 進(jìn)行早期診斷及治療對(duì)于預(yù)防關(guān)節(jié)畸形及提高患者的生活質(zhì)量有重要意義,闡明GA 的發(fā)病機(jī)制對(duì)于疾病的早期診斷和治療至關(guān)重要。
大量研究表明,lncRNA 調(diào)控在各種風(fēng)濕性疾病的發(fā)生和發(fā)展中發(fā)揮重要作用[13]。 目前關(guān)于lncRNA 在GA 患者中的研究仍較少。本研究中GA 急性發(fā)作患者LINC01465 表達(dá)明顯上調(diào)。 芯片數(shù)據(jù)及實(shí)驗(yàn)驗(yàn)證均顯示其具有良好的分類診斷功能,AUC 均大于0.8, 提示LINC01465 能作為GA 患者的診斷標(biāo)志物之一。 同時(shí),LINC01465 與ESR、CRP、IL-6等炎癥因子表達(dá)呈正相關(guān),而與血清尿酸水平無明顯相關(guān),提示LINC01465 與痛風(fēng)急性發(fā)作有關(guān), 也可能是急性期發(fā)作的生物標(biāo)志物。
本研究通過與LINC01465 共表達(dá)的蛋白來推測(cè)其潛在功能。 HUB 基因篩選得到5 個(gè)關(guān)鍵基因, 分別是HIF1α、PIK3CA、IL-6、HRAS、CTNNB1。其中,PIK3CA 由1 個(gè)85 kDa的調(diào)節(jié)亞基和1 個(gè)110 kDa 的催化亞基組成, 是PI3K 通路的組成部分[14]。 研究顯示,尿酸結(jié)晶會(huì)觸發(fā)脾酪酸激酶(spleen tyrosine kinase,Syk)激活PI3K 信號(hào)通路誘導(dǎo)細(xì)胞因子的產(chǎn)生導(dǎo)致炎癥[15]。HRAS 是腎素-血管緊張素系統(tǒng)(reninangiotensin system, RAS)基因產(chǎn)生4 種主要的蛋白質(zhì)產(chǎn)物之一, 另外3 個(gè)為Kirsten 大鼠肉瘤病毒腫瘤基因同源物(Kirsten rat sarcoma viral oncogene homolog,KRAS4) 的2 個(gè)異構(gòu)體KRAS4A 和KRAS4 以及神經(jīng)母細(xì)胞瘤RAS 病毒腫瘤基因同源物 (neuroblastoma RAS viral oncogene homolog,NRAS)。 這4 個(gè)蛋白具有高度同源性的序列和結(jié)構(gòu),且都具有保守的G 結(jié)構(gòu)域和C 端高突變區(qū)。RAS 屬于鳥苷三磷酸(guanosine triphosphate,GTP)酶家族,是細(xì)胞增殖、遷移、凋亡和存活的調(diào)節(jié)劑[16]。 RAS 蛋白與鳥苷二磷酸(guanosine diphosphate,GDP)結(jié)合時(shí)處于非活性狀態(tài)(RASGDP),與GTP 結(jié)合處于活性狀態(tài)(RAS-GTP)。 RAS-GTP 與下游效應(yīng)器[包括Raf、PI3K、Ral 鳥嘌呤核苷酸交換因子(Ral guanine nucleotide exchange factors,RalGEF)]結(jié)合,轉(zhuǎn)導(dǎo)信號(hào)以調(diào)節(jié)生物行為[17-19]。 前2 個(gè)相應(yīng)的通路RAS-Raf-絲裂原活化的細(xì)胞外信號(hào)調(diào)節(jié)激酶(mitogen extracellular signal regulated kinase, MEK)-細(xì)胞外信號(hào)調(diào)節(jié)激酶(extracellular signal regulated kinase, ERK)和RAS-PI3K-Akt-哺乳動(dòng)物雷帕霉素靶蛋白復(fù)合物 (mammalian target of rapamycin complex,mTORC),是RAS 蛋白的基本信號(hào)通路[18]。 由此可見,PIK3CA蛋白與HRAS 之間相互聯(lián)系,HRAS 可能通過激活PIK3CA進(jìn)而激活PI3K-Akt 信號(hào)通路。 Cavalcanti 等[20]觀察到痛風(fēng)患者血清中IL-6 水平與痛風(fēng)石(P=0.005)和關(guān)節(jié)畸形(P=0.000 8)相關(guān)。動(dòng)物實(shí)驗(yàn)發(fā)現(xiàn),尿酸結(jié)晶可刺激M1 巨噬細(xì)胞產(chǎn)生IL-6,介導(dǎo)中性粒細(xì)胞浸潤(rùn),進(jìn)而產(chǎn)生炎癥級(jí)聯(lián)反應(yīng),加重炎癥反應(yīng),形成惡性循環(huán)[21]。 提示IL-6 在GA 中發(fā)揮重要作用。HIF 由HIF1α 和HIF1β 2 個(gè)亞基組成。當(dāng)局部炎癥發(fā)生時(shí),血流速度減慢,炎癥細(xì)胞耗氧量增加導(dǎo)致局部環(huán)境缺氧,HIF 活化,參與NF-κB 活化和糖酵解[22]。 糖酵解可誘發(fā)炎癥反應(yīng), 還可促進(jìn)NLRP3 炎性小體的活化以及IL-6 和IL-1β 等炎性細(xì)胞因子的分泌[23]。有研究表明,幾丁質(zhì)可通過抑制巨噬細(xì)胞中HIF1α 和NLRP3 的表達(dá)來減少IL-1β 的分泌,從而治療GA[24],表明HIF1α 可能通過調(diào)節(jié)NLRP3 通路對(duì)GA 產(chǎn)生影響。 CTNNB1 蛋白又名為β-連環(huán)素, 是經(jīng)典Wnt 信號(hào)通路的關(guān)鍵下游組分。 研究發(fā)現(xiàn),尿酸能夠顯著促進(jìn)小鼠巨噬細(xì)胞中β-連環(huán)素的表達(dá), 促進(jìn)巨噬細(xì)胞M1 極化和遷移,從而促進(jìn)炎癥[25]。
5個(gè)關(guān)鍵基因涉及PI3K/Akt、NF-κB及Wnt 信號(hào)通路,功能涉及到炎癥反應(yīng)、 糖酵解等, 這與GO 富集分析及KEGG 信號(hào)通路分析一致。 而3 個(gè)通路之間存在交互作用,其中PI3K-Akt 處于幾個(gè)通路的核心地位。 研究顯示,PI3KAkt 通路通過激活NF-κB 在炎癥反應(yīng)中發(fā)揮重要作用,而NF-κB 也是激活NLRP3 炎性體的上游信號(hào)之一[26]。 PI3K 抑制劑可減少骨關(guān)節(jié)炎大鼠的中性粒細(xì)胞凋亡和軟骨細(xì)胞炎癥[27]。 β-連環(huán)素與NF-κB 形成復(fù)合物,負(fù)調(diào)節(jié)NF-κB 活性,導(dǎo)致NF-κB 靶基因表達(dá)降低[28]。在樹突細(xì)胞中,敲低β-連環(huán)素增強(qiáng)了脂多糖(lipopolysaccharide,LPS)誘導(dǎo)的NF-κB 活化和促炎細(xì)胞因子的產(chǎn)生[29]。 這些研究揭示了β-連環(huán)素的抗炎作用, 并且β-連環(huán)素信號(hào)傳導(dǎo)使樹突細(xì)胞進(jìn)入耐受狀態(tài), 從而限制炎癥反應(yīng)。 多項(xiàng)研究顯示HIF1α 受PI3K/Akt/mTOR 信 號(hào) 通 路 的 調(diào) 節(jié)[30-31]。 PI3K 抑 制 劑LY294002[32]和PI3K/mTOR 雙重抑制劑NVP-BEZ235[33]可抑制由缺氧引起的Akt 活化和HIF1α 的表達(dá)。 HIF1α 激活可上調(diào)己糖激酶的表達(dá)水平[34],己糖激酶是一種限速酶,能夠促進(jìn)細(xì)胞內(nèi)葡萄糖不可逆磷酸化為6-磷酸葡萄糖, 使葡萄糖分子進(jìn)入糖酵解循環(huán),從而增強(qiáng)糖酵解。 這種多個(gè)通路之間的相互作用高度提示5 個(gè)關(guān)鍵基因通過復(fù)雜的調(diào)控在GA 的發(fā)病中發(fā)揮重要作用, 而LINC01465 可能影響1 個(gè)或多個(gè)關(guān)鍵基因的轉(zhuǎn)錄或翻譯來達(dá)到調(diào)控的目的。
綜上,本研究確定了LINC01465 為GA 潛在的診斷和治療靶點(diǎn),并在患者中對(duì)其表達(dá)進(jìn)行了驗(yàn)證。 然而,對(duì)于其具體的作用機(jī)制及生物學(xué)功能仍需進(jìn)一步研究來驗(yàn)證。