国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于GEO數(shù)據(jù)庫結(jié)合CT影像預(yù)測肺癌臨床分期的分子標(biāo)志物及其診斷預(yù)測模型的建立

2021-11-22 00:46歐陽錦余石群黃邵鑫
關(guān)鍵詞:隊列結(jié)節(jié)肺癌

歐陽錦,羅 亭,余石群,黃邵鑫,汪 鑫

(1.南昌大學(xué)江西省預(yù)防醫(yī)學(xué)重點實驗室,南昌 330006;2.九江學(xué)院基礎(chǔ)醫(yī)學(xué)院精準(zhǔn)預(yù)防醫(yī)學(xué)實驗室,江西 九江 332000)

肺癌是癌癥相關(guān)死亡的主要原因,在全球范圍內(nèi)發(fā)病率呈上升趨勢[1]。其癥狀多出現(xiàn)較晚,確診時已處病變的晚期,發(fā)現(xiàn)于晚期的非小細胞肺癌患者的5年生存率平均只有14%,而接受治療的I期患者的5年生存率可達83%[2]。因此,提高肺癌早期診斷率是改善肺癌患者預(yù)后的重要方法?;赥NM分期,目前非小細胞肺癌患者的5年生存率估計在IA期的73%到Ⅳ期的13%之間[3]。TNM分期仍然是臨床肺癌復(fù)發(fā)率和生存率的預(yù)測依據(jù),但目前對肺癌患者的確診和病變范圍(國際TNM分類/分期)的判斷仍必須通過活檢來確認[4]。影像學(xué)結(jié)果在肺癌臨床分期的準(zhǔn)確分類上存在潛在的缺陷和局限性[5],如CT影像用于肺結(jié)節(jié)的檢測雖具有一定的價值,然而很難準(zhǔn)確判斷肺結(jié)節(jié)的性質(zhì)[6]。近來,采用免疫組織化學(xué)、突變圖譜和微陣列方式對腫瘤個體進行分析已應(yīng)用于腫瘤臨床分期領(lǐng)域[7]。例如,癌胚抗原、神經(jīng)元特異性烯醇化酶等分子標(biāo)志物已被應(yīng)用于臨床檢測,然而其靈敏度和特異度有限[8],很少應(yīng)用于肺癌早期診斷中。

基因表達數(shù)據(jù)庫(gene expression omnibus,GEO)是來自高通量微陣列實驗基因表達數(shù)據(jù)的公共存儲庫[9]。借助該數(shù)據(jù)庫,利用生物信息學(xué)工具挖掘腫瘤的分子標(biāo)志物,可縮短對腫瘤標(biāo)志物的研究時間,節(jié)約研究成本?;贑T掃描的附加診斷標(biāo)志物的開發(fā)證實可用于肺癌分期預(yù)測[6]。在臨床環(huán)境中,評估選定的潛在基因表達可使臨床醫(yī)生能夠根據(jù)每個人的遺傳物特征在影像結(jié)節(jié)大小的基礎(chǔ)上做出更準(zhǔn)確的分期診斷,并在總體存活率、進展時間和治療反應(yīng)方面顯著改善治療效果[10]。本研究從GEO中篩選2個肺癌相關(guān)芯片數(shù)據(jù)集,通過分析建立一個基于影像分析結(jié)果(肺結(jié)節(jié)最大直徑≤3 cm)的基因研究網(wǎng)絡(luò),篩選確定與肺癌診斷密切相關(guān)的基因,建立診斷模型和預(yù)測列線圖。

1 資料與方法

1.1 資料

以“肺癌”“TNM”為關(guān)鍵詞進行檢索,從GEO(http://www.ncbi.nlm.nih.gov/geo/)數(shù)據(jù)庫下載肺癌隊列的基因表達譜和CT信息。以GSE13213數(shù)據(jù)為訓(xùn)練隊列,從肺癌患者中納入54例小結(jié)節(jié)(T1期,最大直徑≤3cm)患者;以GSE43580數(shù)據(jù)為驗證隊列,共入選38例小結(jié)節(jié)(T1期,最大直徑≤3 cm)肺癌患者。按其分期分為2組:早期(Ⅰ期)組和中晚期(Ⅱ、Ⅲ和Ⅳ期)組[11]。預(yù)測模型構(gòu)建流程見圖1。

圖1 診斷預(yù)測模型分析流程圖

1.2 方法

1.2.1 肺癌分期的差異表達基因分析

以|log2FC|>1和P<0.05為篩選標(biāo)準(zhǔn),用R4.0.3軟件中的LIMMA軟件包進行肺癌分期的差異表達基因分析。使用在線工具ClustVis(https://biit.cs.ut.ee/clustvis/)繪制熱圖和火山圖。將獲得的差異表達基因分別導(dǎo)入在線軟件draw Venn diagrams(http://bioinformatics.psb.ugent.be/webtools/Venn/),獲得2個隊列取交集后的重疊差異(共差異)基因及韋恩圖。

利用Metascape對訓(xùn)練隊列中差異表達的基因進行GO(Gene Ontology)與KEGG(Kyoto Encyclopedia of Gene and Genome)功能分析。GO分析為涵蓋分子和細胞生物學(xué)眾多領(lǐng)域的基因注釋提供了結(jié)構(gòu)化和受控的詞匯表和分類[12]。利用String數(shù)據(jù)庫對差異表達的基因構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò),在Cytoscape軟件中可視化。

1.2.2 肺癌分期的預(yù)測基因篩選及分析

在共差異基因的基礎(chǔ)上,利用R軟件進行基因分析、分類預(yù)測和比較,并篩選區(qū)分早、中晚期肺癌的預(yù)測基因。利用受試者工作特征曲線(ROC)分析這些預(yù)測基因的診斷價值。

1.3 統(tǒng)計學(xué)方法

2 結(jié)果

2.1 差異表達的基因

差異表達基因分析結(jié)果顯示,54例訓(xùn)練隊列和38例驗證隊列分別獲得161個和437個與肺癌分期相關(guān)的差異表達基因。訓(xùn)練隊列中,與中晚期組比較,早期組107個基因表達上調(diào)和54個基因表達下調(diào)?;虮磉_的熱圖見圖2A。驗證隊列中,與中晚期組比較,早期組193個基因表達上調(diào),244個基因表達下調(diào)?;虮磉_的熱圖見圖2B。在2隊列中,2組的基因表達模式不同?;虮磉_的火山圖,見圖2C和圖2D。韋恩圖比較2個隊列的基因差異表達,發(fā)現(xiàn)有7個重疊(共)差異表達基因。見圖2E。

2.2 差異表達基因的功能富集

訓(xùn)練隊列中161個差異表達基因進行GO功能注釋的結(jié)果顯示,這些基因的功能分為3類即生物過程(圖3A)、分子功能(圖3B)和細胞成分(圖3C)。在這3個類別中,差異表達基因主要富集的條目分別是“含膠原蛋白的細胞外基質(zhì)”“受體調(diào)節(jié)活性”和“腺體發(fā)育”。

A:訓(xùn)練隊列熱圖;B:驗證隊列熱圖;圖2 基因差異表達分析

C:訓(xùn)練隊列火山圖;D:驗證隊列火山圖;E:韋恩圖(左為高表達;右為低表達)。

訓(xùn)練隊列的差異基因進行KEGG富集分析發(fā)現(xiàn),所有差異表達基因主要富集于4類通路即谷胱甘肽代謝、補體和凝血級聯(lián)、造血細胞譜系和膽汁分泌(圖3D)。“癌癥通路”是谷胱甘肽代謝中最大的一組,其次是“谷胱甘肽代謝”和“肝細胞癌”。

A:GO富集:生物過程;B:GO富集:分子功能;C:GO富集:細胞成分;D:KEGG富集。圖3 訓(xùn)練隊列差異表達基因的功能富集結(jié)果

2.3 蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析

蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析結(jié)果顯示了重要的模塊,其中度值表示節(jié)點的大小。這些包括了在模塊中識別的所有重要的蛋白質(zhì)。該模塊由141條邊定義,涉及82個節(jié)點。SOX2、CCND1、AR、CD19、BMP2、WNT3a、NR0B2、C8A、CD38、FGG、ITIH2、HPGDS和POU2AF1是連接最高的節(jié)點。蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析見圖4。

圖4 蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析模型圖

2.4 與肺癌相關(guān)的風(fēng)險分析

單因素Logistic回歸分析結(jié)果顯示,在訓(xùn)練隊列2組的7個共差異表達基因中,盡管基因SLC16A14和LHX2在訓(xùn)練隊列2組間存在差異,但在2個隊列中的表達模式不同,故其在該研究中不具價值;年齡、性別2組中亦無顯著差異(均P>0.05);基因ZNF257表達與肺癌的病理分期相關(guān),訓(xùn)練隊列(OR=2.26;95%CI:1.29~3.96)、驗證隊列(OR=1.44、95%CI:0.99~2.10)。基因SOX2、KCNJ16和GSTA1的表達與肺癌分期呈負相關(guān)。見表1。

表1 基線資料及單因素Logistic回歸分析

2.5 預(yù)測模型的診斷風(fēng)險值分析

基于4個基因(SOX2,KCNJ16,GSTA1和ZNF257)建立的全模型線性回歸方程在訓(xùn)練和驗證隊列中分別為AUC=-5.225 02-0.725 56×SOX2-0.231 60×KCNJ16-0.550 36×GSTA1+1.400 61×ZNF257和AUC=3.450 09-0.398 41×SOX2-0.379 06×KCNJ16-0.038 51×GSTA1+0.350 74×ZNF257。ROC分析結(jié)果顯示,訓(xùn)練隊列中全模型的靈敏度為83.3%,特異度為92.9%,AUC值為0.917;在驗證隊列中全模型的靈敏度為85.7%,特異度為87.5%,AUC為0.836。見表2。

表2 肺癌病理分期風(fēng)險值預(yù)測

2.6 小結(jié)節(jié)肺癌中晚期預(yù)測列線圖

進一步研究構(gòu)建了一個包含4個基因的診斷列線圖(圖5)。如圖所示,基于LOG轉(zhuǎn)化后的ZNF257、SOX2、KCNJ16和GSTA1基因表達值位于每個變量軸上。例如,在小結(jié)節(jié)肺癌患者中,如果SOX2基因表達值為-3,則可以從SOX2軸到點條畫一條向上的垂直線,以獲得45分。其他指標(biāo)也可以這樣操作,假設(shè)GSTA1表達值為-4時的得分為50分,KCNJ16表達值為-1時的得分為15分,ZNF257表達值為2時的得分為70分,即總分為180分(45分+50分+15分+70分)。最后,小結(jié)節(jié)肺癌中晚期的風(fēng)險約為90%。

圖5 預(yù)測肺小結(jié)節(jié)患者中晚期風(fēng)險列線圖

3 討論

腫瘤分子標(biāo)志物的確定在肺癌早期診斷中具有重要意義。前期研究[13]發(fā)現(xiàn),多種腫瘤基因(P53、NY-ESO-1、Survivin、c-myc、Cyclin B1、GBU4-5、CAGE、P16、SOX2和HUD)的自身抗體在腫瘤診斷中表現(xiàn)出很好的特異性,但其敏感性均較差。此外,EarlyCDT?-Lung測試[14]檢測了7種腫瘤相關(guān)自身抗體即P53、NY-ESO-1、CAGE、GBU4-5、HUD、MAGEA4和SOX2,發(fā)現(xiàn)其特異性達90%但僅識別47%的肺癌。雖然,自身抗體的組合可提高診斷的敏感性,但又會影響其特異性。因此,有必要開發(fā)具有更高的敏感性和特異性的肺癌早期診斷方法。

本研究的診斷模型預(yù)測是基于GEO數(shù)據(jù)庫中的CT診斷結(jié)果(結(jié)節(jié)直徑≤3 cm),篩選確定與肺癌診斷密切相關(guān)的基因。在納入的小結(jié)節(jié)肺癌患者中,通過Logistic回歸分析和多變量分析,獲得由4個差異表達的基因(ZNF257、SOX2、KCNJ16和GSTA1)組成的可用于診斷的預(yù)測模型。該模型的特異度和靈敏度分別為92.9%、83.8%,其模型預(yù)測的靈敏度明顯高于傳統(tǒng)的腫瘤標(biāo)志物[15]。而且納入的基因數(shù)量少,易于操作。本研究結(jié)果還顯示,ZNF257表達上調(diào)和SOX2、KCNJ16、GSTA1表達下調(diào)均與肺癌惡性程度增加有關(guān)。細胞因子SOX2調(diào)控著細胞的自我更新和分化[16]。GSTA1可能是肺癌早期診斷和治療的靶分子[17]。已有研究[18]證實KCNJ16表達下調(diào)與多種腫瘤的發(fā)生有關(guān),但其在腫瘤進展中的復(fù)雜調(diào)控機制仍有待探討。其余的基因ZNF257尚未被報道與癌癥有關(guān),還需要進一步研究它們的生物學(xué)功能[19]。值得注意的是,通路富集分析表明,包括GSTA1在內(nèi)的3個下調(diào)的基因與藥物代謝-細胞色素P450通路、腫瘤發(fā)生和化學(xué)致癌通路密切相關(guān)[20]。此外,本研究基于這4個基因繪制了一個便于臨床使用、準(zhǔn)確度高的診斷列線圖,該圖可預(yù)測CT篩查到的小結(jié)節(jié)肺癌患者的惡性風(fēng)險。然而,該診斷模型的確切的診斷價值和穩(wěn)定性,仍需在臨床患者中進一步驗證。

綜上所述,本研究基于GEO數(shù)據(jù)庫結(jié)合CT影像結(jié)果獲得了由4個差異表達基因組成的診斷模型及診斷預(yù)測列線圖,而且該診斷模型具有較好的特異度和靈敏度,診斷預(yù)測列線圖也具有預(yù)測CT篩查到的小結(jié)節(jié)肺癌,提示其在小結(jié)節(jié)肺癌的早期診斷中具有一定的潛在價值。

猜你喜歡
隊列結(jié)節(jié)肺癌
氬氦刀冷凍治療肺癌80例的臨床觀察
乳腺結(jié)節(jié)狀病變的MRI診斷
超聲引導(dǎo)下甲狀腺結(jié)節(jié)細針穿刺活檢的6種操作方法的比較
肺結(jié)節(jié),不糾結(jié)
發(fā)現(xiàn)肺結(jié)節(jié)需要做PET/CT嗎?
長鏈非編碼RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表達
CXCL-14在非小細胞肺癌中的表達水平及臨床意義
隊列隊形體育教案
隊列里的小秘密
基于多隊列切換的SDN擁塞控制*
永嘉县| 荔浦县| 阳原县| 垣曲县| 高平市| 富民县| 聊城市| 凤庆县| 湖北省| 武功县| 孝义市| 淮滨县| 成安县| 静海县| 定兴县| 维西| 怀化市| 甘泉县| 民丰县| 高台县| 沙河市| 凤翔县| 九寨沟县| 宁明县| 安乡县| 张家港市| 丰镇市| 商南县| 兰溪市| 台南县| 铜山县| 嘉黎县| 昌江| 沙坪坝区| 颍上县| 长寿区| 故城县| 南汇区| 教育| 攀枝花市| 嘉峪关市|