穆雪峰 李振宇 黃書琦 康文全 尹小菲 穆桂芳
(1華中科技大學協(xié)和深圳醫(yī)院消化科,廣東 深圳 518052;2深圳微辰生命科技有限公司;3威海市立二院消化科)
胃癌發(fā)病率居惡性腫瘤第5位,死亡率居第4位,總體死亡率為7.7/10萬。近5年全球胃癌平均年發(fā)病例數(shù)為180.6萬例,其中亞洲139.7萬例(77.4%),中國68.9 萬例(38.2%)。我國 2020 年胃癌發(fā)病率居惡性腫瘤第 3 位,死亡率居第 3 位,死亡37.4萬例,死亡率15.9/10萬〔1〕。統(tǒng)計結(jié)果顯示,胃癌在老年人群中高發(fā),發(fā)病高峰為65~80歲,80歲以上胃癌患者死亡率最高。幽門螺旋桿菌通常被認為是導(dǎo)致胃癌的重要因素〔1〕。研究表明,除幽門螺旋桿菌,其他微生物也可能在胃癌的發(fā)生、發(fā)展過程中發(fā)揮重要的作用〔2,3〕,同時血液中相關(guān)代謝物也和胃癌發(fā)病及進展存在密切關(guān)系〔4~6〕。本文收集糞便、唾液和血液樣本進行研究,以期得到和胃癌相關(guān)的潛在生物標志。
1.1對象 納入華中科技大學協(xié)和深圳醫(yī)院胃癌患者5例為研究組,選取同期正常且無其他病史的人群5例作為對照組。性別、年齡和胃癌患者盡量匹配。對所有招募者進行問卷調(diào)查,主要包括年齡、民族、性別、吸煙和飲酒史、既往慢性基礎(chǔ)病病史及相關(guān)輔助檢查等特征資料。同時檢測胃癌相關(guān)臨床指標,建立臨床信息數(shù)據(jù)庫,如血常規(guī),胃癌的腫瘤標記物癌胚抗原(CEA)、糖類抗原(CA)19-9、CA125等。采集樣本包括血液、糞便、唾液。納入標準:研究組采用病理活檢、胃鏡等診斷,確診疾病;資料齊全;認知正常;熟知本研究,自愿參加。排除標準:精神異常;其他惡性腫瘤;胃大部切除術(shù);依從性差。兩組年齡等一般資料差異無統(tǒng)計學意義(P>0.05)。
1.2樣本采集 糞便和唾液樣本均在未接受任何治療的情況下采集。糞便樣本采集:采集前受試者需先排尿,然后將糞便排于無菌采集袋中,排便結(jié)束后用一次性采樣勺采集中間未接觸空氣部分0.5~0.8 g樣本,將樣本置于凍存管中擰緊后-80 ℃凍存。唾液樣本采集:采集前30 min受試者需先用清水漱口,用帶有漏斗的采集管收集唾液約2 ml,取下采集漏斗并擰緊采集管后-80 ℃凍存。
1.3基因組DNA提取和建庫測序 使用Omega E.Z.N.A.Stool DNA Kit (Bio-tek,Inc.,USA) 提取糞便和唾液的微生物基因組DNA。提取完成的DNA用Covaris E220超聲打斷儀打斷成約300 bp的小片段后,使用NEB Next Ultra DNA Library Prep Kit進行測序文庫構(gòu)建,構(gòu)建好的文庫經(jīng)過Qubit 定量和文庫檢測合格后,在Illumina Novaseq6000平臺進行PE150的文庫測序,并保證每個樣本下機數(shù)據(jù)量不低于5G。
1.4統(tǒng)計學處理 測序得到的下機數(shù)據(jù)的處理步驟:(1)過濾低質(zhì)量的數(shù)據(jù);(2)使用SOAP2比對到基因集;(3)根據(jù)基因集和微生物分類及KO的對應(yīng)關(guān)系,計算門(phylum)、屬(genus)、種(species)和KO的相對豐度〔7〕。樣本內(nèi)的物種多樣性(Alpha多樣性)使用shannon index表示。樣本間的物種多樣性(Beta多樣性)使用bray-curtis距離表示。主坐標分析(PCoA)用來展示樣本間的bray-curtis距離。相似性分析(ANOSIM,置換次數(shù)為999)用來評估不同組的樣本的分布差異是否有統(tǒng)計學意義。使用R(版本3.5.1)中的wilcox秩和檢驗用于對不同組之間的微生物的相對豐度進行差異分析。腸型分析:(1)基于樣本在屬水平的相對豐度計算樣本間JSD;(2)基于JSD進行圍繞中心點劃分算法(PAM)聚類;(3)使用CH指數(shù)評估最優(yōu)聚類數(shù)量;(4)使用PCoA展示聚類效果〔8〕。線性判別分析(LEfSe)用于對不同組樣本的微生物相對豐度進行比較,以獲得可能和胃癌相關(guān)的微生物〔9〕。LDA分值的閾值設(shè)定為3。使用R(版本3.5.1)中的cor.test在屬水平對微生物的相關(guān)性進行分析。選擇相關(guān)系數(shù)<-0.6或>0.6,P值<0.05,且在不同組的樣本中的相對豐度之和>0.1%的微生物使用cytoscape進行繪圖展示。隨機森林模型用于對不同組的樣本進行分類,最終的曲線下面積(AUC)為5折交叉驗證的均值?;跇颖镜腒O相對豐度,使用reporter score算法計算KEGG模塊和通路的z-score〔10〕。z-score的絕對值>1.96(正態(tài)分布的97.5%置信度)時,認為結(jié)果在不同組之間有顯著差異。使用R(版本3.5.1)psych包中的corr.test對臨床指標和LEfSe找到的差異微生物進行關(guān)聯(lián)分析。檢驗方法為spearman。
2.1Alpha和Beta多樣性 研究組和對照組腸道微生物和口腔微生物在屬和種水平的Alpha多樣性shannon差異均無統(tǒng)計學意義(P>0.05)。但研究組腸道微生物和口腔微生物的Alpha多樣性的中位數(shù)均低于對照組。見圖1。研究組和對照組在PCoA1和PCoA2維度的分布無法明顯區(qū)分。ANOSIM分析的結(jié)果表明研究組和對照組差異無統(tǒng)計學意義??谇晃⑸锏慕Y(jié)果也同樣如此(P>0.05)。見圖2。
A:腸道微生物,屬水平;B:腸道微生物,種水平;C:口腔微生物:屬水平;D:口腔微生物,種水平;圖2同圖1 兩組腸道和口腔微生物的Alpha多樣性
圖2 兩組腸道和口腔微生物的Beta多樣性
2.2微生物構(gòu)成和腸型 在門水平,相對豐度較高的微生物包括擬桿菌門(Bacteroidetes)、厚壁菌門(Firmicutes)、變形菌門(Proteobacteria)、放線菌門(Actinobacteria)等。在屬水平,相對豐度較高的微生物包括擬桿菌屬(Bacterodie)、經(jīng)黏液真桿菌屬(Blautia)、普雷沃菌屬(Prevotella)、普拉梭菌(Bifidobacterium)、大腸桿菌(Escherichia)等。其中,研究組和對照組中至少有一組的相對豐度中位數(shù)大于0.1%,兩組差異具有統(tǒng)計學意義,乳桿菌屬內(nèi)(Lactobacillus)(研究組1.282 6%,對照組0.001 6%,P=0.016)。在種水平,相對豐度較高的微生物包括Bacteroides dorei、Bacteroides uniformis、Bacteroides ovatus等。其中,兩組中至少有一組的相對豐度的中位數(shù)大于0.01%,差異具有統(tǒng)計學意義;咽頰炎鏈球菌(Streptococcus anginosus)(研究組0.047%,對照組0.001%,P=0.008)、糞球菌屬(Coprococcus comes)(研究組0.078%,對照組=0.010%,P=0.016)、克雷伯桿菌(Klebsiella pneumoniae)(研究組0.154%,對照組0.02%,P=0.016)、Lactobacillus salivarius(研究組0.017%,對照組0.000%,P=0.016)、Dorea longicatena(研究組0.054%,對照組0.006%,P=0.032)、布氏瘤胃球菌(Ruminococcus bromii)(研究組0.325%,對照組0.003%,P=0.032)。
研究組和對照組中豐度較高的口腔微生物,在門水平,相對豐度較高的微生物包括Proteobacteria、Firmicutes、Bacteroidetes、梭桿菌門(Fusobacteria)、Actinobacteria等。在屬水平,相對豐度較高的微生物包括嗜血桿菌屬(Haemophilus)、鏈球菌屬(Streptococcus)、韋榮球菌屬(Veillonella)、伯克霍爾德菌屬(Burkholderia)、Fusobacterium等。研究組和對照組中至少有一組相對豐度的中位數(shù)大于0.1%,且在兩組差異具有統(tǒng)計學意義,包括Actinobacillus(GCmedian=0.007%,Control median=0.106 %,P=0.032)。在種水平,相對豐度較高的微生物包括副流感嗜血桿菌(Haemophilus para influenzae)、炎鼻疽伯克霍爾德菌(Burkholderia pseudomallei)、未分類的乳桿菌(unclassified Fusobacterium)、彎曲桿菌(Campylobacter concisus)等。兩組中至少有一組的相對豐度的中位數(shù)大于0.01%,且在兩組之間的差異具有統(tǒng)計學意義,包括Actinobacillus minor(研究組0.00%,對照組0.01%,P=0.011)、Actinobacillus pleuropneumoniae(研究組0.000%,對照組0.016%,P=0.025)、Kingella denitrificans(研究組0.003%,對照組0.018%,P=0.032)、Neisseria mucosa(研究組0.025%,對照組0.164%,P=0.032)、Streptococcus mutans(研究組0.005%,對照組=0.016%,P=0.032)。見圖3。
A:腸道微生物,門水平;B:腸道微生物,屬水平;C:腸道微生物,種水平;D:口腔微生物,門水平;E:口腔微生物,屬水平;F:口腔微生物:種水平圖3 兩組相對豐度較高的腸道微生物和口腔微生物
研究組和對照組的所有腸道樣本可以聚為2類,分別對應(yīng)腸型1和腸型2。見圖4。研究組均屬于腸型1。對照組中4例腸型1,1例腸型2。兩組在不同腸型中的人數(shù)分布的差異不具有統(tǒng)計學意義(fisher檢驗,P=1)。
圖4 兩組糞便樣本的腸型分析結(jié)果
2.3與胃癌相關(guān)的微生物及分類模型 在門、屬和種水平進行了LEfSe來尋找可能和胃癌相關(guān)的微生物。在腸道微生物中共找到7種分類,包括1種門水平的分類,2種屬水平的分類、4種種水平的分類見圖5A。在門水平,Firmicutes在研究組中的相對豐度較高。在屬水平,在研究組中的相對豐度較高的Lactobacillus屬于Firmicutes門,Thauera屬于Proteobacteria;和相關(guān)研究一致〔11~14〕。在種水平,研究組中的相對豐度較高的4種分類中,Lactobacillus reuteri屬于Firmicutes門下Lactobacillus屬。
A:可能和胃癌相關(guān)的腸道微生物;B:可能和胃癌相關(guān)的口腔微生物;C:腸道微生物之間相關(guān)性網(wǎng)絡(luò);D:口腔微生物之間相關(guān)性網(wǎng)絡(luò);相關(guān)性網(wǎng)絡(luò)中,節(jié)點大小正比于研究組和對照組之間微生物的相對豐度中位數(shù)之比;邊的粗細正比于相關(guān)系數(shù)的大小的絕對值,藍色邊表示負相關(guān),紅色邊表示正相關(guān)圖5 LEfSe分析獲得的可能和胃癌相關(guān)的微生物及微生物之間的相關(guān)性
在口腔微生物中共找到6種分類和胃癌相關(guān),包括3種屬水平的分類、3種種水平的分類見圖5B。在屬水平,2種在研究組中的相對豐度較高的屬中,Campylobacter屬于Proteobacteria門;Gemella屬于Firmicutes門。在對照組中的相對豐度較高的Neisseria屬于Proteobacteria門;和之前報道一致〔15~17〕。在種水平,對照組中的相對豐度較高的3種分類中,Campylobacter concisus 屬于Proteobacteria門的Campylobacter屬; Jonquetella anthropi屬于Synergistetes門的Jonquetella屬;Gemella sanguinis屬于Firmicutes門的Gemella屬。
基于微生物之間的相關(guān)性分析,獲得部分相關(guān)性較高且具有一定相對豐度的微生物。腸道微生物中,和Lactobacillus正相關(guān)的屬包括Citrobacter (r=0.85,P=0.003)、Oscillibacter(r=0.79,P=0.01)等。在對照組中相對豐度更高的分類包括Bifidobacterium、Eubacterium、Faecalibacterium、Subdoligranulum等有益菌。這些有益菌能夠生成丁酸鹽、丙酸鹽、醋酸鹽等對人體健康有益的代謝物〔18~21〕。見圖5C。
口腔微生物中,Campylobacter和Gemella之間的相關(guān)性較高(r=0.83,P=0.006)。和Campylobacter相關(guān)性較高的其他屬包括Atopobium (r=0.93,P=0.000 1)、Megasphaera(r=0.89,P=0.001)、Solobacterium(r=0.88,P=0.002)等。和Gemella相關(guān)性較高的其他屬包括Atopobium(r=0.88,P=0.002)、Corynebacterium(r=0.82,P=0.007)等。和Neisseria相關(guān)性較高的其他屬包括Kingella(r=0.88,P=0.002)、Actinobacillus(r=0.79,P=0.01)等,見圖5D。
在腸道微生物和口腔微生物中,研究組Lactobacillus、Enterococcus、Veillonella、Dialister、Odoribacter相對豐度均大于對照組;Bacteroides相對豐度均小于對照組。
基于LEfSe找到的胃癌相關(guān)的微生物,使用隨機森林模型構(gòu)建分類模型 。在腸道微生物中,分別使用屬水平的Lactobacillus和陶厄菌屬(Thauera)中的一種作為特征時,AUC分別為0.9、0.7;當同時使用這些屬作為特征時,AUC為0.9。在口腔微生物中,分別使用屬水平的Campylobacter、Gemella和Neisseria中的一種作為特征時,AUC分別為0.7、0.9、0.8;當同時使用這些屬作為特征時,AUC為0.8。見圖6。
A:腸道微生物;B:口腔微生物;圖7、8同圖6 基于可能和胃癌相關(guān)的微生物構(gòu)建的分類模型的受試者工作特征(ROC)曲線
2.4和胃癌相關(guān)的臨床指標及微生物關(guān)聯(lián)分析 對檢測的10個臨床指標進行差異分析。其中CEA和鱗狀細胞癌相關(guān)抗原(SCCa)在兩組差異不具有統(tǒng)計學意義(wilcox秩和檢驗,CEA:研究組8.66,對照組2.10,P=0.06;SCCa:研究組0.27,對照組0.71,P=0.06)。
計算臨床指標的檢測值和LEfSe找到的和胃癌相關(guān)的微生物分類之間的相關(guān)性。在糞便樣本中,CEA的檢測值和屬水平的Thauera的相對豐度呈正相關(guān)(r=0.76,P=0.01)。SCCa的檢測值和屬水平的Lactobacillus、種水平的Lactobacillus reuteri、Alistipes putredinis、Streptococcus_anginosus的豐度呈負相關(guān)(r分別為-0.85、-0.79、-0.87、-0.68,P分別為0.001、0.006、0.001、0.030)。見圖7。
圖7 臨床指標和微生物之間的關(guān)聯(lián)性
在唾液樣本中,SCCa和屬水平的Neisseria的豐度呈正相關(guān)(r=0.72,P=0.02)。CA242、CA199和Neisseria的豐度呈負相關(guān)(r分別為-0.77、-0.84,P分別為0.009、0.002)。見圖7。
2.5功能分析 基于reporter score算法的富集分析,獲得在分別研究組和對照組中富集的KEGG通路。腸道微生物中,兩組之間顯著富集的通路明顯不同。 研究組顯著富集的通路主要和遺傳信息處理、脂質(zhì)代謝等相關(guān)。而在對照組中顯著富集的通路主要和氨基酸代謝、輔助因子和維生素代謝等相關(guān)。研究組顯著富集的通路主要和遺傳信息處理、脂質(zhì)代謝等相關(guān)。見圖8。
--:reporter score<-2.3,-:reporter score<-1.96,++:reporter score>2.3,+:reporter score>1.96圖8 兩組富集的KEGG通路
從物種構(gòu)成來看,腸道微生物和口腔微生物的相對豐度最高的3種門都是Bacteroidetes、Firmicutes和Proteobacteria。但是腸道微生物中相對豐度最高的Bacteroidetes在口腔微生物中的相對豐度較低。而腸道微生物中相對豐度較低的Proteobacteria在口腔微生物中的相對豐度則最高。
LEfSe發(fā)現(xiàn)一些和胃癌相關(guān)的微生物。盡管在屬水平,不同樣本類型(糞便、唾液)發(fā)現(xiàn)的相關(guān)微生物不一樣,但在門的層級存在共性。例如在研究組中相對豐度更高的腸道微生物中的Lactobacillus和口腔微生物中的Gemella都屬于Firmicutes門。當使用和胃癌相關(guān)的微生物構(gòu)建分類模型時,腸道微生物中發(fā)現(xiàn)的Lactobacillus和口腔微生物中發(fā)現(xiàn)的Gemella的分類效果相當。通過相關(guān)性分析發(fā)現(xiàn),腸道微生物中的Enterococcus、Dorea和Streptococcus等在研究組的相對豐度大于對照組,而這些微生物也曾在之前的研究中被認為和胃癌相關(guān)。說明不同的樣本情況(包括數(shù)量、臨床特征等)、檢測方法(16S、宏基因組測序等)及分析方法等均可能影響結(jié)果。相關(guān)性分析發(fā)現(xiàn)明腸道微生物和口腔微生物之間存在一定一致性。
腸道微生物中,翻譯(RNA轉(zhuǎn)運、核糖體)、轉(zhuǎn)錄(RNA聚合酶)通路在研究組中顯著富集,這些通路和癌癥的發(fā)生、發(fā)展密切相關(guān)〔22,23〕。磷酸轉(zhuǎn)移酶系統(tǒng)和ABC運送等膜轉(zhuǎn)運通路也在對照組中顯著富集。Firmicutes門是對這些通路做出貢獻的主要微生物之一〔24〕。脂質(zhì)代謝(甘油脂代謝、甘油磷脂代謝、酮體合成和降解)、異物生物降解與代謝(苯酸鹽降解、氟苯甲酸酯降解、多環(huán)芳烴降解)。Liao等〔25〕研究發(fā)現(xiàn)多環(huán)芳烴的一種代謝產(chǎn)物1-羥基芘葡萄糖醛酸苷在胃癌患者中的濃度要比健康對照的高。與此相反,氨基酸代謝(丙氨酸-天冬氨酸和谷氨酸代謝、纈氨酸-亮氨酸和異亮氨酸生物合成、苯丙氨酸-酪氨酸和色氨酸生物合成、組氨酸代謝)、能量代謝(氧化磷酸化、原核生物中的碳固定通路)、輔助因子和維生素代謝(卟啉和葉綠素代謝、生物素代謝、葉酸合成、維生素B6代謝)等通路則在對照組中顯著富集。維生素對于維持健康狀態(tài)發(fā)揮著重要的作用〔26〕。和維生素B6合成呈負相關(guān)的Blautia、Roseburia在健康對照中的相對豐度更低,和生物素合成相關(guān)的Bacteroides則在對照組的豐度更高〔8,27〕??谇晃⑸镏?異物生物降解和代謝(苯酸鹽降解、氯環(huán)己烷和氯苯降解、多環(huán)芳烴降解)、神經(jīng)退行性疾病(阿爾茨海默病、帕金森病)等通路在胃癌患者中顯著富集。
綜上,胃癌患者組和健康人無論在腸道微生物還是口腔微生物方面都存在差異。這些差異既存在共性,也存在特性。腸道微生物中的Lactobacillus可以作為一種潛在的和胃癌相關(guān)的生物標記。由于本研究中樣本數(shù)量的限制,分析存在一定局限性,后續(xù)使用更大樣本量進行分析可以進一步完善現(xiàn)有結(jié)果。