徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)教研室(221004)
黃林玉 王鳴岐 余星皓 曾 平△ 黃水平△
【提 要】 目的 采用孟德爾隨機化方法探索飲酒行為和肌萎縮側(cè)索硬化發(fā)病風(fēng)險的因果關(guān)系。方法 利用大樣本全基因組關(guān)聯(lián)研究數(shù)據(jù),確定與酒精依賴密切相關(guān)的遺傳位點作為工具變量,通過逆方差加權(quán)法、MR-Egger回歸法等兩樣本孟德爾隨機化方法,以比值比(OR值)作為結(jié)局指標對因果關(guān)系進行評價。結(jié)果 本研究共納入476例男性酒精依賴患者和1358例男性對照,IVW方法估計的OR值為1.12(95%可信區(qū)間:1.02-1.24,P=0.021),MR-Egger回歸結(jié)果表明遺傳多效性不會對結(jié)果造成偏倚(截距=-0.036,P=0.755)。結(jié)論 本研究采用兩樣本孟德爾隨機化的方法,表明在男性中嚴重的酒精依賴會增加肌萎縮側(cè)索硬化的風(fēng)險。
肌萎縮側(cè)索硬化(amyotrophic lateral sclerosis,ALS),俗稱“漸凍癥”,是一種致命的退行性神經(jīng)疾病,歐洲人群年發(fā)病率約為2~3/10萬,且男性患者多于女性[1]。ALS初期臨床表現(xiàn)為肌束震顫、吞咽和講話困難;隨病程進展,運動神經(jīng)元發(fā)生不可逆的程序性凋亡進而導(dǎo)致全身肌肉萎縮,患者逐漸失去運動能力,最終往往因呼吸系統(tǒng)衰竭而窒息死亡;中位生存期約為3年[2-3]。目前暫無針對ALS的有效臨床診斷及治療方法;利魯唑是目前唯一一個美國食品藥品管理局批準用于治療ALS的藥物,但僅能延長患者3~6個月的生存期[4-5]。
在所有ASL病例中,約有10%的ALS顯示家族聚集性的特點,而其余90%為散發(fā)病例。ALS的致病機制和病因尚未明確,遺傳因素和環(huán)境因素都會影響ALS的發(fā)展,其中20%的病例可能與遺傳和基因缺陷有關(guān)。目前已研究發(fā)現(xiàn)30多種ALS相關(guān)致病基因[6],主要包括SOD1[7],TDP43和C9orf72。流行病學(xué)研究表明,吸煙、飲酒等行為因素[8-11]以及重金屬中毒[12]等環(huán)境因素都和ALS存在一定關(guān)聯(lián)。
識別ALS的病因?qū)ζ漕A(yù)防、診斷和治療至關(guān)重要。傳統(tǒng)的觀察性流行病學(xué)方法,如病例對照研究、隊列研究,可用來探索復(fù)雜疾病的病因,但往往受到反向因果關(guān)聯(lián)及潛在混雜因素(如,吸煙、飲酒和飲食等)的影響,從而影響其論證病因假設(shè)的能力。隨機對照試驗(randomized controlled trial,RCT)因其可比性好、因果關(guān)聯(lián)時序合理、有效控制偏倚的優(yōu)點,被視為檢驗因果關(guān)系的“金標準”[13]。然而,RCT難以控制樣本的代表性,需要大量的人力物力及財力,且經(jīng)常受到倫理學(xué)限制,因而實際中實施難度較大。
1986年,學(xué)者Katan[14]提出了孟德爾隨機化(Mendelian randomisation,MR)的概念,具體思想是:配子在形成過程中遵循孟德爾隨機分配定律,即親代等位基因隨機分配給子代;如果基因型決定表型,基因型可通過表型與疾病發(fā)生關(guān)聯(lián),因此可以使用基因型作為工具變量[15](instrumental variable,IV)來推斷表型與疾病之間的因果關(guān)聯(lián)。MR是一種在觀察性研究中以IV為基礎(chǔ)進行因果推斷的方法,與中間表型或環(huán)境暴露有關(guān)聯(lián)的遺傳變異可以作為中間變量,來估計暴露對疾病結(jié)局的影響。由于基因是人類一出生即決定的,因此不會受到后天的環(huán)境因素、生活方式、行為因素等常見的混雜因素的影響;且符合因果判定中“先因后果”的時序性要求,可以有效避免反向因果關(guān)聯(lián)的干擾[16]。但是,MR的應(yīng)用需要滿足三個前提假設(shè)[17]:(1)作為IV的遺傳變異與待研究的暴露因素密切相關(guān);(2)IV與已知的混雜因素不存在關(guān)聯(lián);(3)IV和疾病結(jié)局無直接關(guān)聯(lián),即IV除了通過暴露因素以外,不可以通過其它途徑來影響疾病結(jié)局(見圖1)。近年來,大樣本的全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)的廣泛應(yīng)用和公共數(shù)據(jù)的公開,使得通過MR來廣泛研究不同暴露和ALS的因果關(guān)聯(lián)成為可能[18]。
圖1 多個工具變量孟德爾隨機化的圖模型*實線表示存在關(guān)聯(lián),虛線表示不存在關(guān)聯(lián)
作為一個常見的生活行為暴露,飲酒與ALS的關(guān)系引起了廣泛關(guān)注。先前一項大型瑞典國家隊列研究的結(jié)果表明[11],患有酒精使用障礙的人群和未患有酒精使用障礙的對照組相比,ALS的發(fā)病風(fēng)險明顯降低,標化發(fā)病率為0.54[95%可信區(qū)間(confidence interval,CI):0.45~0.63,P=7.04×10-14]。有兩項基于人群的病例對照研究表明,高酒精攝入和ALS風(fēng)險降低有關(guān),優(yōu)勢比(odds ratio,OR)分別為0.91(95%CI:0.84~0.99,P=0.03)[19]和0.52(95%CI:0.40~0.75,P=4.54×10-5)[10]。一項包括5個觀察性研究的關(guān)于酒精消耗與ALS的meta分析表明[20],飲酒可降低患ALS風(fēng)險(OR=0.57,95%CI:0.51~0.64,P=2.88×10-22)。這些觀察性研究的結(jié)果暗示酒精對ALS可能具有潛在的神經(jīng)保護作用。然而,也有研究表明飲酒可能增加ALS的潛在發(fā)病風(fēng)險。例如,有兩項關(guān)于日本人群和新西蘭人群的病例對照研究報告飲酒和ALS發(fā)病風(fēng)險的OR值分別為1.10(95%CI:0.70~1.50,P=0.62)[21]和1.10(95%CI:0.50~2.50,P=0.82)[22],但這種關(guān)聯(lián)在調(diào)整吸煙的混雜后不存在統(tǒng)計學(xué)意義。此外,最近的一項meta分析[23]證實飲酒和ALS風(fēng)險之間不存在關(guān)聯(lián)。從上可見,目前尚不清楚飲酒與ALS之間是否存在因果關(guān)系。因此,本文嘗試通過MR來探索飲酒與ALS的關(guān)系,并估計其效應(yīng)大小。
1.研究設(shè)計
本研究采用兩樣本MR[24]作為估計酒精依賴和ALS發(fā)病風(fēng)險因果關(guān)系的方法。兩樣本MR研究是以最早的一階段MR研究為基礎(chǔ)發(fā)展形成的。所謂兩樣本,即在一個樣本獲得GWAS與酒精依賴(暴露因素)的關(guān)聯(lián)數(shù)據(jù),確定與酒精依賴密切相關(guān)的遺傳變異;通過另一個樣本獲得GWAS與ALS(疾病結(jié)局)的關(guān)聯(lián)數(shù)據(jù),再結(jié)合與酒精依賴相關(guān)聯(lián)的遺傳變異,進而確定可以作為工具變量的遺傳變異(即與酒精依賴和ALS均密切相關(guān)的遺傳變異)。兩樣本MR要求兩樣本相互獨立,來自同一人群,具有相似的性別、年齡以及種族特征。任何一種遺傳變異類型都可以作為IV,本研究選擇單核苷酸多態(tài)性(single nucleotide polymorphisms,SNP)位點作為工具變量類型。
2.數(shù)據(jù)來源
以2009年發(fā)表在Archives of General Psychiatry上的一項關(guān)于酒精依賴的GWAS作為酒精依賴遺傳變異的數(shù)據(jù)庫[25]。該項研究共包括476個男性病例和1358個男性對照,所有個體均為德國人,以美國精神障礙診斷統(tǒng)計手冊(DSM-IV)的標準來定義酒精依賴,符合嚴重酒精依賴且發(fā)病年齡早于28歲者納入病例組;數(shù)據(jù)庫中共包括524396個SNPs,其中有8個SNPs和酒精依賴密切相關(guān)(P<1×10-5)。需要說明的是,通常當(dāng)SNP的P<5×10-8的臨界值時才具有全基因組意義;但若以P<5×10-8作為篩選標準,在該數(shù)據(jù)庫中僅有3個SNP符合,且彼此之間存在連鎖不平衡。有研究表明,在對風(fēng)險因素的每個遺傳變異進行線性回歸后,若P<1×10-5,則MR分析存在弱工具變量偏倚的可能性很小(即不違反MR應(yīng)用的第一項假設(shè))[26],故而本研究采用P<1×10-5作為臨界標準并確定了8個和酒精依賴密切相關(guān)的SNP,提取需要的數(shù)據(jù)信息,包括每個SNP的rs編號、主要和次要等位基因,以及等位基因頻率、β系數(shù)、P值和標準誤。
關(guān)于ALS的基因型數(shù)據(jù)來自于2017年對ALS的一項GWAS分析[27],包括12577例ALS患者和23475例健康對照,所有個體均為歐洲血統(tǒng)。數(shù)據(jù)庫中包括7740344個與ALS有關(guān)的遺傳變異。在ALS基因型數(shù)據(jù)庫中篩選和酒精依賴密切相關(guān)的8個SNP,最終確定了7個和酒精依賴、ALS均存在關(guān)聯(lián)的具有全基因組意義(P<1×10-5)的SNPs作為工具變量。但是,有3個SNPs兩兩之間存在明顯的連鎖不平衡(linkage disequilibrium,LD),分別是rs7590720、rs1344694及rs705648(rs1344694-rs7590720:r2=0.739;rs1344694-rs705648:r2=0.568;rs7590720-rs705648:r2=0.776)。為避免LD對因果估計結(jié)果造成偏倚及過度估計,本研究依次納入3個SNP的其中之一進行MR分析,即每次分析有5個SNP作為遺傳工具變量。本文所有的統(tǒng)計分析均在R軟件3.4.4版本中進行。
3.兩樣本MR方法
(1)Wald比值和逆方差加權(quán)法估計效應(yīng)
IVW模型(inverse-variance weighting,IVW)是一種加權(quán)線性回歸模型,所謂逆方差加權(quán),是聚集兩個或多個隨機變量的方差總和并使之最小化的一種方法,且每個隨機變量與它的方差成反比:
(2)敏感性分析
Egger′s檢驗常用來定量評價meta分析中發(fā)表偏倚的大小,用回歸方程的截距來表示[28]。在MR分析中,采用多個SNP作為工具變量,這樣就難以避免遺傳多效性對因果估計產(chǎn)生影響,使用MR-egger回歸可以評價遺傳多效性帶來的偏倚,MR-Egger回歸直線的截距說明了定向多效性的大小[29]。若回歸方程的截距接近于0,則認為遺傳多效性影響較小。使用MR-Egger回歸的前提是要滿足InSIDE假設(shè),即遺傳變異-暴露因素和遺傳變異-疾病結(jié)局之間的影響是相互獨立的[30]。采用meta分析中“l(fā)eave-one-out”的敏感性分析方法,每次分析剔除一個SNP,將其作為測試集,剩余的SNP作為訓(xùn)練集。若研究中使用非特異性SNP作為IV,即同時與目標暴露因素和其他暴露因素均存在關(guān)聯(lián)的SNP,可能會對因果估計效應(yīng)產(chǎn)生影響,而敏感性分析可以評價非特異性SNP對因果關(guān)聯(lián)估計結(jié)果的影響大小。
1.工具變量SNP信息
表1列出了用于MR分析的7個遺傳工具變量的相關(guān)信息,包括染色體位置、效應(yīng)等位基因及其頻率、與酒精依賴關(guān)聯(lián)的β系數(shù)及其標準誤、與ALS的關(guān)聯(lián)β系數(shù)及其標準誤。每個SNP的Wald比值及其95%置信區(qū)間的森林圖見圖2。圖2展示了既往飲酒與ALS關(guān)系的觀察性研究結(jié)果,Ji 2016表示瑞典人群隊列研究結(jié)果[11];Meng 2016表示一項關(guān)于歐洲人群meta分析的結(jié)果[20];Huisman 2015表示一項荷蘭人群的病例對照研究結(jié)果[19]。
圖2 工具變量SNP及三項既往關(guān)于飲酒與ALS關(guān)系的研究結(jié)的OR值及其95%CI森林圖
*IVW effect1、MR-Egger effect1表示:rs1344694納入研究;IVW effect2、MR-Egger effect2表示:rs7590720納入研究;IVW effect3、MR-Egger effect3表示:rs705648納入研究
表1 工具變量SNP信息列表
*:Chr:染色體;BP:堿基對位置;EA:效應(yīng)SNP的等位基因;MAF:效應(yīng)SNP的等位基因頻率;AD:酒精依賴;SE:標準誤;ALS:肌萎縮側(cè)索硬化。
2.IVW法結(jié)果
將rs1344694、rs7590720、rs705648OR分別納入研究,OR值分別為1.10(95%CI:1.00~1.22,P=0.062)、1.11(95%CI:1.01~1.22,P=0.027)、1.12(95%CI:1.02~1.24,P=0.021),表明酒精依賴會提高ALS的發(fā)病風(fēng)險約為10%。
3.敏感性分析結(jié)果
將rs1344694、rs7590720、rs705648分別納入研究,MR-Egger回歸的OR值分別為1.17(95%CI:0.47~2.93,P=0.739)、1.16(95%CI:0.54~2.48,P=0.706)、1.30(95%CI:0.53~3.16,P=0.573),截距分別為-0.016(95%CI:0.12~0.25,P=0.897)、-0.011(95%CI:0.10~0.21,P=0.918)、-0.036(95%CI:0.12~0.26,P=0.755),截距都很小,接近于0,且P值均大于0.05,說明遺傳多效性不會對因果效應(yīng)造成偏倚。
敏感性分析結(jié)果見表2、表3及表4,結(jié)果表明,每次MR分析中,即使將和酒精依賴關(guān)聯(lián)最為密切的上述3個SNP依次移除研究,OR仍為1.11(95%CI:1.01~1.21,P=0.02),說明不存在會對因果估計結(jié)果產(chǎn)生影響的非特異性SNP。
表2 rs1344694納入研究的敏感性分析
表3 rs7590720納入研究的敏感性分析
表4 rs705648納入研究的敏感性分析
本研究借助大規(guī)模GWAS,利用MR研究了酒精依賴和ALS的關(guān)系,結(jié)果表明男性酒精依賴和ALS之間存在因果關(guān)聯(lián),嚴重的酒精依賴會提高ALS的發(fā)病風(fēng)險。據(jù)我們所知,本研究是首次對酒精依賴和ALS進行因果關(guān)系估計的MR評價。MR研究進行因果推斷的優(yōu)點在于遺傳變異是長期而穩(wěn)定的暴露因素,且可以直接測量,不受社會環(huán)境、生活方式等混雜因素的干擾。和RCT相比,MR可以嚴格控制樣本代表性并將其隨機分配到各個觀察組。本研究采用的兩樣本MR研究,基于現(xiàn)有的公開GWAS數(shù)據(jù),樣本量較大,可以獲得更大的把握度,經(jīng)濟且高效。
先前的觀察性研究[10-11,19-20]顯示酒精可能具有潛在的神經(jīng)保護作用而本研究暗示了飲酒對ALS的潛在風(fēng)險,其機制可能與膠質(zhì)纖維酸性蛋白以及酒精的神經(jīng)毒性有關(guān)。有學(xué)者進行了動物實驗,在一項大鼠實驗中,酒精組和對照組相比,星形膠質(zhì)細胞中的GFAP密度降低[31]。而在ALS的發(fā)展過程中,一個明顯特征就是反應(yīng)性星形膠質(zhì)細胞中的膠質(zhì)纖維酸性蛋白的表達增加[32]。但是,神經(jīng)毒性物質(zhì)谷氨酸堆積在神經(jīng)細胞之間對ALS有很大影響,過量的谷氨酸能直接破壞運動神經(jīng)細胞。已有研究表明,長期大量飲酒可介導(dǎo)谷氨酸離子型受體N-methy1-D-aspartat(NMDA受體),造成細胞間隙谷氨酸鹽的大量堆積,導(dǎo)致細胞遲發(fā)型損傷[33],這一結(jié)論也支持了本研究的結(jié)果。
本研究也具有一定的局限性,首先,兩樣本MR分析使用的是GWAS的匯總數(shù)據(jù),目前還無法檢測暴露因素和疾病結(jié)局之間的非線性關(guān)系,也無法進行女性亞組(或男女總體人群)分析;例如,通常男性與女性在飲酒行為方面存在較大差異且ALS的發(fā)病存在性別差異,進行不同性別的MR分析可獲得更加具體的效應(yīng)關(guān)系。本研究對嚴重的酒精依賴與ALS之間的因果關(guān)系進行估計,但是,由于缺少分組數(shù)據(jù),無法探索輕度或中度酒精依賴是否與ALS也存在因果關(guān)聯(lián),也無法研究不同飲酒種類(例如,紅酒、烈酒或啤酒)是否與ALS也存在因果關(guān)聯(lián)。其次,兩樣本MR假定兩個樣本來自相同的人群且沒有重疊。若兩樣本來自不同的人群,估計的因果效應(yīng)大小可能存在偏倚。在本研究中,確保兩樣本人群均為歐洲血統(tǒng)的個體,以減少種族偏倚的影響。此外,兩樣本MR分析無法對發(fā)病機制進行解釋,因此還需要進一步探索飲酒對ALS致病機制。
總之,本研究采用兩樣本孟德爾隨機化的方法,對酒精依賴和肌萎縮側(cè)索硬化進行因果關(guān)系推斷,認為男性中嚴重的酒精依賴會導(dǎo)致ALS患病風(fēng)險增加。