王兆年,高文靜△,王碧琦,曹衛(wèi)華,呂 筠,余燦清,逄增昌,叢黎明,汪 華,吳先萍,劉 彧,李立明
(1. 北京大學公共衛(wèi)生學院流行病與衛(wèi)生統(tǒng)計學系,北京 100191; 2. 青島市疾病預防控制中心,山東青島 266033; 3. 浙江省疾病預防控制中心,杭州 310051; 4. 江蘇省疾病預防控制中心,南京 210009; 5. 四川省疾病預防控制中心,成都 610041; 6. 黑龍江省農墾總局疾病預防控制中心,哈爾濱 150090)
據世界糖尿病聯盟報告[1],2019年全球范圍內成人糖尿病標化患病率為9.3%,而有研究報道[2],2013年我國糖尿病患病率為10.9%,高于世界平均水平。糖尿病是一組以高血糖為特征的代謝性疾病,高血糖可對人體腎臟、心腦血管等多個器官系統(tǒng)造成損害[3]??崭寡羌疤腔t蛋白(glycated haemoglobin, HbA1c)均可反映機體糖代謝狀況,并作為糖尿病的診斷指標。美國糖尿病協(xié)會建議[4],抽取靜脈血測量的空腹血糖≥7.0 mmol/L或HbA1c≥6.5%的患者應被診斷為糖尿病??崭寡鞘亲钪苯臃从逞谴x狀況的指標,也是最早應用于糖尿病診斷的指標。HbA1c與空腹血糖相比,更能反映最近幾周內中長期血糖變化,2011年被世界衛(wèi)生組織推薦為糖尿病的診斷指標之一[5]。另外,血糖升高即便沒達到糖尿病的診斷標準,也可對心血管系統(tǒng)造成不利影響,提高心血管系統(tǒng)疾病的發(fā)病風險[6]。
DNA甲基化是指在DNA的胞嘧啶-磷酸-鳥嘌呤(cytidine-phosphate-guanosine site,CpG)二核苷酸的胞嘧啶5′端在酶催化作用下共價鍵結合一個甲基基團。DNA甲基化可通過影響轉錄酶的結合強度調控基因的表達、細胞的蛋白質合成等代謝過程,因此,DNA甲基化研究可以從組織和機體代謝改變層面探討疾病的致病機制和過程,為探索復雜疾病的病因及疾病間聯系提供線索??崭寡鞘且粋€短期的血糖代謝指標,可反映當下時點的血糖水平;HbA1c代謝周期則較長,可反映患者機體的中長期血糖代謝的平均水平,因此,空腹血糖與CpG位點甲基化的相關性研究可反映短期內的血糖代謝水平和DNA甲基化間的相關性,HbA1c與CpG位點甲基化的相關性研究更能反映較長時間的血糖代謝水平和DNA甲基化間的相關性。
雙生子是一類特殊的人群,同卵雙生子可匹配遺傳和早期發(fā)育等環(huán)境因素[7],在相同樣本量的條件下,結論具有更高的準確性[8],但目前尚缺乏基于中國等東亞雙生子人群的研究證據。利用雙生子人群進行的2型糖尿病及血糖相關指標也多在10~30對之間[9-11],納入的雙生子人群較少,難以發(fā)現更微小的關聯,因此本研究以我國成年雙生子人群作為研究對象,探索與空腹血糖、HbA1c相關的DNA甲基化現象,比較我國與歐美人群間的差異,為糖尿病相關的表觀遺傳學機制提供進一步證據。
雙生子研究對象來自中國雙生子登記系統(tǒng)(Chinese National Twin Registry,CNTR), 2013年6月至12月和2017年6月至2018年10月于山東青島、浙江、江蘇、四川及黑龍江五地募集。研究對象納入標準:(1)年齡為30歲及以上;(2)雙生子兩成員均參與了現場體檢及問卷調查;(3)問卷初篩為同卵雙生子;(4)雙生子兩成員均可提供空腹血標本。本研究經過北京大學生物醫(yī)學倫理委員會審查并批準(批準號:IRB00001052-13022和IRB00001052-14021),雙生子兩成員均簽署知情同意書。
利用問卷收集一般人口學信息、疾病相關信息,以及研究中可能存在的吸煙、飲酒等混雜因素信息。問卷信息由經過培訓的調查員面對面訪問獲得,其中糖尿病患病情況及用藥史均為研究對象自報,患病情況要求為區(qū)縣級及以上醫(yī)院診斷。體格檢查包括身高、體質量、收縮壓、舒張壓等指標,由工作人員使用統(tǒng)一的身高測量儀、體成分測量儀和電子血壓計測量??崭寡呛虷bA1c利用現場抽取的空腹靜脈血,由指定的第三方實驗室采用統(tǒng)一的方法檢測,其中空腹血糖采用己糖激酶法檢測,HbA1c采用高效液相色譜法檢測。
利用同一時期收集外周血標本,進行DNA甲基化檢測。全基因組DNA甲基化檢測均采用Illumina公司生產的芯片檢測。研究涉及兩種芯片,分別為Illumina Infinium HumanMethylation450 BeadChip(簡稱450K芯片)和Illumina Infinium MethylationEPIC BeadChip(簡稱850K芯片),采用minfi包[12]對數據進行讀取,本研究重點分析兩種芯片重合的CpG位點。
正式分析前首先對DNA甲基化數據進行標準化及樣本和位點的質量控制。利用 R軟件WateRmelon程序包[13],對甲基化數據利用數據驅動的獨立標準化(data-driven separate normalization,DASEN)方法進行標準化(控制Ⅰ型、Ⅱ型探針的測量偏倚、背景噪音偏倚和芯片間偏倚),并檢測每個樣本中的每個CpG位點是否存在缺失[若CpG位點所在Ⅰ、Ⅱ型探針信號與空白對照對比差異無統(tǒng)計學意義(P>0.01),則該位點缺失]。位點質量控制包括:(1)剔除缺失率>0.01的位點;(2)剔除本身為單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)位點,且在亞洲人群中最小等位基因頻率(minor allele frequency, MAF)>0.05的CpG位點;(3)所在基因探針與其他MAF>0.05的SNP位點存在交叉的CpG位點。樣本質量控制包括:(1)剔除缺失率>0.01的樣本;(2)利用甲基化芯片上的59個SNP位點進行雙生子的卵型鑒定,SNP位點相關系數<0.8即可能為異卵的雙生子,予以剔除[14];(3)同一對雙生子中一人被剔除,則該對雙生子被剔除。最終形成待分析的DNA甲基化數據集。
由于各個CpG位點的DNA甲基化水平在不同細胞中存在差異,不同個體血液中各個組分占比存在差異,所以需要調整血細胞成分。本研究利用已測得的450K及850K芯片上甲基化數據,采用minfi包中estimateCellCounts函數[15]估計全血及血凝塊樣本中CD4+T細胞、CD8+T細胞、NK細胞、B細胞、單核細胞、巨噬細胞等有核細胞組分所占的百分比。
甲基化檢測時,不同的檢測平板及實驗批次會由于試劑、操作儀器等差異,使得DNA甲基化數據存在一定誤差。本研究使用代理變量分析方法(surrogate variable analysis, SVA)調整這些批次效應及其他潛在的混雜因素,在代理變量調整時采用SVA包的sva函數[16]。
本研究所涉及統(tǒng)計分析及圖像(包括曼哈頓圖及Q-Q圖)繪制均使用R 3.5.3軟件進行。連續(xù)變量采用均數±標準差描述;分類變量采用頻數(百分比)描述。若無特殊說明,顯著性水平設為P< 0.05。全基因組甲基化與空腹血糖或HbA1c間相關性分析采用混合效應模型(linear mixed effect model,LME), 分析基于nlme包的lme函數[18],以空腹血糖或HbA1c分別作為主效應,甲基化水平(β值)作為因變量,將年齡、性別、體重指數(body mass index, BMI)、血壓、血細胞組成成分、用SVA包生成的代理變量等連續(xù)變量,吸煙、飲酒、是否服用降糖藥等分類變量作為協(xié)變量納入固定效應模型,將雙生子對編號納入隨機效應模型,截距設置為隨機,其他變量為默認設置,進行回歸分析,找出分別與空腹血糖或HbA1c相關的CpG位點。采用Bonferroni法對回歸結果中的P值進行多重比較校正,顯著性水平設為錯誤發(fā)現率(false discovery rate,FDR)< 0.05。
本研究最終納入同卵雙生子338人(169對),CpG位點412 459個,其中男性同卵雙生子114對、女性55對,平均年齡(48.2±11.9)歲,其他相關變量基本描述如表1,雙生子對內血糖及HbA1c水平差異均有統(tǒng)計學意義(P< 0.001),空腹血糖平均對內差值(1.1±1.8) mmol/L,HbA1c平均對內差值(0.6±0.9)%。
表1 雙生子人口學特征及相關變量基本信息
Diabetes mellitus and hypertension were diagnosed by hospitals at or above the county level and reported by patients themselves. The situation of taking hypoglycemic drugs was whether the subjects had taken hypoglycemic drugs within 30 days. FPG, fasting plasma glucose; HbA1c, glycated haemoglobin; BMI, body mass index; SBP, systolic blood pressure; DBP, diastolic blood pressure.
全基因組DNA甲基化與血糖或HbA1c間相關性分析將338人(169對)同卵雙生子以空腹血糖、HbA1c等血糖相關指標作為主效應,甲基化水平(β值)作為因變量,納入相關協(xié)變量用混合效應模型進行分析,找出與血糖相關的CpG位點。圖1展示了CpG位點及其顯著性(P值)與染色體之間的位置關系,在與空腹血糖相關分析中,在1、2、4、6、7、8號染色體上發(fā)現陽性CpG位點(圖1A),在與HbA1c相關分析中,在1、4、6、7、17號染色體上發(fā)現陽性CpG位點(圖1B)。
經調整年齡、性別、BMI等因素及進行多重比較校正后,發(fā)現與空腹血糖相關位點7個,與HbA1c相關CpG位點10個(表2),其中cg19693031位點在與空腹血糖及HbA1c相關分析中均是P值最小的位點;共有3個CpG位點在與空腹血糖、HbA1c相關分析中被重復發(fā)現(表3)??崭寡菍腉CF為1.036,HbA1c對應的GCF為1.014,均在1附近(GCF < 1.1),Q-Q圖(圖2)中多數CpG位點與參考線基本重合,僅在末端有較大偏離,顯示本研究較好地控制了人群分層。
目前,DNA甲基化是一個疾病機制研究中的新領域,目前已有基于歐美人群的研究發(fā)現,DNA甲基化與空腹血糖或HbA1c之間存在相關性,發(fā)現多個CpG位點(如cg19693031-TXNIP、cg18881723-SLAMF1、cg05201300-ATP6V0E1、cg01676795-POR、cg00936728-FCRL6、cg00574958-CPT1A、cg07805383-未知基因、cg08309687-LINC0069、cg26262157-PFKFB3、cg12655112-EHD3等)的甲基化可能與空腹血糖或HbA1c水平相關[19-21],但研究結果之間的差異較大,就目前已知的研究結果而言,僅有位于TXNIP基因上的cg19693031 位點在兩篇不同研究中被重復發(fā)現[19-20]。
本研究利用收集到的338人(169對)同卵雙生子進行全基因組DNA甲基化與血糖指標相關分析。經多重校正后,發(fā)現與空腹血糖相關的CpG位點7個, 其中4個CpG位點及其所在基因(cg19693031-TXNIP、cg01538969-DHX16、cg04816311-C7orf50、cg06721411-DQX16)與血糖代謝或2型糖尿病間的相關性已被其他文獻報道[20,22-24]。本研究新發(fā)現3個與空腹血糖存在相關性的位點(cg08501915、ch.8.1820050F、cg26608667),其中cg08501915位點雖然在以往的研究中沒有被發(fā)現與血糖之間有相關性,但有研究發(fā)現該位點所在PGRMC2基因和血糖代謝之間可能存在相關性[25],所以cg08501915位點的甲基化,可能和血糖存在實際的相關性;其余兩個CpG位點cg26608667、ch.8.1820050F,分別位于ZFAND2A基因和8號染色體的未知基因上,這些CpG位點與血糖代謝之間的關聯尚需進一步探討。
表2 全基因組DNA甲基化與血糖指標相關性分析
Correlation analysis of whole genome DNA methylation and blood glucose related indicators covariates such as age, gender, BMI, smoking, drinking, blood pressure, hypoglycemic drug use, blood cell composition and surrogate variables generated by SVA package were adjusted. SE, standard error; FDR, false discovery rate; FPG, fasting plasma glucose; 1st exon, first exon; Body, gene body; TSS1500, 200-1500 bases upstream of the transcriptional start site; 3′UTR, 3′ untranslated region; 5′UTR, 5′ untranslated region; -, represents the CpG sites does not target on known genes; Island, the CpG site is on CpG island; N_Shore, ≤2 kb far on the 5′ side; N_Shelf, ≤2 kb from CpG island on the 5′ side; OpenSea, ≥4 kb from any CpG island.
本研究發(fā)現與HbA1c相關的CpG位點10個, 其中6個陽性位點(cg19693031-TXNIP、cg04816311-C7orf50、cg01538969-DHX16、cg01676795-POR、cg09029192-TNRC6C、cg16097041-FLAD1)已在其他研究中發(fā)現與HbA1c、空腹血糖或糖尿病之間存在相關關系[19-20,22-24]; 4個位點(cg01339781-ZUFSP、cg24667115-BACH2、cg20697417-未知基因、ch.4.1528651F-FRAS1)在之前研究中未發(fā)現與糖尿病或血糖相關指標間的相關性,不過BACH2基因上另一個CpG位點cg27644327曾被報道與2型糖尿病及BMI存在相關性[23],其余3個CpG位點cg01339781、ch.4.1528651F、cg20697417,分別位于ZUFSP、FRAS1基因和1號染色體的未知基因上,其功能尚需進一步探討。此外,本研究發(fā)現的3個與空腹血糖及HbA1c均存在相關性的CpG位點(cg19693031-TXNIP、cg01538969-DHX16、cg04816311-C7orf50)與2型糖尿病及HbA1c等血糖指標間相關性已在先前研究中被多次報道[22-23]。
表3 全基因組DNA甲基化與血糖指標相關分析重疊位點
Correlation analysis of whole genome DNA methylation and blood glucose related indicators covariates such as age, gender, body mass index, smo-king, drinking, blood pressure, hypoglycemic drug use, blood cell composition and surrogate variables generated by SVA package were adjusted.FDR, false discovery rate; FPG, fasting plasma glucose; Body, gene body; 3′UTR, 3′ untranslated region.
本研究發(fā)現的TXNIP基因上的cg19693031位點與血糖之間的相關性已在多篇DNA甲基化研究中被報道,該基因表達的蛋白與硫氧還原蛋白相互作用并對其表達和功能起負調控作用[26],調節(jié)氧化還原過程。近年研究發(fā)現,TXNIP是細胞內糖轉運信號通路的關鍵節(jié)點,該基因的表達產物通過影響GLUT1和GLUT4調節(jié)葡萄糖進入細胞[27]。DHX16基因表達產物參與mRNA剪接過程,是細胞代謝和基因表達的重要參與蛋白[28]。C7orf50為位于7號染色體上的開放閱讀框,對于其功能的研究較少,尚不清楚該區(qū)域的生理功能及其與血糖代謝之間的作用機制。目前已發(fā)表的研究[22-23]僅發(fā)現DHX16基因及C7orf50區(qū)域上的部分CpG位點的甲基化與血糖水平可能存在相關性,但其與血糖轉運、代謝之間的聯系尚無明確證據。
本研究的優(yōu)勢是相較其他的DNA甲基化相關性研究,研究對象為同卵雙生子,同卵雙生子共享了全部的遺傳物質和早期發(fā)育環(huán)境,因此具有較高的匹配度。在樣本量相當的研究中,雙生子研究具有更高的把握度[8]。在利用雙生子人群進行的糖尿病及相關指標與DNA甲基化的相關性研究中,本研究具有較大樣本量,因此也發(fā)現了多個前人研究當中未發(fā)現的位點,并且本研究采用更保守的Bonferroni檢驗,研究結果更具參考價值。
本研究也存在一定局限性:(1)僅對全血樣本進行DNA甲基化檢測,未對其他組織進行檢測。DNA甲基化存在組織特異性,對于血糖相關指標與其他組織中目標位點之間的相關性需要進一步驗證。也有研究提示外周血與組織中DNA甲基化具有較高的一致性,由于采血更為便捷,使得外周血成為目前多數甲基化研究的首選材料。(2)僅分析了各個CpG位點的甲基化和空腹血糖、HbA1c等指標間的聯系,這些基因轉錄、翻譯的產物的變化及其與人體內血糖代謝狀況間的相關性還有待進一步研究驗證。(3)為橫斷面研究,無法確定甲基化與血糖變化在發(fā)生時間上先后順序,因此本研究只能發(fā)現CpG位點的甲基化與血糖相關指標間的相關關系,不能研究因果關系。(4)僅分析了單個CpG位點的甲基化與血糖或HbA1c之間的相關性,未考慮多個連續(xù)CpG位點組成的區(qū)域(CpG島)的甲基化與HbA1c之間的相關性,可能忽略了多個位點的微小的甲基化與血糖代謝之間的效應聯系。(5)僅考慮了單個CpG位點的甲基化和HbA1c及空腹血糖間的相關性,未考慮位點之間及表型之間的交互作用,在后續(xù)研究中,可進一步考慮其他影響因素間的交互作用。
綜上所述,本研究利用中國雙生子人群,全基因組范圍內探索與血糖相關指標相關的DNA甲基化位點,發(fā)現了與空腹血糖及HbA1c存在相關的DNA甲基化位點。本研究為國內較早地利用雙生子人群進行的血糖相關指標與DNA甲基化之間的相關分析,能夠為后續(xù)研究提供重要的參考,但是本研究所發(fā)現的陽性CpG位點的甲基化與近期及遠期血糖代謝水平間的相關性,還需要進一步在更大樣本量的人群中驗證。