王文秀,黃濤,李立明,2
資源與平臺
基于“中國慢性病前瞻性研究”的遺傳資源建設(shè)與應(yīng)用
王文秀1,黃濤1,李立明1,2
1. 北京大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系,北京 100191 2. 北京大學(xué)公眾健康與重大疫情防控戰(zhàn)略研究中心,北京 100191
目前中國慢性病負(fù)擔(dān)沉重,加快推進(jìn)慢性病早期預(yù)防的研究迫在眉睫。大型人群隊列是慢性病病因?qū)W研究的首要設(shè)計之一,有助于人們尋找到切實可行的慢性病干預(yù)措施。同時,從大型人群隊列的基因水平闡明危險因素與疾病的遺傳關(guān)聯(lián),也可開辟一條研究流行病學(xué)中因果關(guān)系的新途徑。本文對由中國醫(yī)學(xué)科學(xué)院、北京大學(xué)和英國牛津大學(xué)聯(lián)合開展的“中國慢性病前瞻性研究”項目China Kadoorie Biobank (CKB)進(jìn)行了推介,重點介紹了該項目遺傳數(shù)據(jù)資源的建設(shè)進(jìn)展以及近年來發(fā)表的遺傳學(xué)研究成果,以期為我國大型人群隊列遺傳資源的深入挖掘與利用提供參考。
中國慢性病前瞻性研究;遺傳資源;生物樣本庫;大型人群隊列
隨著我國經(jīng)濟(jì)社會的飛速發(fā)展,國民生活方式和膳食營養(yǎng)結(jié)構(gòu)發(fā)生了深刻的變化。加之人口老齡化及城鎮(zhèn)化進(jìn)程的加速,種種因素使得我國居民的疾病譜發(fā)生了很大的轉(zhuǎn)變,慢性非傳染性疾病的患者基數(shù)不斷擴(kuò)大,同時因慢性病死亡的比例也在不斷增加?!吨袊用駹I養(yǎng)與慢性病狀況報告(2020年)》顯示,我國18歲以上居民高血壓患病率為27.5%,糖尿病患病率為11.9%,慢性阻塞性肺病患病率為13.6%,因慢性病導(dǎo)致的死亡占總死亡率的88.5%[1]。由此可見,中國慢性病負(fù)擔(dān)沉重,預(yù)防、控制和治療慢性病的工作迫在眉睫。解決這個問題應(yīng)該從一級預(yù)防入手,綜合防控慢性病危險因素。而目前已有的病因?qū)W研究多來自西方發(fā)達(dá)國家人群,并不完全適用于中國人群。因此,獲得中國人群的慢性病病因?qū)W證據(jù),尋找更加切實可行的干預(yù)措施,具有迫切的理論與實踐意義。
隊列研究是流行病學(xué)研究最基本的研究設(shè)計之一,是一種重要的評價疾病危險因素的流行病學(xué)研究方法。小樣本隊列因樣本量的限制常導(dǎo)致統(tǒng)計效率的不足,而大型人群隊列因樣本量大、隨訪時間長、覆蓋廣泛的人群與地區(qū)特征等優(yōu)勢,使其有機(jī)會更深入地探討復(fù)雜的基因–環(huán)境相互作用、劑量-反應(yīng)關(guān)系以及不同特征人群的亞組分析等,從而可以為病因?qū)W研究提供更為強(qiáng)有力的證據(jù)。我國人群隊列建設(shè)具有約50年歷史,相比于西方隊列存在起步較晚、隨訪時間較短和規(guī)模較小等局限[2]。近20余年來,我國陸續(xù)建成了若干大型人群隊列,其中重點關(guān)注慢性病的隊列有:51.3萬樣本量的中國慢性病前瞻性研究(China Kadoorie Biobank, CKB)、20萬樣本量的泰州人群健康跟蹤調(diào)查、7.5萬樣本量的上海女性健康研究和6.2萬樣本量的上海男性健康研究等[3~6]。目前,以個體化醫(yī)療為特征的精準(zhǔn)醫(yī)學(xué)模式成為了研究焦點。“十三五”期間,“精準(zhǔn)醫(yī)學(xué)研究”被列為我國重點研究專項之一,啟動了百萬人以上的自然人群國家大型健康隊列和重大疾病專病隊列,旨在實施精準(zhǔn)醫(yī)學(xué)研究的協(xié)同攻關(guān)。目前已完成立項的研究包括京津冀自然人群隊列研究、西南區(qū)域自然人群隊列研究、呼吸系統(tǒng)疾病專病隊列研究和乳腺癌專病隊列研究等。
隨著以測序技術(shù)與質(zhì)譜技術(shù)為代表的高通量組學(xué)技術(shù)的發(fā)展,近年來的人群隊列致力于采集、長期保藏、利用研究對象的生物樣本,建立了專門的隊列生物樣本庫。流行病學(xué)家借助豐富的生物樣本數(shù)據(jù),結(jié)合傳統(tǒng)流行病學(xué)的宏觀性,通過建立大數(shù)據(jù)、多水平的計算模型,可以更為系統(tǒng)地闡明由因及果的致病機(jī)制,系統(tǒng)流行病學(xué)(systems epidemio-logy)的概念因此也應(yīng)運而生[7]。系統(tǒng)流行病學(xué)通過生物樣本庫多水平、多層次的豐富數(shù)據(jù),構(gòu)建整合的模型,完善了傳統(tǒng)流行病學(xué)的局限性,在探索病因和尋找可能的干預(yù)靶點中發(fā)揮著重要的作用。CKB作為目前全球僅有的幾項建立生物樣本庫的超大型前瞻性隊列研究之一,集成了豐富的中國人群遺傳資源與數(shù)據(jù)信息資源。因此,本文將以CKB為例,概述該項目的研究設(shè)計、遺傳資源的采集與管理方法,總結(jié)其已發(fā)表的遺傳學(xué)證據(jù),為我國大型人群隊列的建設(shè)提供參考。
CKB是2002年由衛(wèi)生部批準(zhǔn)立項,現(xiàn)由中國醫(yī)學(xué)科學(xué)院、北京大學(xué)和英國牛津大學(xué)聯(lián)合開展的一項大型慢性病國際合作研究項目。該項目旨在從遺傳、環(huán)境和生活方式等多個層次和水平入手,深入研究危害中國人群健康的主要慢性疾病(如腦卒中、冠心病、糖尿病、癌癥等)的致病因素、保護(hù)性因素、發(fā)病機(jī)制及流行規(guī)律和趨勢,為有效制定重大慢性病防控策略和指南,開發(fā)新的治療和干預(yù)手段,提供高質(zhì)量的病因?qū)W證據(jù)。
本項目于2004年6月至2008年8月間在中國10個省/地區(qū)(黑龍江省哈爾濱市、山東省青島市、江蘇省蘇州市、浙江省桐鄉(xiāng)市、河南省輝縣市、甘肅省天水市、四川省彭州市、廣西壯族自治區(qū)柳州市、海南省??谑泻秃鲜g陽市)開展,項目點的選擇綜合考慮了城市和農(nóng)村的比例、各類慢性病的發(fā)病率和主要危險因素的分布、人口穩(wěn)定性,以及死因和疾病登記報告制度的完整性等因素,并經(jīng)過現(xiàn)場調(diào)研考核后確定。本項目采取整群抽樣的方式,以城市區(qū)和農(nóng)村縣為單位進(jìn)行募集和調(diào)查,共計招募了512,891名年齡在30~79歲、具有知情同意書及完整基線調(diào)查數(shù)據(jù)的研究對象,其中男性占41%,農(nóng)村人口占56%,平均年齡為52歲[3,8]。項目于2008年、2014年及2020年在各項目點隨機(jī)抽取約5%的研究對象各完成一次重復(fù)調(diào)查,以了解隊列人群中生活方式等因素的動態(tài)變化情況。基線及三次重復(fù)調(diào)查的開展時間、調(diào)查人數(shù)及調(diào)查內(nèi)容見圖1。
圖1 CKB項目基線與重復(fù)調(diào)查信息
在隊列成員參加基線調(diào)查后6個月,開展針對全部隊列成員的結(jié)局隨訪工作。隨訪期間的死亡與發(fā)病信息通過多種途徑獲得,包括當(dāng)?shù)匦l(wèi)生部門現(xiàn)有的死亡和常規(guī)疾病監(jiān)測系統(tǒng)及社區(qū)工作人員主動定向監(jiān)測。隊列成員的醫(yī)保覆蓋率已經(jīng)達(dá)到98%,醫(yī)療保險數(shù)據(jù)庫也成為了補充死亡、常規(guī)發(fā)病信息的重要途徑。為了保證結(jié)局隨訪工作的質(zhì)量,項目組還開展了對主要慢性病發(fā)病事件的病例復(fù)核工作,確保報告和診斷的準(zhǔn)確性。
CKB作為一項多因素、多結(jié)局、多學(xué)科的大型慢性流行病學(xué)研究,建立了世界上領(lǐng)先規(guī)模的成人生物樣本庫,存儲了項目51.3萬人及重復(fù)調(diào)查的所有生物樣本,存儲規(guī)模達(dá)到58.8萬份[2]。與其他國內(nèi)外隊列相比,其樣本量龐大,覆蓋了我國東北、華東、華南、西北和西南具有不同文化背景、經(jīng)濟(jì)水平以及暴露譜和疾病譜的城市和農(nóng)村地區(qū);隨訪時間長,截至目前,隊列平均隨訪13年,累計隨訪600余萬人年。CKB項目數(shù)據(jù)量大、類型多元、來源復(fù)雜。數(shù)據(jù)資源上既包括問卷調(diào)查、體格檢查數(shù)據(jù),還包括了血生化檢測數(shù)據(jù)、基因分型數(shù)據(jù)、代謝組學(xué)數(shù)據(jù)和結(jié)局事件數(shù)據(jù)等。因此,數(shù)據(jù)的標(biāo)準(zhǔn)化采集、規(guī)范化管理成為隊列建設(shè)的一項重要議題?;诖耍珻KB項目以十余年來的成功建設(shè)經(jīng)驗為基礎(chǔ),撰寫并發(fā)布了一套完善的大型人群隊列研究的規(guī)范化團(tuán)體標(biāo)準(zhǔn),包括《大型人群隊列現(xiàn)場調(diào)查管理技術(shù)規(guī)范(T/CPMA 001-2019)》[9]、《大型人群隊列研究數(shù)據(jù)安全技術(shù)規(guī)范(T/CPMA 002-2018)》[10]等,以期為其他隊列研究提供參考。
CKB項目建立了生物樣本采集、分裝、運輸、存儲等一系列的電子化標(biāo)準(zhǔn)操作程序和管理系統(tǒng),對所有樣本實施全方位監(jiān)管,最大限度地降低人為錯誤的概率。所有生物樣本的采集均獲得了研究對象的知情同意,由經(jīng)過統(tǒng)一培訓(xùn)的專業(yè)技術(shù)人員根據(jù)標(biāo)準(zhǔn)操作程序完成采集和分裝,并統(tǒng)一運輸至CKB項目樣本庫儲存。項目樣本庫嚴(yán)格按照樣本存儲空間、電源、網(wǎng)絡(luò)、溫度、監(jiān)控等各項標(biāo)準(zhǔn)進(jìn)行管理。
CKB項目的基因測序工作由武漢華大基因(Beijing Genomics institution, BGI)完成,統(tǒng)一采用針對中國人群單倍體信息設(shè)計的芯片(Affymetrix Axiom myDesign)檢測。項目組先后選取了兩批研究對象,采用兩種不同版本的芯片進(jìn)行測定。第一批選取了約3.2萬名研究對象,于2015年采用700K芯片進(jìn)行基因測序,其中包括5000名腦出血病例、5000名缺血性中風(fēng)病例、5000名慢阻肺病例、1.5萬余名健康對照等。第二批采用更新后的800K芯片,對隊列中隨機(jī)選取的約5萬名研究對象,以及第二次重復(fù)調(diào)查的2.5萬人進(jìn)行測序。后期參照千人基因組計劃第三階段數(shù)據(jù)進(jìn)行填補,最終填補600萬~1000萬位點信息,對全基因組的常見變異實現(xiàn)了大于93%的覆蓋。
隊列遺傳資源還包括與之相關(guān)聯(lián)的健康數(shù)據(jù)資源信息,主要來源于現(xiàn)場調(diào)查和長期隨訪監(jiān)測,包括人口和社會經(jīng)濟(jì)學(xué)因素、生活方式、疾病史與用藥史等詳細(xì)的問卷數(shù)據(jù),身高、體重、腰臀圍、肺功能、血壓等體測數(shù)據(jù)以及隨訪結(jié)局事件數(shù)據(jù)等。
現(xiàn)場調(diào)查期間,均由通過統(tǒng)一培訓(xùn)的工作人員進(jìn)行數(shù)據(jù)資源采集。問卷調(diào)查人員熟悉當(dāng)?shù)卣Z言、生活方式與習(xí)慣,并采用計算機(jī)輔助面訪及詢問時錄音等方式保證問卷質(zhì)量。體檢人員具有較強(qiáng)的醫(yī)學(xué)背景,具備熟練操作相關(guān)設(shè)備的能力,考核通過方可開展體檢,并接受定期考核。不同項目點地區(qū)現(xiàn)場調(diào)查中用到的設(shè)備、物資等統(tǒng)一配備、規(guī)格一致,定期維護(hù)。同時,采用信息關(guān)聯(lián)的方式獲取結(jié)局信息,與當(dāng)?shù)厮劳龊图膊”O(jiān)測、醫(yī)保系統(tǒng)有機(jī)整合,以及社區(qū)工作人員主動定向監(jiān)測、項目組病例復(fù)核,保證病例的真實性。
為了保證隊列調(diào)查收集數(shù)據(jù)的準(zhǔn)確性和完整性,保障項目的質(zhì)量控制、監(jiān)測、長期隨訪,項目組開發(fā)了一系列計算機(jī)系統(tǒng),可實現(xiàn)遠(yuǎn)程數(shù)據(jù)庫管理、庫存控制和設(shè)備校準(zhǔn)、長期隨訪系統(tǒng)的鏈接等?,F(xiàn)場調(diào)查產(chǎn)生的各種文件,按保密級別及重要程度進(jìn)行存檔。涉及調(diào)查對象隱私數(shù)據(jù)的文件,確保數(shù)據(jù)信息的安全,設(shè)置相關(guān)責(zé)任人,嚴(yán)格責(zé)任制。定期進(jìn)行統(tǒng)計學(xué)監(jiān)測,及時了解數(shù)據(jù)質(zhì)量及數(shù)據(jù)庫動態(tài),識別可能存在的問題并及時反饋,以保證數(shù)據(jù)質(zhì)量。
CKB項目目前已經(jīng)在遺傳學(xué)研究中取得了重大階段性成果,相關(guān)研究論文在、、、等國際重要學(xué)術(shù)期刊發(fā)表,產(chǎn)生了廣泛的國際影響,為探索我國人群慢性病病因的科學(xué)證據(jù),開發(fā)適合我國人群的遺傳風(fēng)險評分,指導(dǎo)精準(zhǔn)預(yù)防提供了重要參考。
酗酒是危害心血管健康的一大原因,但是既往前瞻性研究發(fā)現(xiàn)適量攝入酒精對中風(fēng)和心肌梗死具有一定的保護(hù)作用[11]。CKB研究結(jié)果顯示,自報飲酒量與中風(fēng)、急性心肌梗死的發(fā)病風(fēng)險呈U型軌跡,在調(diào)整了年齡、性別、教育程度、收入與吸煙狀況后,在男性中,相比不飲酒以及酗酒者,每周飲酒100 g的研究對象患病風(fēng)險最低[12]。然而,遺傳研究證據(jù)則并不支持適度飲酒預(yù)防中風(fēng)的保護(hù)性作用。在男性中,基因型與地區(qū)決定的酒精攝入量的增加與腦卒中發(fā)病風(fēng)險呈連續(xù)的正相關(guān),表現(xiàn)為每增加280 g,對應(yīng)的缺血性與出血性中風(fēng)的為1.27 (95%:1.13~1.43)和1.58 (1.36~1.84)。而女性由于飲酒率很低,基因型不能反映實際的酒精攝入量,與血壓、中風(fēng)和心肌梗死也不存在相關(guān)性。觀察性研究與遺傳證據(jù)結(jié)果的不一致可能是因為適量飲酒的保護(hù)性作用不一定來自于酒精本身,研究對象本身健康狀況不佳可能會影響酒精攝入,從而導(dǎo)致其發(fā)病風(fēng)險高于適量飲酒者。
血脂水平也與心腦血管疾病發(fā)病密切相關(guān)。既往觀察性研究和隨機(jī)對照試驗已經(jīng)證明,低密度膽固醇(low-density lipoprotein, LDL)是缺血性心臟病和缺血性中風(fēng)的重要危險因素之一[13,14],而LDL與腦出血風(fēng)險之間的關(guān)系仍沒有定論。此外,中國人群與西方人群相比,盡管有著較低的平均LDL濃度,但是腦出血的發(fā)病率較高[15],并不能簡單套用西方研究的結(jié)論。因此,CKB項目在巢式病例對照研究中比較生化測定的LDL與出血性與缺血性中風(fēng)的關(guān)聯(lián),以及采用孟德爾隨機(jī)化方法證實兩種中風(fēng)類型與LDL的因果關(guān)聯(lián)[16]。研究顯示,血漿LDL每降低1 mmol/L, 缺血性與出血性中風(fēng)=0.85 (0.80~ 0.91)和1.16(1.08~1.25)?;蝾A(yù)測的LDL每降低1 mmol/L,缺血性與出血性中風(fēng)=0.75 (0.60~0.95)和1.13 (0.91~1.40)。研究提示,降低LDL對預(yù)防總體中風(fēng)風(fēng)險和主要冠狀動脈事件依然具有凈收益。此外,CKB項目利用隊列15萬名研究對象的數(shù)據(jù),分析膽固醇酯轉(zhuǎn)運蛋白(cholesteryl ester transfer protein, CETP)基因中的變異,進(jìn)而評估高密度膽固醇(high-density lipoprotein, HDL)與心腦血管疾病的遺傳性關(guān)聯(lián)[17]。研究發(fā)現(xiàn)CETP變異與顯著升高HDL水平,但并未改變LDL水平,與心腦血管疾病發(fā)病風(fēng)險也無顯著關(guān)聯(lián)。這表明在不降低LDL水平的情況下,單純增加HDL并不能有效降低心腦血管疾病發(fā)病風(fēng)險,為藥物研究路徑提供了新的科學(xué)證據(jù)。
歐洲人群中的觀察性研究顯示,血漿維生素D (25[OH]D)低水平與較高的心腦血管疾病發(fā)病與死亡風(fēng)險相關(guān)[18]。然而,尚不清楚25[OH]D是導(dǎo)致心腦血管疾病風(fēng)險降低的原因,還是僅僅是健康狀況不佳的結(jié)果。CKB項目與哥本哈根一般人群研究(Copenhagen General Population Study, CGPS)及哥本哈根心臟研究(Copenhagen City Heart Study, CCHS)合作,以證實維生素D是否與特定血管疾病風(fēng)險存在因果關(guān)聯(lián)[19]。孟德爾隨機(jī)化研究結(jié)果顯示,無論在中國還是歐洲成人中,均未發(fā)現(xiàn)血漿25[OH]D水平(通常用于評估維生素D水平)與中風(fēng)、心肌梗死、總體心腦血管病發(fā)病或死亡之間存在因果關(guān)聯(lián)。同樣,25[OH]D水平與血脂成分之間也不存在因果關(guān)聯(lián)。CKB結(jié)果表明,觀察性研究中維生素D與心腦血管疾病之間的負(fù)相關(guān)可能是混雜的結(jié)果。
全基因組關(guān)聯(lián)研究發(fā)現(xiàn)了許多 2 型糖尿病相關(guān)的遺傳變異。然而,既往研究多在歐洲人群中進(jìn)行,缺少中國人群的證據(jù);通?;诟叨冗x擇的病例對照樣本,缺少對人群水平效應(yīng)大小的可靠估計。2016年CKB項目在具有基因分型的93,000名研究對象中,檢驗了56個既往研究確定的位點與2型糖尿病的風(fēng)險關(guān)聯(lián)。其中,48個位點與既往文獻(xiàn)的效應(yīng)方向一致,為歐洲人和東亞人之間2型糖尿病的共同遺傳結(jié)構(gòu)提供了進(jìn)一步的證據(jù)[20]。另外,改進(jìn)的位點效應(yīng)大小估計可以構(gòu)建更加準(zhǔn)確的加權(quán)遺傳風(fēng)險評分,更好地應(yīng)用于疾病預(yù)測。2020年CKB的一項研究即采用以上驗證的位點構(gòu)建遺傳風(fēng)險評分,研究2型糖尿病遺傳風(fēng)險評分與健康生活方式(根據(jù)BMI、飲酒、吸煙、體力活動和飲食定義)的交互作用與2型糖尿病發(fā)病風(fēng)險的關(guān)聯(lián)[21]。研究發(fā)現(xiàn),高遺傳風(fēng)險組(最高五分位數(shù))患2型糖尿病的風(fēng)險比低遺傳風(fēng)險組(最低五分位數(shù))高出79% (60%, 100%)。在具有高遺傳風(fēng)險的人群中,采取健康生活方式的參與者患2型糖尿病的風(fēng)險比不健康生活方式者低63% (56%, 69%)。
肺癌是中國發(fā)病率與死亡率最高的癌癥類型[22],其中非小細(xì)胞肺癌(non-small cell lung cancer, NSCLC)約占肺癌總數(shù)的85%[23]。然而,肺癌的主要遺傳位點尚未完全確定,尤其是在中國人群中。2019年發(fā)表的納入27,120例病例與27,355例對照的全基因組關(guān)聯(lián)研究,發(fā)現(xiàn)了19個與NSCLC相關(guān)的遺傳位點[24]。利用這些位點,在應(yīng)用于CKB研究的95,408名研究對象時,位點的多基因遺傳評分與肺癌的發(fā)病率存在劑量反應(yīng)關(guān)聯(lián)(趨勢=2.02×10–9),成功驗證了其在肺癌風(fēng)險預(yù)測中的有效性,并有可能應(yīng)用于肺癌的個體化預(yù)防。
超過40%的胃癌新發(fā)與死亡病例發(fā)生在中國[22]。2020年發(fā)表的全基因組關(guān)聯(lián)薈萃分析納入了10,254例病例及10,914例對照,并利用發(fā)現(xiàn)的112個遺傳位點構(gòu)建多基因風(fēng)險得分。在CKB項目的100,220名研究對象中,研究基因與健康生活方式因素(定義為不吸煙、從不飲酒、較少攝入腌制食品以及經(jīng)常攝入新鮮水果)的交互作用與胃癌發(fā)病風(fēng)險的關(guān)聯(lián)[25]。研究發(fā)現(xiàn),多基因風(fēng)險得分與胃癌發(fā)病風(fēng)險顯著相關(guān)(趨勢<0.0001);與同樣具有高遺傳風(fēng)險但采取不健康生活方式的對象相比,采取健康生活方式的研究對象胃癌發(fā)病風(fēng)險較低,值為0.53(0.29~0.99),其絕對風(fēng)險降低1.12%(0.62~1.56)。
肺功能受損是反映慢性阻塞性肺病的重要指標(biāo)。然而,既往肺功能的全基因組關(guān)聯(lián)研究都基于歐洲人群,缺乏亞洲人群的關(guān)聯(lián)證據(jù)。CKB項目利用100,285名研究對象的遺傳資源數(shù)據(jù),開展了目前為止最大的亞裔肺功能全基因組關(guān)聯(lián)研究,識別了18個既往未報道過的肺功能相關(guān)基因位點,并發(fā)現(xiàn)肺功能和肥胖指標(biāo)之間存在共同的遺傳基礎(chǔ)[26]。該研究提供了中國人群肺功能易感基因的證據(jù),從遺傳的角度揭示了肺功能與肥胖的關(guān)聯(lián),這些發(fā)現(xiàn)可能為未來開發(fā)個體化干預(yù)治療以預(yù)防肺功能下降開辟新的途徑。
東亞人群中BMI與肝膽疾病的關(guān)聯(lián)證據(jù)有限。2020年發(fā)表的一篇孟德爾隨機(jī)化研究發(fā)現(xiàn),基因預(yù)測的BMI與肝膽疾病風(fēng)險增加有關(guān),在疾病亞型之間也觀察到一致的關(guān)聯(lián)[27]。研究表明,肥胖是中國人群患有肝膽疾病的一項重要危險因素。因此,研究支持采用生活方式干預(yù)的手段,包括減重和飲食干預(yù),以達(dá)到肝膽疾病的一級預(yù)防。
目前,CKB項目已經(jīng)獲得了一系列適用于中國人群的慢性病病因?qū)W遺傳證據(jù),成為了我國高質(zhì)量病因?qū)W證據(jù)的重要來源,對制定慢性病防控的策略和措施和指導(dǎo)我國慢性病精準(zhǔn)防治具有重要意義。由于大樣本隊列研究是一項長期系統(tǒng)的工程,CKB項目已對10萬余名研究對象進(jìn)行了基因分型,但后續(xù)樣本的基因測序仍需要投入大量的經(jīng)費與人力資源。此外,項目組對表觀遺傳組學(xué)、蛋白組學(xué)、代謝組學(xué)等多組學(xué)數(shù)據(jù)的檢測與利用較少,有待進(jìn)一步開展多時點多組學(xué)檢測,構(gòu)建精細(xì)隊列?;贑KB高質(zhì)量的人群隊列生物樣本數(shù)據(jù),如果可以得到足夠的經(jīng)費支持、長期維持隊列,必將帶來大量的研究機(jī)遇,產(chǎn)出更多的研究成果,為我國慢性病流行病學(xué)領(lǐng)域的發(fā)展做出突出貢獻(xiàn)。
“健康中國2030”戰(zhàn)略的推進(jìn)需要具有更廣泛人群和地域特征的中國人群隊列研究。包括CKB研究在內(nèi)的大型人群隊列以及已逐步建立完善的“精準(zhǔn)醫(yī)學(xué)研究”專項隊列,正在形成一個多層次的生物醫(yī)學(xué)大數(shù)據(jù)平臺和遺傳多樣化的數(shù)據(jù)資源體系。未來,通過應(yīng)用更先進(jìn)的大數(shù)據(jù)網(wǎng)絡(luò)分析處理方法并整合多層次多組學(xué)的數(shù)據(jù),這些隊列將在分子、細(xì)胞、組織、社會與生態(tài)環(huán)境等多水平上進(jìn)行深入地挖掘與探索,進(jìn)一步解釋和明確疾病發(fā)生發(fā)展過程,為疾病的預(yù)防、控制和治療提供重要支持;依靠智能手機(jī)、可穿戴移動設(shè)備等移動終端收集更為詳盡、準(zhǔn)確的個體化暴露組學(xué)信息;加強(qiáng)數(shù)據(jù)共享平臺的建設(shè),優(yōu)化數(shù)據(jù)清理、開發(fā)和有機(jī)整合,同時密切關(guān)注生物信息安全,將會是大型人群隊列遺傳數(shù)據(jù)資源的發(fā)展方向。
[1] National Health Commission of the People's Republic of China. Report on the nutrition and chronic diseases status of Chinese residents 2020. Beijing: Peking University Medical Press, 2020.
國家衛(wèi)生健康委員會. 中國居民營養(yǎng)與慢性病狀況報告(2020年). 北京: 北京大學(xué)醫(yī)學(xué)出版社, 2020.
[2] Li LM, Lv J. Large prospective cohort studies: a review and update., 2015, 36(11): 1187–1189.
李立明, 呂筠. 大型前瞻性人群隊列研究進(jìn)展. 中華流行病學(xué)雜志, 2015, 36(11): 1187–1189.
[3] Chen ZM, Chen JS, Collins R, Guo Y, Peto R, Wu F, Li LM. China Kadoorie Biobank of 0.5 million people: survey methods, baseline characteristics and long-term follow-up., 2011, 40(6): 1652–1666.
[4] Zheng W, Chow WH, Yang G, Jin F, Rothman N, Blair A, Li HL, Wen WQ, Ji BT, Li Q, Shu XO, Gao YT. The Shanghai Women's Health Study: rationale, study design, and baseline characteristics., 2005, 162(11): 1123–1131.
[5] Shu XO, Li HL, Yang G, Gao J, Cai H, Takata Y, Zheng W, Xiang YB. Cohort profile: the Shanghai Men's Health Study., 2015, 44(3): 810–818.
[6] Wang XF, Lu M, Qian J, Yang YJ, Li SL, Lu D, Yu SZ, Meng W, Ye WM, Jin L. Rationales, design and recruitment of the Taizhou Longitudinal Study., 2009, 9: 223.
[7] Huang T, Li LM. Systems epidemiology., 2018, 39(05): 694–699.
黃濤, 李立明. 系統(tǒng)流行病學(xué). 中華流行病學(xué)雜志, 2018, 39(05): 694–699.
[8] Chen ZM, Lee L, Chen JS, Collins R, Wu F, Guo Y, Linksted P, Peto R. Cohort profile: the Kadoorie Study of Chronic Disease in China (KSCDC)., 2005, 34(6): 1243–1249.
[9] Chinese Preventive Medicine Association. Technical specification of management for field survey in large population-based cohort study (T/CPMA 001-2019)., 2019, 40(7): 739–747.
中華預(yù)防醫(yī)學(xué)會. 大型人群隊列現(xiàn)場調(diào)查管理技術(shù)規(guī)范(T/CPMA 001-2019). 中華流行病學(xué)雜志, 2019, 40(7): 739–747.
[10] Chinese Preventive Medicine Association. Technical specification of data security for large population-based cohort study (T/CPMA 002-2018)., 2019, 40(1): 12–16.
中華預(yù)防醫(yī)學(xué)會. 大型人群隊列研究數(shù)據(jù)安全技術(shù)規(guī)范(T/CPMA 002-2018). 中華流行病學(xué)雜志, 2019, 40(1): 12–16.
[11] Wood AM, Kaptoge S, Butterworth AS, Willeit P, Warnakula S, Bolton T, Paige E, Paul DS, Sweeting M, Burgess S, Bell S, Astle W, Stevens D, Koulman A, Selmer RM, Verschuren WMM, Sato S, Nj?lstad I, Woodward M, Salomaa V, Nordestgaard BG, Yeap BB, Fletcher A, Melander O, Kuller LH, Balkau B, Marmot M, Koenig W, Casiglia E, Cooper C, Arndt V, Franco OH, Wennberg P, Gallacher J, De La Cámara AG, V?lzke H, Dahm CC, Dale CE, Bergmann MM, Crespo CJ, Van Der Schouw YT, Kaaks R, Simons LA, Lagiou P, Schoufour JD, Boer JMA, Key TJ, Rodriguez B, Moreno-Iribas C, Davidson KW, Taylor JO, Sacerdote C, Wallace RB, Quiros JR, Tumino R, Blazer 2nd DG, Linneberg A, Daimon M, Panico S, Howard B, Skeie G, Strandberg T, Weiderpass E, Nietert PJ, Psaty BM, Kromhout D, Salamanca-Fernandez E, Kiechl S, Krumholz HM, Grioni S, Palli D, Huerta JM, Price J, Sundstrom J, Arriola L, Arima H, Travis RC, Panagiotakos DB, Karakatsani A, Trichopoulou A, Kuhn T, Grobbee DE, Barrett-Connor E, Van Schoor N, Boeing H, Overvad K, Kauhanen J, Wareham N, Langenberg C, Forouhi N, Wennberg M, Despres JP, Cushman M, Cooper JA, Rodriguez CJ, Sakurai M, Shaw JE, Knuiman M, Voortman T, Meisinger C, Tjonneland A, Brenner H, Palmieri L, Dallongeville J, Brunner EJ, Assmann G, Trevisan M, Gillum RF, Ford I, Sattar N, Lazo M, Thompson SG, Ferrari P, Leon DA, Smith GD, Peto R, Jackson R, Banks E, Di Angelantonio E, Danesh J. Risk thresholds for alcohol consumption: combined analysis of individual-participant data for 599 912 current drinkers in 83 prospective studies., 2018, 391(10129): 1513–1523.
[12] Millwood IY, Walters RG, Mei XW, Guo Y, Yang L, Bian Z, Bennett DA, Chen YP, Dong CX, Hu RY, Zhou G, Yu B, Jia WF, Parish S, Clarke R, Davey Smith G, Collins R, Holmes MV, Li LM, Peto R, Chen ZM. Conventional and genetic evidence on alcohol and vascular disease aetiology: a prospective study of 500 000 men and women in China., 2019, 393(10183): 1831–1842.
[13] Baigent C, Blackwell L, Emberson J, Holland LE, Reith C, Bhala N, Peto R, Barnes EH, Keech A, Simes J, Collins R. Efficacy and safety of more intensive lowering of LDL cholesterol: a meta-analysis of data from 170,000 parti-cipants in 26 randomised trials., 2010, 376(9753): 1670–1681.
[14] Di Angelantonio E, Sarwar N, Perry P, Kaptoge S, Ray KK, Thompson A, Wood AM, Lewington S, Sattar N, Packard CJ, Collins R, Thompson SG, Danesh J. Major lipids, apolipoproteins, and risk of vascular disease., 2009, 302(18): 1993–2000.
[15] Zhou MM, Wang HD, Zhu J, Chen WQ, Wang LH, Liu SW, Li YC, Wang LJ, Liu YN, Yin P, Liu JM, Yu SC, Tan F, Barber RM, Coates MM, Dicker D, Fraser M, González- Medina D, Hamavid H, Hao YT, Hu GH, Jiang GH, Kan HD, Lopez AD, Phillips MR, She J, Vos T, Wan X, Xu GL, Yan LLJ, Yu CH, Zhao Y, Zheng YF, Zou XN, Naghavi M, Wang Y, Murray CJL, Yang GH, Liang XF. Cause-specific mortality for 240 causes in China during 1990-2013: a systematic subnational analysis for the Global Burden of Disease Study 2013., 2016, 387(10015): 251–272.
[16] Sun LL, Clarke R, Bennett D, Guo Y, Walters RG, Hill M, Parish S, Millwood IY, Bian Z, Chen YP, Yu CQ, Lv J, Collins R, Chen JS, Peto R, Li LM, Chen ZM. Causal associations of blood lipids with risk of ischemic stroke and intracerebral hemorrhage in Chinese adults., 2019, 25(4): 569–574.
[17] Millwood IY, Bennett DA, Holmes MV, Boxall R, Guo Y, Bian Z, Yang L, Sansome S, Chen YP, Du HD, Yu CQ, Hacker A, Reilly DF, Tan YL, Hill MR, Chen JS, Peto R, Shen HB, Collins R, Clarke R, Li LM, Walters RG, Chen ZM. Association of CETP gene variants with risk for vascular and nonvascular diseases among Chinese adults., 2018, 3(1): 34–43.
[18] Al Mheid I, Quyyumi AA. Vitamin D and cardiovascular disease: controversy unresolved., 2017, 70(1): 89–100.
[19] Huang T, Afzal S, Yu CQ, Guo Y, Bian Z, Yang L, Millwood IY, Walters RG, Chen YP, Chen NY, Gao RQ, Chen JS, Clarke R, Chen ZM, Ellervik C, Nordestgaard BG, Lv J, Li LM. Vitamin D and cause-specific vascular disease and mortality: a Mendelian randomisation study involving 99,012 Chinese and 106,911 European adults., 2019, 17(1): 160.
[20] Gan W, Walters RG, Holmes MV, Bragg F, Millwood IY, Banasik K, Chen YP, Du HD, Iona A, Mahajan A, Yang L, Bian Z, Guo Y, Clarke RJ, Li LM, Mccarthy MI, Chen ZM. Evaluation of type 2 diabetes genetic risk variants in Chinese adults: findings from 93,000 individuals from the China Kadoorie Biobank., 2016, 59(7): 1446–1457.
[21] Li HX, Khor CC, Fan JN, Lv J, Yu CQ, Guo Y, Bian Z, Yang L, Millwood IY, Walters RG, Chen YP, Yuan JM, Yang Y, Hu C, Chen JS, Chen ZM, Koh WP, Huang T, Li LM. Genetic risk, adherence to a healthy lifestyle, and type 2 diabetes risk among 550,000 Chinese adults: results from 2 independent Asian cohorts., 2020, 111(3): 698–707.
[22] Chen WQ, Zheng RS, Baade PD, Zhang SW, Zeng HM, Bray F, Jemal A, Yu XQ, He J. Cancer statistics in China, 2015., 2016, 66(2): 115–132.
[23] Alberg AJ, Brock MV, Ford JG, Samet JM, Spivack SD. Epidemiology of lung cancer: Diagnosis and management of lung cancer, 3rd ed: American College of Chest Physicians evidence-based clinical practice guidelines., 2013, 143(Suppl 5): e1S–e29S.
[24] Dai JC, Lv J, Zhu M, Wang YZ, Qin N, Ma HX, He YQ, Zhang RX, Tan W, Fan JY, Wang TP, Zheng H, Sun Q, Wang LJ, Huang MT, Ge ZJ, Yu CQ, Guo Y, Wang TM, Wang J, Xu L, Wu WB, Chen L, Bian Z, Walters R, Millwood IY, Li XZ, Wang X, Hung RJ, Christiani DC, Chen HQ, Wang MY, Wang C, Jiang Y, Chen KX, Chen ZM, Jin GF, Wu TC, Lin DX, Hu ZB, Amos CI, Wu C, Wei QY, Jia WH, Li LM, Shen HB. Identification of risk loci and a polygenic risk score for lung cancer: a large-scale prospective cohort study in Chinese populations., 2019, 7(10): 881–891.
[25] Jin GF, Lv J, Yang M, Wang MY, Zhu M, Wang TP, Yan CW, Yu CQ, Ding YB, Li G, Ren CL, Ni J, Zhang RX, Guo Y, Bian Z, Zheng Y, Zhang NS, Jiang Y, Chen JP, Wang YN, Xu DZ, Zheng H, Yang L, Chen YP, Walters R, Millwood IY, Dai JC, Ma HX, Chen KX, Chen ZM, Hu ZB, Wei QY, Shen HB, Li LM. Genetic risk, incident gastric cancer, and healthy lifestyle: a meta-analysis of genome-wide association studies and prospective cohort study., 2020, 21(10): 1378–1386.
[26] Zhu ZZ, Li JC, Si JH, Ma BS, Shi HWB, Lv J, Cao WH, Guo Y, Millwood IY, Walters RG, Lin K, Yang L, Chen YP, Du HD, Yu B, Hasegawa K, Camargo Jr CA, Moffatt MF, Cookson WOC, Chen JS, Chen ZM, Li LM, Yu CQ, Liang LM. A large-scale genome-wide association analysis of lung function in the Chinese population identifies novel loci and highlights shared genetic etiology with obesity., 2021.
[27] Pang YJ, Kartsonaki C, Lv J, Millwood IY, Yu CQ, Guo Y, Chen YP, Bian Z, Yang L, Chen JS, Clarke R, Walters R, Wu SK, Li HM, Holmes MV, Li LM, Chen ZM. Observational and genetic associations of body mass index and hepatobiliary diseases in a relatively lean Chinese population., 2020, 3(10): e2018721.
Construction and application of human genetic resources in the China Kadoorie Biobank
Wenxiu Wang1, Tao Huang1, Liming Li1,2
China is facing a heavy burden of chronic diseases, so it is urgent to promote the relevant researches for early prevention of chronic diseases. Large population cohorts are one of the primary study designs for etiology evidence of chronic diseases, which are helpful to explore feasible intervention measures. Moreover, clarifying the genetic associations between risk factors and diseases from the genetic level of large population cohort can also open up a new way to the exploration of causality. This article aimed to introduce the study “China Kadoorie Biobank (CKB)” jointly carried out by the Chinese Academy of Medical Sciences, Peking University and University of Oxford, with emphasis on the construction progress of genetic resources and the recent published genetic studies, in order to provide reference for the in-depth mining and utilization of genetic resources in large population cohort in China.
China Kadoorie Biobank;genetic resources; biobank; large population cohort
2021-07-19;
2021-09-07
國家重點研發(fā)計劃項目(編號2020YFC2003401)資助[Supported by the National Key R&D Program of China (No. 2020YFC2003401)]
王文秀,在讀碩士研究生,專業(yè)方向:流行病與衛(wèi)生統(tǒng)計學(xué)。E-mail: wwenxiu1996@126.com
黃濤,博士,研究員,研究方向:慢性病流行病學(xué)。E-mail: huang.tao@pku.edu.cn
10.16288/j.yczz.21-257
2021/9/14 16:26:34
URI: https://kns.cnki.net/kcms/detail/11.1913.R.20210914.1433.002.html
(責(zé)任編委: 方向東)