王 斌,許春偉
(1.唐縣人民醫(yī)院病理科,河北唐縣 723502;2.中國人民解放軍北京軍區(qū)總醫(yī)院病理科)
乳腺癌、甲狀腺癌和黑色素瘤全基因組關聯(lián)分析計量和熱點研究
王 斌1,許春偉2△
(1.唐縣人民醫(yī)院病理科,河北唐縣 723502;2.中國人民解放軍北京軍區(qū)總醫(yī)院病理科)
全基因組關聯(lián)研究;GWAS;文獻研究
全基因組關聯(lián)研究(GWAS)是利用高通量基因芯片技術,對人類全基因組范圍內(nèi)常見遺傳變異-單核苷酸多態(tài)性(SNP)和拷貝數(shù)變異(CNV)進行總體關聯(lián)分析的研究方法[1]。國際人類基因組測序和單體型圖譜工程的完成,以及經(jīng)濟高效的高通量基因分型技術的開展,使全基因組范圍內(nèi)篩檢與疾病相關的序列變異成為可能,通過比較全基因組范圍內(nèi)所有變異的等位基因頻率,從中發(fā)現(xiàn)與疾病相關聯(lián)的序列變異[2-3]。2007年,Duggan等[4]和Murabito等[5]利用Illumina及Affymetrix的基因芯片對前列腺癌進行了GWAS,此后,越來越多腫瘤方面的GWAS研究結果陸續(xù)發(fā)表。本研究使用最新的GWAS數(shù)據(jù)庫之一—NHGRI,分析挖掘乳腺癌、甲狀腺癌和黑色素瘤文獻特征數(shù)據(jù),以期為國內(nèi)甲狀腺、乳腺及皮膚腫瘤GWAS提供參考。
研究資料來源于NHGRI。登入頁面http://www.genome. gov/page.cfm?pageid=26525384#searchForm,在頁面下Disease/ Trait一欄中輸入“Breast cancer”,點擊Search后再點擊“Download Spreadsheet of Search Result”保存“MyGWASSearch. xls”,并改名為“Breast cancer.xls”,并用同樣的步驟獲得“Thyroid cancer.xls”和“Melanoma.xls”。
2.1 文獻基本特征 數(shù)據(jù)庫原記錄包含34篇論文[6-38](乳腺癌24篇、甲狀腺癌2篇、黑色瘤7篇),涉及114個SNP(乳腺癌88個,甲狀腺癌5個,黑色素瘤21個)。論文分別發(fā)表在Nat Genet(IF:35.209/2012)14篇,Nature(IF:38.597/2012)1篇,Breast Cancer Res (IF:5.872/2012)2篇,Breast Cancer Res Treat (IF:4.469/ 2012)2篇,Hum Genet(IF:4.633/2012)4篇,Hum Mol Genet(IF:7.692/ 2012)3篇,J Hum Genet(IF:2.365/2012)1篇,J Natl Cancer Inst(IF:14.336/2012)1篇,PLoS Genet (IF:8.517/2012)3篇,PLoS One(IF:3.73/2012)1篇,Proc Natl Acad Sci U S A(IF:9.737/2012)1篇。
2.2 第一(篩選)階段樣本量 34篇乳腺、甲狀腺及皮膚腫瘤GWAS研究文獻第一階段病例組樣本量30-27758例不等,對照組例數(shù)30-37196例。按病例數(shù)/對照數(shù)的研究文獻分布見圖1。5.88%文獻沒有明確報告對照組樣本量。
圖1 乳腺、甲狀腺及皮膚腫瘤GWAS文獻第一階樣本量分布
2.3 第二(驗證)階段樣本量 第二階段病例組樣本量203-26646例,沒有報告第二階段病例數(shù)據(jù)的文獻占11.76%;對照組例數(shù)263-55667例,2.94%的文獻沒有報告對照組樣本量。按病例數(shù)/對照數(shù)的研究文獻分布見圖2。
圖2 乳腺、甲狀腺及皮膚腫瘤GWAS文獻第二階段樣本量分布
2.4 染色體區(qū)域相關SNP(NCBI rs登記號) 所定位的染色體區(qū)域分布大致與染色體長度近似,其中10號和16號染色體明顯多于鄰近的染色體(圖3)。
圖3 乳腺、甲狀腺及皮膚腫瘤GWAS文獻中有明確rs(NCBI)登記號SNP所在染色體區(qū)域
2.5 對照組相關風險等位基因頻率 對照組中與最強SNP相關風險等位基因頻率在乳腺、甲狀腺及皮膚腫瘤GWAS文獻中的分布,未發(fā)現(xiàn)稀有變異(即在對照人群中的發(fā)生頻率<1%)的乳腺、甲狀腺及皮膚腫瘤GWAS文獻(圖4)。
圖4 對照組中與最強SNP相關風險等位基因頻率在乳腺、甲狀腺及皮膚腫瘤GWAS文獻中的分布
2.6 P值文獻中最強SNP 相關風險等位基因P值選擇<1× 10-6為錄入標準,最小P值2×10-76。P值分布見圖5:
圖5 P值分布
2.7 優(yōu)勢比(OR)或β相關系數(shù) 文獻中最強SNP相關風險等位基因優(yōu)勢比(或β相關系數(shù))為1.04-8.40(圖6)。
圖6 最強SNP相關風險等位基因優(yōu)勢比(或β相關系數(shù))分布
2.8 實驗平臺及檢測SNP數(shù)量 超過一半(64.70%)的乳腺、甲狀腺及皮膚腫瘤GWAS獨立使用了Illumina研究平臺,近三分之一(32.35%)使用Affimetrix芯片系統(tǒng),2.94%使用Perlegen芯片系統(tǒng)。檢測SNP數(shù)量70897-5480804個,14.71%的研究用試驗平臺的SNP數(shù)量在100萬-1000萬之間(圖7-8)。
圖7 乳腺、甲狀腺及皮膚腫瘤GWAS文獻實驗的試驗平臺分布
圖8 乳腺、甲狀腺及皮膚腫瘤GWAS文獻使用的試驗平臺檢測SNP數(shù)量
3.1 概述 目前,乳腺、甲狀腺及皮膚腫瘤GWAS方面的報道主要在甲狀腺癌、乳腺癌和黑色素瘤領域。乳腺癌GWAS方面,Easton等[26]研究發(fā)現(xiàn),10q26.1區(qū)域(FGFR2基因)rs2981582、16q12.1區(qū)域(TNRC9/LOC643714基因)rs3803662、5q11.2區(qū)域(MAP3K1基因)rs889312、11p15.5區(qū)域(LSP1基因)rs3817198、5q11.2(基因間隔區(qū))rs13281615和5p12(基因間隔區(qū))rs981782位點多態(tài)性與乳腺癌易感性相關聯(lián);Fletcher等[18]研究發(fā)現(xiàn),9q31.2區(qū)域(KLF4/RAD23B/ ACTL7A基因)rs865686位點多態(tài)性與乳腺癌易感性相關,并驗證了Easton等基因多態(tài)性位點。甲狀腺癌GWAS方面,Gudmundsson等[7]研究發(fā)現(xiàn),9q22.3區(qū)域(FOXE1基因)rs965513和14q13.3區(qū)域(NKX2-1基因)rs944289位點多態(tài)性與低濃度的甲狀腺激素(TSH)顯著相關,其中rs965513與低濃度的甲狀腺素(T4)和高濃度的甲狀腺(T3)相關;三年后,Gudmundsson等又報道了2q35區(qū)域(DIRC3基因)rs966423、8p12區(qū)域(NRG1基因)rs2439302和14q13區(qū)域(MBIP基因)rs116909374位點多態(tài)性與甲狀腺癌相關。黑色素瘤GWAS方面,Brown等[38]研究發(fā)現(xiàn)20q11.2區(qū)域(CDC91L1基因)rs910873位點多態(tài)性與黑色素瘤相關;隨后,Barrett等報道了2q33區(qū)域(CASP8基因)rs13016963、11q22.3區(qū)域(ATM基因)rs1801516、21q22.3區(qū)域(MX2基因)rs45430、5p15.3區(qū)域(TERT/CLPTM1L基因)rs401681、5p13.2區(qū)域(SLC45A2基因)rs35390、9p21區(qū)域(CDKN2A/MTAP基因)rs7023329、11q14.3區(qū)域(TYR基因)rs1393350、16q24區(qū)域(MC1R基因)rs258322、6q23.2區(qū)域(ASIP基因)rs2284378和22q13.1區(qū)域(PLA2G6基因)rs6001027位點多態(tài)性與黑色素瘤相關。
3.2 NHGRI數(shù)據(jù)庫分析 通過對NHGRI數(shù)據(jù)庫中乳腺、甲狀腺及皮膚腫瘤中八項數(shù)據(jù)進行不完全統(tǒng)計發(fā)現(xiàn),乳腺、甲狀腺及皮膚腫瘤有如下特點:⑴在文獻基本特征方面:乳腺、甲狀腺及皮膚腫瘤在Nat Genet發(fā)表的文獻最多,占41.18%,其次是Hum Genet(11.76%)和Hum Mol Genet、PLoS Genet(8.82%),再次是Breast Cancer Res Treat(5.88%)。因此推測,Nat Genet以其影響力將是優(yōu)質乳腺、甲狀腺及皮膚腫瘤GWAS的主要陣地。⑵甲狀腺、乳腺及皮膚腫瘤GWAS第一、二階段的病例組樣本量,一般從幾百例到幾萬例不等,且以千例為主,最大樣本量均不超過30000例;對照組樣本量也從幾百例到幾萬例不等,但以千例以上為主,最大樣本量均超過60000例。⑶染色體區(qū)域相關SNP方面:以10號和16號染色體區(qū)域SNP居多,其中10號染色體區(qū)域SNP在消化系統(tǒng)腫瘤中也占一定數(shù)量,16號染色體區(qū)域SNP在其它腫瘤中比較少見。⑷對照組相關風險等位基因頻率方面:乳腺、甲狀腺及皮膚腫瘤GWAS中風險等位基因以Risk Allele Frequency=0.40左右最多,其次是Risk Allele Frequency=0.30,但未發(fā)現(xiàn)稀有變異。⑸P值文獻中最強SNP方面:乳腺、甲狀腺及皮膚腫瘤P值以10-6和10-10為主,其中最強P值2×10-76,是目前為止所有腫瘤GWAS中P值最高的。⑹優(yōu)勢比(OR)或β相關系數(shù)方面:乳腺、甲狀腺及皮膚腫瘤OR以1.00左右的弱相關占多數(shù),2.00以上的強相關所占比例較少。⑺實驗平臺及檢測SNP數(shù)量方面:乳腺、甲狀腺及皮膚腫瘤實驗平臺方面Illumina研究平臺占大多數(shù),其次是Affymetrix芯片系統(tǒng)和Perlegen研究平臺,未見Invader研究平臺的報道。檢測SNP數(shù)量從70897個到5480804個,近1/6試驗平臺的SNP數(shù)量在100萬-1000萬之間。
綜上所述,腫瘤方面GWAS的最終目標是應用于臨床,主要體現(xiàn)在對正常人群進行腫瘤的危險度預測評估和指導腫瘤的個體化治療。個體化治療推崇在腫瘤遺傳譜指導下的個體化醫(yī)學,為腫瘤發(fā)生和治療療效提供早期預測,以促進腫瘤的預防和治療。乳腺、甲狀腺及皮膚腫瘤GWAS經(jīng)過7年的發(fā)展,已在乳腺癌、甲狀腺癌和黑色素瘤遺傳易感性研究方面取得了很大成功,為個體化治療打下了基礎。本文通過運用文獻計量學方法客觀分析了NHGRI的文獻基本特征、第一、二階段樣本量、染色體區(qū)域相關SNP、對照組相關風險等位基因頻率、P值文獻中最強SNP、優(yōu)勢比(OR)或β相關系數(shù)和實驗平臺及檢測SNP數(shù)量八項數(shù)據(jù),找到了乳腺、甲狀腺及皮膚腫瘤GWAS的一些共性特征,可為乳腺、甲狀腺及皮膚腫瘤GWAS的研究現(xiàn)狀和發(fā)展趨勢奠定基礎,并可為國內(nèi)乳腺、甲狀腺及皮膚腫瘤GWAS提供參考。
[1]張學軍.全基因組關聯(lián)分析對銀屑病遺傳學研究的啟示[J].浙江大學學報(醫(yī)學版),2009,38(4):333-337.
[2]嚴衛(wèi)麗.復雜疾病全基因組關聯(lián)研究進展—研究設計和遺傳標記[J].遺傳,2008,30(4):400-406.
[3]嚴衛(wèi)麗.復雜疾病全基因組關聯(lián)研究進展—遺傳統(tǒng)計分析[J].遺傳,2008,30(5):543-549.
[4]Duggan D, Zheng SL, Knowlton M, et al. Two genome-wide association studies of aggressive prostate cancer implicate putative prostate tumor suppressor gene DAB2IP[J]. J Natl Cancer Inst,2007, 99(24): 1836-1844.
[5]Murabito JM, Rosenberg CL, Finger D, et al. A genome-wide association study of breast and prostate cancer in the NHLBI’s Framingham Heart Study[J]. BMC Med Genet, 2007, 8 Suppl 1:S6.
[6]Gudmundsson J, Sulem P, Gudbjartsson DF, et al. Discovery of common variants associated with low TSH levels and thyroid cancer risk[J]. Nat Genet, 2012,44(3): 319-322.
[7]Gudmundsson J, Sulem P, Gudbjartsson DF, et al. Common variants on 9q22.33 and 14q13.3 predispose to thyroid cancer in European populations[J]. Nat Genet, 2009, 41(4): 460-464.
[8]Kim HC, Lee JY, Sung H, et al. A genome-wide association study identif ies a breast cancer risk variant in ERBB4 at 2q34: results from the Seoul Breast Cancer Study[J]. Breast Cancer Res, 2012,14(2): R56.
[9]Li J, Humphreys K, Darabi H, et al. A genome-wide association scan on estrogen receptor-negative breast cancer[J]. Breast Cancer Res, 2010, 12(6): R93.
[10]Li J, Humphreys K, Heikkinen T, et al. A combined analysis of genome-wide association studies in breast cancer[J]. Breast Cancer Res Treat, 2011, 126(3): 717-727.
[11]Kibriya MG, Jasmine F, Argos M, et al. A pilot genome-wide association study of early-onset breast cancer[J]. Breast Cancer Res Treat, 2009, 114(3): 463-477.
[12]Rinella ES, Shao Y, Yackowski L, et al. Genetic variants associated with breast cancer risk for Ashkenazi Jewish women with strong family histories but no identifiable BRCA1/2 mutation[J]. Hum Genet, 2013, 132(5): 523-536.
[13]Chen F, Chen GK, Stram DO, et al. A genome-wide association study of breast cancer in women of African ancestry[J]. Hum Genet, 2013, 132(1): 39-48.
[14]Sehrawat B, Sridharan M, Ghosh S, et al. Potential novelcandidate polymorphisms identif ied in genome-wide association study for breast cancer susceptibility[J]. Hum Genet, 2011,130(4): 529-537.
[15]Siddiq A, Couch FJ, Chen GK, et al. A meta-analysis of genomewide association studies of breast cancer identifies two novel susceptibility loci at 6q14 and 20q11[J]. Hum Mol Genet, 2012,21(24): 5373-5384.
[16]Cai Q, Long J, Lu W, et al. Genome-wide association study identif ies breast cancer risk variant at 10q21.2: results from the Asia Breast Cancer Consortium[J]. Hum Mol Genet, 2011,20(24): 4991-4999.
[17]Elgazzar S, Zembutsu H, Takahashi A, et al. A genome-wide association study identif ies a genetic variant in the SIAH2 locus associated with hormonal receptor-positive breast cancer in Japanese[J]. J Hum Genet, 2012, 57(12): 766-771.
[18]Fletcher O, Johnson N, Orr N, et al. Novel breast cancer susceptibility locus at 9q31.2: results of a genome-wide association study[J]. J Natl Cancer Inst, 2011, 103(5): 425-435.
[19]Haiman CA, Chen GK, Vachon CM, et al. A common variant at the TERT-CLPTM1L locus is associated with estrogen receptornegative breast cancer[J]. Nat Genet, 2011, 43(12): 1210-1214.
[20]Antoniou AC, Wang X, Fredericksen ZS, et al. A locus on 19p13 modif ies risk of breast cancer in BRCA1 mutation carriers and is associated with hormone receptor-negative breast cancer in the general population[J]. Nat Genet, 2010, 42(10): 885-892.
[21]Turnbull C, Ahmed S, Morrison J, et al. Genome-wide association study identif ies f ive new breast cancer susceptibility loci[J]. Nat Genet, 2010, 42(6): 504-507.
[22]Thomas G, Jacobs KB, Kraft P, et al. A multistage genome-wide association study in breast cancer identif ies two new risk alleles at 1p11.2 and 14q24.1 (RAD51L1)[J]. Nat Genet, 2009, 41(5):579-584.
[23]Zheng W, Long J, Gao YT, et al. Genome-wide association study identif ies a new breast cancer susceptibility locus at 6q25.1[J]. Nat Genet, 2009, 41(3): 324-328.
[24]Hunter DJ, Kraft P, Jacobs KB, et al. A genome-wide association study identif ies alleles in FGFR2 associated with risk of sporadic postmenopausal breast cancer[J]. Nat Genet, 2007, 39(7):870-874.
[25]Stacey SN, Manolescu A, Sulem P, et al. Common variants on chromosomes 2q35 and 16q12 confer susceptibility to estrogen receptor-positive breast cancer[J]. Nat Genet, 2007, 39(7):865-869.
[26]Easton DF, Pooley KA, Dunning AM, et al. Genome-wide association study identifies novel breast cancer susceptibility loci[J]. Nature, 2007, 447(7148): 1087-1093.
[27]Long J, Cai Q, Sung H, et al. Genome-wide association study in east Asians identif ies novel susceptibility loci for breast cancer[J]. PLoS Genet, 2012, 8(2): e1002532.
[28]Gaudet MM, Kirchhoff T, Green T, et al. Common genetic variants and modification of penetrance of BRCA2-associated breast cancer[J]. PLoS Genet, 2010, 6(10):e1001183.
[29]Long J, Cai Q, Shu XO, et al. Identif ication of a functional genetic variant at 16q12.1 for breast cancer risk: results from the Asia Breast Cancer Consortium[J]. PLoS Genet, 2010, 6(6): e1001002.
[30]Song C, Chen GK, Millikan RC, et al. A genome-wide scan for breast cancer risk haplotypes among African American women[J]. PLoS One, 2013, 8(2): e57298.
[31]Gold B, Kirchhoff T, Stefanov S, et al. Genome-wide association study provides evidence for a breast cancer risk locus at 6q22.33[J]. Proc Natl Acad Sci U S A, 2008, 105(11): 4340-4345.
[32]Teerlink C, Farnham J, Allen-Brady K, et al. A unique genomewide association analysis in extended Utah high-risk pedigrees identifies a novel melanoma risk variant on chromosome arm 10q[J]. Hum Genet, 2012, 131(1): 77-85.
[33]Amos CI, Wang LE, Lee JE, et al. Genome-wide association study identif ies novel loci predisposing to cutaneous melanoma[J]. Hum Mol Genet, 2011, 20(24): 5012-5023.
[34]Iles MM, Law MH, Stacey SN, et al. A variant in FTO shows association with melanoma risk not due to BMI[J]. Nat Genet,2013, 45(4):428-432, 432e1.
[35]Barrett JH, Iles MM, Harland M, et al. Genome-wide association study identifies three new melanoma susceptibility loci[J]. Nat Genet, 2011, 43(11): 1108-1113.
[36]Macgregor S, Montgomery GW, Liu JZ, et al. Genome-wide association study identif ies a new melanoma susceptibility locus at 1q21.3[J]. Nat Genet, 2011, 43(11): 1114-1118.
[37]Bishop DT, Demenais F, Iles MM, et al. Genome-wide association study identifi es three loci associated with melanoma risk[J]. Nat Genet, 2009, 41(8): 920-925.
[38]Brown KM, Macgregor S, Montgomery GW, et al. Common sequence variants on 20q11.22 confer melanoma susceptibility[J]. Nat Genet, 2008, 40(7): 838-840.
R73
C
1004-6879(2015)03-0267-04
2014-06-23)