王智輝,鐘媚共,陳秋旋,孟子杰,伍婉婷,鄭焱,張鑫
乳腺癌是最常見的女性惡性腫瘤,近四十年間,全球乳腺癌發(fā)病率保持上升趨勢,嚴重威脅著女性健康[1-2]。乳腺癌是生物學高度異質的惡性腫瘤,臨床最為常見且惡性程度較高的是浸潤性乳腺癌,根據組織形態(tài)進一步分為浸潤性導管癌(invasive ductal carcinoma,IDC)和浸潤性小葉癌(invasive lobular carcinoma,ILC)等,并以IDC為臨床的主要病理類型[3]。然而,同樣的病理類型在臨床生物學特征及治療反應性上常常截然不同,這是因為特征基因的突變與異常表達往往更能反映乳腺癌的治療反應及患者預后[4],隨著高通量基因檢測技術的成熟應用,乳腺癌基因特征與臨床特征的關系逐漸清晰,由此建立病理基因分型逐步被臨床所接受并廣泛應用。
乳腺癌基因分型的方法有多種,主要通過基因的表達譜算法和免疫組織化學判讀等,雖然不同的分型方法在具體樣品的判斷中存在差異,但群體的分類重復性上基本相似[5]。臨床上公認的四個基因亞型為管腔A型(Luminal A,LumA)、管腔B型(Luminal B,LumB)、人表皮生長因子受體2過表達型(HER2 overexpression,Her2)和基底細胞樣型(Basal-like,BasL),其中BasL型基本等同于免疫組織化學分型中的三陰乳腺癌(triple negative breast carcinoma,TNBC)[6]?,F(xiàn)已知Her2型乳腺癌的特征是人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)的過表達及下游通路的持續(xù)激活,而其編碼基因ERBB2(erb-B2 receptor tyrosine kinase 2)的擴增是HER2蛋白過表達的主要原因[4],迄今未見系統(tǒng)性報道其余三個基因亞型的基因組拷貝數變異(copy number variations,CNV)特征,因此,本課題組通過全基因組CNV分析,在癌癥基因組圖譜數據庫(The Cancer Genome Atlas,TCGA,https://gdc-portal.nci.nih.gov/)中挖掘出與基因分型相關的CNV并加以驗證。
下載TCGA中乳腺癌的表達譜測序數據、基因組拷貝信息及對應樣品的臨床信息,數據庫的更新下載日期為2020年1月31日。參考本課題組已發(fā)表文獻[5],在R語言(版本3.2.2)程序平臺上,使用AIMS程序包(版本1.2.0)對每個樣品的表達譜進行基因分型,納入LumA、LumB、Her2和BasL四個基因亞型及臨床信息詳細的1 006例乳腺癌病例。參考本課題組已發(fā)表文獻[7],利用GISTIC 2.0軟件分析腫瘤組織的全基因組拷貝信息,運行所得的關鍵數據有:(1)每個探針標記位點的擴增或缺失情況,即G評分(G-score)。G評分的高低能綜合反映該位點的擴增或缺失的深度和頻率;(2)每個樣品中單個基因的拷貝數變異情況,包括深度缺失(Deep deletion)、淺度缺失(Shallow deletion)、二倍體(Diploid)、第三拷貝獲得(Gain)和顯著擴增(Amplification)五個狀況;其中在分析缺失中,將深度缺失及淺度缺失均納入為缺失,而在擴增分析中,僅將顯著擴增定義為擴增,并在R4.0.2軟件中對各基因在不同基因亞型的拷貝數分布進行卡方檢驗(Chi-square test函數),并采用Benjamin-Hochberg方法(p.adjust函數)進行P值校正,得到Q值。
收集整理2017年1月—2019年12月在江門市中心醫(yī)院就診的浸潤性乳腺癌324例,均為原發(fā)灶的手術或活檢檢查后的剩余標本,取樣前均未行任何新輔助治療,保存在該院臨床生物資源庫中。TCGA與江門市中心醫(yī)院乳腺癌患者的一般信息見表1,兩組樣品在性別、年齡、病理類型、臨床分期和基因分型的分布差異均無統(tǒng)計學意義(均P>0.05)。本研究為回顧性研究,已申請并獲批免患者知情同意,且整個項目經江門市中心醫(yī)院倫理委員會審查并批準(2020-51號)。
表1 TCGA及江門市中心醫(yī)院浸潤性乳腺癌患者的基本信息Table 1 General information of invasive breast carcinoma patients in TCGA and Jiangmen Central Hospital
參考本課題組已發(fā)表文獻[7],調取石蠟組織切片,利用GeneRead DNA FFPE Kit按操作說明書提取石蠟切片的DNA;利用Taq-Man Copy Number Assay的熒光定量PCR引物Hs00450668_cn檢測ERBB2基因拷貝數,引物Hs03853983_cn檢測TFDP1基因拷貝數,引物Hs06966674_cn檢測MIR148B基因拷貝數,引物Hs01978234_cn檢測CCND1基因拷貝數,引物Hs00738157_cn檢測MDM2基因拷貝數,引物Hs06266734_cn檢測MIR139基因拷貝數,其中內參引物為TaqMan Copy Number Reference Assay RNase P,二倍體參考樣品為健康人血漿白膜層樣品,擴增試劑盒為TaqMan Fast Advanced Master Mix,按說明書在CFX96熒光定量PCR儀中檢測。規(guī)定樣品中目標基因的相對拷貝數檢測值小于0.75為缺失(Deletion),大于1.9為顯著擴增(Amplification)。
計數資料用頻數表示,用R4.0.2、Excel 2016及GraphPad Prism7.0軟件處理數據,各組間頻數數據統(tǒng)計使用卡方檢驗(Chi-squared test)或Fisher’s精確檢驗(Fisher’s exact test),檢驗水準α=0.05,組間頻數的兩兩比較使用rcompanion程序包的pairwiseNominalIndependence函數,并采用函數內默認的Benjamin-Hochberg方法進行P值校正,得到Q值。
除BasL型外,另外3種亞型乳腺癌的擴增峰較為聚集,且熱點擴增峰的G評分較高,可達0.8以上。以軟件默認的FDR<0.25為顯著性擴增的閾值,可發(fā)現(xiàn)BasL型的特征峰有1q43和13q34,LumB型的特征峰為12q15,Her2型的特征峰為17q12;而11q13.3在Her2型、LumA型及LumB型中擴增,在BasL型中無擴增,見圖1。
相對于全基因組的擴增情況,各亞型缺失區(qū)段缺少明顯的規(guī)律,且G評分也普遍較低,在0.2左右。6q15在Her2型、LumA型及LumB型中缺失,11q13.4特異性在LumB型中缺失,12q13.13特異性在BasL型中缺失,21q21.1在Her2型和LumB型中缺失,見圖2。
圖1 TCGA中各亞型的擴增區(qū)段分析Figure 1 Amplified chromosome regions of each subtype from TCGA
圖2 TCGA中各亞型的缺失區(qū)段分析Figure 2 Deleted chromosome regions of each subtype from TCGA
利用IGV軟件并結合相關文獻報道(見討論部分),確定各區(qū)段的擴增或缺失關鍵基因:1q43為絲氨酸/蘇氨酸蛋白激酶Akt-3(AKT serine/threonine kinase 3,Akt3)、11q13.3為細胞周期蛋白D1(Cyclin D1,CCND1)、12q15為原癌基因MDM2(MDM2 proto-oncogene,MDM2)、13q34為轉錄因子Dp-1(transcription factor Dp-1,TFDP1)、17q12為Erb-B2受體酪氨酸激酶2(Erb-B2 receptor tyrosine kinase 2,ERBB2)、6q15為絲裂原活化蛋白激酶7(mitogen-activated protein kinase kinase kinase 7,MAP3K7)、11q13.4為微小RNA-139(microRNA 139,MIR139)、12q13.13為微小RNA-148B(microRNA 148B,MIR148B)及21q21.1為微小RNA Let-7c(microRNA Let-7c,MIRLET7C)。上述熱點基因的CNV在四種亞型的分布差異均有統(tǒng)計學意義(均P<0.05),其中,在BasL型中,TFDP1(13q34)的擴增和MIR148B(12q13.13)的缺失占比高;在Her2型中,ERBB2(17q12)的擴增是最顯著的特征;LumB型中,CCND1(11q13.3)和MDM2(12q15)的擴增及MIR139(11q13.4)的缺失占比高;而未見LumA型的特異性CNV熱點基因,見表2。
將ERBB2的擴增定義為陽性事件,比較發(fā)現(xiàn),在TCGA中Her2型陽性事件發(fā)生率為55.2%,BasL型和LumA型的陽性率均低于或等于4.4%,而LumB型較高,可達16.8%;在江門市中心醫(yī)院樣品中,Her2型陽性事件發(fā)生率為86.7%,BasL型和LumA型的陽性率均為0,而LumB型為2.0%,組間分布差異均有統(tǒng)計學意義(均P<0.05),見表3。
表2 TCGA中各拷貝數變異熱點基因在各亞型間的分布Table 2 Distribution of CNV hotspot genes among subtypes from TCGA
表3 ERBB2的拷貝數變異在各基因亞型間的分布Table 3 Distribution of CNV of ERBB2 among gene subtypes
將TFDP1的擴增或MIR148B的缺失定義為陽性事件,分析發(fā)現(xiàn)57.8%的BasL型發(fā)生了TFDP1的擴增或MIR148B的缺失,而其他亞型的陽性事件發(fā)生率均低于或等于15.2%,分布差異均有統(tǒng)計學意義(均P<0.05)。江門市中心醫(yī)院樣品中71.4%的BasL型發(fā)生了TFDP1的擴增或MIR148B的缺失,而其他亞型的陽性事件發(fā)生率均低于或等于19.5%,組間分布均差異有統(tǒng)計學意義(均P<0.05),見表4。
表4 TFDP1/MIR148B的拷貝數變異在各基因亞型間的分布Table 4 Distribution of CNV of TFDP1/MIR148B among gene subtypes
將CCND1或MDM2的擴增或MIR139的缺失定義為陽性事件,分析發(fā)現(xiàn),47.6%的LumB型發(fā)生了CCND1或MDM2的擴增或MIR139的缺失,而其他亞型的陽性事件發(fā)生率均低于35%,分布差異均有統(tǒng)計學意義(P<0.05)。江門市中心醫(yī)院樣品中61.8%的LumB型發(fā)生了CCND1或MDM2的擴增或MIR139的缺失,而其他亞型乳腺癌的陽性事件發(fā)生率均低于或等于20.0%,組間分布差異有統(tǒng)計學意義(P<0.05),見表5。
表5 CCND1/MDM2/MIR139的拷貝數變異在各基因亞型間的分布Table 5 Distribution of CNV of CCND1/MDM2/MIR139 among gene subtypes
本研究首先利用AIMS分型軟件,將TCGA數據庫中的乳腺癌患者按表達譜進行基因分型,再利用GISTIC2.0軟件分別對BasL型、Her2型、LumA型和LumB型患者的腫瘤組織進行全基因組CNV分析,發(fā)現(xiàn):(1)相對于其他三種亞型,BasL型的擴增峰較為雜亂,表明BasL型乳腺癌的發(fā)生過程中維持基因組穩(wěn)定及參與修復的功能受損,這與BasL型有高頻率的腫瘤相關蛋白53(tumor protein 53,TP53)和乳腺癌易感基因1(breast cancer 1,BRCA1)突變相一致[4];(2)相對于全基因組的擴增情況,各亞型缺失區(qū)段缺少明顯的規(guī)律,且具體缺失區(qū)段的程度和頻率均較低,表明在各亞型中抑癌基因的功能失活只有小部分與缺失相關,這與同行的研究[8]結論相似;(3)BasL型中有高比例的13q34擴增和12q13.13缺失,Her2型有高比例的17q12擴增,LumB型的特征為高比例的12q15擴增和11q13.4缺失,而LumA型則無特異性擴增或缺失的染色體區(qū)段,這部分發(fā)現(xiàn)值得進一步討論。
位于17q12區(qū)段的關鍵癌基因ERBB2的擴增是Her2型乳腺癌的重要分子特征,江門市中心醫(yī)院樣品結果顯示,ERBB2(17q12)在Her2型乳腺癌中顯著擴增,雖然與其他亞型間的分布比例有顯著性差異,但無法做到100%的區(qū)分,其原因主要是:(1)相對于臨床常用的免疫組織化學及熒光原位雜交法[9],本研究采用的qPCR法和TCGA的高通量分析均無法完全排除腫瘤組織中的原位癌、壞死及間質成分;(2)各種方法中,對于臨界值的爭議依然存在,無法完全做到客觀分析。不過,相比于TCGA,江門市中心醫(yī)院樣品的驗證過程中,盡可能采用顯微切割的方法,剔除了大部分非目標區(qū)域組織,其臨床一致性較高,可以作為TCGA分析結果的驗證支持數據。
隨后,用TFDP1(13q34)的擴增或MIR148B(12q13.13)的缺失定義為BasL型乳腺癌的特征分子事件,通過對TCGA的分析及江門市中心醫(yī)院樣品的驗證,可知該事件在BasL型的陽性率比其他各亞型高3.6~7.3倍,且差異具統(tǒng)計學意義,表明BasL型乳腺癌中有高比例的TFDP1/MIR148B拷貝數變異。已有研究報道,BasL型乳腺癌或TNBC存在較高比例的13q34區(qū)段擴增[10],且該區(qū)段的擴增能導致TFDP1蛋白水平的上調,而TFDP1為細胞周期啟動的關鍵轉錄因子家族E2Fs的共激活因子,體外實驗證明,沉默TFDP1能有效抑制生長因子驅動的乳腺癌細胞增殖[11],這表明TFDP1很可能參與了BasL型乳腺癌的惡性生物學行為,是潛在的特異性靶點。同樣,值得我們注意的是,有報道指出miR-148b具有抑制多種惡性腫瘤的轉移能力,過表達miR-148b能抑制乳腺癌細胞浸潤破壞血管內皮層,抑制乳腺癌等多種惡性腫瘤的體內轉移[12-13],這提示MIR148B的缺失可能與BasL型乳腺癌部分患者的高轉移臨床表型相關,值得進一步挖掘其臨床轉化價值。
在四個分子分型中,LumA型和LumB型的區(qū)分標準還存在一定的爭議,我們利用全基因組CNV分型也未能發(fā)現(xiàn)LumA型中較典型的擴增或缺失峰,只觀察到CCND1(11q13.3)和MDM2(12q15)的擴增及MIR139(11q13.4)的缺失在LumB型中的比例更高,其中,TCGA的LumA型和LumB型發(fā)生CCND1/MDM2/MIR139拷貝數變異情況的比例分別是25%和48%,江門市中心醫(yī)院樣品的比例分別是14%和62%,差異均有統(tǒng)計學意義。雖然未見MIR139在乳腺癌組織中缺失的報道,但已有大量文獻報道,CCND1和MDM2在LumB型乳腺癌中的顯著擴增,其中CCND1的擴增是細胞周期素依賴性激酶4/6(cyclin-dependent kinase 4/6,CDK4/6)抑制劑帕博西尼(Palbociclib)的伴隨診斷用藥指標[14],而MDM2的擴增能通過抑制p53蛋白的功能促進乳腺癌化療抵抗,是潛在的治療靶點[15]。雖然本研究挖掘到了較新穎的乳腺癌分子分型標志物,但具體的臨床價值還需要進一步加以驗證。