魏竹馨 文玲 王希明
乳腺癌是我國女性中最常見的癌癥,占女性癌癥發(fā)病率的17.10%[1]。乳腺癌異質(zhì)性高,為了更好地解釋乳腺癌的異質(zhì)性,全基因組表達譜分析技術(shù)開始應(yīng)用于臨床,該類技術(shù)可對乳腺癌進行分子分型,從而更準確地預(yù)測乳腺癌的復(fù)發(fā)轉(zhuǎn)移風(fēng)險及治療效果。但是,有創(chuàng)的基因表達譜分析獲得的病理組織進行分子表征僅能提供腫瘤的局部信息,其結(jié)果的準確性及代表性受到限制[2-3]。影像基因組學(xué)的應(yīng)用克服了上述局限性,具有廣闊的發(fā)展空間。影像基因組學(xué)一方面通過無創(chuàng)的方式反映腫瘤整體的異質(zhì)性,有助于提高我們對腫瘤生物學(xué)的認識,建立腫瘤基因型和影像學(xué)表型之間的聯(lián)系;另一方面,影像基因組學(xué)的定量或定性生物學(xué)成像標志物可為病人的個性化治療提供必要的信息,從而達到優(yōu)化臨床決策和改善病人預(yù)后的目的[4-5]。本文系統(tǒng)闡述影像基因組學(xué)在乳腺癌中的研究進展。
影像基因組學(xué)主要用來研究醫(yī)學(xué)成像影像表型和腫瘤基因組之間的關(guān)系。Lambin 等[6]在2012 年正式提出了影像組學(xué)的概念,即采用自動化、高通量的特征提取方法,將醫(yī)學(xué)影像轉(zhuǎn)化為大量的特征信息,深入挖掘圖像的生物學(xué)本質(zhì)并提供臨床決策支持。影像組學(xué)的工作流程包括以下幾個步驟[7]:①圖像收集,類似于臨床試驗中的“病例入組”。乳腺癌檢查涉及多模態(tài)成像,包括乳腺X 線攝影、超聲、MRI 和正電子發(fā)射體層成像(PET)/CT 等,因此存在多種圖像收集途徑;②圖像分割,包括人工手動分割、半自動分割和全自動分割;③圖像特征提取與鑒定,即通過提取高維特征數(shù)據(jù)來定量描述興趣區(qū)(ROI)的屬性[8],為影像組學(xué)的核心部分;④特征的選擇及模型的建立;⑤臨床應(yīng)用,影像組學(xué)應(yīng)用最多的領(lǐng)域包括腫瘤分類、腫瘤分期和預(yù)后預(yù)測。
2.1 乳腺癌影像數(shù)據(jù)獲取
2.1.1 MRI 與乳腺X 線攝影和乳腺超聲成像相比,乳腺MRI 能更準確地測量腫瘤大小,有助于發(fā)現(xiàn)乳腺癌周圍轉(zhuǎn)移灶、多中心癌灶及對側(cè)乳腺病變。2012 年,Yamamoto 等[9]發(fā)表了第一份乳腺影像基因組MRI 研究報告,該研究表明26 種顯像表型中有21 種影像特征與71%的基因存在全基因組范圍內(nèi)的關(guān)聯(lián),同時發(fā)現(xiàn)異質(zhì)性增強模式與干擾素型乳腺癌(預(yù)后與luminal B 相似)顯著相關(guān),并且通過基因富集分析確定了11 個與預(yù)后相關(guān)的影像特征。乳腺動態(tài)增強MRI(DCE-MRI)因軟組織分辨力高和能夠準確反映血流動力學(xué)信息而被廣泛應(yīng)用。DCE-MRI 的特征已被證明是與基因組學(xué)相關(guān)的最常見影像特征。MRI 還可以通過擴散加權(quán)成像(DWI)來評估腫瘤其他特征,提供有關(guān)腫瘤生物學(xué)和微觀結(jié)構(gòu)特征的信息。Martincich 等[10]通過研究DWI 與乳腺癌生物標志物之間的關(guān)系發(fā)現(xiàn),乳腺癌的生物學(xué)特征與表觀擴散系數(shù)(ADC)值存在顯著相關(guān)性,雌激素受體(estrogen receptor,ER)陰性腫瘤的ADC 值中位數(shù)高于ER 陽性腫瘤,并且富含人表皮生長因子受體2(human epidermal growth factor receptor 2,HER2)的腫瘤的ADC 值中位數(shù)最高,該值顯著高于Luminal A 和Luminal B/HER2 陰性的腫瘤。Kim 等[11]進一步利用ADC 直方圖的各個參數(shù)進行分析,包括ADC 的最小值(ADCmin)、第10 百分位、平均值、中位數(shù)、第90 百分位和最大值,該研究發(fā)現(xiàn)除了ADCmin之外,其他各ADC 參數(shù)都與預(yù)后因素和亞型相關(guān),HER2 陽性腫瘤ADC 值高,Ki-67指數(shù)高的腫瘤則ADC 值低。Cho 等[12]使用體素內(nèi)不相干運動(intravoxel incoherent motion,IVIM)成像的生物標志物,如組織擴散系數(shù)(Dt)、灌注分數(shù)(fp)和偽擴散系數(shù)(Dp)來描述乳腺癌的異質(zhì)性。另有研究者[13-15]聯(lián)合多參數(shù)MR 技術(shù)(包括DCE、DWI、MR 波譜分析)及血氧水平依賴(BOLD)成像進行研究,通過BOLD MRI 獲得乳腺癌微環(huán)境的乏氧信息,評估新輔助治療的效果,使其有潛力成為乳腺癌預(yù)后和治療效果的影像學(xué)生物標志物。
2.1.2 乳腺X 線攝影 乳腺癌的多模態(tài)成像還包括乳腺X 線攝影,盡管其應(yīng)用廣泛,但受二維成像和組織重疊的限制,不能對腫瘤形狀和邊緣進行詳細評估,因此乳腺X 線攝影在影像基因組學(xué)分析方面存在一定的局限性。Woodard 等[5]發(fā)現(xiàn)具有細線分支鈣化的乳腺癌復(fù)發(fā)分數(shù)較其他可疑鈣化形態(tài)的復(fù)發(fā)分數(shù)更高;而且根據(jù)乳腺實質(zhì)分類,不同類別的乳腺密度與復(fù)發(fā)分數(shù)呈負相關(guān),a 類的乳腺密度(脂肪型)的復(fù)發(fā)分數(shù)為24.4,顯著高于d 類乳腺密度(致密型)的復(fù)發(fā)分數(shù)(16.5)。Nie 等[16]發(fā)現(xiàn)范圍>2 cm 的微鈣化灶最常見于HER2 過度表達分子亞型。
2.2 圖像分割 圖像分割是指對ROI 的分割,即在影像上勾畫出ROI,從而針對這一特定區(qū)域計算出影像組學(xué)特征。由于乳腺癌的異質(zhì)性和形狀不規(guī)則,針對腫瘤的精準分割是一個巨大挑戰(zhàn)。目前,分割技術(shù)主要包括人工分割法、半自動分割法及自動分割法[14,17-20]。Agner 等[17]采用二維手動分割法人工劃定病變邊界,分別對三陰性乳腺癌與其他非三陰性病變、ER 和HER2 陽性、ER 陽性、HER2 陽性乳腺癌及乳腺纖維腺瘤進行鑒別,受試者操作特征(ROC)曲線下面積(AUC)為0.73~0.97。Ashraf 等[21]手動勾畫56 例ER 陽性乳腺癌病人的ROI,研究DCE-MRI 影像特征與復(fù)發(fā)可能性之間的相關(guān)性,結(jié)果表明ER 陽性乳腺癌DCE-MRI 影像特征與基因預(yù)測的腫瘤復(fù)發(fā)風(fēng)險中度相關(guān),ROC AUC 為0.77。自動分割法常用的分割算法有圖形切割法、活動輪廓法、區(qū)域生長法和水平集法等。Wan 等[20]則采用病灶自動分割方法,研究了DCE-MRI 影像特征與復(fù)發(fā)分數(shù)之間關(guān)系。目前,手動分割法應(yīng)用較多,其優(yōu)勢在于可對不規(guī)則的腫瘤邊界進行精細、準確地勾畫,常被用作金標準;但其受主觀因素影響較大,可重復(fù)性低,且耗時、效率低,不能用于大樣本的研究;相反,半自動或自動分割法則表現(xiàn)出較高的可重復(fù)性和時效性。自動分割法較半自動分割法能更好地排除人為因素對研究的影響,但由于完全自動分割法目前還沒有統(tǒng)一的方案及標準,難以廣泛用于研究。因此,進一步優(yōu)化ROI 分割方法將是影像組學(xué)的一個重要研究方向。
2.3 圖像特征提取 提取特征數(shù)據(jù)用于定量分析ROI 的過程是影像組學(xué)的核心步驟。圖像特征大致可分為4 類[22]:①一般形態(tài)學(xué)特征:腫瘤大小、形態(tài)、邊緣、分布、內(nèi)部強化特點等;②一階直方圖分布特征:可通過直方圖分析計算得到,包括均數(shù)、中位數(shù)、最小值、最大值、標準差、熵、偏度和峰度等一階特征[18];③二階直方圖或紋理特征:如自相關(guān)函數(shù)、灰度共生矩陣、灰度級長矩陣、灰度及帶矩陣等;④動力學(xué)特征:包括藥代動力學(xué)、增強動力學(xué)(廓清型、平臺型和持續(xù)型)[23]、紋理動力學(xué)等。圖像特征通常來自于成熟的庫,比如MaZda 庫[24]和Haralick 庫。Ahmed 等[25]使用了Haralick 庫定義的14 個紋理特征(f1~f14)預(yù)測乳腺癌病人對化療的反應(yīng),結(jié)果發(fā)現(xiàn)部分參數(shù)在化學(xué)治療完全應(yīng)答與部分應(yīng)答之間存在差異,且在對比劑注射后1~3 min 差異最明顯。計算機可不受特征數(shù)量的限制進行大樣本的分析,分析水平僅受計算能力的限制。隨著分析的復(fù)雜性和需要分析的病例數(shù)量的增加,影像基因組學(xué)領(lǐng)域已主要轉(zhuǎn)向計算機衍生的特征。
2.4 特征的選擇與建模 在提取數(shù)量龐大的高通量影像特征后,需采用特征選擇方法獲得最佳性能表現(xiàn)的特征集,輸入至機器學(xué)習(xí)算法,用于建立基于影像組學(xué)特征的預(yù)測和分類模型。特征選擇中較為常用的方法有LASSO Cox 回歸模型、最小冗余最大相關(guān)(minimum-redundancy maximum-relevancy,mRMR)、互信息法、主成分分析法等。其中,mRMR核心含義即最大化特征與分類變量之間的相關(guān)性,而最小化特征與特征之間的相關(guān)性,在保證最大相關(guān)性的同時去除冗余特征,從而達到降維的效果。隨后運用機器學(xué)習(xí)的方法對篩選出來的影像組學(xué)特征建立模型,實現(xiàn)預(yù)測腫瘤預(yù)后及轉(zhuǎn)歸的作用。在影像組學(xué)建模中,因logistic 回歸模型簡單易行,故成為最常用的監(jiān)督分類器之一;此外,常用的機器學(xué)習(xí)模型還有隨機森林、人工神經(jīng)網(wǎng)絡(luò)、支持向量機、聚類分析等[26]。Parmar 等[27]對14 種特征選擇方法和12 種分類方法的性能和預(yù)測總生存率的穩(wěn)定性進行了研究,結(jié)果發(fā)現(xiàn),mRMR(AUC=0.69,穩(wěn)定性=0.66)和互信息法(AUC=0.66,穩(wěn)定性=0.69)預(yù)測總生存率的穩(wěn)定性最好;分類器方面,隨機森林分類器(AUC=0.61)取得了較佳的預(yù)測結(jié)果。
2.5 臨床應(yīng)用
2.5.1 影像基因組學(xué) 對鑒別分子亞型的作用Perou 等[28]研究發(fā)現(xiàn),乳腺癌在基因表達水平上可以定義為4 種不同的固有亞型(Luminal A、Luminal B、HER2-enriched、三陰性)。但是,隨著研究的發(fā)展,三陰性乳腺癌逐漸被基因表達譜鑒別出來的基底細胞樣型乳腺癌替代,大部分研究使用簡化的分類[29],即Luminal A[ER 陽性和/或孕激素受體(PR)陽性,HER2 陰性]、Luminal B(ER 陽性和/或PR 陽性,HER2 陽性)、HER2-enriched(ER 陰性,PR 陰性,HER2 陽性)和基底細胞樣型(ER 陰性,PR 陰性,HER2 陰性)。盡管不同類型乳腺癌的一些主要的生物學(xué)標記如HR 和HER2 表達存在重疊,但這些亞型在隨后治療反應(yīng)和預(yù)后表現(xiàn)上不盡相同。因此,術(shù)前了解乳腺癌分子亞型,對于個體化治療(化療、內(nèi)分泌治療和HER2 靶向治療)的選擇具有重要的指導(dǎo)價值。癌癥基因組圖譜是一個公開的、可獲得的、已經(jīng)歷過正式分子分型的乳腺癌中央知識庫,它與包含相應(yīng)影像信息的癌癥影像檔案相關(guān)聯(lián)。Mazurowski 等[19]從癌癥影像檔案篩選了48 例病人提取出23 個DCE-MRI 影像特征,結(jié)果表明luminal B型乳腺癌與動態(tài)增強特征存在相關(guān)性,進一步驗證發(fā)現(xiàn)病灶強化率與背景實質(zhì)強化率比值較高者更有可能為luminal B 亞型,這可能與luminal B 亞型中成纖維細胞生長因子受體基因的擴增,促使通透性較高的新生血管形成有關(guān)。雖然基因組學(xué)分析為獲得乳腺癌分子亞型的首選方法,但費用昂貴且耗時,從而限制了可供影像基因組學(xué)分析的病人數(shù)量,因此大多數(shù)研究通常以受體狀態(tài)替代基因組學(xué)分析對分子亞型進行分類。有相關(guān)的DWI 研究[10-11]發(fā)現(xiàn),HER2-enriched 乳腺癌表現(xiàn)出最高的ADC值,而Luminal B/HER2 陰性者ADC 值最低。Youk等[30]的研究則得出不同結(jié)果,他們認為三陰性乳腺癌有更高的ADC 值,這可能由于該研究中59 例三陰性乳腺癌中有33 例(56%)表現(xiàn)為腫瘤內(nèi)壞死,而腫瘤壞死區(qū)域腫瘤細胞減少,導(dǎo)致ADC 值升高。Leithner 等[31]研究表明從DWI 中提取的影像特征,如一階直方圖、灰度共生矩陣等,可以較準確地評估乳腺癌的受體狀態(tài)和分子亞型,尤其對于luminal B 和HER2-enriched 兩種乳腺癌分子亞型的評估(準確度分別為100%和94.7%)。Grimm 等[32]研究發(fā)現(xiàn),DCE-MRI 上所顯示的腫塊形狀與基底細胞樣型癌、腫塊邊緣和HER2 型癌存在顯著相關(guān)性,更為重要的是均質(zhì)的腫塊樣和非腫塊樣的內(nèi)部強化對luminal B 分子亞型的陰性預(yù)測值較高。目前,對三陰性乳腺癌的影像基因組學(xué)研究也有較多報道。Xie 等[14]使用多參數(shù)MR 成像和全腫瘤直方圖分析鑒別三陰性乳腺癌與其他亞型乳腺癌,結(jié)果顯示,對三陰性乳腺癌和Luminal A、HER2-enriched 亞型的鑒別診斷準確度較高,AUC 分別為0.710 和0.763,但三陰性乳腺癌與Luminal B 型的單變量分析差異無統(tǒng)計學(xué)意義。Dilorenzo 等[33]探討MRI 乳腺背景實質(zhì)強化(background parenchymal enhancement,BPE)對不同乳腺癌亞型的鑒別診斷價值,結(jié)果表明輕度BPE 提示Luminal B 或HER2 陰性亞型,重度BPE 則提示三陰性乳腺癌。Wang 等[18]研究發(fā)現(xiàn),增加BPE 的定量成像特征后可明顯提高其對三陰性乳腺癌的預(yù)測能力,使預(yù)測準確度由86.9%提高到90.0%,AUC 由0.782 提高到0.883。
2.5.2 影像基因組學(xué)對療效及預(yù)后的預(yù)測價值 新輔助全身化療(neoadjuvant systemic therapy,NST)是局部和晚期乳腺癌的標準治療方法,通過化療減小腫瘤體積,可使更多的病人接受保乳手術(shù)治療,但并不是所有乳腺癌都受益于NST 治療,因為有部分生物侵襲性強的癌灶可能經(jīng)過幾個月的NST 治療后不但得不到有效控制,反而會增加腫瘤轉(zhuǎn)移的風(fēng)險。因此,在治療過程中盡早區(qū)分NST 治療獲益和對NST 治療不敏感的病人至關(guān)重要。病理完全緩解(pathologic complete remission,pCR)與病人預(yù)后良好密切相關(guān),可作為評價NST 治療效果的一項指標。Tsukada 等[13]預(yù)測在NST 完成后哪類腫瘤能達到pCR,結(jié)果顯示與pCR 相關(guān)的2 個MRI 的衍生特征為腫瘤生長方向和廓清速率,表明與Cooper 韌帶平行的腫瘤生長方向(即腫瘤前后徑長于內(nèi)外徑)和治療前多參數(shù)MRI 的快速廓清速率是pCR的預(yù)測指標。Chamming’s 等[34]利用不同的空間比例因子提取了平均像素強度、標準差、熵、偏度、峰度等特征,發(fā)現(xiàn)在非三陰性乳腺癌病人中空間比例因子為2 的峰度和預(yù)后之間的關(guān)系差異存在統(tǒng)計學(xué)意義,并且采用T2WI 和T1WI 增強峰度圖的多變量模型對三陰性乳腺癌的鑒別有較好的效果(AUC=0.834)。Nakashoji 等[35]研究三陰性乳腺癌病人發(fā)現(xiàn),臨床表現(xiàn)為進展較慢的腫瘤和乳腺X 線攝影顯示鈣化較少的腫瘤可能對化療更敏感。Parikh 等[36]通過檢測腫瘤熵(不規(guī)則性)和均勻性(灰度分布)的變化發(fā)現(xiàn),治療后腫瘤變得更加均勻,T2WI 上信號均勻性的提高和熵的降低可能比腫瘤大小變化更早提示pCR。Kim 等[37]利用無復(fù)發(fā)生存率來評價乳腺癌預(yù)后效果,結(jié)果顯示腫瘤在T2WI 有較高熵值(異質(zhì)性高)的病人表現(xiàn)出較低的無復(fù)發(fā)生存率。
2.5.3 影像基因組學(xué)與乳腺癌復(fù)發(fā)的相關(guān)性研究 應(yīng)用多基因檢測方法[如癌型檢測(Oncotype Dx)和預(yù)測分析微陣列50(PAM50)/Prosigna]對腫瘤的復(fù)發(fā)風(fēng)險進行預(yù)測已應(yīng)用于臨床。Oncotype Dx 主要用于檢測ER 陽性的早期乳腺癌,已有研究證實該檢測方法比臨床病理學(xué)指標能更準確地預(yù)測ER類型及腋窩淋巴結(jié)轉(zhuǎn)移情況[38]。Woodard 等[5]研究發(fā)現(xiàn)乳腺密度與Oncotype Dx 復(fù)發(fā)評分(Oncotype Dx recurrence score, ODxRS)呈負相關(guān),不清晰的腫塊邊緣和纖細的線性分支鈣化與較高的ODxRS 顯著相關(guān)。除了乳腺X 線攝影的特征,MRI 中的動態(tài)增強特征也有潛力作為乳腺癌復(fù)發(fā)風(fēng)險的影像學(xué)生物標志物。Wan 等[20]采用6 個形態(tài)特征、3 個藥物動力學(xué)特征、4 個增強動力學(xué)特征、4 個強度動力學(xué)特征、148 個結(jié)構(gòu)動力學(xué)特征、5 個動態(tài)方向梯度直方圖和6 個動力局部二值模式特征對每個病變進行定量表征,并在ER 陽性病人中評價這些特征與致癌類型Dx 風(fēng)險類別的相關(guān)性,結(jié)果表明計算機提取的ER 陽性乳腺癌DCE-MRI 紋理特征與Oncotype Dx 風(fēng)險評分高度相關(guān),動態(tài)方向梯度直方圖和動力局部二值模式的AUC 值分別為0.84 和0.80。Thakur 等[39]測量ER 陽性和腋窩淋巴結(jié)陰性浸潤性乳腺癌的ADC 值,結(jié)果發(fā)現(xiàn)ODxRS 評分低風(fēng)險癌灶的ADC 值顯著高于中/高危風(fēng)險者。Dialani等[40]利用乳腺X 線攝影、超聲和MRI 特征,結(jié)合PR、HER2 狀態(tài)和腫瘤分級,能夠可靠地預(yù)測腫瘤復(fù)發(fā)風(fēng)險,具有較高的敏感度(89%)和特異度(83%),從而減少昂貴的Oncotype Dx 檢測。PAM50 測定法是對與乳腺癌相關(guān)的50 個基因表達進行的檢測,可用于預(yù)測ER 陽性、HER2 陰性乳腺癌病人轉(zhuǎn)移的可能性,并能指導(dǎo)激素治療和化療的臨床決策[41]。Li 等[42]采用多種多基因檢測手段(MammaPrint、Oncotype DX 和PAM50)與計算機提取的乳腺MRI表型進行對照研究,結(jié)果顯示影像組學(xué)特征尤其是腫瘤大小和增強紋理,與多基因檢測的復(fù)發(fā)評分之間存在顯著相關(guān)性,即腫瘤越大、越不均質(zhì)強化,其復(fù)發(fā)的風(fēng)險越高。
影像基因組學(xué)是將腫瘤基因型與影像表型聯(lián)系起來的一個新興領(lǐng)域,雖然已有大量研究證實其具有重要的臨床價值和廣闊的應(yīng)用前景,但目前仍存在一些局限性:①大多數(shù)研究都依賴于回顧性數(shù)據(jù)集,且樣本量小,缺少代表性;②基因表達和信號通路極其復(fù)雜,且基因檢測價格昂貴、操作復(fù)雜,這限制了大規(guī)模的影像基因組學(xué)研究;③由于缺乏統(tǒng)一的標準、不同的軟件和成像設(shè)備以及數(shù)據(jù)集的機構(gòu)間和機構(gòu)內(nèi)的異質(zhì)性均限制了結(jié)果的通用性,ROI 采用手動劃定或自動分割法也可能影響特征的提取及相關(guān)分析。
乳腺癌影像基因組學(xué)是一個非常有前景的研究領(lǐng)域,可以快速、無創(chuàng)地通過影像學(xué)獲得相關(guān)基因特征與信息,有望提高乳腺癌的診斷、預(yù)后評估和治療反應(yīng)預(yù)測的準確性。迄今為止,影像基因組學(xué)的工作主要集中在單一機構(gòu)和回顧性數(shù)據(jù)集,下一步影像基因組學(xué)研究應(yīng)獲得更大的數(shù)據(jù)集和更準確的信息,并且需要將其進行標準化、規(guī)范化及統(tǒng)一化,從而能更精準地解決臨床問題。