劉 穎,廉亞麗,董律吏,郭 曉,王 蕊,紀(jì)曉坤,杜 蕓
(河北醫(yī)科大學(xué)第四醫(yī)院癌檢中心,河北 石家莊 050011)
近年來(lái)甲狀腺癌發(fā)病率逐年升高,在中國(guó)女性新發(fā)癌癥中位居第4位,在男性中位居第9位[1]。甲狀腺癌的診治越來(lái)越趨于精準(zhǔn)化和個(gè)體化,人工智能(artificial intelligence,AI)深入結(jié)合醫(yī)學(xué)技術(shù)有助于提高甲狀腺癌精準(zhǔn)治療,提高診斷速度,避免醫(yī)生主觀因素導(dǎo)致的偏差。目前AI越來(lái)越多的應(yīng)用于甲狀腺結(jié)節(jié)的診斷,在甲狀腺超聲診斷領(lǐng)域發(fā)展最為迅速,有研究者將AI輔助模型應(yīng)用于超聲圖像,顯著提高了甲狀腺結(jié)節(jié)診斷的準(zhǔn)確性和特異性[2]。也有研究利用深度學(xué)習(xí)技術(shù)基于甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)術(shù)中冰凍病理切片構(gòu)建淋巴結(jié)轉(zhuǎn)移預(yù)測(cè)模型,指導(dǎo)臨床手術(shù)策略[3]。
細(xì)針穿刺(fine-needle aspiration,F(xiàn)NA)活檢是診斷甲狀腺結(jié)節(jié)的金標(biāo)準(zhǔn),計(jì)算機(jī)分析無(wú)疑為甲狀腺針吸細(xì)胞學(xué)檢查提供更客觀量化的指標(biāo),在一定程度上減少診斷的不確定性,AI的迭代發(fā)展可能實(shí)現(xiàn)超越普通診斷醫(yī)師的精準(zhǔn)診斷。
甲狀腺細(xì)胞病理學(xué)Bethesda 系統(tǒng)包括6 類(lèi)用于甲狀腺FNA診斷的不同分類(lèi)。每種分類(lèi)均有相應(yīng)的惡性風(fēng)險(xiǎn)分級(jí),這在甲狀腺結(jié)節(jié)的管理中十分重要,更準(zhǔn)確的惡性腫瘤預(yù)測(cè)可以有效減少不必要的手術(shù)。大多數(shù)甲狀腺結(jié)節(jié)經(jīng)FNA 可以排除惡性,對(duì)于濾泡性腫瘤(包括腺瘤和癌),大多數(shù)針吸細(xì)胞學(xué)檢查的結(jié)節(jié)最終被診斷為良性;對(duì)于甲狀腺乳頭癌,特別是具有典型細(xì)胞學(xué)特征的類(lèi)型,甲狀腺FNA是非常好的確診手段。但對(duì)于濾泡型PTC 和具有乳頭狀核特點(diǎn)的非浸潤(rùn)性甲狀腺濾泡性腫瘤(noninvasive follicular tumor with papillary like nuclear features,NIFTP),常常被細(xì)胞學(xué)歸類(lèi)到診斷不確定(Bethesda III-V 類(lèi))類(lèi)型中。目前,分子檢測(cè)可以對(duì)細(xì)胞學(xué)特征不明確的甲狀腺結(jié)節(jié)進(jìn)行分流,而AI輔助診斷也是減少細(xì)胞病理診斷不確定的潛在方法。
對(duì)于甲狀腺癌,大多數(shù)研究集中在PTC與非PTC分類(lèi)任務(wù)上。2018 年,Sanyal 等[4]開(kāi)發(fā)了一種人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks,ANN)來(lái)區(qū)分PTC 和非PTC,用186 張PTC 涂片和184 張其他甲狀腺病變涂片的顯微鏡照片(放大10 倍和40倍)來(lái)訓(xùn)練,并用174張顯微鏡涂片來(lái)評(píng)估,結(jié)果ANN的應(yīng)用顯示靈敏度為90%,特異性為83%,總體準(zhǔn)確率為85%。然而,由于訓(xùn)練數(shù)據(jù)潛在的“過(guò)擬合”局限性,導(dǎo)致良性濾泡細(xì)胞形成的模糊乳頭狀結(jié)構(gòu)或厚膠質(zhì)有時(shí)被錯(cuò)誤歸類(lèi)為PTC。2019年,Guan 等[5]利用深層卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)模型VGG-16和Inception-v3將甲狀腺乳頭狀癌與甲狀腺良性結(jié)節(jié)進(jìn)行區(qū)分,將279個(gè)病理證實(shí)的甲狀腺結(jié)節(jié)細(xì)胞學(xué)圖像建立數(shù)據(jù)集分為訓(xùn)練組和測(cè)試組。測(cè)試組VGG-16模型和Inception-v3 對(duì)碎片圖像的準(zhǔn)確率分別為97.66%和92.75%,對(duì)患者的準(zhǔn)確率分別為95%和87.5%。使用大數(shù)據(jù)集訓(xùn)練后,DCNN VGG-16 模型在促進(jìn)從細(xì)胞學(xué)圖像中診斷PTC方面顯示了巨大的潛力。
此外,甲狀腺濾泡性腫瘤分類(lèi)的研究已有報(bào)道。Savala等[6]利用甲狀腺FNA 涂片細(xì)胞學(xué)和形態(tài)學(xué)特征建立ANN 模型來(lái)區(qū)分甲狀腺濾泡性腫瘤,組織學(xué)證實(shí)的26 例濾泡腺瘤(follicular adenoma,F(xiàn)A)和31例濾泡癌(follicular carcinoma,F(xiàn)C),訓(xùn)練集39例,驗(yàn)證集和測(cè)試集各9例。結(jié)果顯示9例測(cè)試集中區(qū)分FA和FC準(zhǔn)確率達(dá)到100%。
在迄今為止數(shù)據(jù)最大的甲狀腺研究中,Range等[7]對(duì)908例病例進(jìn)行Bethesda系統(tǒng)分類(lèi),此研究開(kāi)發(fā)了一種機(jī)器學(xué)習(xí)算法(machine learning algorithm,MLA),通過(guò)全視野的數(shù)字化切片(whole slide image,WSI)評(píng)估甲狀腺FNA 標(biāo)本。選取908 例有明確完整病史的甲狀腺FNA 病例中最典型的涂片掃描為WSI,其中799 例為訓(xùn)練集,109 例為測(cè)試集,按照Bethesda 系統(tǒng)分類(lèi),該算法在鑒別良性和惡性結(jié)節(jié)方面的敏感性為92.0%,特異性為90.5%。人工和MLA預(yù)測(cè)惡性腫瘤的曲線下面積分別為0.931和0.932。MLA預(yù)測(cè)惡性腫瘤方面的表現(xiàn)與人工相當(dāng)。由于細(xì)胞病理專(zhuān)家在極端情況下(良性或惡性診斷)表現(xiàn)更好,因此MLA可以作為FNA活檢的補(bǔ)充,以幫助細(xì)化不確定的類(lèi)別。
除此之外,很多研究試圖將甲狀腺FNA診斷主觀的細(xì)胞學(xué)標(biāo)準(zhǔn)轉(zhuǎn)變?yōu)槎康姆诸?lèi)參數(shù),大多數(shù)此類(lèi)研究集中在用于鑒別乳頭狀癌/濾泡性癌與良性甲狀腺結(jié)節(jié)細(xì)胞核的參數(shù)上。2019年,Chain等[8]研究應(yīng)用數(shù)字圖像衍生的核測(cè)量客觀地將PTC與良性結(jié)節(jié)和NIFTP 區(qū)分開(kāi)來(lái),使用Aperio 成像系統(tǒng)掃描每個(gè)病例的涂片,測(cè)量每個(gè)病例125個(gè)細(xì)胞核的長(zhǎng)/短徑,發(fā)現(xiàn)PTC的核面積大于良性,NIFTP 核面積小于PTC。核延伸率顯示相似的結(jié)果,但各組間數(shù)據(jù)重疊率更大。2019年,Yashaswini等[9]使用Bethesda系統(tǒng)對(duì)FNA涂片中的甲狀腺病變進(jìn)行分類(lèi),并評(píng)估核參數(shù)在提高甲狀腺惡性腫瘤預(yù)測(cè)中的意義,使用Aperio計(jì)算機(jī)軟件對(duì)81 例經(jīng)組織學(xué)診斷確診的甲狀腺FNA 病例進(jìn)行核形態(tài)測(cè)量,對(duì)每個(gè)病例的100 個(gè)細(xì)胞核分析了8 個(gè)相關(guān)參數(shù),結(jié)果表明惡性組最小核徑、最大核徑、核周長(zhǎng)和核面積均高于非腫瘤組和良性組,證明了通過(guò)計(jì)算機(jī)圖像分析進(jìn)行的核形態(tài)測(cè)量可以用作輔助診斷工具。
總的來(lái)說(shuō),盡管在一些研究中與核形狀和染色質(zhì)特征相關(guān)的其他因素具有預(yù)測(cè)性,但核面積的測(cè)量似乎是鑒別PTC和良性結(jié)節(jié)的最可靠方法[8,10-11]。對(duì)于濾泡癌,核大小的變化可能是一個(gè)重要的鑒別特征[6]。
然而,有研究未直接評(píng)估細(xì)胞形態(tài)學(xué)特征,而是根據(jù)FNA報(bào)告中包含的微觀描述使用機(jī)器學(xué)習(xí)算法區(qū)分不同病例。2019年,Maleki 等[12]評(píng)估了機(jī)器學(xué)習(xí)算法(suport vector machine,SVM)使用各種細(xì)胞形態(tài)學(xué)特征描述區(qū)分經(jīng)典性PTC和NIFTP/無(wú)包膜或淋巴管浸潤(rùn)的包裹性濾泡型甲狀腺乳頭狀癌(encapsulated follicular variant of papillary thyroid carcinoma,EFVPTC)的性能,選取59 例(29 例經(jīng)典型PTC 和30 例NIFTP/EFVPTCs)作為測(cè)試集,SVM 成功鑒別出經(jīng)典型PTC 與NIFTP/EFVPTC 的概率為(76.05±0.96)%,檢測(cè)經(jīng)典型PTC 的敏感性為72.6%,特異性為81.6%。這種方法可能對(duì)開(kāi)發(fā)數(shù)據(jù)驅(qū)動(dòng)評(píng)分系統(tǒng)有價(jià)值,可以指導(dǎo)細(xì)胞病理學(xué)和外科病理學(xué)診斷。
大多數(shù)基于形態(tài)計(jì)量學(xué)的甲狀腺FNA研究最大的不足是數(shù)據(jù)集太小,這些研究未來(lái)的探索需要更大的數(shù)據(jù)集,更專(zhuān)業(yè)的儀器設(shè)備。核形態(tài)測(cè)量研究通常需要人工識(shí)別和提取細(xì)胞核特征,費(fèi)時(shí)費(fèi)力。WSI的使用有望加快未來(lái)自動(dòng)化進(jìn)程,促進(jìn)AI的應(yīng)用,但其所需存儲(chǔ)空間巨大。此外,訓(xùn)練過(guò)程要求具有強(qiáng)大的計(jì)算能力和龐大的訓(xùn)練集,為機(jī)器學(xué)習(xí)提供足夠的數(shù)據(jù),這可能容易出現(xiàn)數(shù)據(jù)過(guò)擬合。然而,計(jì)算能力、存儲(chǔ)、成像和機(jī)器學(xué)習(xí)算法的進(jìn)步表明,在不久的將來(lái),該技術(shù)在解決甲狀腺FNA標(biāo)本的診斷不確定性方面可發(fā)揮重要作用,輔助人工顯微鏡診斷,并作為分子檢測(cè)的潛在替代品。