張婷婷,渠 寧,鄭 璞,陳雅玲,史榮亮,嵇慶海,孫國華
1.復(fù)旦大學(xué)附屬腫瘤醫(yī)院頭頸外科,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032;
2.Nuralogix公司,多倫多M5C1C3;
3.復(fù)旦大學(xué)附屬腫瘤醫(yī)院超聲診斷科,復(fù)旦大學(xué)上海醫(yī)學(xué)院腫瘤學(xué)系,上海 200032
甲狀腺腫瘤是人體最常見的內(nèi)分泌腫瘤。普通人群中,通過觸診甲狀腺結(jié)節(jié)的檢出率為1%~5%,而采用高分辨率超聲檢測甲狀腺結(jié)節(jié)的檢出率可達(dá)19%~68%。根據(jù)全球的流行病學(xué)資料顯示,甲狀腺惡性腫瘤發(fā)病率呈現(xiàn)逐年遞增的趨勢[1-2]。目前甲狀腺結(jié)節(jié)診斷通常采用觸診、超聲、超聲引導(dǎo)下細(xì)針穿刺(fine-needle aspiration biopsy,F(xiàn)NAB)、CT和MRI等檢查。甲狀腺結(jié)節(jié)的良惡性鑒別最常采用超聲及FNAB檢查[3]。高分辨率的影像學(xué)資料及高質(zhì)量病理切片有利于準(zhǔn)確地診斷,然而影像及病理資料的判讀則存在較大的主觀性,其主要依賴于診斷醫(yī)師的知識與經(jīng)驗(yàn),而這造成了結(jié)果的異質(zhì)性。另外,患者數(shù)量的急劇增加導(dǎo)致了醫(yī)師勞動(dòng)強(qiáng)度大幅提升和平均診斷時(shí)間的縮短,亦會(huì)影響診斷結(jié)果。目前,對影像及病理資料的人工判讀的準(zhǔn)確性及異質(zhì)性并不理想,成為甲狀腺腫瘤診斷發(fā)展的瓶頸。
機(jī)器學(xué)習(xí)(machine learning,ML)是一門多領(lǐng)域交叉學(xué)科,應(yīng)用計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為。因其具備高效率、低消耗、較高的準(zhǔn)確性及同質(zhì)性等優(yōu)勢而在社會(huì)各領(lǐng)域的應(yīng)用獲得了越來越廣泛的關(guān)注,其中早期的人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)及新興的深度學(xué)習(xí)(deep learning)最為突出[4]。機(jī)器學(xué)習(xí)和醫(yī)學(xué)領(lǐng)域的結(jié)合已經(jīng)成為當(dāng)前熱點(diǎn)之一,在短短的幾年時(shí)間內(nèi)已經(jīng)取得豐碩的成果,其中計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CAD)最為突出[5-6]。該研究主要對深度學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)在甲狀腺腫瘤診療中的應(yīng)用進(jìn)行介紹。
人工神經(jīng)網(wǎng)絡(luò)是模擬大腦神經(jīng)元的生物活動(dòng)非線性模型?;驹砣缤窠?jīng)元的分級突觸組織,接收多個(gè)輸入信息的神經(jīng)元分配給每個(gè)輸入信息以權(quán)重,并根據(jù)這些加權(quán)數(shù)據(jù)的總和來決定是否觸發(fā)向下級的傳導(dǎo)。ANN通常由至少三層邏輯單元組成,包括輸入層、隱藏層和輸出層。輸入層負(fù)責(zé)接收相關(guān)數(shù)據(jù)資料,一個(gè)或多個(gè)以某種特定分層方式連接的隱藏層合成此數(shù)據(jù),最后輸出層接收處理后數(shù)據(jù)并生成答案。ANN在數(shù)據(jù)處理上具有許多獨(dú)特的優(yōu)勢:包括可以快速識別線性類型,對于混雜及不完全數(shù)據(jù)的處理,高容錯(cuò)能力和從訓(xùn)練數(shù)據(jù)推廣的能力等。另外,ANN的分析無需從潛在關(guān)鍵變量的假設(shè)或提前識別開始,因此可用以發(fā)現(xiàn)某些既往可能被忽視的潛在預(yù)后影響因素。
深度學(xué)習(xí)是一種深層的人工神經(jīng)網(wǎng)絡(luò),曾被評為2013年度十大科技突破創(chuàng)新技術(shù)之一。它是一種非線性的多層特征學(xué)習(xí)模型,通過自動(dòng)檢測原始數(shù)據(jù)(例如像素、字符等)的特征信息并進(jìn)行分類,然后按照非線性模塊化的方式學(xué)習(xí)到其多個(gè)層次上的特征,再進(jìn)行逐步簡化及整合并產(chǎn)生最終的結(jié)果[6]。與傳統(tǒng)ANN相比,深度學(xué)習(xí)具有更多的隱藏層。深度學(xué)習(xí)的算法可以自動(dòng)地提取分類需要的低層次或高層次特征,高層次特征是指該特征依賴于分級(層次)學(xué)習(xí)的其他特征[4]。例如對于圖像資料,深度學(xué)習(xí)算法首先從原始圖像學(xué)習(xí)得到的一個(gè)低層次表達(dá)(例如邊緣檢測器、小波濾波器等),然后在這些低層次表達(dá)的基礎(chǔ)上再建立表達(dá)(例如已有低層次表達(dá)的線性或者非線性組合方式),再重復(fù)這個(gè)過程,最后得到一個(gè)高層次的表達(dá)。深度學(xué)習(xí)會(huì)根據(jù)研究問題和數(shù)據(jù)的特性對學(xué)習(xí)的層數(shù)進(jìn)行調(diào)整,以達(dá)到更好的學(xué)習(xí)效果。深度學(xué)習(xí)已經(jīng)演化出不同的分支,如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)等[4-6]。
與傳統(tǒng)ML相比,深度學(xué)習(xí)的最大優(yōu)勢在于僅需小部分人工編程,即可自動(dòng)識別并學(xué)習(xí)數(shù)據(jù)源特征并進(jìn)行分析及傳遞。另外,深度神經(jīng)網(wǎng)絡(luò)具有更多的隱層,能夠?yàn)槟P吞峁└叩某橄髮哟危瑥亩@著提高模型的分類能力。深度學(xué)習(xí)多采用監(jiān)督式學(xué)習(xí)(supervised learning),即在機(jī)械學(xué)習(xí)過程中提供對錯(cuò)指示,一般是在數(shù)據(jù)組中包含最終結(jié)果(0,1),并通過加權(quán)的形式減少學(xué)習(xí)過程距離目標(biāo)函數(shù)的偏移,從而提高結(jié)果的準(zhǔn)確性。另外,深度學(xué)習(xí)具有對混雜因素不敏感,僅對特定目標(biāo)特征敏感的優(yōu)點(diǎn)[4]。
機(jī)器學(xué)習(xí)最早主要用于完成語音識別及圖像辨認(rèn)等工作。雖然ML在數(shù)據(jù)處理方面具有諸多優(yōu)勢,然而其發(fā)展卻長時(shí)間受限于硬件條件的不足,直至GPU計(jì)算模塊的出現(xiàn)極大地提高了矩陣運(yùn)算的速度,將原先可能需要耗時(shí)數(shù)月的訓(xùn)練過程縮短為數(shù)天乃至數(shù)小時(shí),從而促使各種相關(guān)技術(shù)快速發(fā)展并受到廣泛應(yīng)用[4]。
隨著技術(shù)的發(fā)展與成熟,機(jī)器學(xué)習(xí)目前已成為社會(huì)各領(lǐng)域研究的熱點(diǎn)。Google公司的多國語言識別翻譯系統(tǒng)、DeepMind項(xiàng)目及蘋果公司的Siri語音服務(wù)系統(tǒng)應(yīng)用的就是深度學(xué)習(xí)技術(shù)。2016年初,基于深度學(xué)習(xí)算法的電腦圍棋程序Alphago擊敗了前世界排名第一的韓國圍棋選手李世石。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)在圖像處理領(lǐng)域最突出的技術(shù),以其為基礎(chǔ)的圖像識別系統(tǒng)項(xiàng)目已被許多大型公司爭相開展,包括Google、Facebook、Microsoft、IBM及Adobe等。NVIDIA、Intel及三星公司等也欲將CNN技術(shù)應(yīng)用于智能手機(jī)、相機(jī)及機(jī)器人的成像系統(tǒng)中。
機(jī)器學(xué)習(xí)應(yīng)用于醫(yī)學(xué)領(lǐng)域可追溯到20世紀(jì)90年代?;贑NN的系統(tǒng)在圖像識別上已顯示出其自身的價(jià)值,在許多圖像識別任務(wù)中達(dá)到接近乃至超越人類的表現(xiàn)水平。美國斯坦福大學(xué)的皮膚癌人工智能檢測系統(tǒng),通過與人類皮膚科專家診斷的比較,其特異度和靈敏度均得到了認(rèn)證,且該結(jié)果刊登在醫(yī)學(xué)雜志Nature上[7]。另外,許多學(xué)者報(bào)道了運(yùn)用ML技術(shù)開展各方面醫(yī)學(xué)領(lǐng)域的研究,包括基因組學(xué)、蛋白質(zhì)組學(xué)、組織病理學(xué)及預(yù)后風(fēng)險(xiǎn)評估等。Danaee等[8]通過對TCGA數(shù)據(jù)庫中1 097例乳腺癌患者及113例正常人組織RNA測序結(jié)果的研究發(fā)現(xiàn),深度學(xué)習(xí)可用于處理腫瘤基因檢測多維而復(fù)雜的數(shù)據(jù)。Pouliakis等[9]嘗試應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行腫瘤病理細(xì)胞學(xué)診斷。Litjens等[10]報(bào)道應(yīng)用深度學(xué)習(xí)進(jìn)行乳腺癌及前列腺癌的組織細(xì)胞學(xué)診斷。Lundin等[11]研究ML對乳腺癌5、10及15年生存預(yù)測的準(zhǔn)確率分別為0.909、0.886及0.883。深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的應(yīng)用前景還在不斷探尋之中。
醫(yī)學(xué)影像診斷是機(jī)器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域最早應(yīng)用的方向,其作用也得到了廣泛的肯定。目前已有許多學(xué)者報(bào)道了機(jī)器學(xué)習(xí)方法在甲狀腺腫瘤影像診斷中的應(yīng)用。Zhu等[12]對618例患者超聲影像資料分析,納入形狀、邊緣、回聲強(qiáng)度、內(nèi)部組成、鈣化及暈征共6項(xiàng)因素,采用ANN方法建立鑒別甲狀腺腫瘤良惡性模型,模型準(zhǔn)確率、敏感性和特異度分別為84.3%,84.5%及79.1%。Lim等[13]通過比較ANN模型與兩名經(jīng)驗(yàn)豐富的影像科醫(yī)師對109枚甲狀腺結(jié)節(jié)的良惡性判斷,發(fā)現(xiàn)ANN模型的診斷準(zhǔn)確率顯著高于醫(yī)師的準(zhǔn)確率。經(jīng)過對543例甲狀腺結(jié)節(jié)患者(其中惡性207例,良性403例)超聲影像資料的分析,Yu等[14]建立ANN診斷模型,應(yīng)用另外45例患者資料驗(yàn)證模型的準(zhǔn)確率、敏感性及特異度分別為90%、88.24%及90.91%。Halicek等[15]對50例進(jìn)展期頭頸部腫瘤(其中甲狀腺癌21例)進(jìn)行高光譜成像(hyperspectral imaging,HSI)的CNN分析,提出CNN運(yùn)用于HSI圖像時(shí)可以較好的區(qū)分腫瘤與正常組織。Chi等[16]采用深度卷積神經(jīng)網(wǎng)絡(luò)根據(jù)超聲影像對428例公用數(shù)據(jù)庫資料及164例當(dāng)?shù)刭Y料進(jìn)行甲狀腺結(jié)節(jié)良惡性鑒別,前者準(zhǔn)確率、靈敏度和特異度分別為98.29%、99.10%和93.90%,后者分別為96.34%、86%和99%。與其他腫瘤相似,機(jī)器學(xué)習(xí)在甲狀腺腫瘤影像診斷中同樣表現(xiàn)出了較高的準(zhǔn)確率及較好的應(yīng)用前景。
在甲狀腺腫瘤超聲引導(dǎo)下FNAB中,機(jī)器學(xué)習(xí)同樣表現(xiàn)出了在細(xì)胞病理學(xué)診斷中具有較高的準(zhǔn)確性。Gopinath等[17]采用多種計(jì)算機(jī)學(xué)習(xí)技術(shù)對FNAB細(xì)胞學(xué)圖像資料進(jìn)行分析,其準(zhǔn)確率最高可達(dá)到90%。另外,Mansoor等[18]通過對5例甲狀腺濾泡狀腺瘤的1 904枚細(xì)胞及5例甲狀旁腺瘤患者的690枚細(xì)胞采用ML的方法進(jìn)行分類,結(jié)果準(zhǔn)確率為98%。兩項(xiàng)研究均提示機(jī)器學(xué)習(xí)在甲狀腺癌細(xì)胞學(xué)診斷中的應(yīng)用前景。對于FNAB細(xì)胞學(xué)病理診斷為惡性潛能未定的453例甲狀腺腫瘤患者,Ippolito等[19]采用ANN算法根據(jù)患者病理及臨床資料將其分為高危或低危組,并與最終術(shù)后組織病理類型進(jìn)行對比,結(jié)果表明ANN法的敏感性及特異度均高于傳統(tǒng)細(xì)胞學(xué)分類方法。另外,Saylam等[20]對116例術(shù)前穿刺提示惡性潛能未定的結(jié)節(jié)性甲狀腺腫患者納入相關(guān)臨床因素建立ANN模型預(yù)測結(jié)節(jié)惡性可能,經(jīng)與術(shù)后病理比對,ANN模型預(yù)測準(zhǔn)確性較高,AUC值為0.824。但目前相關(guān)報(bào)道較少,機(jī)器學(xué)習(xí)在甲狀腺腫瘤病理診斷中的作用還有許多方向有待研究。
目前關(guān)于機(jī)器學(xué)習(xí)在甲狀腺腫瘤診療其他方面的研究較少。Jajroudi等[21]報(bào)道了ANN法在甲狀腺癌患者預(yù)后評價(jià)中的作用,該研究納入7 706例樣本,采用ANN算法建立甲狀腺癌預(yù)后評價(jià)系統(tǒng),其對5年生存預(yù)測的準(zhǔn)確率、敏感性及特異度分別為90.7%、95.9%和83.7%。當(dāng)前機(jī)器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的應(yīng)用也主要集中在醫(yī)學(xué)輔助診斷和治療方案選擇上,較少涉及隨訪部分,這也是未來需要進(jìn)一步探索的方向。
機(jī)器學(xué)習(xí)具有高效率、高準(zhǔn)確性等諸多優(yōu)點(diǎn),它的快速發(fā)展與廣泛應(yīng)用給社會(huì)各領(lǐng)域帶來了動(dòng)力,機(jī)器學(xué)習(xí)和醫(yī)學(xué)領(lǐng)域的結(jié)合已經(jīng)成為當(dāng)前熱點(diǎn)之一。與其他疾病相比,機(jī)器學(xué)習(xí)在甲狀腺腫瘤診療中的研究相對較少。根據(jù)現(xiàn)有研究結(jié)果,機(jī)器學(xué)習(xí)在甲狀腺腫瘤超聲診斷、細(xì)胞學(xué)診斷中具有較好的應(yīng)用前景。然而甲狀腺腫瘤的診療中還存在許多其他有待提高的方面,如影像診斷中CT及MRI的診斷價(jià)值、甲狀腺濾泡狀癌的診斷及甲狀腺癌患者預(yù)后評價(jià)等。隨著機(jī)器學(xué)習(xí)在甲狀腺腫瘤診療中的應(yīng)用不斷擴(kuò)展,或許其在未來可以在改善和提高甲狀腺腫瘤的診斷、治療及患者管理等許多方面發(fā)揮巨大作用。
[1] CHEN W, ZHENG R, BAADE P D, et al. Cancer statistics in China, 2015 [J]. CA Cancer J Clin, 2016, 66(2): 115-132.
[2] LA VECCHIA C, MALVEZZI M, BOSETTI C, et al. Thyroid cancer mortality and incidence: a global overview [J]. Int J Cancer, 2015, 136(9): 2187-2195.
[3] HAUGEN B R, ALEXANDER E K, BIBLE K C, et al. 2015 American Thyroid Association Management Guidelines for Adult Patients with Thyroid Nodules and Differentiated Thyroid Cancer: The American Thyroid Association Guidelines Task Force on Thyroid Nodules and Differentiated Thyroid Cancer [J]. Thyroid, 2016, 26(1): 1-133.
[4] LE CUN Y, BENGIO Y, HINTON G. Deep learning [J].Nature, 2015, 521(7553): 436-444.
[5] SUZUKI K. Overview of deep learning in medical imaging[J]. Radiol Phys Technol, 2017. doi: 10.1007/s12194-017-0406-5. [Epub ahead of print].
[6] LEE J G, JUN S, CHO Y W, et al. Deep learning in medical imaging: general overview [J]. Korean J Radiol, 2017,18(4): 570-584.
[7] ESTEVA A, KUPREL B, NOVOA R A, et al. Dermatologistlevel classification of skin cancer with deep neural networks[J]. Nature, 2017, 542(7639): 115-118.
[8] DANAEE P, GHAEINI R, HENDRIX D A. A deep learning approach for cancer detection and relevant gene identification[J]. Pac Symp Biocomput, 2016, 22: 219-229.
[9] POULIAKIS A, KARAKITSOU E, MARGARI N, et al.Artificial neural networks as decision support tools in cytopathology: past, present, and future [J]. Biomed Eng Comput Biol, 2016, 7: 1-18.
[10] LITJENS G, SANCHEZ C I, TIMOFEEVA N, et al. Deep learning as a tool for increased accuracy and efficiency of histopathological diagnosis [J]. Sci Rep, 2016, 6: 26286.doi: 10.1038/srep26286.
[11] LUNDIN M, LUNDIN J, BURKE H B, et al. Artificial neural networks applied to survival prediction in breast cancer [J].Oncology, 1999, 57(4): 281-286.
[12] ZHU L C, YE Y L, LUO W H, et al. A model to discriminate malignant from benign thyroid nodules using artificial neural network [J]. PLoS One, 2013, 8(12): e82211.
[13] LIM K J, CHOI C S, YOON D Y, et al. Computer-aided diagnosis for the differentiation of malignant from benign thyroid nodules on ultrasonography [J]. Acad Radiol, 2008,15(7): 853-858.
[14] YU Q, JIANG T, ZHOU A, et al. Computer-aided diagnosis of malignant or benign thyroid nodes based on ultrasound images[J]. Eur Arch Otorhinolaryngol, 2017, 274(7): 2891-2897.
[15] HALICEK M, LU G, LITTLE J V, et al. Deep convolutional neural networks for classifying head and neck cancer using hyperspectral imaging [J]. J Biomed Opt, 2017, 22(6):60503.
[16] CHI J, WALIA E, BABYN P, et al. Thyroid nodule classification in ultrasound images by fine-tuning deep convolutional neural network [J]. J Digit Imaging, 2017,30(4): 477-486.
[17] GOPINATH B, SHANTHI N. Computer-aided diagnosis system for classifying benign and malignant thyroid nodules in multi-stained FNAB cytological images [J]. Australas Phys Eng Sci Med, 2013, 36(2): 219-230.
[18] MANSOOR I, ZALLES C, ZAHID F, et al. Fine-needle aspiration of follicular adenoma versus parathyroid adenoma:the utility of multispectral imaging in differentiating lesions with subtle cytomorphologic differences [J]. Cancer, 2008,114(1): 22-26.
[19] IPPOLITO A M, DE LAURENTIIS M, LA ROSA G L, et al.Neural network analysis for evaluating cancer risk in thyroid nodules with an indeterminate diagnosis at aspiration cytology:identification of a low-risk subgroup [J]. Thyroid, 2004,14(12): 1065-1071.
[20] SAYLAM B, KESKEK M, OCAK S, et al. Artificial neural network analysis for evaluating cancer risk in multinodular goiter [J]. J Res Med Sci, 2013, 18(7): 554-557.
[21] JAJROUDI M, BANIASADI T, KAMKAR L, et al. Prediction of survival in thyroid cancer using data mining technique[J]. Technol Cancer Res Treat, 2014, 13(4): 353-359.