彭建偉 譚政波 韓霖 莊艷 陳科 林江莉
摘要:皮膚癌早期診斷和篩查非常重要,但是皮膚癌識(shí)別難度較大,診斷準(zhǔn)確度一直偏低。在國際皮膚影像協(xié)會(huì)舉辦的最近一次多分類競(jìng)賽ISIC2019上,冠軍模型的平均準(zhǔn)確率僅為63.6%。目前亟須性能良好的策略來提升皮膚病智能分類的準(zhǔn)確性。經(jīng)研究使用EfficientNet網(wǎng)絡(luò),并創(chuàng)新性提出非典型類數(shù)據(jù)平衡策略。用ISIC2019競(jìng)賽數(shù)據(jù)進(jìn)行實(shí)驗(yàn),結(jié)果顯示,八分類的平均準(zhǔn)確度高達(dá)82.4%。非典型類數(shù)據(jù)平衡策略為不均衡數(shù)據(jù)集的分類提供了一個(gè)新的方案。
關(guān)鍵詞:皮膚癌圖像;EfficientNet ;不均衡數(shù)據(jù)集;多分類;ISIC2019
中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2023)01-0041-02
1 概述
根據(jù)世界衛(wèi)生組織2020年的數(shù)據(jù),皮膚癌已經(jīng)成為發(fā)病率前五的癌癥,在1000萬的死亡病例中皮膚癌約有120萬例。
目前皮膚病的臨床輔助診斷手段主要是皮膚鏡技術(shù),但是部分疾病的皮膚鏡圖像相似度高,臨床診斷困難[1],近年來人工智能在皮膚病診斷領(lǐng)域顯示出優(yōu)越性能,研究發(fā)現(xiàn),人工智能模型在皮膚鏡圖像上有著超過人類醫(yī)生的診斷準(zhǔn)確度[2-4]。但是由于皮膚癌圖像的“同病異影”和“同影異病”問題嚴(yán)重(如圖1所示),皮膚癌智能診斷準(zhǔn)確度較低。ISIC2019競(jìng)賽上,針對(duì)黑色素瘤、鱗狀細(xì)胞癌等8種皮膚病的分類任務(wù)中,官方公布的冠軍模型的準(zhǔn)確率只有63.6%。
鑒于此,本文針對(duì)性提出皮膚癌智能診斷策略,致力于進(jìn)一步提升分類準(zhǔn)確率。
2 方法
2.1 數(shù)據(jù)集
研究數(shù)據(jù)來自ISIC2019競(jìng)賽,主要包括HAM10000,BCN20000,以及ISIC挑戰(zhàn)賽本身的數(shù)據(jù)。數(shù)據(jù)集共有25331張,包括八種病變[5]。分別是5類良性病變:NV:黑色素痣(12875張),BKL良性角化?。?624張),AK光化性角化?。?67張),VASC:血管源性病變(253張),DF皮膚纖維瘤(239張);以及3類惡性病變:MEL黑色素瘤(4522張),BCC基底細(xì)胞癌(3323張),SCC鱗狀細(xì)胞癌(628張)。最多的黑色素痣有12875張,最少的皮膚纖維瘤, 僅有239張,樣本分布極不均衡。
2.2 數(shù)據(jù)平衡擴(kuò)增
為平衡各類樣本數(shù)量,首先采用傳統(tǒng)擴(kuò)充策略,即直方圖均衡,水平翻轉(zhuǎn),旋轉(zhuǎn)30、90、150或180度,隨機(jī)擦除等方法進(jìn)行擴(kuò)增,使擴(kuò)增后每類的數(shù)量接近黑色素痣數(shù)量的二分之一左右。
2.3 非典型類數(shù)據(jù)平衡方法
傳統(tǒng)平衡擴(kuò)增之后,分類準(zhǔn)確率提升并不明顯,在此基礎(chǔ)上本文提出了一種全新的“非典型類”數(shù)據(jù)平衡擴(kuò)增方法。技術(shù)路線如圖2所示。
非典型類是指在傳統(tǒng)平衡擴(kuò)增數(shù)據(jù)集訓(xùn)練后錯(cuò)分到其他類別的圖片,就是FN(False Negative) 。通過大量擴(kuò)增非典型類圖像,達(dá)到數(shù)量分布趨于平衡。
2.4 EfficientNetB0網(wǎng)絡(luò)
EfficientNetB0是MingXing Tan等人在2019年提出的。網(wǎng)絡(luò)由 9個(gè)單元組成,主要模塊有MBConvBlock,MBConv,SepConv,使用了深度可分離卷積(DWConv) ,SE模塊等結(jié)構(gòu)。本文采用遷移學(xué)習(xí)改善此網(wǎng)絡(luò)訓(xùn)練過程中由過擬合和隨機(jī)初始化權(quán)重帶來的梯度消失問題。
3 實(shí)驗(yàn)結(jié)果
3.1 實(shí)驗(yàn)設(shè)置和評(píng)價(jià)
訓(xùn)練過程中,輸入圖像大小為224×224pixels,并做隨機(jī)數(shù)據(jù)增強(qiáng)操作,最后歸一化轉(zhuǎn)為向量輸入網(wǎng)絡(luò)。Epoch為100,Batch Size為64,遷移學(xué)習(xí)的學(xué)習(xí)率為0.01,遷移學(xué)習(xí)之后的學(xué)習(xí)率為0.001,兩次訓(xùn)練均使用帶動(dòng)量的SGD優(yōu)化器,動(dòng)量為0.9,衰減速率設(shè)置為0.0001。對(duì)于識(shí)別結(jié)果,采用敏感度SEN,準(zhǔn)確率ACC,F(xiàn)1_Score進(jìn)行評(píng)估;并畫出ROC曲線計(jì)算AUC,來評(píng)價(jià)模型的可靠性。
3.2 實(shí)驗(yàn)結(jié)果
EfficientNetB0分類器使用非典型類數(shù)據(jù)平衡策略之后,模型的敏感度、準(zhǔn)確率和F1_Score都獲得最優(yōu),結(jié)果如表1所示。
敏感度SEN代表著正樣本的檢出率,是醫(yī)生最關(guān)注的指標(biāo)。表2顯示了實(shí)驗(yàn)結(jié)果中各個(gè)類別的敏感度數(shù)據(jù)??梢?,除NV和VASC略有下降,其他類別的靈敏度都有不同程度的提升,特別是黑色素瘤MEL的提升對(duì)臨床篩查有較大幫助。
分類器的ROC曲線和AUC如圖3所示,AUC值均高于90%,這說明模型的分類結(jié)果非??煽俊?/p>
3.3 驗(yàn)證實(shí)驗(yàn)
為進(jìn)一步驗(yàn)證非典型類數(shù)據(jù)平衡方法的有效性,實(shí)驗(yàn)選取了VGG,ResNet以及GoogLeNet進(jìn)行測(cè)試,測(cè)試結(jié)果如圖4。可見,三個(gè)網(wǎng)絡(luò)在非典型類數(shù)據(jù)平衡策略下的F1分?jǐn)?shù)均取得了最優(yōu)的效果。
4 結(jié)束語
本研究針對(duì)皮膚癌圖像高度相似及數(shù)據(jù)不均衡的特點(diǎn),提出一種全新的非典型類數(shù)據(jù)平衡方法,大幅提升了皮膚癌識(shí)別的準(zhǔn)確性,超過ISIC2019冠軍模型20%,為皮膚癌的早期篩查提供了有效策略,為不均衡數(shù)據(jù)集的分類提供了新的思路。
參考文獻(xiàn):
[1] 邵虹,張鳴坤,崔文成.基于分層卷積神經(jīng)網(wǎng)絡(luò)的皮膚鏡圖像分類方法[J].智能科學(xué)與技術(shù)學(xué)報(bào),2021,3(4):474-481.
[2] 埃斯特瓦,庫普勒,諾沃亞,等. 皮膚科醫(yī)生級(jí)皮膚癌的深度神經(jīng)網(wǎng)絡(luò)分類[J].自然,2017,542(7639):115-118.
[3] 海恩斯勒,芬克,施耐德鮑爾,等. 人對(duì)機(jī)器:深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)在皮膚鏡黑色素瘤識(shí)別中的診斷性能與58位皮膚科醫(yī)生的比較[J].腫瘤學(xué)紀(jì)事,2018,29(8):1836-1842.
[4] 布林克爾,??评?,艾恩克,等.在面對(duì)面皮膚鏡黑色素瘤圖像分類任務(wù)中,深度學(xué)習(xí)優(yōu)于157名皮膚科醫(yī)生中的136名[J]. 歐洲癌癥雜志,2019,113:47-54.
[5] 錢德爾,羅森達(dá)爾,基特勒.HAM1000數(shù)據(jù)集:一個(gè)收集了大量常見色素性皮膚病變的多源皮膚鏡圖像的數(shù)據(jù)集[J].科學(xué)數(shù)據(jù),2018,5(1):1-9.
【通聯(lián)編輯:聞翔軍】