国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

神經(jīng)網(wǎng)絡(luò)模型診斷胃腸道早癌價值的Meta分析

2020-03-08 04:44周駿李楊韓樹堂
關(guān)鍵詞:胃腸道異質(zhì)性內(nèi)鏡

周駿,李楊,韓樹堂

[南京中醫(yī)藥大學(xué)附屬醫(yī)院(江蘇省中醫(yī)院) 消化內(nèi)鏡中心,江蘇 南京 210029]

胃腸道惡性腫瘤主要包括食管癌、胃癌及結(jié)、直腸癌等,總發(fā)病率為19.1%,死亡率為22.7%[1],嚴(yán)重危害人類健康。根據(jù)腫瘤臨床特征及病理其可分為早期癌和進(jìn)展期癌,疾病分期不同,采取的治療方式和預(yù)后差別較大[2]。目前胃腸道早癌可通過內(nèi)鏡行微創(chuàng)治療,其相比外科手術(shù)患者創(chuàng)傷小、并發(fā)癥少、恢復(fù)快、費(fèi)用低。早癌的發(fā)現(xiàn)及診斷主要依靠先進(jìn)的內(nèi)鏡設(shè)備結(jié)合內(nèi)鏡醫(yī)師的豐富經(jīng)驗,明確診斷較進(jìn)展期癌難度更大[3]。隨著人工智能(artificial intelligence,AI)技術(shù)的發(fā)展,以深度學(xué)習(xí)(deep learning,DL)為代表的AI算法正逐步應(yīng)用于各個醫(yī)療領(lǐng)域,并獲得了較好的診斷能效。其中神經(jīng)網(wǎng)絡(luò)(neural network,NN)模型在醫(yī)學(xué)圖像診斷領(lǐng)域應(yīng)用最為廣泛,在消化內(nèi)鏡方向,其主要應(yīng)用于早期胃腸道惡性腫瘤的診斷、胃腸道圖像解剖位置的辨別、胃內(nèi)幽門螺桿菌狀態(tài)的判斷以及腸道息肉的識別等[4]。多項研究指出,NN模型具有較高的圖像識別率,然而目前尚缺乏循證醫(yī)學(xué)證據(jù)。本研究采用Meta分析的方法評價了NN模型診斷胃腸道早癌的價值,為其應(yīng)用于臨床診斷提供客觀依據(jù),為AI技術(shù)更好地服務(wù)于臨床提供理論支持。

1 資料與方法

1.1 檢索策略

在PubMed、EMbase、Web of Science、the Cochrane Library以及知網(wǎng)、萬方、維普等數(shù)據(jù)庫中對2010年1月至2019年10月發(fā)表的文獻(xiàn)進(jìn)行系統(tǒng)檢索,以獲取相關(guān)文章。檢索條件:中文檢索式為(人工智能 OR 深度學(xué)習(xí) OR 神經(jīng)網(wǎng)絡(luò)) AND (胃OR食管OR腸OR消化道OR胃腸道)AND(癌 OR 腫瘤),英文檢索式為(artificial intelligence OR deep learning OR neural network) AND (esophageal OR esophagus OR gastric OR stomach OR colorectal OR colon OR rectum OR intestine OR gastrointestinal OR gastrointestine) AND (cancer OR tumor OR carcinoma OR neoplasm OR neoplasia)。在初步剔除重復(fù)的文獻(xiàn)后,對剩余文獻(xiàn)的標(biāo)題和摘要進(jìn)行閱讀,排除其他的文獻(xiàn)類型如文獻(xiàn)綜述、個案、新聞等;通讀進(jìn)一步獲取的文獻(xiàn)全文;為了避免遺漏,同時閱讀其參考文獻(xiàn)。

1.2 選擇標(biāo)準(zhǔn)

1.2.1 納入標(biāo)準(zhǔn) (1) 應(yīng)用NN模型進(jìn)行早癌鑒別診斷;(2) 從文中能直接或間接獲取研究結(jié)果的真陽性(TP)、假陽性(FP)、真陰性(TN)、假陰性(FN)數(shù);(3) 金 標(biāo)準(zhǔn)采用活檢或手術(shù)的病理學(xué)診斷;(4) 陽性病灶的病理診斷結(jié)果為低/高級別上皮內(nèi)瘤變或早期癌。

1.2.2 排除標(biāo)準(zhǔn) (1) 陽性病灶的病理診斷為進(jìn)展期癌或息肉等良性病變;(2) 無法獲得完整的四格表數(shù)據(jù);(3) 綜述、病例報告、社評、給編輯的信、會議摘要及重復(fù)發(fā)表的文獻(xiàn)等。

1.3 數(shù)據(jù)提取和質(zhì)量評估

2名研究者經(jīng)過篩選文獻(xiàn)后獨(dú)立提取數(shù)據(jù),每項研究獲得的信息包括第一作者、發(fā)表年份、國家、病灶位置、研究類型、研究中心數(shù)量、內(nèi)鏡類型、內(nèi)鏡模式、NN類別、診斷對象、圖像分辨率是否一致、陰性病灶是否有病理結(jié)果、與專家診斷結(jié)果比較、模型測試量、模型學(xué)習(xí)量及四格表數(shù)據(jù)(TP、FP、FN、TN)。使用診斷性實(shí)驗質(zhì)量評價標(biāo)準(zhǔn)(QUADAS-2)評估納入研究的質(zhì)量。

1.4 統(tǒng)計學(xué)處理

采用META-DISC 1.4軟件對各研究結(jié)果間的異質(zhì)性進(jìn)行分析,并結(jié)合I2定量判斷異質(zhì)性的大小。當(dāng)P>0.1 或I2<50%時,可忽略研究的異質(zhì)性,直接采用固定效應(yīng)模型;當(dāng)P<0.1 或I2>50%時,則判定研究存在異質(zhì)性,首先考慮閾值效應(yīng)對研究結(jié)果的影響,排除其影響后,采用亞組分析或(和)Meta回歸分析產(chǎn)生異質(zhì)性的因素,并采用敏感性分析判斷研究結(jié)果的穩(wěn)定性,運(yùn)用隨機(jī)效應(yīng)模型計算合并后的敏感度(sensitivity,Sen)、特異度(specificity,Spe)、陽性似然比(positive likelihood ratio,+LR)、陰性似然比(negative likelihood ratio,-LR)、診斷比值比(diagnosis odds ratios,DOR)、總受試者工作特征曲線(summary receiver operating characteristic,SROC曲線)并計算曲線下面積(area under the curve,AUC)。根據(jù)AUC值的大小評價診斷性試驗的價值,AUC為0.7~0.9時表示診斷準(zhǔn)確性中等,AUC>0.9時表示診斷準(zhǔn)確性較高。通過STATA 15.0軟件繪制Deek’s圖對文獻(xiàn)的發(fā)表偏倚進(jìn)行分析。

2 結(jié) 果

2.1 文獻(xiàn)檢索結(jié)果

通過檢索上述數(shù)據(jù)庫,共找到1 914篇文獻(xiàn),包括中文400篇、英文1 514篇,通過閱讀標(biāo)題和摘要,排除了1 803篇,留下126篇全文進(jìn)一步研究。圖1總結(jié)了選擇過程和排除原因。最終,21篇文獻(xiàn)的25個研究,總共13 711張圖像符合最終分析的條件。

圖1 文獻(xiàn)篩選流程及結(jié)果

2.2 納入文獻(xiàn)的基本特征和質(zhì)量評價

納入21篇文獻(xiàn)的25個研究,對每篇文獻(xiàn)的第一作者、發(fā)表年份、國家、病變部位、研究類型、研究中心、內(nèi)鏡類型、內(nèi)鏡模式、NN類型、診斷對象、分辨率一致性、病理完整性、與專家比較結(jié)果、測試量、學(xué)習(xí)量進(jìn)行記錄,結(jié)果見表1。通過QUADAS-2量表對納入文獻(xiàn)進(jìn)行質(zhì)量評估,其結(jié)果和四格表數(shù)據(jù)見表2。

表1 納入研究的基本特征

表2 納入研究的四格表數(shù)據(jù)及風(fēng)險偏倚評價

2.3 數(shù)據(jù)分析結(jié)果

使用META-DISC 1.4對納入數(shù)據(jù)進(jìn)行分析,各項指標(biāo)均存在一定程度的異質(zhì)性,Sen存在異質(zhì)性(P<0.001,I2=91%),Sen合并=0.95(95%CI為0.94~0.95);Spe存在異質(zhì)性(P<0.001,I2=90%),Spe合并=0.90(95%CI為0.89~0.90);+LR存在異質(zhì)性(P<0.001,I2=100%),+LR合并=7.00(95%CI為2.98~16.42);-LR存在異質(zhì)性(P<0.001,I2=96%),-LR合并=0.09(95%CI為0.05~0.17);DOR存在異質(zhì)性(P<0.001,I2=94%),DOR合并=78.23(95%CI為33.71~181.52);AUC=0.97。

2.4 異質(zhì)性分析

觀察SROC曲線不呈“肩臂狀”,且Spearman檢驗相關(guān)系數(shù)為0.097(P=0.674>0.05),故并非閾值效應(yīng)導(dǎo)致的異質(zhì)性。本研究Sen和Spe異質(zhì)性檢驗結(jié)果分別為P<0.001、I2=91%和P=0.01、I2=90%。研究結(jié)果間異質(zhì)性較大,分析原因可能為:(1)各國對胃腸道早癌的診斷標(biāo)準(zhǔn)不同,對金標(biāo)準(zhǔn)的判讀可能不同,如日本采用本國標(biāo)準(zhǔn),我國及歐美國家多采用WHO標(biāo)準(zhǔn);(2) 胃[5-12]、食管[13-20]、腸道[21-25]早癌病灶解剖位置有差異,導(dǎo)致識別難易程度有別,診斷難度不同;(3) 采用不同類型的內(nèi)鏡(放大/非放大)、內(nèi)鏡的不同模式(白光/NBI/色素)、不同的圖像分辨率其診斷結(jié)果可能有所差別;(4) 部分研究中使用了非CNN[17,21,25]或未提及NN[19-20,22]的類型,由于不同模型的預(yù)訓(xùn)練程度不同,可能導(dǎo)致診斷差異;(5) 部分研究的陰性病例(正常圖像)未經(jīng)病理確診,可能存在漏診的陽性病灶[7,15,23],導(dǎo)致結(jié)果出現(xiàn)偏差;(6) 部分研究的診斷對象為病灶而非圖像[6,14-15,17-18,21-23,25],由于同一病灶可能對應(yīng)多張圖像,通常有一張圖像確認(rèn)為陽性即可判定病灶為陽性,因而可能導(dǎo)致研究的Sen較高而Spe較低。

2.5 敏感性分析和發(fā)表偏倚

敏感性分析結(jié)果顯示,無論是剔除質(zhì)量較低及Sen與Spe相差較大的研究,或是切換效應(yīng)模型,對總體合并的Sen、Spe影響并不大,故本Meta分析結(jié)果的穩(wěn)定性及可信度較高。通過STATA 15.0 繪制的Deek’s圖發(fā)現(xiàn),圖像結(jié)果顯示無明顯不對稱性,斜率系數(shù)P=0.01,提示存在一定發(fā)表偏倚的可能(圖3)。分析其可能原因:本研究領(lǐng)域較為前沿,早期相關(guān)研究尚不夠成熟,對NN的研究仍在進(jìn)行中;且我們未能獲取未發(fā)表研究的數(shù)據(jù)以及陰性結(jié)果的文獻(xiàn)。

A.Sen;B.Spe;C.+LR;D.-LR;E.DOR;F.SROC

圖3 發(fā)表偏倚分析

2.6 亞組分析和Meta回歸

為了進(jìn)一步探討異質(zhì)性來源,我們將國家(日本/韓國/中國/歐美國家)、病變部位(胃/食管/結(jié)腸)、研究中心(單/多)、內(nèi)鏡類型(放大/非放大)、內(nèi)鏡模式(白光/NBI/色素)、NN類型(CNN/其他)、診斷對象(圖像/病灶)、分辨率一致性(是/否)、病理結(jié)果完整性(是/否)、與專家比較結(jié)果(高/低/未比較)等影響因素均納入Meta回歸和亞組分析中,最終研究結(jié)果穩(wěn)定,提示以上因素均不是異質(zhì)性的來源(表3)。

表3 亞組分析和Meta 回歸結(jié)果

3 討 論

NN采用模擬人類大腦神經(jīng)元的構(gòu)架特征[26],能主動提取并學(xué)習(xí)鑒別圖像特征[27],從而能達(dá)到較好的診斷能效。目前NN模型除了可用于白光內(nèi)鏡下的診斷,也適用于放大內(nèi)鏡[10-11]、染色內(nèi)鏡[15,22,24]、細(xì)胞內(nèi)鏡[15,22]等不同類型的內(nèi)鏡。有10項研究進(jìn)行了NN模型與人工診斷的比較,7項[5,8,11,17-18,21-22]研究NN模型的診斷率高于內(nèi)鏡專家,3項[7,5,25]研究低于內(nèi)鏡專家,但仍高于普通內(nèi)鏡醫(yī)師。此外,在診斷速率方面,NN模型明顯優(yōu)于人工識別,平均速率可達(dá)每秒41.4~51.8張圖像[10,14]。早期的AI技術(shù)大多采用以支持向量機(jī)(support vector machine,SVM)為主的手工識別方法,也獲得了較高的診斷率[28-30]。然而,SVM對大規(guī)模樣本及多分類問題解決能力相對不足,更適用于小樣本的研究。與之相比,NN模型顯示了更好的分類性能[31],它的準(zhǔn)確率、Sen、Spe均超過了90%。其中,CNN被認(rèn)為是目前圖像識別領(lǐng)域性能最優(yōu)秀、最具有發(fā)展前景的診斷模型[32]。本Meta分析中除6項研究[17,19-22,25]外,其余均采用CNN進(jìn)行診斷并取得了較高的診斷能效。

本Meta分析中,各研究診斷的Sen介于50%~98%之間,Spe介于16%~100%之間,單個研究的診斷能效相差較大,不具代表性;進(jìn)行Meta分析后的Sen和Spe分別為95%和90%,AUC=0.97,綜合診斷能效較高。本研究納入文獻(xiàn)診斷試驗的實(shí)施及金標(biāo)準(zhǔn)合理性的報告質(zhì)量較好,提示納入的研究具有較高的質(zhì)量,引起選擇偏倚的可能性較小。但在病例選擇、病例流程及進(jìn)展情況方面的報告質(zhì)量參差不齊,盡管NN模型避免了盲法實(shí)施中所導(dǎo)致的偏倚,但由于納入的研究中可能在選擇病例時采用了非連續(xù)、非隨機(jī)的方法,以及金標(biāo)準(zhǔn)實(shí)施的不完全性,進(jìn)而導(dǎo)致研究報告的質(zhì)量較差,發(fā)生實(shí)施和測量偏倚的可能性較大[33],建議在今后的研究中采用診斷性試驗報告標(biāo)準(zhǔn)(STARD)[34],以提高診斷性試驗的報告質(zhì)量。

本Meta分析的局限性:(1) 灰色文獻(xiàn)與未發(fā)表文獻(xiàn)未納入本次研究,故存在一定的發(fā)表偏倚;僅納入了中文及英文文獻(xiàn),存在一定的語種偏倚;所有納入文獻(xiàn)均為回顧性研究,且部分研究的質(zhì)量不高。(2) 關(guān)于研究異質(zhì)性的來源,通過敏感性分析、Meta回歸及亞組分析并未給出,結(jié)合專業(yè)知識分析,NN的診斷結(jié)果與模型的學(xué)習(xí)量呈正相關(guān)[35]。目前尚無成熟的NN模型可直接用內(nèi)鏡圖像的診斷,研究者多采用自主研發(fā)或調(diào)試的模型進(jìn)行研究。主流的CNN有AlexNet、VGGNet、GoogleNet等,各模型的預(yù)訓(xùn)練程度不同,且后期研究者給與的學(xué)習(xí)量也各不相同,由于研究者未對此方面內(nèi)容作進(jìn)一步詳述,因此目前尚無法將此因素納入分析,有待后續(xù)研究。

綜上所述,NN模型輔助診斷早期胃腸道腫瘤具有較高的臨床價值,其準(zhǔn)確率、Sen、Spe均與內(nèi)鏡專家診斷結(jié)果較為接近,且診斷速率大大高于人工。雖然短期內(nèi)尚不能完全取代人工識別,但能高效地輔助人工進(jìn)行胃腸道腫瘤的早期診斷及篩查,尤其是在專家和醫(yī)療資源缺乏的地區(qū)[36],因此值得進(jìn)一步研究及推廣。本研究匯總近年來國內(nèi)外應(yīng)用NN模型診斷胃腸道早癌的相關(guān)文獻(xiàn),綜合評價了其診斷價值,認(rèn)為NN模型對內(nèi)鏡醫(yī)師診斷早癌能提供一定的幫助支持。但本研究由于受到樣本量及研究本身質(zhì)量的限制,可靠性有待進(jìn)一步提高,后期我們將繼續(xù)跟進(jìn)。

猜你喜歡
胃腸道異質(zhì)性內(nèi)鏡
Meta分析中的異質(zhì)性檢驗
城市規(guī)模與主觀幸福感——基于認(rèn)知主體異質(zhì)性的視角
內(nèi)鏡止血在急性非靜脈曲張性上消化道出血治療中的應(yīng)用
眼內(nèi)鏡的噱頭
酶可提高家禽的胃腸道完整性和生產(chǎn)性能
胃腸道腫瘤患者行腹腔鏡手術(shù)治療的效果觀察
臨床常見革蘭陰性菌異質(zhì)性耐藥研究進(jìn)展
基于可持續(xù)發(fā)展的異質(zhì)性債務(wù)治理與制度完善
一種用于內(nèi)鏡干燥的酒精收集器的設(shè)計與應(yīng)用
分析比較經(jīng)耳內(nèi)鏡鼓膜切開與耳內(nèi)鏡鼓膜穿刺治療分泌性中耳炎的療效
石景山区| 凉城县| 衡东县| 阿坝| 酒泉市| 中山市| 锡林浩特市| 灌南县| 金塔县| 德化县| 达日县| 晋城| 湘潭市| 申扎县| 大兴区| 鱼台县| 西畴县| 镇沅| 佛坪县| 德昌县| 宁远县| 辉县市| 盐城市| 旬邑县| 伊川县| 曲沃县| 册亨县| 锡林郭勒盟| 米泉市| 安义县| 金昌市| 仙游县| 宣汉县| 高阳县| 安福县| 紫阳县| 清苑县| 新昌县| 淄博市| 赣榆县| 新河县|