王 萌,弭博巖,鄭 奮
(海軍軍醫(yī)大學(xué) 衛(wèi)生勤務(wù)學(xué)系 計(jì)算機(jī)與仿真技術(shù)教研室,上海200433)
近年來(lái),隨著人工智能技術(shù)的蓬勃發(fā)展,其在醫(yī)療衛(wèi)生領(lǐng)域逐漸占據(jù)重要的地位,已在并發(fā)癥預(yù)測(cè)、康復(fù)護(hù)理、疾病管理等方向得到廣泛應(yīng)用。胎兒健康監(jiān)測(cè)是評(píng)估胎兒健康狀況、及時(shí)識(shí)別胎兒潛在健康危險(xiǎn)及降低產(chǎn)婦妊娠意外的有效手段,但由于監(jiān)測(cè)項(xiàng)目及參數(shù)在時(shí)域、形態(tài)學(xué)等方面指標(biāo)眾多,如非經(jīng)過(guò)專業(yè)培訓(xùn)且經(jīng)驗(yàn)豐富的醫(yī)生,在進(jìn)行判讀時(shí)容易受到主觀因素的影響,從而引發(fā)誤診漏診。人工智能技術(shù)能摒棄主觀因素影響,從海量數(shù)據(jù)中自動(dòng)化提取出計(jì)算機(jī)可識(shí)別的病理特征,從而構(gòu)建出穩(wěn)健、可靠的模型[1],為構(gòu)建靈敏、準(zhǔn)確、方便地監(jiān)測(cè)胎兒健康狀況提供可能,人工智能技術(shù)與胎兒健康監(jiān)測(cè)領(lǐng)域相結(jié)合已成為數(shù)字醫(yī)學(xué)的重要發(fā)展趨勢(shì)之一。
人工智能技術(shù)是指使計(jì)算機(jī)對(duì)人的思維過(guò)程和行為進(jìn)行模擬,從而實(shí)現(xiàn)自動(dòng)化從海量數(shù)據(jù)中獲取并分析有價(jià)值的信息。人工智能技術(shù)的引入在目前在我國(guó)的醫(yī)療健康行業(yè)中已在逐漸發(fā)展和完善[2],并已初具使用效果。人工智能技術(shù)的很多重要分支在胎兒健康監(jiān)測(cè)領(lǐng)域中都有著很高的應(yīng)用前景,主要利用了機(jī)器學(xué)習(xí)[3]、深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)[4]等多種技術(shù)。
宮內(nèi)窘迫是胎兒在宮內(nèi)的缺氧征象,嚴(yán)重會(huì)危及胎兒生命。電子胎心監(jiān)護(hù)[5]是臨床應(yīng)用最廣泛的判別胎兒宮內(nèi)窘迫的常用方法之一。在實(shí)際應(yīng)用中,由于監(jiān)測(cè)信號(hào)的復(fù)雜多樣,致使人工判讀結(jié)果效率低、效果易產(chǎn)生偏差,因此已有眾多學(xué)者利用機(jī)器學(xué)習(xí)算法從胎心監(jiān)護(hù)參數(shù)中提取特征并進(jìn)行模型訓(xùn)練。
2.1 模型評(píng)估方式
為直觀反映各機(jī)器學(xué)習(xí)模型的分類性能,通常以模型預(yù)測(cè)結(jié)果的分類歸屬[6]為基礎(chǔ),計(jì)算出的準(zhǔn)確率、精確率、召回率、特異度來(lái)對(duì)模型進(jìn)行評(píng)價(jià)。準(zhǔn)確率是模型預(yù)測(cè)每個(gè)類別正確的樣本所占的比例大小;精確率是所有預(yù)測(cè)結(jié)果為每類的樣本中預(yù)測(cè)正確的樣本所占的比例,召回率是每個(gè)類別真實(shí)結(jié)果為該類樣本中預(yù)測(cè)結(jié)果正確的樣本比例,特異度是將負(fù)樣本識(shí)別正確占所有負(fù)樣本的比例。以上四個(gè)指標(biāo)均為越大效果越好。
2.2 算法概述
Hoodbhoy[7]等以加利福尼亞大學(xué)歐文機(jī)器學(xué)習(xí)庫(kù)中的胎心監(jiān)護(hù)圖數(shù)據(jù)進(jìn)行模型訓(xùn)練,運(yùn)用極端梯度提升樹(Extreme Gradient Boosting,XGBoost)算法得到最優(yōu)判別結(jié)果。聶磊[8]以同一數(shù)據(jù)集進(jìn)行模型訓(xùn)練,將五種機(jī)器學(xué)習(xí)模型進(jìn)行對(duì)比,提出的集成算法(Stacking)為最優(yōu)方案。曾冬洲等[9]以福建省某醫(yī)院的脫敏臨床數(shù)據(jù)進(jìn)行訓(xùn)練,將應(yīng)用梯度提升決策樹和邏輯回歸相融合(gradient boosting decision tree-logistic regression,GBDT-LR),設(shè)計(jì)了預(yù)診斷模型,融合后的模型較單個(gè)模型的預(yù)測(cè)效果有顯著提升。郝婧宇等[10]以波爾圖大學(xué)公開(kāi)的葡萄牙孕婦胎心監(jiān)護(hù)數(shù)據(jù)進(jìn)行模型訓(xùn)練,提出了一種運(yùn)用五層堆疊(Stacking-5)模型融合的方法,相較于融合前檢測(cè)效果大幅度提升。以上算法對(duì)比如表1所示。
表1 評(píng)價(jià)指標(biāo)對(duì)比
胎兒畸形雖不會(huì)對(duì)胎兒造成致命傷害,但難以預(yù)測(cè)出生后的影響,一些嚴(yán)重疾病會(huì)給家庭造成很大負(fù)擔(dān)[11]。超聲檢測(cè)[12]是判斷畸形的常用手段,但由于畸形種類較多,成因繁雜,致使手動(dòng)測(cè)量效率低下,且漏診現(xiàn)象較為常見(jiàn)。運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)結(jié)合超聲信號(hào)進(jìn)行胎兒畸形篩查的方式已成為研究熱點(diǎn)。
Zhang等[13]提出一種基于監(jiān)督文本的精確分割方法自動(dòng)化測(cè)量胎兒頭部和股骨,平均精度為96.85%、84.37%。Matthew等[14]運(yùn)用全卷積網(wǎng)絡(luò)來(lái)測(cè)量胎兒頭圍和雙頂徑值,該模型的表現(xiàn)水平與專家相似。李志昂等[15]對(duì)圖像分割領(lǐng)域U-NET[16]結(jié)構(gòu)進(jìn)行改進(jìn),引入擴(kuò)張卷積模塊,提出一種對(duì)胎兒的腹圍、股骨長(zhǎng)以及頭臀徑等參數(shù)進(jìn)行測(cè)量的方法(D-UNET),模型測(cè)量值幾乎等同于醫(yī)生手工標(biāo)注的標(biāo)準(zhǔn)測(cè)量值,精度較高。汪金婷等[17]將U-NET與目標(biāo)檢測(cè)模型YOLOv3[18]相結(jié)合并進(jìn)行改進(jìn),最終模型Dice系數(shù)、豪斯多夫距離和頭圍絕對(duì)差值分別為97.81±1.41、1.32±0.86、2.02±1.97,能克服干擾,提高胎兒頭圍測(cè)量精度。
近年來(lái),我國(guó)胎兒巨大兒的發(fā)生率逐年升高[19]。巨大兒易增加產(chǎn)婦產(chǎn)傷及母嬰并發(fā)癥風(fēng)險(xiǎn)[20]。我國(guó)估測(cè)新生兒體重的常用手段為超聲信號(hào)結(jié)合Hadlock公式[21],但對(duì)于巨大兒的預(yù)測(cè)精度有很大提升空間。
李昆等[22]運(yùn)用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)模型構(gòu)建,最終將預(yù)測(cè)體重誤差控制在100 g到500 g之間,能夠減少嚴(yán)重的預(yù)測(cè)失誤。董蓉蓉等[23]利用新生兒出生體質(zhì)量及超聲測(cè)量數(shù)據(jù)分別進(jìn)行多元線性回歸計(jì)算、機(jī)器學(xué)習(xí)模型訓(xùn)練,并與Hadlock公式預(yù)測(cè)結(jié)果進(jìn)行比較,提出的多元線性回歸方法將預(yù)測(cè)的正確率提升8.63%,靈敏度提升19.36%,機(jī)器學(xué)習(xí)算法將預(yù)測(cè)正確率平均提升14.42%,靈敏度平均提升44.09%。Ye等[24]運(yùn)用機(jī)器學(xué)習(xí)中的集成方法結(jié)合多個(gè)模型,提高了胎兒體重預(yù)測(cè)精度。張碩彥等[25]在長(zhǎng)短期記憶網(wǎng)絡(luò)的基礎(chǔ)上提出一種變長(zhǎng)時(shí)間間隔的模型,使預(yù)測(cè)平均相對(duì)誤差下降0.65%。
人工智能技術(shù)在胎兒健康監(jiān)測(cè)領(lǐng)域有著廣闊的發(fā)展前景。相較于傳統(tǒng)、手工的監(jiān)測(cè)方式,人工智能技術(shù)的引入能在眾多方面提升胎兒健康監(jiān)測(cè)效能。但結(jié)合實(shí)際應(yīng)用需求進(jìn)行分析,在算法設(shè)計(jì)、統(tǒng)一評(píng)價(jià)指標(biāo)、臨床實(shí)踐驗(yàn)證三方面還存在提升空間。
由于模型訓(xùn)練需要大量數(shù)據(jù),可用數(shù)據(jù)量過(guò)少、噪聲數(shù)據(jù)過(guò)多從而產(chǎn)生的訓(xùn)練過(guò)擬合現(xiàn)象是需要克服的。此外,部分算法雖相較于傳統(tǒng)算法有所提高,但與同領(lǐng)域?qū)<医淌诘淖R(shí)別結(jié)果相比還有所差距,提升算法精度工作仍應(yīng)繼續(xù)。
對(duì)于同一研究方向的算法而言,設(shè)計(jì)過(guò)程與實(shí)際臨床之間的評(píng)價(jià)指標(biāo)無(wú)法統(tǒng)一,在分析多個(gè)算法之間的優(yōu)劣時(shí)難以進(jìn)行對(duì)比,因此統(tǒng)一評(píng)價(jià)指標(biāo)對(duì)于分析與提升算法效能而言有著重要意義。
部分算法雖運(yùn)用測(cè)試集檢測(cè)效果優(yōu)越,但缺乏臨床的實(shí)踐驗(yàn)證,難以進(jìn)行廣泛推廣及應(yīng)用。
因此,廣大科研工作者應(yīng)繼續(xù)推進(jìn)人工智能技術(shù)與醫(yī)學(xué)領(lǐng)域的結(jié)合,不斷優(yōu)化算法、調(diào)整參數(shù),進(jìn)一步提升模型性能,推進(jìn)臨床應(yīng)用,以推動(dòng)數(shù)字醫(yī)學(xué)的蓬勃發(fā)展。