国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)算法建立胎母輸血綜合征預(yù)測(cè)模型*

2022-08-22 06:19范可欣朱鵬匯王云王勇軍張寧潔
臨床輸血與檢驗(yàn) 2022年4期
關(guān)鍵詞:胎兒變量孕婦

范可欣 朱鵬匯 王云 王勇軍 張寧潔

胎母輸血綜合征(fetomaternal hemorrhage syndrome,F(xiàn)MH)是指一定量的胎兒紅細(xì)胞經(jīng)由破損的胎盤絨毛間隙進(jìn)入母體血循環(huán),造成胎兒不同程度的失血及母親和胎兒溶血性反應(yīng)的臨床癥候群[1]。嚴(yán)重的FMH可以造成新生兒嚴(yán)重貧血、胎兒非免疫性水腫等不良圍產(chǎn)期結(jié)局,甚至危及胎兒生命,其占死產(chǎn)原因的14%[2]。然而,大多數(shù)情況下胎兒出血為持續(xù)發(fā)生且量較小,因此臨床癥狀不典型、起病隱匿,臨床醫(yī)生普遍缺乏對(duì)該疾病的認(rèn)識(shí),從而導(dǎo)致早期宮內(nèi)診斷困難[3],通常于不良孕產(chǎn)結(jié)局發(fā)生后才得到確診。目前臨床上尚無(wú)有效的預(yù)測(cè)FMH發(fā)生風(fēng)險(xiǎn)的手段。近年來(lái),人工智能方法在醫(yī)學(xué)領(lǐng)域發(fā)展迅速,利用機(jī)器學(xué)習(xí)算法建立精準(zhǔn)的預(yù)測(cè)模型也已開始廣泛應(yīng)用于醫(yī)學(xué)領(lǐng)域,為我們探究各種疾病、發(fā)掘新的研究角度提供了新的技術(shù)手段[4-6]。本研究擬基于機(jī)器學(xué)習(xí)算法構(gòu)建FMH預(yù)測(cè)模型,旨在輔助臨床診療中盡早識(shí)別診斷FMH并有效干預(yù)治療。

材料與方法

1 數(shù)據(jù)資料 本研究納入2019年6月~2020年12月于中南大學(xué)湘雅二醫(yī)院產(chǎn)科進(jìn)行產(chǎn)檢的孕婦總共1933名。納入標(biāo)準(zhǔn)為:孕周在6~42周(孕早期:6~12周;孕中期:13~27周;孕晚期:28~42周)在我院進(jìn)行產(chǎn)檢,并獲得知情同意的孕婦(倫理批件編號(hào):20191009)。排除標(biāo)準(zhǔn):1)存在嚴(yán)重貧血、鐮刀細(xì)胞性貧血、遺傳性胎兒血紅蛋白持續(xù)存在癥、珠蛋白生成障礙性貧血的孕婦;2)由于非病理性原因終止妊娠的孕婦;3)未在我院生產(chǎn)的孕婦;4)可查閱的相關(guān)資料記錄不完整的孕婦。相關(guān)定義:1)FMH:經(jīng)過改良Kleihauer-Betke(K-B)試驗(yàn)[7]估算胎兒失血量超過2 mL的孕婦,即至少有2 mL胎兒紅細(xì)胞轉(zhuǎn)移到了母親血液循環(huán)的孕婦;2)大量胎母輸血:將胎母輸血量高于30 mL的患者定義為大量胎母輸血;3)產(chǎn)前血紅蛋白:是指該婦女分娩前48 h內(nèi)所測(cè)得的血紅蛋白水平。

2 數(shù)據(jù)收集 本研究收集了已知或推測(cè)可能與FMH發(fā)生相關(guān)的特征變量。主要包括孕產(chǎn)婦的一般情況(年齡、身高、體重、胎齡、懷孕次數(shù)、妊娠次數(shù)、流產(chǎn)次數(shù)、圍產(chǎn)期增加體重、單胎/雙胎、是否為體外人工受精、產(chǎn)時(shí)孕周)、產(chǎn)前檢查情況(孕婦血紅蛋白水平、孕婦ABO血型、孕婦Rh血型、孕婦血小板抗體檢測(cè)、孕婦甲胎蛋白水平、孕婦血紅蛋白F(HbF)水平、孕婦血清炎癥細(xì)胞因子水平(IL-2、IL-4、IL-6、IL-10、TNF-α、IL-17A)、胎盤分級(jí)、羊水指數(shù)、臍動(dòng)脈阻力、胎心監(jiān)護(hù)情況)、孕婦合并癥及并發(fā)癥(疤痕子宮、妊娠期糖尿病、妊娠期高血壓、妊娠合并子宮肌瘤、妊娠合并貧血、胎膜早破、前置胎盤、是否存在生殖道感染)、產(chǎn)婦分娩情況(生產(chǎn)方式、產(chǎn)時(shí)出血)、圍產(chǎn)兒結(jié)局(Apgar'1分鐘評(píng)分、Apgar'5分鐘評(píng)分)等。

3 FMH實(shí)驗(yàn)室診斷檢測(cè) 隨機(jī)收集2019年6月~2020年12月來(lái)醫(yī)院做產(chǎn)檢的孕婦EDTA抗凝全血標(biāo)本利用改良版的K-B試驗(yàn)進(jìn)行初篩,取收集到的EDTA抗凝全血制作血涂片,選取成年男性抗凝全血標(biāo)本作為陰性對(duì)照,取同型臍帶血作為陽(yáng)性對(duì)照。并進(jìn)一步估算胎兒失血量。初篩陽(yáng)性的孕婦血樣采用流式細(xì)胞術(shù)進(jìn)行驗(yàn)證[8]。流式細(xì)胞術(shù)所用FITC-抗HbF單克隆抗體試劑盒購(gòu)自美國(guó)Invitrogen公司,流式細(xì)胞分析儀FACSCalibur購(gòu)自美國(guó)BD公司。

4 預(yù)測(cè)模型的建立 本研究通過對(duì)患者數(shù)據(jù)進(jìn)行收集構(gòu)建數(shù)據(jù)集,并對(duì)數(shù)據(jù)進(jìn)行清洗,剔除離群值,對(duì)于缺失值多使用多重插補(bǔ)進(jìn)行估算,而對(duì)于缺失比例過高的特征變量,為了不影響模型結(jié)果判斷予以剔除。本研究主要使用遞歸特征消除法(recursive feature elimination,RFE)對(duì)FMH預(yù)測(cè)中的關(guān)鍵特征變量進(jìn)行篩選。

為了能夠更好地構(gòu)建、驗(yàn)證模型,本研究將所收集到的數(shù)據(jù)隨機(jī)分成訓(xùn)練集(70%)和測(cè)試集(30%)。在訓(xùn)練集中采用RFE篩選出的特征變量,采用包括了極端梯度提升決策樹(eXtreme Gradient Boosting,XGBoost)模型[9]、梯度提升決策樹(gradient boosting decision tree,GBDT)模型[10]、隨機(jī)森林模型(random forest,RF)[11]、K近鄰算法模型(k-nearest neighbor,KNN)[12]、自適應(yīng)提升算法模型(adaptive boosting,Adaboost)[13]、樸素貝葉斯模型(naive bayes,NB)[14]、支持向量機(jī)模型(support vector machine,SVM)[15]、多層感知器模型(multi-layer perceptron,MLP)[16]以及邏輯回歸模型(logistic regression,LR)等9種方法來(lái)構(gòu)建模型,并對(duì)所構(gòu)建的模型性能進(jìn)行對(duì)比。由于部分模型不能自動(dòng)處理缺失值,因此,我們使用多重插補(bǔ)的方法來(lái)對(duì)缺失值進(jìn)行填補(bǔ)。

5 統(tǒng)計(jì)學(xué)分析 本研究中的實(shí)驗(yàn)數(shù)據(jù)主要運(yùn)用SPSS 25.0、Python 3.6進(jìn)行統(tǒng)計(jì)分析:1)服從正態(tài)分布的計(jì)量資料用平均值±標(biāo)準(zhǔn)差(mean±SD)表示,采用t檢驗(yàn)進(jìn)行組間比較;2)不服從正態(tài)分布的計(jì)量資料采用中位數(shù)±四分位數(shù)表示,采用Mann-Whitney U非參數(shù)檢驗(yàn)進(jìn)行組間比較;3)計(jì)數(shù)資料使用頻數(shù)(%)來(lái)表示,卡方檢驗(yàn)或Fisher確切概率法用于組間比較(P<0.05即差異為具有統(tǒng)計(jì)學(xué)意義)。機(jī)器學(xué)習(xí)預(yù)測(cè)模型采用Python軟件包進(jìn)行建模,十折交叉驗(yàn)證主要用于模型效能驗(yàn)證,評(píng)價(jià)指標(biāo)選擇受試者工作特征曲線下的面積(AUC),其面積越大,則表明模型的預(yù)測(cè)效能更好。

結(jié)果

1 臨床資料 本研究納入2019~2020年在中南大學(xué)湘雅二醫(yī)院進(jìn)行產(chǎn)檢的1933名孕婦血液進(jìn)行K-B試驗(yàn)檢測(cè),排除患有相關(guān)血液疾病、未在我院分娩的181名孕婦后,最終納入1752名孕婦資料進(jìn)行分析(圖1所示)。

圖1 納入排除標(biāo)準(zhǔn)流程圖

2 胎母輸血預(yù)測(cè)模型構(gòu)建 研究中將1226名(70%)孕婦的數(shù)據(jù)作為訓(xùn)練集進(jìn)行模型構(gòu)建,526(30%)名孕婦的數(shù)據(jù)作為驗(yàn)證集。在訓(xùn)練組中,128名(10.44%)孕婦在圍產(chǎn)期發(fā)生了FMH,1098名孕婦沒有發(fā)生FMH。在驗(yàn)證組中,54名(10.27%)孕婦在圍產(chǎn)期發(fā)生了FMH,472名孕婦沒有發(fā)生FMH。根據(jù)表1不難發(fā)現(xiàn),各特征變量在訓(xùn)練集和測(cè)試集中的分布均不具有統(tǒng)計(jì)學(xué)差異。

表1 胎母輸血綜合征預(yù)測(cè)模型訓(xùn)練集、測(cè)試集數(shù)據(jù)分布比較

續(xù)表1

3 胎母輸血預(yù)測(cè)模型性能比較 納入所采集特征指標(biāo)(表1)及回歸分析所得的危險(xiǎn)因素(高齡、雙胎妊娠、懷孕次數(shù)更多、妊娠伴有子宮肌瘤、行人工體外受精、胎兒生長(zhǎng)受限、妊娠伴子癇前期),運(yùn)用RFE再次對(duì)特征變量進(jìn)行篩選,分別采用8種機(jī)器學(xué)習(xí)算法和傳統(tǒng)邏輯回歸模型對(duì)孕婦是否在圍產(chǎn)期發(fā)生胎母輸血進(jìn)行預(yù)測(cè)。其模型性能效果如圖所示,通過十折交叉驗(yàn)證對(duì)其分別進(jìn)行驗(yàn)證,發(fā)現(xiàn)XGBoost模型表現(xiàn)出明顯的預(yù)測(cè)優(yōu)勢(shì),其測(cè)試集AUC為0.808,準(zhǔn)確率達(dá)0.76。其性能明顯優(yōu)于AUC僅為0.681的傳統(tǒng)邏輯回歸模型和其他7個(gè)機(jī)器學(xué)習(xí)模型(如圖2)。

圖2 構(gòu)建的9種預(yù)測(cè)模型AUC比較

模型性能結(jié)果比較詳見表2,根據(jù)約登指數(shù),建議模型XGBoost的最佳預(yù)測(cè)概率臨界值為0.74,靈敏度和特異度分別為0.75和0.80。邏輯回歸模型LR的最佳cutoff值為0.74,其靈敏度僅為0.55,特異度為0.76。

表2 九種模型預(yù)測(cè)性能比較

討論

由于缺少特異性的診斷標(biāo)準(zhǔn),F(xiàn)MH的早期診斷十分困難,因此常被臨床醫(yī)生所忽視。臨床上常常是出現(xiàn)胎兒宮內(nèi)生長(zhǎng)受限、水腫甚至死胎后,才得到診斷。隨著人工智能技術(shù)在醫(yī)療領(lǐng)域的廣泛使用,基于機(jī)器學(xué)習(xí)算法建立精確的預(yù)測(cè)模型已廣泛應(yīng)用于心臟手術(shù)、骨科、兒科等領(lǐng)域,CHEN等[6]基于機(jī)器學(xué)習(xí)算法和生存分析相結(jié)合建立對(duì)IgA腎病結(jié)局進(jìn)行預(yù)測(cè)的模型;AL'AREF等[17]利用機(jī)器學(xué)習(xí)算法不僅挖掘出了接受經(jīng)皮冠狀動(dòng)脈介入治療患者相關(guān)危險(xiǎn)因素中的一些新聯(lián)系,而且還實(shí)現(xiàn)了對(duì)該類患者住院死亡率的預(yù)測(cè);JO等[18]使用梯度提升機(jī)算法建立了全膝關(guān)節(jié)置換術(shù)后輸血的預(yù)測(cè)模型,顯示出良好的預(yù)測(cè)性能。該技術(shù)具有高效、高精準(zhǔn)性、能夠有效挖掘隱藏在海量數(shù)據(jù)中隱藏關(guān)系等特點(diǎn)。能夠直接應(yīng)用于個(gè)體是機(jī)器學(xué)習(xí)的一大優(yōu)點(diǎn),特別是在處理像醫(yī)療問題這樣的復(fù)雜的大數(shù)據(jù)時(shí),它比傳統(tǒng)的統(tǒng)計(jì)學(xué)方法有更多的優(yōu)勢(shì),其不僅能從多個(gè)數(shù)據(jù)模塊中進(jìn)行學(xué)習(xí),有效地識(shí)別與患者結(jié)局相關(guān)的變量、準(zhǔn)確地預(yù)測(cè)相關(guān)危險(xiǎn)因素、從復(fù)雜的數(shù)據(jù)中探索規(guī)律并建立數(shù)學(xué)模型,而且,還可以在驗(yàn)證的過程中具有反復(fù)校正的能力[19]。

本研究納入2019~2020年在中南大學(xué)湘雅二醫(yī)院進(jìn)行產(chǎn)檢的1933名孕婦血液進(jìn)行K-B試驗(yàn)檢測(cè),排除患有相關(guān)血液疾病、未在我院分娩的181名孕婦后,最終納入1752名孕婦資料進(jìn)行分析。隨后通過對(duì)患者數(shù)據(jù)進(jìn)行數(shù)據(jù)集構(gòu)建,并對(duì)數(shù)據(jù)進(jìn)行清洗,剔除離群值,對(duì)于缺失值多使用多重插補(bǔ)進(jìn)行估算,而對(duì)于缺失比例過高的特征變量,為了不影響模型結(jié)果判斷予以剔除。由于在機(jī)器學(xué)習(xí)中不同特征變量對(duì)于結(jié)果的影響存在差異,因此,為了提升模型的精確性、降低模型的復(fù)雜性,需要針對(duì)與預(yù)測(cè)結(jié)局相關(guān)的特征進(jìn)行篩選。本研究主要使用RFE對(duì)FMH預(yù)測(cè)中的關(guān)鍵特征變量進(jìn)行篩選,最終得到年齡、體重、羊水指數(shù)等特征變量,隨后將1226名(70%)孕婦的數(shù)據(jù)作為訓(xùn)練集進(jìn)行模型構(gòu)建,526(30%)名孕婦的數(shù)據(jù)作為驗(yàn)證集。在訓(xùn)練集中采用RFE篩選出的特征變量,采用包括了XGBoost模型在內(nèi)的9種方法來(lái)構(gòu)建“胎母輸血綜合征預(yù)測(cè)模型”,并對(duì)所構(gòu)建模型的性能進(jìn)行對(duì)比。由于部分模型不能自動(dòng)處理缺失值,因此,我們使用多重插補(bǔ)的方法來(lái)對(duì)缺失值進(jìn)行填補(bǔ)。通過十折交叉驗(yàn)證對(duì)9種方法分別進(jìn)行驗(yàn)證,發(fā)現(xiàn)XGBoost模型表現(xiàn)出明顯的預(yù)測(cè)優(yōu)勢(shì),其測(cè)試集AUC為0.808,準(zhǔn)確率達(dá)0.760。其性能明顯優(yōu)于AUC僅為0.681的傳統(tǒng)邏輯回歸模型和其他7個(gè)機(jī)器學(xué)習(xí)模型。

本研究發(fā)現(xiàn)所建立的XGBoost模型具有較強(qiáng)的區(qū)分性,預(yù)測(cè)性能好,表現(xiàn)出令人滿意的特異性和敏感性。該模型的成功建立,我們后續(xù)可以利用所構(gòu)建的模型,映射到可視化網(wǎng)頁(yè),醫(yī)生僅需要通過網(wǎng)頁(yè)輸入孕婦相關(guān)信息,便可得到其是否有發(fā)生FMH的風(fēng)險(xiǎn),從而及時(shí)幫助臨床醫(yī)生識(shí)別高危人群,減少漏診的風(fēng)險(xiǎn)。此外,還可以針對(duì)不同孕婦的孕周和疾病嚴(yán)重程度對(duì)其制定個(gè)體化診療方案,盡早對(duì)患者進(jìn)行救治,從而改善胎兒不良妊娠結(jié)局。

本研究尚存在一定的局限性,首先,本研究?jī)H對(duì)單中心數(shù)據(jù)進(jìn)行研究分析,所建立的模型并不具備普適性,有必要擴(kuò)大樣本量、納入其他中心的數(shù)據(jù)對(duì)模型進(jìn)行完善。總之,本研究運(yùn)用8種機(jī)器學(xué)習(xí)算法和傳統(tǒng)邏輯回歸模型構(gòu)建了預(yù)測(cè)孕婦圍產(chǎn)期是否發(fā)生FMH的模型,并分別對(duì)其性能進(jìn)行了比較,從而挑選出一款綜合預(yù)測(cè)性能最佳的模型,探索FMH的早期預(yù)測(cè)方法,對(duì)FMH的早期臨床診斷和早期干預(yù)具有積極意義。

利益沖突所有作者均聲明不存在利益沖突

猜你喜歡
胎兒變量孕婦
產(chǎn)前超聲診斷胎兒雙主動(dòng)弓1例
胎兒三維超聲科普知識(shí)
妊娠劇吐如何進(jìn)行飲食及心理護(hù)理
這些孕婦任性有理
收拾行李
分離變量法:常見的通性通法
不可忽視變量的離散與連續(xù)
輕松把握變量之間的關(guān)系
變中抓“不變量”等7則
警惕孕婦缺乏維生素B6
赞皇县| 寿光市| 永州市| 崇义县| 金华市| 吴堡县| 南乐县| 赤城县| 大丰市| 郁南县| 育儿| 铜山县| 怀宁县| 濮阳市| 珠海市| 会同县| 西峡县| 清丰县| 丰城市| 砀山县| 历史| 都江堰市| 班玛县| 合水县| 兴宁市| 太仓市| 隆德县| 深圳市| 抚宁县| 湘乡市| 屯门区| 句容市| 兴仁县| 黄浦区| 西畴县| 卢龙县| 乌兰察布市| 灵山县| 百色市| 咸丰县| 深圳市|