国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機器學習預測模型探究薄型子宮內膜患者接受IVF/ICSI-ET 治療的早期流產風險因素

2024-01-01 00:00:00胡馨月胡瑜凌呂興鈺丁裕斌李恬鐘朝暉唐曉君
重慶醫(yī)科大學學報 2024年4期
關鍵詞:機器學習

【摘 要】目的:基于多種機器學習方法,探討薄子宮內膜患者在新鮮胚胎移植中發(fā)生早期流產的影響因素,并建立預測模型,為預防薄子宮內膜患者在進行新鮮胚胎移植中發(fā)生早期流產提供合理的指導思路。方法:納入了首次進行新鮮胚胎移植的薄子宮內膜患者1153例,通過LASSO回歸和隨機森林遞歸特征消除(recursive feature elimination,RFE)篩選特征,建立6種機器學習模型,通過交叉驗證、準確度、敏感性、召回率、f1值、ROC曲線下面積及校準曲線比較不同模型的性能。SHAP圖用于解釋影響早期流產的因素。結果:通過LASSO回歸和隨機森林RFE篩選出29個特征變量納入六種機器學習模型,其中多層感知機模型對早期流產的區(qū)分度最佳,ROC曲線下面積為0.803(95%CI=0.772~0.834)。隨機森林、XGBoost和AdaBoost模型的ROC曲線下面積都高于0.7。結論:開發(fā)了薄子宮內膜患者在新鮮胚胎移植中是否發(fā)生早期流產的機器學習預測模型,各種評價指標的驗證表明該模型的性能良好,有助于臨床醫(yī)生對該人群患者的早期診斷,為未來改善早期流產高危患者的妊娠結局提供指導思路。

【關鍵詞】機器學習;早期流產;薄子宮內膜;新鮮胚胎移植

【中圖分類號】R714.8 【文獻標志碼】A 【收稿日期】2023-11-29

近年來,輔助生殖技術(assisted reproductivetechnology,ART)尤其是IVF/ICSI-ET被廣泛應用于治療不孕不育患者,新鮮胚胎移植是ART最常用的治療方法之一[1-2]。與冷凍胚胎移植相比,新鮮胚胎移植不需要解凍過程,可避免解凍后的胚胎質量下降,減少了對胚胎的潛在影響。對于薄子宮內膜目前尚無統(tǒng)一的定義,通常認為HCG日子宮內膜厚度(endometrial thickness,EMT)lt;8 mm 或黃體酮日EMTlt;9 mm是薄子宮內膜[3]。大部分子宮內膜偏薄的患者,在新鮮胚胎移植中通常取消周期或進行冷凍胚胎移植[4],這會導致治療過程延長,給患者造成心理負擔,增加治療成本[5]。并且有一些研究表明EMT并不會在隨后的冷凍胚胎移植周期中得到改善[6-8],還有一些研究發(fā)現(xiàn)在凍融胚胎移植中,EMT對妊娠的預測能力較低[9-10],部分研究也認為EMT與妊娠結局之間沒有關聯(lián)[11- 12]。這些研究認為,因為子宮內膜偏薄而取消胚胎移植或改為冷凍胚胎移植是不合理的,薄子宮內膜患者仍然有很大概率在新鮮胚胎移植中實現(xiàn)活產[13]。盡管已有一些文獻對造成早期流產的原因進行探索[14-15],但薄子宮內膜的患者在新鮮胚胎移植后發(fā)生早期流產的確切因素尚不清楚[16]。

機器學習已被用于為診斷、預測預后和解釋醫(yī)學圖像[17]。與傳統(tǒng)的預測方法相比,基于機器學習的方法有助于建立更精確和準確的預測模型[18]。本研究采用機器學習方法,首次對薄子宮內膜患者在新鮮胚胎移植中發(fā)生早期流產的影響因素進行探究,構建預測模型,并通過SHAP 圖對影響因素進行解釋,補充了機器學習模型在可解釋性方面的不足,有助于指導臨床醫(yī)生對該類型患者的早期干預。

1 資料與方法

1.1 數(shù)據收集

回顧性收集了2018年1月至2022年9月在某醫(yī)院生殖中心進行首次新鮮胚胎移植(IVF/ICSI)的薄子宮內膜患者共計1 153例。

納入標準:①首次進行IVF/ICSI周期的患者;②HCG日EMT≤8 mm;排除標準:①染色體異常的夫婦;②患有子宮畸形、未經治療的黏膜下子宮肌瘤或子宮內膜息肉的患者;③未獲得成熟卵母細胞或可用胚胎而取消的周期;④由于社會或個人原因而取消的周期;⑤使用供體胚胎移植的患者;⑥植入前基因檢測周期;⑦雙胎妊娠、異位妊娠、死產的周期。

對于符合標準的患者,收集基本臨床數(shù)據,包括以下內容:①人口統(tǒng)計學信息(如年齡、體質指數(shù)、不孕年限、不孕因素、孕次、產次等);②實驗室檢查結果[如基礎卵泡刺激素(FSH)、黃體生成素(LH)和雌二醇(E2)等激素水平以及精子存活率、正常形態(tài)率等];③治療過程(如GN用量、移植胚胎數(shù)量、移植胚胎類型等)。特征變量中缺失值大于20%的特征被過濾,其余變量通過多重插補和隨機森林填補法進行填充。早期流產定義為在妊娠12周內發(fā)生的流產。

1.2 統(tǒng)計方法

使用Python3.9、R4.3.2和SPSS 26.0軟件進行分析。使用t 檢驗或Mann-Whitney U 檢驗比較連續(xù)變量,使用卡方檢驗比較分類變量。連續(xù)數(shù)據用平均值±標準差或中位數(shù)描述,分類數(shù)據用頻率或百分比描述。檢驗水準α=0.05。本研究以7∶3的比例隨機分為訓練集和測試集。采用LASSO回歸結合隨機森林遞歸特征消除(RFE)篩選預測因子,以提高預測的準確度,使模型的可解釋性更強。邏輯回歸是最常見的用于分類的線性模型。決策樹通過樹形結構將數(shù)據集分割成多個子集,每個葉節(jié)點代表一個類別或者一個數(shù)值。隨機森林通過構建多個決策樹并且綜合它們的預測結果來提高分類或者回歸的準確性與泛化能力。XGBoost通過優(yōu)化損失函數(shù)并引入正則化項來提高模型的泛化能力與效率。AdaBoost訓練一系列弱分類器,并加權組合其預測結果以提高整體模型的性能。多層感知機是一種人工神經網絡模型,由多個神經元層組成,每一層都與下一層全連接,通過反向傳播算法進行訓練,適用于復雜的非線性模式識別問題。為了獲得最佳的預測性能,使用6種機器學習算法對模型進行構建和訓練,包括邏輯回歸、決策樹、隨機森林、XGBoost、AdaBoost和多層感知機,通過網格搜索、隨機搜索和貝葉斯優(yōu)化的方法尋找最佳超參數(shù)組合。通過準確率、特異性、召回率、F1值和ROC曲線下的面積量化模型對早期流產和持續(xù)妊娠事件的區(qū)分能力;校準曲線用于評估預測模型預測概率與樣本概率之間的一致性。統(tǒng)計分析及模型建立具體流程圖如圖1所示。

2 結果

2.1 患者基本情況

本研究共納入1 153例患者。早期流產組的患者和持續(xù)妊娠組的患者特征的比較如表1所示。其中年齡、BMI、基礎E2、AST/SLT、HBSAB、HCG日P、禁欲天數(shù)、GV數(shù)量、移植胚胎個數(shù)的組間差異具有統(tǒng)計學意義(Plt;0.05)。

2.2 預測因子的選擇

在特征選擇之前,對連續(xù)變量進行標準化,對離散變量進行獨熱編碼。采用隨機森林RFE方法,隨著特征數(shù)量增加,模型的準確率的變化如圖2所示。在特征數(shù)量達到46時,模型的準確率達到最高。圖3顯示了基于LASSO回歸的交叉驗證曲線。X軸表示正則化參數(shù)的范圍,Y軸表示均方誤差,模型達到最佳性能時對應的特征集合數(shù)量為49。最終選擇的特征集合如圖4,左圓表示LASSO 回歸選擇的特征,右圓表示隨機森林RFE選擇的特征,2者交集部分的特征數(shù)量為29,即最終考慮納入模型的特征集合。

2.3 預測模型的建立與驗證

篩選出來的預測因子被納入6種機器學習模型,為確保每個模型達到最佳性能,本研究對其超參數(shù)進行了進一步優(yōu)化,使用5倍交叉驗證評估模型的預測性能,模型在測試集上的具體表現(xiàn)見表2。如圖5所示,多層感知機模型的表現(xiàn)明顯優(yōu)于其他5個模型,ROC曲線下面積為0.803(95%CI=0.772~0.834),準確率為0.792,特異性為0.852,敏感性為0.701,F(xiàn)1值為0.727。隨機森林、XGBoost和AdaBoost模型的AUC值均大于0.7。

此外,本研究通過校準曲線對預測模型的效果做出評價。圖6表明實際概率與機器學習模型預測概率之間具有良好的預測一致性。

2.4 SHAP模型的可解釋性

多層感知機模型表現(xiàn)出最佳的預測能力,因此引入SHAP框架來解釋該模型。圖7列出了通過平均絕對SHAP值評估的前5個影響因素,依次是胚胎移植個數(shù)、基礎E2、啟動日LH、精子正常形態(tài)率和年齡。圖8說明了影響因素對早期流產風險的影響。y 軸表示影響因素的值,x 軸表示影響因素對發(fā)生早期流產的影響。雙胚胎移植、基礎E2水平較低、啟動日LH水平較高、精子正常形態(tài)率低以及年齡較高都會增加發(fā)生早期流產的風險。

3 討論

本研究基于機器學習方法,首次對新鮮胚胎移植中薄子宮內膜患者發(fā)生早期流產的影響因素進行探究,建立了6種機器學習預測模型,在區(qū)分該人群患者發(fā)生早期流產方面顯示出良好的預測性能,其中多層感知機模型性能最佳。該模型有助于臨床醫(yī)生對該人群患者的早期診斷,為未來改善早期流產高?;颊叩娜焉锝Y局提供指導思路。

特征數(shù)量較多的情況下,機器學習方法在處理特征之間的復雜關系方面明顯表現(xiàn)優(yōu)于傳統(tǒng)統(tǒng)計學方法[19],能夠識別到傳統(tǒng)經驗容易忽略的可能影響因素[20]。在預測因子選擇方面,采用了LASSO回歸和隨機森林RFE 2種方法,最終取得的交集來建立預測模型。在建立的6種機器學習模型里,多層感知機模型的性能最佳,AUC 為0.803(95%CI=0.772~0.834),準確率、敏感性、召回率和F1值分別為0.79、0.85、0.70、0.73。此外,隨機森林、XGBoost和AdaBoost模型的AUC都大于0.7。

為了進一步闡明本課題組的模型并確定預測變量的影響,對表現(xiàn)最佳的多層感知機模型應用了SHAP分析。每個SHAP值衡量每個特征對薄子宮內膜患者在新鮮胚胎移植中發(fā)生早期流產的正向或負向貢獻程度。在納入的預測因子中,胚胎移植數(shù)量對模型預測的貢獻最大,這可能表示在薄子宮內膜患者在新鮮胚胎移植后發(fā)生早期流產的影響因素中,最應該關注的是胚胎移植的數(shù)量,SHAP分析結果顯示移植2個胚胎會增加發(fā)生早期流產的風險。根據一些研究,盡管雙胎移植比單胎移植的妊娠率更高[21],但同時也增加了多胎妊娠及卵巢過度刺激綜合征風險。目前已有的研究和共識都表明雙胎移植會增加多胎妊娠和隨后妊娠并發(fā)癥的風險以及不良的圍產期結局[21-23]。已有大量研究表明雌激素水平和卵巢反應性及不良妊娠結局有關[24- 25]。在本研究中,基礎E2較低和啟動日LH較高都是薄子宮內膜患者在新鮮胚胎移植中發(fā)生早期流產的重要危險因素?;AE2較低和啟動日LH較高都可能提示與卵巢早衰有關[26-27]。卵巢儲備功能下降,導致卵子質量下降,從而增加早期流產的風險。精子形態(tài)正常通常表示精子遺傳物質是完整的,且精子中段的中心體在原核形成的過程中與星體形成、雄原核形成及原核融合有關[28],因此精子正常形態(tài)率高對提高臨床妊娠率有正向的影響。但目前很少有研究直接說明精子正常形態(tài)率和早期流產之間的關系,本研究表明精子正常形態(tài)率偏低可能會增加早期流產的風險。由于精子形態(tài)異常與精子頭部核蛋白組型轉換異常、染色質結構異常、DNA碎片增多有關,且染色質異常精子多表現(xiàn)為頭部形態(tài)異常,導致精子受精能力下降而發(fā)生早期流產的風險增加[29-31]。與先前的大部分研究一致,本研究表明年齡是早期流產的重要影響因素之一,高齡會增加早期流產的風險。主要原因可能與卵母細胞的質量隨年齡的增長而下降有關,卵母細胞中線粒體的顯著減少,可能導致胚胎非整倍體的風險增加[27]。移植前對胚胎進行植入前遺傳學篩查可能會降低非整倍體的可能性,從而降低該人群發(fā)生早期流產的風險,但目前該技術的安全性和風險尚有爭議[32]。

目前的研究還存在一些局限性。首先,本研究使用的數(shù)據來自單一中心,這使得模型可能不能很好地應用于其他機構的患者。其次,電子病歷中缺乏在治療過程中子宮內膜厚度的監(jiān)測數(shù)據,無法確定扳機日開始后的藥物作用是否改變了子宮內膜的厚度。此外,我們沒有對構建的預測模型進行外部驗證,因此模型的泛化性仍然不確定,需要進一步驗證。未來將收集足夠的外部驗證數(shù)據集,以進一步改進該模型。

本研究開發(fā)了6種機器學習模型來預測薄子宮內膜患者在新鮮胚胎移植后的早期流產,并取得了良好的評估準確性。該模型對于識別該人群中早期流產高風險病例、做出適當?shù)闹委煕Q策以及監(jiān)測進展可能是有用且有益的。

參考文獻

[1] Kawwass JF,Badell ML. Maternal and fetal risk associated with as?sisted reproductive technology[J]. Obstet Gynecol,2018,132(3):763-772.

[2] Kushnir VA,Barad DH,Albertini DF,et al. Systematic review ofworldwide trends in assisted reproductive technology 2004-2013[J]. Re?prod Biol Endocrinol,2017,15(1):6.

[3] Liu KE,Hartman M,Hartman A. Management of thin endometriumin assisted reproduction:a clinical practice guideline from the CanadianFertility and Andrology Society[J]. Reprod Biomed Online,2019,39(1):49-62.

[4] Cohen MJ,Rosenzweig TS,Revel A. Uterine abnormalities and em?bryo implantation:clinical opinion altered by peer debate[J]. Reprod Biomed Online,2007,14(5):555-558.

[5] 成海英,譚小軍,彭婀娜,等. 多囊卵巢綜合征患者不同預處理對凍融胚胎移植臨床療效的影響[J]. 生殖醫(yī)學雜志,2019,28(2):146-150.

Cheng HY,Tan XJ,Peng EN,et al. Effects of different pretreatment onfrozen-thawed embryo transfer in patients with polycystic ovary syn?drome[J]. J Reprod Med,2019,28(2):146-150.

[6] Gonen Y,Casper RF,Jacobson W,et al. Endometrial thicknessand growth during ovarian stimulation:a possible predictor of implanta?tion in in vitro fertilization[J]. Fertil Steril,1989,52(3):446-450.

[7] Khalifa E,Brzyski RG,Oehninger S,et al. Sonographic appearanceof the endometrium:the predictive value for the outcome of in-vitro fer?tilization in stimulated cycles[J]. Hum Reprod,1992,7(5):677-680.

[8] Mercé LT,Barco MJ,Bau S,et al. Are endometrial parameters bythree-dimensional ultrasound and power Doppler angiography related toin vitro fertilization/embryo transfer outcome?[J]. Fertil Steril,2008,89(1):111-117.

[9] Traub ML,van Arsdale A,Pal L,et al. Endometrial thickness,Cau?casian ethnicity,and age predict clinical pregnancy following fresh blas?tocyst embryo transfer:a retrospective cohort[J]. Reprod Biol Endocri?nol,2009,7:33.

[10] Al-Ghamdi A,Coskun S,Al-Hassan S,et al. The correlation be?tween endometrial thickness and outcome of in vitro fertilization and em?bryo transfer(IVF-ET) outcome[J]. Reprod Biol Endocrinol,2008,6:37.

[11] Dietterich C,Check JH,Choe JK,et al. Increased endometrialthickness on the day of human chorionic gonadotropin injection does notadversely affect pregnancy or implantation rates following in vitrofertilization-embryo transfer[J]. Fertil Steril,2002,77(4):781-786.

[12] Zhao J,Zhang Q,Wang YG,et al. Endometrial pattern,thicknessand growth in predicting pregnancy outcome following 3319 IVF cycle[J]. Reprod Biomed Online,2014,29(3):291-298.

[13] Kasius A,Smit JG,Torrance HL,et al. Endometrial thickness andpregnancy rates after IVF:a systematic review and meta-analysis[J].Hum Reprod Update,2014,20(4):530-541.

[14] Hertz-Picciotto I,Samuels SJ. Incidence of early loss of preg?nancy[J]. N Engl J Med,1988,319(22):1483-1484.

[15] Wang LY,Wang L,Yang X,et al. Risk factors related to earlypregnancy loss in fresh IVF/ICSI:an analysis of 954 embryo transfercycles[J]. Medicine,2022,101(34):e30166.

[16] Hipp H,Crawford S,Kawwass JF,et al. First trimester pregnancyloss after fresh and frozen in vitro fertilization cycles[J]. Fertil Steril,2016,105(3):722-728.

[17] Bi QF,Goodman KE,Kaminsky J,et al. What is Machine Learn?ing? A Primer for the Epidemiologist[J]. Am J Epidemiol,2019,188(12):2222-2239.

[18] Li D,Kulasegaram K,Hodges BD. Why we needn’t fear the ma?chines:opportunities for medicine in a machine learning world[J]. AcadMed,2019,94(5):623-625.

[19] Colmenarejo G. Machine learning models to predict childhoodand adolescent obesity:a review[J]. Nutrients,2020,12(8):2466.

[20] Parikh RB,Manz C,Chivers C,et al. Machine learning ap?proaches to predict 6-month mortality among patients with cancer[J].JAMA Netw Open,2019,2(10):e1915997.

[21] Attawet J,Wang AY,F(xiàn)arquhar CM,et al. Pregnancy and birthoutcomes of single versus multiple embryo transfer in gestational surro?gacy arrangements:a systematic review and meta-analysis[J]. Hum Fer?til,2022,25(2):217-227.

[22] Büscher U,Horstkamp B,Wessel J,et al. Frequency and signifi?cance of preterm delivery in twin pregnancies[J]. Int J Gynaecol Obstet,2000,69(1):1-7.

[23] Duffy DA,Nulsen JC,Maier DB,et al. Obstetrical complicationsin gestational carrier pregnancies[J]. Fertil Steril,2005,83(3):749-754.

[24] 劉 娟,周歡群,周 文,等. 促排卵早期血清雌激素水平預測體外受精-胚胎移植結局的評價[J]. 實用醫(yī)學雜志,2016,32(13):2157-2160.

Liu J,Zhou HQ,Zhou W,et al. The predictive value of serum estradiollevel during early phase of controlled ovarian hyperstimulation in IVFET[J]. J Pract Med,2016,32(13):2157-2160.

[25] Prasad S,Kumar Y,Singhal M,et al. Estradiol level on day 2 andday of trigger:a potential predictor of the IVF-ET success[J]. J ObstetGynaecol India,2014,64(3):202-207.

[26] 趙梓宇,王曉寧,徐鴻毅,等. 促黃體生成素在輔助生殖技術中的研究進展[J]. 生殖醫(yī)學雜志,2023,32(3):469-474.

Zhao ZY,Wang XN,Xu HY,et al. Research progress of luteinizing hor?mone in assisted reproductive technology[J]. J Reprod Med,2023,32(3):469-474.

[27] Soler A,Morales C,Mademont-Soler I,et al. Overview of chromo?some abnormalities in first trimester miscarriages:a series of 1,011 con?secutive chorionic villi sample karyotypes[J]. Cytogenet Genome Res,2017,152(2):81-89.

[28] Haddock L,Gordon S,Lewis SEM,et al. Sperm DNA fragmenta?tion is a novel biomarker for early pregnancy loss[J]. Reprod Biomed On?line,2021,42(1):175-184.

[29] Tan J,Taskin O,Albert A,et al. Association between sperm DNAfragmentation and idiopathic recurrent pregnancy loss:a systematic re?view and meta-analysis[J]. Reprod Biomed Online,2019,38(6):951-960.

[30] Zidi-Jrah I,Hajlaoui A,Mougou-Zerelli S,et al. Relationship be?tween sperm aneuploidy,sperm DNA integrity,chromatin packaging,traditional semen parameters,and recurrent pregnancy loss[J]. FertilSteril,2016,105(1):58-64.

[31] Osman A,Alsomait H,Seshadri S,et al. The effect of sperm DNAfragmentation on live birth rate after IVF or ICSI:a systematic reviewand meta-analysis[J]. Reprod Biomed Online,2015,30(2):120-127.

[32] Yang AM,Xu XH,Han Y,et al. Risk factors for different types ofpregnancy losses:analysis of 15,210 pregnancies after embryo transfer[J]. Front Endocrinol,2021,12:683236.

(責任編輯:李青穎)

基金項目:重慶醫(yī)科大學智慧醫(yī)學資助項目(編號:ZHYX202127)。

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于機器學習的圖像特征提取技術在圖像版權保護中的應用
基于網絡搜索數(shù)據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據分析研究
基于Spark的大數(shù)據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學習方法綜述
機器學習理論在高中自主學習中的應用
克东县| 饶河县| 洱源县| 泸溪县| 大田县| 镇沅| 剑河县| 泰宁县| 江川县| 阿克| 龙岩市| 呈贡县| 扬州市| 边坝县| 西贡区| 永年县| 邢台市| 彰武县| 招远市| 神农架林区| 江川县| 平乐县| 阜南县| 高平市| 屏边| 武定县| 景德镇市| 湖北省| 承德县| 华蓥市| 舒兰市| 砚山县| 老河口市| 建平县| 广河县| 东山县| 台南县| 东丰县| 右玉县| 兴文县| 武胜县|