姜 皓,張 冰*,張曉朦,林志健
基于4種機(jī)器學(xué)習(xí)算法的妊娠期中藥“禁忌慎”判別
姜 皓1, 2,張 冰1, 2*,張曉朦1, 2,林志健1, 2
1. 北京中醫(yī)藥大學(xué)中藥學(xué)院,北京 102488 2. 北京中醫(yī)藥大學(xué) 中藥藥物警戒與合理用藥研究中心,北京 102488
識別禁忌表述尚不明確中藥中的妊娠期禁忌藥,并將其劃分為禁用藥、忌用藥和慎用藥,為妊娠期婦女安全用藥提供依據(jù)。以《中國藥典臨床用藥須知》2015年版收載的666味中藥為研究對象,選取其中“禁忌慎”分類明確的藥物,基于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、樸素貝葉斯和隨機(jī)森林4種機(jī)器學(xué)習(xí)算法建模。根據(jù)交叉驗(yàn)證的受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under ROC curve,AUC)與F1分?jǐn)?shù)(F1 score,F(xiàn)1)評價(jià)模型優(yōu)劣,篩選相對最優(yōu)算法建立妊娠期中藥“禁忌慎”判別模型,并應(yīng)用該模型預(yù)測禁忌表述尚不明確的藥物。納入224種藥物建模,模型由基于神經(jīng)網(wǎng)絡(luò)的中藥禁忌與否判別模型(AUC=0.952,F(xiàn)1=0.885)、基于支持向量機(jī)的禁忌藥禁用與否判別模型(AUC=0.912,F(xiàn)1=0.779)、基于樸素貝葉斯的禁忌藥忌用與否判別模型(AUC=0.843,F(xiàn)1=0.333)和基于神經(jīng)網(wǎng)絡(luò)的禁忌藥慎用與否判別模型(AUC=0.932,F(xiàn)1=0.877)構(gòu)成。應(yīng)用模型成功劃分442種禁忌表述尚不明確的中藥,預(yù)測提示妊娠期禁忌藥163種,禁用藥8種,忌用藥1種,慎用藥134種。構(gòu)建的判別模型具有良好的穩(wěn)健性與預(yù)測能力,適用于妊娠期中藥“禁忌慎”判別評估,指導(dǎo)臨床用藥決策與實(shí)踐,提高臨床合理用藥水平。
中藥;妊娠期;機(jī)器學(xué)習(xí);“禁忌慎”;神經(jīng)網(wǎng)絡(luò);支持向量機(jī);樸素貝葉斯;隨機(jī)森林
由于大多數(shù)藥物能夠通過胎盤屏障直接或間接影響胎兒的生長發(fā)育,妊娠期用藥不僅需要考量母體的獲益,更須關(guān)注藥物對胎兒可能造成的風(fēng)險(xiǎn)[1]。有調(diào)研顯示,妊娠期婦女用藥具有普遍性[2]。中藥“禁忌慎”是圍繞風(fēng)險(xiǎn)與獲益對禁忌藥使用限制程度的劃分(“禁”>“忌”>“慎”),為臨床常見用藥警示語。因此,在我國進(jìn)入“三孩”政策時(shí)期,特別是高齡產(chǎn)婦逐漸增加的時(shí)代背景下[3],研究妊娠期婦女用藥安全,識別妊娠期禁忌藥,并劃分其“禁忌慎”,具有重要的現(xiàn)實(shí)意義與臨床價(jià)值。
本研究基于神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、樸素貝葉斯和隨機(jī)森林4種機(jī)器學(xué)習(xí)算法,建立妊娠期中藥“禁忌慎”判別模型,預(yù)測妊娠期禁忌表述尚不明確的藥物,以期為臨床用藥決策提供更為直觀的用藥依據(jù)。
鑒于《中國藥典臨床用藥須知》2015年版(簡稱《臨床用藥須知》)面向臨床遣藥組方、記載中藥品種數(shù)較多、藥物信息較為全面,將其收載的666種中藥作為研究對象。
圍繞666種中藥,整合權(quán)威禁忌信息,提取藥性功效、藥理毒理等藥物基本信息。信息來源于①權(quán)威專著:《中國藥典》2020年版、《臨床用藥須知》2015年版。②國家“十三五”規(guī)劃中藥學(xué)教材:2016年王建等主編的《臨床中藥學(xué)》;2016年周禎祥等主編的《中藥學(xué)》;2017年鐘贛生主編的《中藥學(xué)》。
功效依據(jù)《中國藥典》2020年版規(guī)約,如利尿、利小便統(tǒng)一為利尿,利水消腫拆分為利水、消腫等,形成112種單元功效術(shù)語集;藥理依據(jù)2018年彭成等主編的《中藥藥理學(xué)》規(guī)約,如抗癌、抗腫瘤統(tǒng)一為抗腫瘤,調(diào)節(jié)子宮拆分為興奮子宮和抑制子宮等,形成95種單元藥理作用術(shù)語集;毒理依據(jù)第3版《藥理毒理學(xué)》,規(guī)約為15種毒理作用類別,包括肝毒性、胃腸毒性、腎毒性、神經(jīng)毒性、心血管毒性、血液毒性、呼吸毒性、內(nèi)分泌毒性、免疫毒性、生殖毒性、致突變毒性、致癌毒性、皮膚毒性、細(xì)胞毒性、其他等。
1.4.1 劃分藥物組別 根據(jù)禁忌與否,將藥物分為禁忌藥、宜用藥與禁忌表述尚不明確藥。其中禁忌藥根據(jù)禁忌用語的不同,又分為禁用藥、忌用藥與慎用藥。宜用藥的納入須滿足以下2個條件:①國家衛(wèi)生健康委員會公布的110種藥食兩用中藥、《中藥藥物警戒》[4]中劃分為妊娠期A級的藥物或妊娠疾病適用藥;②目前尚無明確證據(jù)指出存在妊娠期風(fēng)險(xiǎn)的品種。
1.4.2 篩選判別指標(biāo) 將藥性功效、藥理毒理各項(xiàng)數(shù)據(jù)作為候選指標(biāo)。采用SPSS 25.0軟件,基于秩和檢驗(yàn)中指標(biāo)的值篩選判別指標(biāo),將<0.05,即具有統(tǒng)計(jì)學(xué)差異的候選指標(biāo)作為判別指標(biāo);基于秩和檢驗(yàn)中判別指標(biāo)的秩平均值差比較該判別指標(biāo)對各組判別影響的趨向性[5]。同時(shí),結(jié)合2檢驗(yàn)中的2值評估指標(biāo)在判別過程中的重要性,2值越高越重要。
(1)篩選中藥“禁忌慎”基礎(chǔ)判別指標(biāo):基于秩和檢驗(yàn)對比禁忌藥與宜用藥,篩選判別禁忌藥的“禁忌慎”基礎(chǔ)(禁忌與否)判別指標(biāo)。在禁忌與否判別指標(biāo)中,秩平均值差為禁忌藥的秩平均值減去宜用藥的秩平均值。差值為正,代表該指標(biāo)可能對禁忌藥的影響更大,被視為危險(xiǎn)指標(biāo);差值為負(fù),代表該指標(biāo)可能對宜用藥的影響更大,被視為保護(hù)指標(biāo)。
(2)篩選中藥“禁忌慎”特征判別指標(biāo):包括①基于秩和檢驗(yàn)對比禁用藥與慎忌藥(慎用藥和忌用藥),篩選判別禁用藥的禁忌藥禁用與否判別指標(biāo);②基于秩和檢驗(yàn)對比忌用藥與慎禁藥(慎用藥和禁用藥),篩選判別忌用藥的禁忌藥忌用與否指標(biāo);③基于秩和檢驗(yàn)對比慎用藥組與忌禁藥(忌用藥和禁用藥),篩選判別慎用藥的禁忌藥慎用與否指標(biāo)。在特征判別指標(biāo)中,秩平均值差計(jì)算方式以禁忌藥禁用與否指標(biāo)為例,禁用藥的秩平均值減去慎忌藥的秩平均值,若差值為正,說明該指標(biāo)可能對禁用藥判別的影響更大;若差值為負(fù),則表示該指標(biāo)可能對慎忌藥判別的影響更大。
1.4.3 建立判別模型 中藥“禁忌慎”判別模型由基礎(chǔ)判別模型與特征判別模型組成?;A(chǔ)判別模型,即中藥禁忌與否判別模型,用于判別是否為禁忌藥;特征判別模型由禁忌藥禁用與否判別模型、忌用與否判別模型和慎用與否判別模型組成,用于判別禁忌藥類別(禁用藥、忌用藥或是慎用藥)。借助Orange 3.27.3軟件,基于篩選出的判別指標(biāo),結(jié)合影響中藥安全的因素多而復(fù)雜、中藥數(shù)據(jù)多為非線性的特點(diǎn),選取數(shù)據(jù)復(fù)雜關(guān)系分析能力強(qiáng)的神經(jīng)網(wǎng)絡(luò)、適合非線性數(shù)據(jù)處理的支持向量機(jī)、對數(shù)據(jù)缺失值不敏感的樸素貝葉斯和可解釋性好的隨機(jī)森林4種較為適合中醫(yī)藥數(shù)據(jù)挖掘的機(jī)器學(xué)習(xí)算法[6-7],建立相應(yīng)的判別模型,并通過超參數(shù)調(diào)整優(yōu)化模型。
1.4.4 優(yōu)選判別模型 采用交叉驗(yàn)證法評估模型性能,優(yōu)選預(yù)測能力好、穩(wěn)健性強(qiáng)的判別模型。交叉驗(yàn)證時(shí),依據(jù)建模樣本數(shù)量大小,分層折疊次數(shù)為10或5。將受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under ROC curve,AUC)和F1分?jǐn)?shù)(F1 score,F(xiàn)1)分別作為評估模型預(yù)測能力與穩(wěn)健性的指標(biāo),并通過ROC曲線圖觀察模型敏感性與特異性之間的關(guān)系[8]。其中,模型的AUC在0.5以上才具有預(yù)測價(jià)值。在0.5~0.7時(shí)代表模型具有較低的預(yù)測能力,在0.7~0.9時(shí)代表模型具有良好的預(yù)測能力,大于0.9時(shí)代表模型具有優(yōu)秀的預(yù)測能力。最終篩選出相對最優(yōu)機(jī)器算法建立4個子模型,共同構(gòu)成妊娠期中藥“禁忌慎”判別示例模型。
1.4.5 預(yù)測示例藥物 由于50%是模型常用的分類閾值,且考慮將用藥風(fēng)險(xiǎn)盡可能最小化,所以本研究將50%作為預(yù)測的分類閾值。將禁忌表述尚不明確的藥物作為預(yù)測示例藥物導(dǎo)入妊娠期中藥“禁忌慎”判別模型開展預(yù)測,主要分為以下3步:第1步,預(yù)測中藥“禁忌慎”基礎(chǔ)(禁忌)概率。將禁忌表述尚不明確藥物的指標(biāo)數(shù)據(jù)導(dǎo)入“禁忌慎”基礎(chǔ)判別模型中,得出藥物作為妊娠期“禁忌慎”中藥的基礎(chǔ)概率,即成為妊娠期禁忌藥的禁忌概率。若禁忌概率>50%,則視為妊娠期禁忌藥。第2步,預(yù)測中藥“禁忌慎”的特征概率。將預(yù)測得出的妊娠禁忌藥指標(biāo)數(shù)據(jù)導(dǎo)入“禁忌慎”特征判別模型中,得到藥物作為妊娠期“禁忌慎”中藥的特征概率。第3步,計(jì)算藥物禁用概率、忌用概率和慎用概率。禁忌概率乘以“禁忌慎”特征概率,得出妊娠期中藥的禁用概率、忌用概率或慎用概率。若概率大于50%,本研究視其為禁用藥、忌用藥或慎用藥。若3種概率中存在二者及以上皆大于50%,則以概率最高者作為最終預(yù)測結(jié)果。預(yù)測流程見圖1。
圖1 妊娠期中藥“禁忌慎”預(yù)測流程圖
納入224種建模藥物,包括120種妊娠期禁忌藥和104種宜用藥。在妊娠期禁忌藥中,包括48種禁用藥、5種忌用藥和67種慎用藥。納入442種禁忌表述尚不明確的藥物,即預(yù)測的示例藥物。
在妊娠期中藥“禁忌慎”基礎(chǔ)(禁忌與否)判別指標(biāo)中,包括36項(xiàng)危險(xiǎn)指標(biāo)和21項(xiàng)保護(hù)指標(biāo),分別見表1、2。
表1 妊娠期中藥“禁忌慎”基礎(chǔ)(禁忌與否)判別危險(xiǎn)指標(biāo)
與妊娠期宜用藥比較:*<0.05**<0.01,表1~5同
*< 0.05**< 0.01appropriate medication during pregnancy, same as tables 1—5
表2 妊娠期中藥“禁忌慎”基礎(chǔ)(禁忌與否)判別保護(hù)指標(biāo)
在妊娠期中藥“禁忌慎”特征判別指標(biāo)中,包括33項(xiàng)禁忌藥禁用與否判別指標(biāo)、18項(xiàng)禁忌藥忌用與否判別指標(biāo)和31項(xiàng)禁忌藥慎用與否判別指標(biāo),分別見表3~5。
完成模型的超參數(shù)調(diào)整后,根據(jù)模型性能表現(xiàn),確立妊娠期中藥“禁忌慎”判別模型的4個子模型,分別為基于神經(jīng)網(wǎng)絡(luò)的妊娠期中藥“禁忌慎”基礎(chǔ)(禁忌與否)判別模型、基于支持向量機(jī)的妊娠期禁忌藥禁用與否判別模型、基于樸素貝葉斯的妊娠期禁忌藥忌用與否判別模型與基于神經(jīng)網(wǎng)絡(luò)的妊娠期禁忌藥慎用與否判別模型。不同機(jī)器學(xué)習(xí)算法的最優(yōu)超參數(shù)調(diào)整與性能指標(biāo)情況分別見表6、7,ROC曲線圖見圖2。
2.4.1 妊娠期禁忌藥 預(yù)測得出163種妊娠期禁忌藥,見圖3。
2.4.2 妊娠期禁用藥、忌用藥和慎用藥 在163種妊娠期禁忌藥,預(yù)測得出8種妊娠期禁用藥,1種妊娠期忌用藥,134種妊娠期慎用藥,見圖4。另外,尚有20種中藥無法劃分“禁忌慎”,包括黃藥子、鳳仙透骨草、訶子、水紅花子、石榴皮、兒茶、蒼耳子、合歡皮、延胡索、前胡、暴馬子皮、白屈菜、側(cè)柏葉、蘇合香、夏天無、補(bǔ)骨脂、老鸛草、青風(fēng)藤、鐵落、燈心草。
表3 妊娠期禁忌藥禁用與否判別指標(biāo)
表4 妊娠期禁忌藥忌用與否判別指標(biāo)
表5 妊娠期禁忌藥慎用與否判別指標(biāo)
表6 妊娠期中藥“禁忌慎”判別模型的最優(yōu)超參數(shù)設(shè)置情況
表7 妊娠期中藥“禁忌慎”判別模型評價(jià)指標(biāo)比較表
圖2 妊娠期中藥“禁忌慎”判別模型ROC曲線對比圖
禁忌藥的判別基于基礎(chǔ)判別指標(biāo)中的危險(xiǎn)指標(biāo)與保護(hù)指標(biāo)。某味中藥含有的危險(xiǎn)性指標(biāo)越多越重要,則該藥越有可能是禁忌藥;而含有的保護(hù)指標(biāo)越多越重要,則該藥越有可能是宜用藥,即越不可能是禁忌藥。
在已知某藥為禁忌藥的前提下,篩選出“禁忌慎”各自的特征判別指標(biāo)開展用藥“禁忌慎”的判別??偟膩碚f,特征判別指標(biāo)可分為2類:第1類指標(biāo)為“禁忌慎”中任意二者或3者所共有的判別指標(biāo);第2類指標(biāo)為“禁忌慎”各自獨(dú)有的判別指標(biāo)。
圖3 妊娠禁忌藥預(yù)測結(jié)果
3.1.1 基礎(chǔ)判別指標(biāo)對妊娠期中藥“禁忌”性質(zhì)的判別 從危險(xiǎn)指標(biāo)來看,藥性主要圍繞毒性、苦味、辛味、寒性、肝經(jīng)、心包經(jīng)等;功效主要圍繞殺蟲、逐水、活血、消癰腫、止痛、消瘡、破血、逐瘀、散結(jié)、消癥、瀉下、通經(jīng)絡(luò)、拔毒、溫經(jīng)、開竅、通乳;藥理主要圍繞抗血栓與擴(kuò)張血管;毒理主要圍繞心血管毒性、腎毒性、生殖毒性、神經(jīng)毒性、肝毒性、皮膚毒性、呼吸毒性、致癌毒性、胃腸毒性、血液毒性、致突變毒性等。毒性是藥物偏性、峻烈程度及對人體毒副作用大小的高度概括。毒性越強(qiáng),越有可能對母體或胎兒造成傷害。毒性與毒理密切相關(guān),殺蟲藥多數(shù)具有一定毒性,散結(jié)、消癥及消癰腫往往藥效較為峻烈,而辛香走竄、活血逐瘀或通利行經(jīng)之品,有滑胎、墮胎之弊。因此,在妊娠期服用與上述危險(xiǎn)指標(biāo)關(guān)聯(lián)的中藥會存在用藥風(fēng)險(xiǎn)[9-10]。
從保護(hù)指標(biāo)來看,藥性主要圍繞甘味、肺經(jīng)、平性等;功效主要圍繞健脾、補(bǔ)腎、生津、補(bǔ)血、滋陰、補(bǔ)氣、和胃、潤肺、健胃、安胎、除煩、明目、養(yǎng)肝、溫中、固精、固澀、止渴等。甘味藥具有補(bǔ)益、和中、調(diào)和藥性和緩急止痛的功效。平性藥往往藥性平和、作用緩慢。甘平之藥具有很好的安全性。因此,上述指標(biāo)作為妊娠期禁忌藥的保護(hù)指標(biāo),這是與臨床實(shí)際妊娠期服藥多為甘平的補(bǔ)益類中藥、安胎類中藥是相符的。
3.1.2 特征判別指標(biāo)對妊娠期禁忌藥“禁忌慎”差異的確認(rèn) 從第1類指標(biāo)來看,在妊娠期禁忌藥中,具有辛味、熱性、毒性,或存在逐水、拔毒、破血、解痙功效,或存在抗腫瘤藥理作用,或存在肝毒性、腎毒性、神經(jīng)毒性、呼吸毒性、心血管毒性、生殖毒性、皮膚毒性毒理作用的藥物更可能為妊娠禁用藥,更不可能為妊娠慎用藥;具有甘味、歸胃經(jīng),或存在散瘀、清熱、解毒、散寒、通淋功效,或存在平喘藥理作用的藥物更可能為妊娠慎用藥,更不可能為妊娠禁用藥;存在消癥或消瘡功效的藥物更可能為妊娠禁用藥或妊娠慎用藥;存在活血功效的藥物更可能為妊娠忌用藥,更不可能為妊娠禁用藥;存在收縮血管藥理作用的藥物更可能為妊娠忌用藥,更不可能為妊娠慎用藥。
圖4 妊娠期禁用藥、忌用藥和慎用藥預(yù)測結(jié)果
從第2類指標(biāo)來看,在妊娠禁忌藥中,存在辛味、內(nèi)分泌毒性、歸腎經(jīng)或抑制胃液分泌等判別指標(biāo),或不存在止血這一分類指標(biāo)的藥物更可能為妊娠禁用藥;存在擴(kuò)張血管、消食、溫腎、排膿、退黃、保肝、保護(hù)腎臟、促進(jìn)造血、抗肺損傷、抗應(yīng)激、殺蟲、升血糖、調(diào)血脂、咸味、興奮胃腸平滑肌等判別指標(biāo)的藥物更可能為妊娠忌用藥;存在歸心包經(jīng)、改善代謝或涼血等判別指標(biāo),或不存在膀胱經(jīng)、通脈或化痰等判別指標(biāo)的藥物更可能為妊娠期慎用藥。
妊娠期中藥“禁忌慎”判別模型識別妊娠期禁忌藥及劃分禁用藥與慎用藥的能力較好,但對妊娠期忌用藥預(yù)測的穩(wěn)定性較差。針對妊娠期中藥“禁忌慎”基礎(chǔ)判別模型,其AUC和F1高于0.850,說明該子模型具有良好的預(yù)測能力與穩(wěn)健性,判別妊娠期禁忌藥的結(jié)果可靠。在妊娠期“禁忌慎”特征判別模型中,妊娠期禁忌藥禁用與否模型的AUC和F1高于0.77,妊娠期禁忌藥慎用與否判別模型的AUC與F1高于0.87,說明此2個子模型亦具有較好的分類能力與穩(wěn)健性能。妊娠期禁忌藥忌用與否判別模型的AUC雖然高于0.84,但F1僅為0.33說明該子模型的穩(wěn)健性差,無法較為精確識別妊娠期忌用藥。
綜合基礎(chǔ)判別模型和特征判別模型分析模型對“禁忌慎”的判別能力:從AUC來看,劃分“慎”優(yōu)于“禁”優(yōu)于“忌”,表明模型對妊娠期慎用藥和非妊娠慎用藥的區(qū)分效果最好;從F1來看,劃分“慎”優(yōu)于“禁”優(yōu)于“忌”,表明模型對妊娠期慎用藥的預(yù)測過程中,預(yù)測結(jié)果最穩(wěn)定??梢?,妊娠期中藥“禁忌慎”判別模型對慎用藥的判別能力最強(qiáng),其次為禁用藥和忌用藥。
本研究建立的模型主要存在兩方面的局限性:一方面從建模方法來看,考慮到納入數(shù)據(jù)量較少,未設(shè)置測試集,模型可能存在一定性能誤估或過擬化風(fēng)險(xiǎn);另一方面從建模結(jié)果而言,該模型對妊娠期忌用藥的區(qū)分能力較差,且部分可能的妊娠期禁忌藥無法劃分“禁忌慎”。造成以上局限性的最大原因在于基于有限數(shù)據(jù)難以實(shí)現(xiàn)模型理想化的“禁忌慎”判別或建模效果。在3種中藥臨床“禁忌慎”判別模型中,部分子模型的樣本量明顯偏少,如妊娠忌用藥僅5種,可能導(dǎo)致機(jī)器學(xué)習(xí)算法未能完全識別“禁忌慎”藥物之間的差異性,即無法獲得建模所需的完整而準(zhǔn)確的特征判別指標(biāo),從而造成部分藥物基于當(dāng)前的模型時(shí)無法完成“禁忌慎”的判別評估。另外,基礎(chǔ)判別模型識別出的妊娠期禁忌藥無法保證完全正確,因此第2點(diǎn)局限性或許與部分無法區(qū)分“禁忌慎”的藥物可能并非妊娠期禁忌藥有關(guān)。
為改善以上局限性,筆者提出2個方案:一是擴(kuò)大樣本量,增加作為研究對象的藥味,以提高“禁忌慎”分類明確藥物的數(shù)量,尤其是忌用藥;二是判別指標(biāo)的篩選結(jié)合專家咨詢,增強(qiáng)指標(biāo)的可信度和合理性。
中藥妊娠期應(yīng)用的安全性備受臨床關(guān)注。本研究以224種“禁忌慎”分類明確藥物為建模藥物,基于4種機(jī)器學(xué)習(xí)算法構(gòu)建性能表現(xiàn)良好的妊娠期中藥“禁忌慎”判別模型,實(shí)現(xiàn)442種禁忌表述不明確藥物的判別預(yù)測,對臨床具有較為直觀的指導(dǎo)價(jià)值。今后有待以預(yù)測藥物為研究對象,設(shè)計(jì)毒理學(xué)實(shí)驗(yàn)、收集臨床數(shù)據(jù)驗(yàn)證模型結(jié)果的可靠性,進(jìn)一步證明模型的可靠性與建模方法的可信度。
利益沖突 所有作者均聲明不存在利益沖突
[1] 馬曉瑋, 顧紅燕, 栗芳, 等. 我院妊娠期婦女門診用藥的合理性分析 [J]. 中國藥房, 2021, 32(9): 1114-1117.
[2] 張川, 張伶俐, 陳力, 等. 妊娠期用藥調(diào)查研究的系統(tǒng)評價(jià) [J]. 中國藥學(xué)雜志, 2012, 47(11): 858-862.
[3] 賈亮. 配套支持給力三孩政策才能見成效 [J]. 北京觀察, 2021(6): 30.
[4] 張冰. 中藥藥物警戒 [M]. 北京: 人民衛(wèi)生出版社, 2015: 112.
[5] 蘭欣, 衛(wèi)榮, 蔡宏偉, 等. 機(jī)器學(xué)習(xí)算法在醫(yī)療領(lǐng)域中的應(yīng)用 [J]. 醫(yī)療衛(wèi)生裝備, 2019, 40(3): 93-97.
[6] 張恒, 張葆青. 基于數(shù)據(jù)挖掘的中醫(yī)藥臨床研究述評 [J]. 中華中醫(yī)藥雜志, 2020, 35(11): 5378-5383.
[7] 仇麗霞. 醫(yī)學(xué)統(tǒng)計(jì)學(xué) [M]. 第3版. 北京: 中國協(xié)和醫(yī)科大學(xué)出版社, 2018: 426-448.
[8] 周志華. 機(jī)器學(xué)習(xí) [M]. 北京: 清華大學(xué)出版社, 2016: 33-35.
[9] 徐建亞, 李思穎, 謝彤, 等. 基于羊水代謝組學(xué)策略評價(jià)妊娠禁忌中藥的安全性 [J]. 南京中醫(yī)藥大學(xué)學(xué)報(bào), 2019, 35(2): 223-228.
[10] 鄭依玲, 梅全喜, 戴衛(wèi)波, 等. 妊娠禁忌中藥研究概述 [J]. 中國藥房, 2018, 29(3): 421-424.
Discriminant of “prohibiting, avoiding or using caution” in traditional Chinese medicine during pregnancy based on four machine learning algorithms
JIANG Hao1, 2, ZHANG Bing1, 2, ZHANG Xiao-meng1, 2, LIN Zhi-jian1, 2
1. School of Chinese Materia Medica, Beijing University of Chinese Medicine, Beijing 102488, China 2. Center for Pharmacovigilance and Rational Use of Chinese Medicine, Beijing University of Chinese Medicine, Beijing 102488, China
To provide evidence for the safe medication of pregnant women, the identification of contraindications in traditional Chinese medicine (TCM) during pregnancy was not clear, and divided them into prohibited drugs, avoided drugs and cautious drugs.A total of 666 TCMs collected in the 2015 edition ofwere selected as the research objects. The drugs with clear classification of “prohibiting, avoiding or using caution” were selected from the research objects, and four machine learning algorithms, neural network, support vector machine, naive Bayes and random forest, were used for modeling. According to the cross-validated area under receiver operating characteristic (ROC) curve (AUC) and F1 score (F1) to evaluate the pros and cons of the model, and to screen the relatively optimal machine learning algorithm to establish the “prohibiting, avoiding or using caution” discriminant mode of TCM during pregnancy, and the model was used to predict the drugs whose contraindication was not clear.A total of 224 kinds of drugs were included to establish the model. The models consisted of a neural network-based discrimination model for the contraindications of TCM (AUC=0.952, F1=0.885), a support vector machine-based discrimination model for the prohibited drugs of contraindications (AUC=0.912, F1=0.779), a naive Bayes-based discrimination model for the avoided drugs of contraindications (AUC=0.843, F1=0.333), and a neural network-based discrimination model for the cautious drugs of contraindications (AUC=0.932, F1=0.877). The application model successfully divided 442 kinds of TCM whose contraindications were not clear. The prediction suggested that there were 163 kinds of contraindicated drugs during pregnancy, eight kinds of prohibited drugs, one kind of avoided drugs and 134 kinds of cautious drugs.The discriminant models have good robustness and predictive ability. They are suitable for the discriminant evaluation of the “prohibiting, avoiding or using caution” in TCMs during pregnancy. They could guide the decision-making and practice of clinical medication, and improve the level of clinical rational medication.
traditional Chinese medicine; pregnancy; machine learning; “prohibiting, avoiding or using caution”; neural network; support vector machine; naive Bayes; random forest
R285.64
A
0253 - 2670(2021)24 - 7596 - 10
10.7501/j.issn.0253-2670.2021.24.022
2021-07-21
國家中醫(yī)藥管理局-國家中醫(yī)藥領(lǐng)軍人才支持計(jì)劃“岐黃學(xué)者”項(xiàng)目(10400633210004);第三批國家高層次人才特殊支持計(jì)劃(萬人計(jì)劃)教學(xué)名師項(xiàng)目(2020063320001)
姜 皓,碩士研究生,研究方向?yàn)橹兴幩幬锞渑c合理用藥。E-mail: jianghtcm@163.com
張 冰,教授,主任醫(yī)師,博士生導(dǎo)師,研究方向?yàn)橹兴幩幬锞渑c合理用藥、中藥防治代謝性疾病等。E-mail: zhangbing6@263.net
[責(zé)任編輯 潘明佳]