欒奕博,張依,郭圣璇,李璇,胡思源
天津中醫(yī)藥大學(xué)第一附屬醫(yī)院,國(guó)家中醫(yī)針灸臨床醫(yī)學(xué)研究中心,天津 300381
目前,我國(guó)兒童用藥存在品種少、劑型少、規(guī)格少和標(biāo)識(shí)少的問(wèn)題,中成藥作為兒童用藥的重要組成部分,在緩解兒童用藥需求、保障兒童生命健康方面有重要價(jià)值和良好前景。然而中成藥在兒童人群的合理應(yīng)用面臨問(wèn)題和挑戰(zhàn),主要為用法用量信息不完善,難以規(guī)范地指導(dǎo)臨床應(yīng)用,超說(shuō)明書(shū)用藥現(xiàn)象普遍存在,如兒童專用中成藥的低年齡段用法用量缺失、成人兒童共用中成藥大多僅標(biāo)注“兒童酌減”或“兒童在醫(yī)師指導(dǎo)下服用”、成人中成藥應(yīng)用于兒童等。因此,完善用于兒童的中成藥用法用量信息十分必要。
隨著中醫(yī)藥理論、人用經(jīng)驗(yàn)和臨床試驗(yàn)相結(jié)合的中藥注冊(cè)審評(píng)證據(jù)體系的構(gòu)建與優(yōu)化,以及《“十四五”中醫(yī)藥發(fā)展規(guī)劃》[1]、《基于人用經(jīng)驗(yàn)的中藥復(fù)方制劑新藥臨床研發(fā)指導(dǎo)原則(試行)》[2]、《中藥注冊(cè)管理專門(mén)規(guī)定》[3]等的發(fā)布,人用經(jīng)驗(yàn)證據(jù)在中藥注冊(cè)審評(píng)中的應(yīng)用日益受到高度重視。真實(shí)世界研究(RWS)是形成人用經(jīng)驗(yàn)證據(jù)的重要方法,利用RWS整理和分析基于醫(yī)院信息系統(tǒng)(HIS)的人用經(jīng)驗(yàn)數(shù)據(jù),可總結(jié)中成藥的適應(yīng)證、適用人群、療程、用藥劑量等基本要素,以提供人用經(jīng)驗(yàn)證據(jù),支持兒童中藥新藥注冊(cè)和說(shuō)明書(shū)變更等情形的探索性臨床研究[4]。
雙清合劑是治療風(fēng)溫肺熱、衛(wèi)氣同病型急性支氣管炎的中成藥,屬成人用藥品種,缺乏兒童用法用量信息,但在兒科臨床應(yīng)用多年,人用經(jīng)驗(yàn)豐富,具有大樣本量、可靠真實(shí)和結(jié)構(gòu)完整的來(lái)源于HIS的人用經(jīng)驗(yàn)數(shù)據(jù)[5]。本研究以雙清合劑的HIS數(shù)據(jù)為切入點(diǎn),通過(guò)機(jī)器學(xué)習(xí)方法,整理和分析其人用經(jīng)驗(yàn)數(shù)據(jù),構(gòu)建探索年齡段成人-兒童用藥劑量折算模型和兒童中成藥用藥劑量多分類預(yù)測(cè)模型,獲得符合臨床實(shí)踐的兒童人群用法用量,以期優(yōu)化雙清合劑的臨床用藥方案,為變更兒童人群的注冊(cè)申請(qǐng)或說(shuō)明書(shū)的完善提供人用經(jīng)驗(yàn)證據(jù)支持。
本研究為回顧性數(shù)據(jù)庫(kù)研究,數(shù)據(jù)來(lái)源于天津中醫(yī)藥大學(xué)第一附屬醫(yī)院HIS數(shù)據(jù)庫(kù),提取2012年9月—2021年10月至少使用過(guò)1次雙清合劑的患兒的診療信息。
1.2.1 納入標(biāo)準(zhǔn)
①年齡1~14歲;②就診方式為兒科門(mén)診/急診。
1.2.2 排除標(biāo)準(zhǔn)
①處方存在明顯邏輯錯(cuò)誤;②合并使用中藥湯劑;③無(wú)法對(duì)疾病診斷進(jìn)行規(guī)范化的患兒。
①基本信息:年齡、性別、就診方式;②診斷信息:西醫(yī)診斷、中醫(yī)診斷;③用藥信息:研究用藥(包括療程、劑量)、合并用藥(包括名稱、類別)。
1.4.1 數(shù)據(jù)提取與清洗
以Excel2021建立數(shù)據(jù)庫(kù),采用Python3.8.12軟件進(jìn)行數(shù)據(jù)處理。
數(shù)據(jù)提?。焊鶕?jù)納入和排除標(biāo)準(zhǔn),剔除不符合標(biāo)準(zhǔn)的患兒數(shù)據(jù)。
數(shù)據(jù)清洗:包括重復(fù)數(shù)據(jù)、邏輯錯(cuò)誤和缺失數(shù)據(jù)的清洗等。在保證數(shù)據(jù)完整的前提下,去除重復(fù)數(shù)據(jù)及不相關(guān)數(shù)據(jù);進(jìn)行邏輯檢查,去除邏輯錯(cuò)誤的數(shù)據(jù),包括出生年月與按年齡推算不符、單日用藥劑量為100 mL、給藥途徑為皮試等;對(duì)缺失數(shù)據(jù)進(jìn)行處理,根據(jù)完整的數(shù)據(jù)分析進(jìn)行必要填補(bǔ)。
1.4.2 數(shù)據(jù)規(guī)范
規(guī)范診斷信息和處方信息。西醫(yī)診斷信息參照《國(guó)際疾病分類(第11次修訂本)》[6]和《兒科學(xué)(第8版)》[7]進(jìn)行規(guī)范化,中醫(yī)診斷信息參照《中醫(yī)病證分類與代碼(修訂版)》[8]進(jìn)行規(guī)范;西藥采用《藥物的解剖學(xué)、治療學(xué)及化學(xué)分類系統(tǒng)》[9]分類合并;中成藥以藥物成分為準(zhǔn),將成分相同、劑型不同者合并,參照藥品說(shuō)明書(shū)對(duì)其名稱進(jìn)行規(guī)范。
采用R語(yǔ)言4.2.0對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,主要采用描述性統(tǒng)計(jì)和建模分析的方法。
用藥特征的描述性統(tǒng)計(jì):組合運(yùn)用dplyr及ggplot2函數(shù)庫(kù),分別對(duì)年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程和劑量、合并用藥名稱和類別進(jìn)行描述性統(tǒng)計(jì)。定量數(shù)據(jù)描述例數(shù)、均數(shù)、標(biāo)準(zhǔn)差;定性數(shù)據(jù)描述頻數(shù)、百分率或構(gòu)成比。
用藥劑量建模分析:①采用一維優(yōu)化K-means算法[10]構(gòu)建探索年齡段成人-兒童用藥劑量折算模型。設(shè)置排名前5位西醫(yī)診斷為篩選條件,各診斷對(duì)應(yīng)的診療數(shù)據(jù)為數(shù)據(jù)子集,患兒年齡為特征變量(自變量),雙清合劑兒童用藥劑量較成人用藥劑量的折算百分比為目標(biāo)變量(因變量)。將K-means模型的聚類數(shù)量的初始范圍設(shè)定為3~5,以Calinski-Harabaz指數(shù)[11]為評(píng)估指標(biāo),針對(duì)不同診斷的數(shù)據(jù)子集,采用迭代檢驗(yàn)的優(yōu)化策略。②基于患兒用藥特征的描述性統(tǒng)計(jì)結(jié)果,采用XGBoost算法[12]構(gòu)建兒童中成藥用藥劑量多分類預(yù)測(cè)模型。設(shè)置年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程、合并用藥數(shù)量、合并用藥名稱等為特征變量(自變量),目標(biāo)變量被整合為[0,10)、[10,20)、[20,30)、[30,40)、[40,50)、[50,60)、[60,70)、[70,80)和[80,90]的區(qū)間進(jìn)行多極分類預(yù)測(cè)。隨機(jī)抽取樣本中80%數(shù)據(jù)訓(xùn)練模型,20%數(shù)據(jù)驗(yàn)證模型,經(jīng)過(guò)多次隨機(jī)交叉檢驗(yàn),根據(jù)計(jì)算預(yù)測(cè)結(jié)果的混淆矩陣檢驗(yàn)?zāi)P蜏?zhǔn)確度,對(duì)各年齡段患兒最佳用藥劑量區(qū)間進(jìn)行預(yù)測(cè)。
本研究共收集用藥記錄51 958條,按納入標(biāo)準(zhǔn)、排除標(biāo)準(zhǔn)篩選和處理數(shù)據(jù)后,納入用藥記錄31 303條。男性16 861例(53.86%),女性14 442例(46.14%)。急診17 882例(57.13%),門(mén)診13 421例(42.87%)。年齡1~14歲,平均(5.44±3.14)歲,各年齡段均有分布,以學(xué)齡前期患兒最多,共11 181例(35.72%)。
31 303例患兒信息中包含診斷信息44 146條。西醫(yī)診斷主要涉及呼吸系統(tǒng),除說(shuō)明書(shū)中明確的急性支氣管炎外,還涉及急性上呼吸道感染、急性扁桃體炎、急性喉炎、肺炎等上呼吸道感染和下呼吸道感染。急性上呼吸道感染有廣義和狹義之分,廣義指外鼻孔至環(huán)狀軟骨下緣包括鼻腔、咽或喉部急性炎癥的總稱,臨床表現(xiàn)主要類型為普通感冒、急性病毒性咽-扁桃體炎,還可包括皰疹性咽峽炎、咽結(jié)合膜熱、急性細(xì)菌性咽扁桃體炎、急性喉炎等;狹義指普通感冒這一臨床表現(xiàn)。通過(guò)分析原始數(shù)據(jù)特點(diǎn),本研究所指急性上呼吸道感染屬狹義范疇。結(jié)果顯示,患兒以急性上呼吸道感染最多見(jiàn),共17 733例(40.17%),其次為急性支氣管炎(8 330例,18.87%)和急性扁桃體炎(2 044例,4.63%)。中醫(yī)診斷主要涉及肺系和脾胃系疾病,集中在感冒(6 275例,14.21%)和咳嗽(5 188例,11.75%),也可見(jiàn)于肺炎喘嗽、乳蛾和積滯等。見(jiàn)表1。
表1 使用雙清合劑患兒主要中西醫(yī)診斷(前5位)
2.3.1 用藥療程
用藥療程平均為(3.06±1.16)d,排名前5位西醫(yī)診斷的療程分別為急性上呼吸道感染(3.01±1.17)d、急性支氣管炎(3.09±1.01)d、急性扁桃體炎(3.04±0.95)d、肺炎(3.0±1.11)d和急性喉炎(3.38±0.96)d。
2.3.2 用藥劑量
單日用藥平均劑量為(40.61±12.15)mL,急性扁桃體炎的用藥劑量最多,為(45.56±12.9)mL,急性喉炎的用藥劑量最少,為(39.67±10.77)mL。
無(wú)兒童用量的兒童中成藥用藥劑量,一般采用基于國(guó)內(nèi)通用年齡分期、分年齡段、按成人用藥劑量的折算方法,固定年齡段折算比例為幼兒期用1/2成人量、學(xué)齡前期用2/3成人量和學(xué)齡期用成人量[13]。本研究中,排名前5位西醫(yī)診斷的固定年齡段成人-兒童用藥劑量折算比例的趨勢(shì)一致,均在幼兒期用1/2~3/5成人量、學(xué)齡前期用2/3~3/4成人量和學(xué)齡期用4/5~1成人量,幼兒期高于用1/2成人量、學(xué)齡前期用2/3成人量、學(xué)齡期用成人量的范圍內(nèi)。不同診斷的各年齡段內(nèi)折算比例存在差異,考慮與適應(yīng)證的病情嚴(yán)重程度有關(guān)。相同診斷的單獨(dú)用藥和合并用藥的各年齡段內(nèi)折算比例差異較小。見(jiàn)表2。
表2 西醫(yī)診斷排名前5位的固定年齡段成人-兒童用藥折算比例(%)
22 272例患兒采用合并用藥,包含合并用藥信息36 031條。共使用60種西藥和43種中成藥。合并用藥使用頻率前10位的藥物和藥物作用類型見(jiàn)表3、表4。可見(jiàn),西藥最常與抗生素類藥物合用,使用頻率最高為阿奇霉素(8.05%);中成藥最常與解表清熱劑合用,使用頻率最高為小兒豉翹清熱顆粒(12.10%)。
表3 使用雙清合劑患兒合并用藥情況(前10位)
表4 使用雙清合劑患兒合并用藥藥物類型(前10位)
2.5.1 探索年齡段成人-兒童用藥劑量折算模型
固定年齡段成人-兒童用藥劑量折算比例大多為相對(duì)較大的區(qū)間。本研究在雙清合劑的兒童用藥劑量中尋找規(guī)律,結(jié)合不同適應(yīng)證特點(diǎn),采用一維優(yōu)化K-means算法構(gòu)建探索年齡段兒成人-兒童用藥劑量折算模型,以Calinski-Harabaz指數(shù)為評(píng)估指標(biāo),針對(duì)不同診斷的數(shù)據(jù)子集,分別通過(guò)20次迭代檢驗(yàn)確定模型的最優(yōu)聚類數(shù)量與對(duì)應(yīng)結(jié)果,合理劃分為3個(gè)或4個(gè)年齡段,并分別計(jì)算出用藥劑量折算比例。見(jiàn)圖1、圖2。
圖1 不區(qū)分用藥的探索年齡段成人-兒童用藥劑量折算比例
圖2 單獨(dú)使用雙清合劑的探索年齡段成人-兒童用藥劑量折算比例
2.5.2 兒童中成藥用藥劑量多分類預(yù)測(cè)模型
為探索不同年齡段劃分規(guī)則下的各年齡段最佳用藥劑量閾值,基于雙清合劑在兒童臨床應(yīng)用的基本信息、診斷信息和用藥信息,采用XGBoost算法構(gòu)建用于預(yù)測(cè)兒童用藥最佳劑量區(qū)間的多分類模型,經(jīng)過(guò)10次隨機(jī)交叉檢驗(yàn),完成對(duì)模型準(zhǔn)確度的驗(yàn)證,結(jié)果發(fā)現(xiàn),當(dāng)n_estimators=100,max depth=10,gamma=0,colsample_bytree=1,min_child_weight=1,subsample=1時(shí)模型表現(xiàn)最佳,準(zhǔn)確度為84.1%,見(jiàn)圖3。通過(guò)特征變量在模型中的重要性得分,發(fā)現(xiàn)對(duì)模型準(zhǔn)確度影響最大的是患兒年齡,對(duì)模型準(zhǔn)確度影響最小的為是否合并中成藥。各特征變量對(duì)模型影響程度的評(píng)分和排序見(jiàn)圖4。
圖3 模型準(zhǔn)確度評(píng)估
圖4 特征變量對(duì)模型準(zhǔn)確度的重要性評(píng)分
本研究建立黑箱式應(yīng)用系統(tǒng),系統(tǒng)后端為建模結(jié)果,前端為用戶界面,臨床醫(yī)生或研究者可在用戶界面輸入數(shù)據(jù),并得到預(yù)測(cè)用量區(qū)間。同時(shí),所得的預(yù)測(cè)用量區(qū)間與臨床醫(yī)生或研究者輸入的數(shù)據(jù)綁定,傳遞給兒童中成藥用藥劑量多分類預(yù)測(cè)模型,擴(kuò)展模型的訓(xùn)練數(shù)據(jù)。系統(tǒng)界面示意圖見(jiàn)本文OSID碼。
本文采用回顧性數(shù)據(jù)庫(kù)研究方法,整理并分析雙清合劑在兒童人群的人用經(jīng)驗(yàn)數(shù)據(jù),構(gòu)建探索年齡段成人-兒童用藥劑量折算模型和兒童中成藥用藥劑量多分類預(yù)測(cè)模型,探索本品種適應(yīng)證、適用人群范圍和兒童用藥劑量,以優(yōu)化臨床用藥方案并支持后續(xù)臨床研究的開(kāi)展。
研究結(jié)果顯示,患兒各年齡段均有分布,以學(xué)齡前期最為多見(jiàn),提示若需增加兒童適用人群時(shí),建議優(yōu)先考慮3~7歲患兒。診斷信息方面,急性支氣管炎和咳嗽屬說(shuō)明書(shū)適應(yīng)證,臨床還常見(jiàn)于急性上呼吸道感染(感冒)、急性扁桃體炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等,提示若需增加功能主治時(shí),可考慮上述適應(yīng)證。
用藥劑量是兒童中成藥合理應(yīng)用于臨床的關(guān)鍵要素,如何確定用藥劑量是兒童藥品上市前和上市后密切關(guān)注的內(nèi)容之一,兒童中成藥一般采用分年齡段給藥的方式,兒童用藥劑量可以按成人劑量折算,即按照一定比例直接折算到兒童,折算比例多為相對(duì)較大區(qū)間。目前,大多采用基于國(guó)內(nèi)通用年齡分期的固定年齡段成人-兒童用藥折算比例,本研究中,幼兒期用藥劑量為通用折算比例,學(xué)齡前期和學(xué)齡期用藥劑量低于通用折算比例。但通用的年齡段劃分區(qū)間較大,可考慮根據(jù)具體品種特性、適應(yīng)證特點(diǎn)和臨床經(jīng)驗(yàn),合理劃分1個(gè)或多個(gè)年齡段并分別計(jì)算使用劑量[14]。因此,根據(jù)雙清合劑的數(shù)據(jù)特點(diǎn),通過(guò)基于一維優(yōu)化K-means算法的建模分析的方法,合理劃分年齡段,并分別計(jì)算出各年齡段的用藥劑量折算比例。
另外,合并用藥亦是影響用藥劑量的因素之一。本研究發(fā)現(xiàn),合并其他藥物治療時(shí),雙清合劑的用藥劑量更低;合并用藥數(shù)量、合并用藥種類可能對(duì)研究藥物的用藥劑量產(chǎn)生影響。
因此,本研究設(shè)置年齡、性別、就診方式、西醫(yī)診斷、中醫(yī)診斷、研究用藥療程、合并用藥數(shù)量、合并用藥名稱等特征變量,輸出用藥劑量區(qū)間為目標(biāo)變量,構(gòu)建基于XGBoost算法的兒童中成藥用藥劑量多分類預(yù)測(cè)模型,探索不同年齡段劃分規(guī)則下的各年齡段最佳用藥劑量閾值,即模型輸出的用藥區(qū)間由2個(gè)數(shù)值界定的范圍構(gòu)成,最小劑量和最大劑量均為藥物有效劑量,臨床醫(yī)生處方時(shí)和臨床研究設(shè)計(jì)可在區(qū)間內(nèi)選擇合適劑量。
本研究尚存在局限性:①為單中心研究,數(shù)據(jù)來(lái)源缺乏廣泛性,今后將開(kāi)展多中心、更深層次的研究。②提取的數(shù)據(jù)缺乏處方醫(yī)生的職稱信息,可能對(duì)處方準(zhǔn)確性產(chǎn)生影響。③本研究方案中包含對(duì)中醫(yī)證候診斷信息的提取,但經(jīng)過(guò)篩選和數(shù)據(jù)處理后,中醫(yī)證候診斷信息的數(shù)據(jù)樣本量較小,因此未納入分析。④僅以成人中成藥雙清合劑為示范品種,探索為擴(kuò)大到兒童適用人群提供證據(jù)支持的方法,今后還需要應(yīng)用在更多的同類型品種,以及推廣到其他類型兒科中成藥開(kāi)發(fā),如院內(nèi)制劑,兒童中成藥或成人兒童共用中成藥增加新的兒童適用人群、增加功能主治等用法用量的選擇與確定,提供方法學(xué)借鑒。
本研究揭示了雙清合劑在兒科真實(shí)醫(yī)療環(huán)境的用藥特征,其適用人群以3~7歲為主,適應(yīng)證常見(jiàn)于急性上呼吸道感染(感冒)、急性支氣管炎(咳嗽)、急性扁桃體炎(乳蛾)、肺炎(肺炎喘嗽)和急性喉炎等。本研究構(gòu)建了基于機(jī)器學(xué)習(xí)算法的模型,規(guī)范兒童分年齡段用藥劑量折算比例和各年齡段最佳用藥劑量閾值,可為雙清合劑在兒童臨床應(yīng)用提供用藥方案參考,并為本品種變更兒童人群的注冊(cè)申請(qǐng)或說(shuō)明書(shū)的完善提供人用經(jīng)驗(yàn)證據(jù)支持。