高 曼 李海燕
(1.中國中醫(yī)科學院中醫(yī)藥信息研究所情報分析與評價研究室,北京 100700; 2.中國中醫(yī)科學院中醫(yī)藥信息研究所,北京 100700)
中醫(yī)藥信息學是一門由中醫(yī)藥學與信息學融合產(chǎn)生的以中醫(yī)藥信息為研究對象,旨在提高中醫(yī)藥信息獲取、轉化、傳播和利用能力的新興交叉學科。中醫(yī)藥信息學主要研究中醫(yī)藥信息的運動規(guī)律及其相互作用,近年來,中醫(yī)藥信息學在理論、方法、技術與標準方面快速發(fā)展,已被廣泛應用于中醫(yī)臨床規(guī)律發(fā)現(xiàn)與輔助診療、中藥科研與生產(chǎn)、中醫(yī)藥古今文獻知識服務等各個領域,在中醫(yī)藥現(xiàn)代化進程中發(fā)揮著重要作用,形成了中醫(yī)臨床數(shù)據(jù)挖掘與利用、中醫(yī)智能診療裝備研制、中藥數(shù)據(jù)分析與智能制造研究、中醫(yī)古籍智能化研究與知識服務、以及基于大數(shù)據(jù)的中醫(yī)藥評價等熱點研究方向,本文對各個研究熱點進行分析以期為研究人員提供有益參考。
利用數(shù)據(jù)挖掘等技術研究名老中醫(yī)臨證經(jīng)驗,對解析名老中醫(yī)診療規(guī)律、總結和傳承其學術思想具有重要意義。采用數(shù)據(jù)挖掘方法和相關平臺軟件開展名老中醫(yī)經(jīng)驗挖掘的研究有很多,如頻數(shù)分析法用于統(tǒng)計名老中醫(yī)常用藥物,關聯(lián)規(guī)則分析方法用于發(fā)現(xiàn)名老中醫(yī)用藥組合,聚類分析用于名老中醫(yī)診治疾病證型分類,因子分析用于總結名老中醫(yī)診治疾病的核心處方等等[1-2];中醫(yī)傳承輔助系統(tǒng)軟件、古今醫(yī)案云平臺集成了數(shù)據(jù)挖掘、人工智能等多種方法技術,不僅可以實現(xiàn)對醫(yī)案信息中的癥狀、證型、疾病名稱、藥物名稱等信息標準化處理,并可采用多種方法實施數(shù)據(jù)挖掘,近年來在名老中醫(yī)經(jīng)驗挖掘中的應用非常普遍[3]。
利用計算機技術將醫(yī)學知識庫與臨床實踐相結合,模擬醫(yī)學專家的診治思路,并通過分析臨床數(shù)據(jù)建立數(shù)據(jù)與決策邏輯關聯(lián)知識點,輔助醫(yī)務人員進行臨床決策是臨床決策支持系統(tǒng)的核心[4-5]。中醫(yī)臨床知識庫全面整合名醫(yī)經(jīng)驗、中醫(yī)醫(yī)案、臨床指南、中醫(yī)文獻、方劑知識和術語系統(tǒng)等多種知識資源,建立數(shù)據(jù)標準,規(guī)范化表達中醫(yī)知識,促進中醫(yī)臨床知識互融互通[6];隨著中醫(yī)知識庫、藥學知識庫和臨床知識庫的構建,以及知識表達、知識推理等技術的不斷進步,使得面向中醫(yī)藥臨床決策支持的知識服務成為可能,中醫(yī)藥信息學領域開展了相關研究,以期為輔助臨床決策提供實時、動態(tài)及個性化的知識服務,提高決策效率和精確度[7]。
電子病歷、醫(yī)保記錄存儲的診療信息能夠較好地體現(xiàn)真實世界中疾病診療情況,以此為數(shù)據(jù)源可以開展中醫(yī)真實世界研究,包括藥物療效評價、藥物安全性分析、臨床診療規(guī)律發(fā)現(xiàn)和疾病中醫(yī)證候特征分析等。根據(jù)研究目的對醫(yī)院信息系統(tǒng)存儲的藥物治療疾病信息進行分組,統(tǒng)計分析觀察組和對照組的疾病治療差異,可進行藥物療效評價[8-9];獲取醫(yī)院信息系統(tǒng)記錄的藥物使用情況及不良反應事件等信息,可實施藥物安全性分析[10-11];采集醫(yī)院信息系統(tǒng)中患者醫(yī)療數(shù)據(jù),分析臨床上疾病治療的用藥特點,可開展真實世界疾病診療規(guī)律的發(fā)現(xiàn)研究[12];統(tǒng)計比較醫(yī)院信息系統(tǒng)中中藥制劑的使用、患者患病特征和診治過程等信息,可分析中藥制劑在臨床上使用的合理性[13];多種維度分析醫(yī)院信息系統(tǒng)存儲的疾病中醫(yī)證候分布情況,可以幫助臨床醫(yī)生了解真實世界中的患者特征、證候分布、核心病機等[14]。
辨證分型是中醫(yī)診斷學的精髓,“辨證”是臨床醫(yī)生對患者的中醫(yī)臨床癥狀和舌脈象等信息加以分析、歸納,以辨清疾病的病因病機、病性和病位的過程。但是中醫(yī)臨床辨證中存在著大量主觀性和模糊性,缺乏客觀的評價標準,運用機器學習、數(shù)據(jù)挖掘等信息技術,分析中醫(yī)四診、患者生理指標等信息,建立辨證分型模型對實現(xiàn)中醫(yī)診斷數(shù)字化、客觀化具有重要意義。利用極值隨機森林等算法結合患者病史和癥狀、生化指標等數(shù)據(jù)進行癥候分類研究,可構建符合中醫(yī)理論的癥候分類模型[15-16];對疾病中醫(yī)證候進行聚類分析,亦可輔助中醫(yī)證候分類研究[17];運用Logistic回歸、關聯(lián)規(guī)則分析等方法能分析疾病證素組合分布規(guī)律及中醫(yī)證候特征[18];利用關聯(lián)規(guī)則分析和決策樹算法可以挖掘證候與證型之間的關系,對指導臨床辨證具有重要意義[19];亦有研究人員采用數(shù)據(jù)挖掘方法分析西醫(yī)同一疾病不同分型的中醫(yī)證候特點,豐富中醫(yī)辨病論治的內涵[20]。
以舌診儀、面診儀、問診儀、脈診儀為代表的中醫(yī)四診信息采集和處理設備,及四診采集集成設備的研發(fā),對中醫(yī)四診客觀化和建設移動健康管理平臺[21]具有重要意義。舌診儀主要由數(shù)字圖像采集和舌象特征處理兩個系統(tǒng)組成[22],采用高性能設備獲取舌象圖像后可對舌象顏色、紋理和舌體等特征進行客觀化分析處理[23-24];面診儀可采集患者面部前額、臉頰和口唇等部分在色調、飽和度與明度的色彩空間顏色參數(shù),稱為面象參數(shù)[25-26];問診儀可以實現(xiàn)人機對話,智能采集患者既往史、現(xiàn)病史、過敏史以及家族史等信息[27];脈診儀利用傳感器等收集人體脈象生理信息,通過芯片將其發(fā)送到中心服務器進行分析[28],四診儀獲取的信息可為中醫(yī)臨床疾病辨證分型提供參考。目前集成中醫(yī)四診客觀化采集設備的輔助診療系統(tǒng)已經(jīng)部分應用于醫(yī)院健康管理中心、治未病科[29];四診信息規(guī)范化、數(shù)字化、客觀化采集是創(chuàng)建四診數(shù)據(jù)庫的關鍵條件,四診數(shù)據(jù)庫是為遠程醫(yī)療提供中醫(yī)解決方案的重要基礎[30]。
中醫(yī)提倡的“治未病”與現(xiàn)代醫(yī)學的健康管理理念頗為一致,睡眠監(jiān)測、飲食監(jiān)測、呼吸監(jiān)測和脈搏監(jiān)測等可穿戴設備在個體“未病先防”、“欲病先治”中起到了重要作用[31]。可穿戴健康設備可以及時監(jiān)測用戶血糖、血壓、睡眠、心率及脈搏等數(shù)據(jù),為中醫(yī)健康管理平臺即時健康監(jiān)測帶來巨大便捷,除此之外可穿戴設備的即時健康監(jiān)測數(shù)據(jù)可借助云存儲技術進行云端存儲和分析,有助于其在遠程診療方面發(fā)揮獨特優(yōu)勢[32]。可穿戴設備提供的實時健康監(jiān)測,在優(yōu)化中醫(yī)藥大健康管理服務過程中亦發(fā)揮著重要作用,促進中醫(yī)藥大健康服務向著數(shù)字化、智能化和科學化方向發(fā)展。
基于中醫(yī)基礎理論和適宜技術開發(fā)的智能治療設備,區(qū)別于傳統(tǒng)的養(yǎng)生保健理療儀器,更貼近中醫(yī)防病治病的理論特點,目前中醫(yī)智能化治療的研究和應用主要集中在智能穴位刺激治療儀和智能推拿治療儀上[33]。南京中醫(yī)藥大學開發(fā)的智能針灸機器人可自動檢測穴位、根據(jù)治療要求調整艾灸位置和針刺深淺;按摩推拿機器人可以自動確定穴位,采用機器臂控制技術模仿中醫(yī)推拿手法,通過測量特定肌肉或肌腱的精準硬度,對軟組織實現(xiàn)精準感控,進行治療[34]。
中藥材質量控制涉及的環(huán)節(jié)繁多,包括土壤、種質、炮制、存儲和制劑等過程,信息技術的介入可有效解決中藥材質量控制難的問題?!盎ヂ?lián)網(wǎng)+”信息技術與中藥農業(yè)深度融合,可改造傳統(tǒng)中藥農業(yè)產(chǎn)業(yè)發(fā)展模式,實現(xiàn)中藥農業(yè)生產(chǎn)信息化管理、數(shù)據(jù)追溯、數(shù)據(jù)反饋和數(shù)據(jù)預測等[35]。中藥材信息化追溯體系建設,是實現(xiàn)中藥材來源可查、去向可追,治理中藥材質量問題的有效舉措[36]。本草基因組數(shù)據(jù)庫依據(jù)多國藥典收錄草藥物種,為草藥物種鑒定、用藥安全、優(yōu)良品種分子育種等方面提供信息支撐[37]。人工智能、深度學習及圖像處理技術已經(jīng)在識別中藥材及中藥飲片中得到深入應用[38],提取不同中藥飲片的圖像大小、顏色、紋理和形狀等參數(shù),運用機器學習算法對樣本數(shù)據(jù)進行分類訓練,建立飲片圖像特征識別分類模型,為有效辨別不同產(chǎn)地的中藥飲片、相近品種和易混淆品種提供了分析手段。
中藥制藥工業(yè)當前正處于數(shù)字化與智能化轉型過程中,中藥信息學領域已經(jīng)開展了大量研究實踐,促進實現(xiàn)中藥智能制造,并已形成一些有益的探索經(jīng)驗[39]。例如,利用文獻報道數(shù)據(jù)、中藥制藥過程數(shù)據(jù)和藥工操作經(jīng)驗,構建中藥制藥工藝知識庫,并整合深度學習等技術實現(xiàn)知識自動化和決策科學化,推動中藥制藥工業(yè)向“智慧制藥”轉型[40];運用數(shù)據(jù)驅動技術建立中藥生產(chǎn)過程的數(shù)字化模型,可為基于模型的中藥制藥過程智能化控制提供優(yōu)化策略[41];遵循制藥行業(yè)自動化生產(chǎn)指南等相關要求,構建實時數(shù)據(jù)庫系統(tǒng),實現(xiàn)制藥過程實時監(jiān)控、數(shù)據(jù)報表電子化操作和管理、生產(chǎn)工藝可回顧及藥物質量可追溯,以輔助中藥制造工藝改進和質量提升[42]。
藥性理論是中藥學的核心理論,是指導中醫(yī)臨床遣方用藥的重要依據(jù),在繼承的基礎上豐富藥性理論、揭示藥性理論的科學內涵,是中藥現(xiàn)代化的研究重點。獲取文獻中記載的中藥藥性、功效等信息并進行標準化處理,運用數(shù)據(jù)挖掘算法,可以分析中藥藥性與功效的關聯(lián)關系[43];中藥藥性與方劑功效存在非線性關系,利用人工神經(jīng)網(wǎng)絡等算法分析組方中的中藥藥性組合 (性-味-歸經(jīng)) 及功效規(guī)律, 并挖掘藥性組合與功效之間的關聯(lián)規(guī)則[44],可以為中藥方劑的功效預測提供依據(jù)[45]。構建人工智能預測模型,度量中藥成分相似性,可推測辨別中藥藥性[46];利用決策樹算法,結合中藥藥理作用與藥性之間的關系建立藥性預測平臺,實現(xiàn)直觀、快速的藥性預測[47],為缺失藥性的補遺提供了新的思路和途徑。
中藥藥效成分多,作用靶點復雜,呈現(xiàn)出多層次、多系統(tǒng)的復雜作用模式,網(wǎng)絡藥理學是通過構建“藥物活性成分-疾病-靶點-通路”的網(wǎng)絡,分析藥物的活性成分、靶點、通路以及和疾病在網(wǎng)絡中的相互作用關系,從而闡明藥物治療疾病的作用機制[48]。通過中藥系統(tǒng)藥理學數(shù)據(jù)庫與分析平臺發(fā)現(xiàn)中藥活性成分及靶點,取與疾病相關交集靶點,借助網(wǎng)絡藥理學方法進行分析,可幫助闡明中藥的藥效成分、預測藥物作用的潛在靶標[49-50];有研究者[51-52]將網(wǎng)絡藥理學與高效液相色譜相結合,通過高效液相色譜檢測中藥含有的化學成分,然后采用網(wǎng)絡藥理學方法,得到其含有的活性化合物,研究其中的活性成分,提高中藥活性成分的篩選效率;亦有研究者[53]將中藥藥性理論與網(wǎng)絡藥理學方法結合,按照藥性把中藥復方劃分為多個性味模塊后再進行網(wǎng)絡藥理學研究,探索更符合中醫(yī)藥特色的藥物作用機制研究方法。
中醫(yī)古籍智能化研究是促進中醫(yī)古籍保護、傳播和深度利用的重要手段,是“讓古籍活起來”的重要途徑。區(qū)別于傳統(tǒng)的中醫(yī)古籍數(shù)字化閱覽平臺,中醫(yī)古籍的智能化數(shù)據(jù)平臺不僅可以實現(xiàn)古籍的自動??薄⒆詣訕它c、自動編纂、自動注釋、自動索引、自動排版等功能,還提供基于中醫(yī)古籍知識圖譜的數(shù)據(jù)分析、挖掘、知識服務等功能[54]。醫(yī)案古籍知識庫通過對醫(yī)案類中醫(yī)古籍蘊含的知識解析、重組和規(guī)范,結合中醫(yī)古籍后控詞表,可以對古籍知識內容進行全面、系統(tǒng)、準確地表達與顯示,實現(xiàn)醫(yī)案古籍的知識化檢索與服務[55]。
學科化知識服務平臺是將知識服務與學科緊密結合,將學科內的知識與知識有機地結合起來,提供專業(yè)的知識服務。中醫(yī)藥領域開展了大量構建專科、專病知識庫的研究,以為專業(yè)內臨床及科研人員提供知識服務,如,整合脾胃病名醫(yī)經(jīng)驗、臨床研究、臨床指南、中醫(yī)文獻和方藥知識等資源,構建脾胃病臨床文獻大數(shù)據(jù)平臺[56];全面收集中醫(yī)領域內功能性胃腸病知識,納入醫(yī)案、方劑、養(yǎng)生方法等數(shù)據(jù),且支持用戶編輯、更新中醫(yī)知識,以共建共享的方式構建功能性胃腸病中醫(yī)知識庫[57];抽取文獻數(shù)據(jù)中包含的實驗數(shù)據(jù)集及其形成的包括機體器官、組織細胞、分子網(wǎng)絡等各級水平的穴位刺激效應數(shù)據(jù)與數(shù)據(jù)內在關系,利用計算機生成圖形和圖表,表示針刺效應錯綜復雜的過程,構建穴位刺激效應可視化平臺,為針刺生物學機制的深入研究提供規(guī)范化的數(shù)據(jù)支持及可視化分析[58]。
知識圖譜是一種可視性強、自帶推理規(guī)則且便于機器學習和利用的知識存儲與應用技術,在中醫(yī)藥領域的研究及應用非常廣泛。中醫(yī)藥各子領域構建的知識圖譜,如證候知識圖譜、專病知識圖譜、方劑知識圖譜和中藥知識圖譜,是實現(xiàn)中醫(yī)知識可視化、中醫(yī)智能問答和語義檢索的關鍵基礎[59]。目前相關研究已深入應用至中醫(yī)藥知識服務的各個方向,利用本體技術描述管理中醫(yī)醫(yī)案,實現(xiàn)醫(yī)案的智能檢索,可更有效地發(fā)揮中醫(yī)醫(yī)案的重要價值[60];構建中醫(yī)病機內涵知識圖譜,結合臨床個體化診療決策支持系統(tǒng),建立病機主導的中醫(yī)臨床個體化診療決策支持系統(tǒng),為中醫(yī)個體化診療輔助決策提供解決方案[61];基于知識圖譜構建中醫(yī)藥智能問答系統(tǒng),為用戶解答病證相關問題,提供輔助診療建議[62-63]。
隨著循證醫(yī)學的發(fā)展,以證據(jù)為基礎制定的臨床實踐指南已經(jīng)成為臨床決策的主要依據(jù)。高質量臨床研究論文是指南的主要證據(jù)來源,對臨床研究類論文進行質量評價,不僅能為指南制定提供證據(jù)支持,亦可以對期刊質量評價提供參考[64-65]。評價現(xiàn)代臨床研究論文質量的方法分為定性和定量兩種,定性方法一般根據(jù)學科特點結合專家訪談開展文獻質量評價[66],定量方法通常根據(jù)公認文獻質量評價量表對文獻質量進行評價[67];中醫(yī)古籍亦是指導中醫(yī)藥診療實踐的重要證據(jù)來源,因此中醫(yī)藥領域開展了中醫(yī)古籍證據(jù)分級體系構建研究,提出了多種中醫(yī)古籍證據(jù)質量分級方式,但尚未形成完善的評價與分級體系[68]。
學術評價是根據(jù)評價目的,從數(shù)量、新穎性、認可度和啟發(fā)性等角度對研究成果進行評價的過程,合理的學術評價可起到引導研究主體開展高質量研究活動的作用。中國醫(yī)學科學院提出科技量值(science and technology evaluation metrics,STEM)的概念,指出其是圍繞科技活動全過程,覆蓋創(chuàng)新活動全鏈條的綜合測算值,并以此為基礎從科技產(chǎn)出、學術影響和科技條件三個維度開展了中國醫(yī)院科技量值計算,旨在激勵醫(yī)學科技創(chuàng)新、推動醫(yī)學學科建設;為區(qū)域性引導患者就醫(yī),推動更多優(yōu)質中醫(yī)醫(yī)院進入民眾視野,建立和健全中醫(yī)藥學術影響力評價長效機制、更好地發(fā)揮中醫(yī)藥學術引領在中醫(yī)醫(yī)院建設中的導向作用,中國中醫(yī)科學院聯(lián)合中華中醫(yī)藥學會開展了基于中醫(yī)藥特色優(yōu)勢和科技影響力的中醫(yī)醫(yī)院評價和中醫(yī)醫(yī)院學科(???學術影響力評價工作[69-70]。
科學知識圖譜是顯示科學知識發(fā)展進程與結構關系的一種圖像,CiteSpace知識可視化軟件是目前最為流行的知識圖譜繪制工具之一,它可以繪制引文網(wǎng)絡圖譜來體現(xiàn)一個知識領域的演化歷程,并標識出圖譜上作為知識基礎的引文節(jié)點文獻和共引聚類所表征的研究前沿[71]。采用CiteSpace軟件挖掘中醫(yī)藥領域文獻的引文、機構、作者、關鍵詞等信息,繪制科學知識圖譜,發(fā)現(xiàn)領域核心研究團隊、研究熱點和研究前沿,總結研究領域發(fā)展現(xiàn)狀和趨勢,為領域發(fā)展提供參考是中醫(yī)藥科學知識圖譜研究的熱點[72-74];專利可以體現(xiàn)研究主體的技術實力與創(chuàng)新能力,專利計量研究可以進行領域技術趨勢分析及預測,利用CiteSpace繪制專利科學知識圖譜,分析領域技術熱點、技術趨勢,可為領域創(chuàng)新研究提供參考[75-76]。
近年來,中醫(yī)藥與信息技術、人工智能技術的融合發(fā)展在中醫(yī)臨床輔助決策支持、智能中醫(yī)診療裝備研發(fā)、名老中醫(yī)經(jīng)驗傳承、藥物療效與安全性評價、中藥智能制造、中藥材質量控制和中醫(yī)藥大健康管理等方面都非?;钴S,中醫(yī)藥信息學這一新興交叉學科的蓬勃發(fā)展為古老的中醫(yī)藥學帶來新的生機與活力,但要產(chǎn)生重大的突破還面臨著諸多挑戰(zhàn),如利用現(xiàn)代生物醫(yī)學工程、人工智能等技術,研制和開發(fā)可應用于中醫(yī)臨床實踐的智能診療裝備,客觀化收集和處理中醫(yī)臨床診療信息從而輔助基層中醫(yī)開展臨床診療研究,患者外在體征(舌脈等)與疾病的非定向對應關系以及中醫(yī)診療行為中蘊含的大量隱性知識等都是中醫(yī)四診客觀化以及中醫(yī)智能診療領域亟待解決的問題;廣泛應用信息技術開展中藥材質量控制、中藥智能制造、中藥藥性與功效關聯(lián)關系挖掘、中藥藥性補遺和中藥網(wǎng)絡藥理學研究,從而促進中藥現(xiàn)代化及產(chǎn)業(yè)化進程過程中,解析影響中藥材質量的眾多參數(shù)、優(yōu)化反饋控制模型是中藥智能制造的難點;智能計算和語義分析等技術在古籍數(shù)字化和知識組織中應用的局限性,以及尚未形成全面可靠的中醫(yī)古文語料庫是中醫(yī)古籍智能化研究的困境;在運用數(shù)據(jù)挖掘等技術分析來源廣泛、容量龐雜的中醫(yī)臨床診療數(shù)據(jù),深入挖掘名老中醫(yī)經(jīng)驗、開展真實世界研究和分析中醫(yī)辯證診斷規(guī)律的過程中,缺乏中醫(yī)藥經(jīng)驗傳承數(shù)據(jù)類標準,在一定程度上限制了中醫(yī)藥傳承信息化的發(fā)展;中醫(yī)藥數(shù)據(jù)量龐大、增長速度快,數(shù)據(jù)質量問題日益突出,在數(shù)據(jù)的采集、傳輸和處理過程中如果出現(xiàn)錯誤標注、噪聲大或不完整等質量問題,就會導致源于數(shù)據(jù)的決策產(chǎn)生嚴重錯誤,從海量數(shù)據(jù)中有效獲取高質量數(shù)據(jù)集是開展中醫(yī)藥信息學研究的重點和難點,因而基于大數(shù)據(jù)處理技術,建立完善的評價機制處理海量中醫(yī)藥領域信息資源,提高信息獲取的質量是關鍵。
利益沖突所有作者均聲明不存在利益沖突。
作者貢獻聲明高曼:設計研究方案,收集分析資料,撰寫論文;李海燕:提出研究思路,總體把關,審定論文。