程學(xué)榮 李木清 張?jiān)戮? 劉黎 李成麗 楊振武 姜雄 杜攀攀
〔摘要〕 信息時(shí)代,科學(xué)技術(shù)的發(fā)展突飛猛進(jìn)。以信息技術(shù)為基礎(chǔ),以中醫(yī)藥膝痹知識(shí)為資源,建立中醫(yī)膝痹病數(shù)據(jù)庫(kù),能為中醫(yī)膝痹病教學(xué)、臨床與科研提供知識(shí)發(fā)現(xiàn)的基礎(chǔ)設(shè)施,有利于中醫(yī)知識(shí)傳播共享與增值利用。探析中醫(yī)骨傷科膝痹病文獻(xiàn)數(shù)字化保存數(shù)據(jù)庫(kù)建立的步驟、方法、功能、內(nèi)容、數(shù)據(jù)庫(kù)維護(hù),數(shù)字化保存與挖掘中醫(yī)膝痹病臨床文獻(xiàn),為臨床實(shí)現(xiàn)中醫(yī)膝痹病證治的標(biāo)準(zhǔn)化、數(shù)據(jù)化提供行之有效的思路與方法。
〔關(guān)鍵詞〕 膝痹病;數(shù)據(jù)庫(kù);文獻(xiàn);數(shù)據(jù)挖掘
〔Abstract〕 In the information age, the development of science and technology has made rapid progress. Complying with the development of the times, based on information technology and using traditional Chinese medicine knee biliary knowledge as a resource, a database of Chinese knee biliary disease can be established, which can provide infrastructure for knowledge discovery for teaching, clinical and scientific research of knee biliary disease, which is conducive to the sharing and promotion of traditional Chinese medicine knowledge and the use of added value. To analyze the steps, methods, functions, contents, database maintenance of the traditional Chinese medicine orthopaedics knee paralysis literature database, to digitally save and explore the medicine knee paralysis clinical literature, can provide effective ideas and methods for the clinical realization of the standardization, and scientific decision-making of the Chinese medicine diagnosis and treatment of knee paralysis in clinical practice.
〔Keywords〕 knee paralysis; database; literature; data mining
膝痹病又稱膝骨關(guān)節(jié)炎(knee osteoarthritis, KOA),是一種常見的以膝關(guān)節(jié)軟骨的變性、破壞及骨質(zhì)增生為特征的慢性關(guān)節(jié)病,屬中醫(yī)學(xué)“骨痹”范疇,是臨床較為多見的慢性骨關(guān)節(jié)性疾病,此種疾病不僅患病率較高且病變的范圍較為廣泛,后期嚴(yán)重影響肢體功能,甚至致殘。緩解KOA病人疼痛,恢復(fù)患膝功能,改善生活質(zhì)量,一直是骨傷科臨床的重要研究課題。本課題擬建立膝痹病專題數(shù)據(jù)庫(kù),目的是通過對(duì)中醫(yī)膝痹病古今文獻(xiàn)進(jìn)行挖掘、分析,總結(jié)前人對(duì)中醫(yī)膝痹病證治思想,發(fā)現(xiàn)診療規(guī)律,系統(tǒng)總結(jié)中醫(yī)膝痹病的理論和辨證論治體系,從而提高膝痹病中醫(yī)診療與服務(wù)水平。其作用突出表現(xiàn)在三個(gè)方面:一是為臨床治療疾病提供一定依據(jù),提高醫(yī)療質(zhì)量、提高醫(yī)療效率;二是傳承中醫(yī)治病經(jīng)驗(yàn)和傳統(tǒng)特色方法;三是便于臨床教學(xué)和科研使用[1-2]。
1 數(shù)據(jù)庫(kù)建設(shè)
1.1? 文獻(xiàn)來源
膝痹數(shù)據(jù)庫(kù)是為國(guó)家臨床重點(diǎn)專科重點(diǎn)病種膝痹病服務(wù)的專題數(shù)據(jù)庫(kù)。研究收集較為規(guī)范的膝痹病古今文獻(xiàn),較為全面地收集中醫(yī)院士、國(guó)醫(yī)大師、全國(guó)名中醫(yī)、國(guó)家級(jí)名老中醫(yī)藥專家及近現(xiàn)代具有重要影響力的中醫(yī)骨科專家的膝痹經(jīng)驗(yàn)。數(shù)據(jù)庫(kù)文獻(xiàn)來源主要包括:(1)紙質(zhì)版書籍。以“痹”或者“關(guān)節(jié)炎”為關(guān)鍵詞項(xiàng)檢索詞,在中國(guó)國(guó)家圖書館·中國(guó)國(guó)家數(shù)字圖書館檢索發(fā)現(xiàn)膝痹專著,或者包含膝痹論述的專著書目。購(gòu)買膝痹病古籍、近現(xiàn)代名老中醫(yī)關(guān)于膝痹病的著作。(2)數(shù)字化文獻(xiàn)。整合湖南中醫(yī)藥大學(xué)圖書館的數(shù)字資源,納入中國(guó)知網(wǎng)、萬方數(shù)據(jù)資源、中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)、超星期刊、維普中文期刊服務(wù)平臺(tái)、PubMed、Medline Complete等中文、外文文獻(xiàn)數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)中涵蓋了關(guān)于膝痹病的期刊論文、會(huì)議論文、博士論文、碩士論文、報(bào)紙、標(biāo)準(zhǔn)、專利、成果等多種學(xué)術(shù)資源。(3)網(wǎng)絡(luò)資源。采集關(guān)于膝痹病的網(wǎng)絡(luò)信息資源,如新藥、科研獎(jiǎng)勵(lì)、新技術(shù)研發(fā)等。
1.2? 古籍整理
1.2.1? 書目的分類? 膝痹病古典專著較少,很多相關(guān)文字記錄都是散見于各類中醫(yī)醫(yī)籍里,然而每本書籍論述的內(nèi)容以及著重點(diǎn)均不相同,所以研究團(tuán)隊(duì)根據(jù)其側(cè)重點(diǎn)將古典書籍進(jìn)行分類,列為中醫(yī)理論類、中草藥類、方劑類、針灸推拿類、按摩導(dǎo)引類、臨證醫(yī)案類等。
1.2.2? 資料的摘編? 為了適應(yīng)臨床的實(shí)用和后期數(shù)據(jù)庫(kù)的開發(fā)及維護(hù)等要求,摘編的基本原則設(shè)定如下:(1)內(nèi)容在200字以下的一般應(yīng)采取以文摘卡形式摘錄;(2)內(nèi)容在200字以上的采取掃描全文或者復(fù)印的方式,最后予以剪貼整理;(3)摘編的書名、版本、作者、出版社、疾病名或病證名、篇名、起止頁碼、出版時(shí)間、摘抄人、復(fù)核人等重要內(nèi)容必須信息完備。
1.2.3? 資料的分類整理? 按時(shí)間(朝代及年份)的先后順序、作者、成書年代、疾病或病證名、病因病機(jī)、治則治法、方藥、調(diào)護(hù)等方面分類整理,待所有資料的錄入全部完成后,再經(jīng)二次校稿篩查整理完成。
1.2.4? 中醫(yī)膝痹病敘詞表的建立? 敘詞,是一類經(jīng)過特殊規(guī)范化處理的詞或者詞組,它具有以基本概念為基礎(chǔ)能夠表達(dá)出文獻(xiàn)主題的特性或?qū)傩?。而具有這類特性或?qū)傩缘脑~或者詞組的匯集就組成了敘詞表,可以用于檢索和標(biāo)引,它還能體現(xiàn)概念之間的相互關(guān)系。故中醫(yī)古籍?dāng)⒃~表的建立對(duì)后續(xù)進(jìn)行中醫(yī)古籍信息標(biāo)引時(shí)主要起到能夠自動(dòng)(輔助)選擇索引詞的功能,及進(jìn)行檢索時(shí)的后控制,是提高查全率、查準(zhǔn)率、實(shí)現(xiàn)多語檢索和智能化概念檢索的重要途徑,是構(gòu)建中醫(yī)古籍知識(shí)庫(kù)的基礎(chǔ)[3]。借鑒以往構(gòu)建中醫(yī)古籍?dāng)⒃~表的方式方法,研究團(tuán)隊(duì)擬采用以下幾步建立中醫(yī)膝痹病文獻(xiàn)敘詞表:(1)參考GB13190-91漢語主題詞表編制規(guī)則和GJB1776A-99軍用主題詞表編制規(guī)則制定詞表的編制標(biāo)準(zhǔn);(2)大量收集現(xiàn)有的與中醫(yī)藥相關(guān)的主題詞表,包括已頒布的當(dāng)前各種有關(guān)的國(guó)標(biāo)、行標(biāo)、參考以及各類中醫(yī)藥相關(guān)工具書。病名證名的制定和選取主要參考各類中醫(yī)辭典、《中醫(yī)病證名大辭典》以及《中醫(yī)名詞術(shù)語精華辭典》或者其他經(jīng)典名籍文獻(xiàn)中收錄[4];(3)在類目層級(jí)設(shè)置上,盡量減少層級(jí),對(duì)文獻(xiàn)較多,檢索頻率較高的類目適當(dāng)提高其列類等級(jí),增強(qiáng)分類法的易用性和直觀性[5]。
1.3? 現(xiàn)代文獻(xiàn)整理
1.3.1? 文獻(xiàn)的分類? 現(xiàn)代膝痹病文獻(xiàn)較多,包含各大數(shù)據(jù)資源,因此,研究團(tuán)隊(duì)可以根據(jù)文獻(xiàn)的種類以及研究的方向來進(jìn)行分類整理,分為學(xué)術(shù)期刊、會(huì)議論文、博碩士學(xué)位論文等。根據(jù)其研究方向的側(cè)重點(diǎn)不同可以分類為:實(shí)驗(yàn)研究、臨床觀察、基礎(chǔ)理論研究等。
1.3.2? 資料的歸類整理? 按文獻(xiàn)發(fā)表的先后時(shí)間順序、期刊雜志類型、臨床治療、實(shí)驗(yàn)研究等歸類整理, 待所有資料的錄入全部完成后,再經(jīng)二次校稿篩查整理完成。
1.4? 數(shù)據(jù)庫(kù)建設(shè)步驟
1.4.1? 制定數(shù)據(jù)庫(kù)檢索關(guān)鍵詞? 根據(jù)臨床研究及科研需求,結(jié)合文獻(xiàn)庫(kù)的特點(diǎn),選定檢索關(guān)鍵詞,如病名、辨證分型、治療方法等,設(shè)定規(guī)范的關(guān)鍵詞語用于檢索,檢索關(guān)鍵詞的制定參考中醫(yī)診斷學(xué)、中醫(yī)骨傷科常見疾病診療指南及我院制定的中醫(yī)膝痹病診療規(guī)范,制定膝痹病敘詞表。
1.4.2? 文獻(xiàn)信息采集與加工? 主要是圖文信息的采集,文本類的可以用高掃或者OCR識(shí)別,圖像類的信息可以借助于數(shù)碼攝像機(jī)或相關(guān)攝像工具;資源發(fā)布可以使用采編發(fā)布軟件、動(dòng)態(tài)發(fā)布軟件系統(tǒng)或TRS管理員工具等有關(guān)系統(tǒng)軟件進(jìn)行發(fā)布。利用開發(fā)工具M(jìn)icrosoft Visual Studio、Dreamweaver、Photoshop設(shè)計(jì)。文獻(xiàn)的整理分為四個(gè)方面:(1)按照歷史年代延續(xù)的先后(先秦-兩漢-晉-唐-宋-金-元-明-清),對(duì)歷代先賢關(guān)于膝痹病的相關(guān)論述,追其溯源,知其由來,審其變遷;(2)整理目前現(xiàn)有的中醫(yī)和西醫(yī)所有關(guān)于膝痹病的診治資料,含括其基本概念、發(fā)病機(jī)制、證候特點(diǎn)以及論治規(guī)律等;(3)按類歸納古今名家對(duì)膝痹病臨床治療的經(jīng)驗(yàn)籍冊(cè),古代名家可按歷史朝代先后分類,現(xiàn)代名家則按國(guó)家級(jí)和省級(jí)名老中醫(yī)分類收錄,研究了解不同時(shí)代醫(yī)家們關(guān)于膝痹病的認(rèn)識(shí)及其論治心得;(4)廣泛整理收集中醫(yī)從古至今治療膝痹病的相關(guān)內(nèi)服外敷的專方專藥,或者敷貼、熏洗、針灸等治療方法。
1.4.3? 制定策略? 校對(duì)文獻(xiàn)原始資料,提取與中醫(yī)膝痹病相關(guān)的章節(jié)內(nèi)容,提煉檢索詞語。
1.4.4? 檢索數(shù)據(jù)庫(kù)? 將檢索出來相關(guān)結(jié)果反饋給檢索者進(jìn)行篩選或者供其調(diào)整檢索方式方法進(jìn)行再次或多次檢索。經(jīng)檢索后將符合要求的數(shù)據(jù)格式進(jìn)行規(guī)范化處理后導(dǎo)入數(shù)據(jù)庫(kù)。數(shù)據(jù)字段參考CBM的全字段標(biāo)準(zhǔn)。
1.4.5? 文獻(xiàn)分析與挖掘? 在做到對(duì)“專而精”的文獻(xiàn)資料系統(tǒng)規(guī)范化采集基礎(chǔ)上,對(duì)文獻(xiàn)資料分析與挖掘,使其能夠?qū)υ假Y料中“理-法-方-藥”之間的關(guān)聯(lián)規(guī)則進(jìn)行統(tǒng)計(jì)分析,為形成系統(tǒng)理論體系提供資料支持。
1.4.6? 數(shù)據(jù)庫(kù)軟件創(chuàng)建步驟? 待研究團(tuán)隊(duì)完成了數(shù)據(jù)庫(kù)創(chuàng)建的前期工作,研究團(tuán)隊(duì)最后一步就是如何將研究成果應(yīng)用于臨床實(shí)踐,所以數(shù)據(jù)庫(kù)的創(chuàng)建其實(shí)就是理論到實(shí)踐的過程。研究團(tuán)隊(duì)將按以下步驟創(chuàng)建數(shù)據(jù)庫(kù)軟件:(1)安裝MySQL數(shù)據(jù)庫(kù)軟件,并且配置信息(MySQL是一個(gè)關(guān)系型數(shù)據(jù)庫(kù)管理系統(tǒng),將數(shù)據(jù)保存在不同的表中,而不是將所有數(shù)據(jù)堆積在一個(gè)大的倉(cāng)庫(kù)內(nèi),于是就提高了數(shù)據(jù)庫(kù)的運(yùn)行速度和靈活性);(2)創(chuàng)建連接。創(chuàng)建一個(gè)數(shù)據(jù)庫(kù)的連接,只有創(chuàng)建了數(shù)據(jù)庫(kù)連接,才能在該數(shù)據(jù)庫(kù)的方案中創(chuàng)建、更改對(duì)象或編輯表中的數(shù)據(jù);(3)測(cè)試連接。填寫對(duì)應(yīng)的連接名、主機(jī)名、端口、用戶名和密碼,確定數(shù)據(jù)庫(kù)連接無誤;(4)新建數(shù)據(jù)庫(kù)。根據(jù)前面創(chuàng)建的連接,在該連接下新建數(shù)據(jù)庫(kù),填寫數(shù)據(jù)庫(kù)的名稱和字符編碼(UTF-8);(5)新建表。在新建的數(shù)據(jù)庫(kù)下建立本項(xiàng)目所使用的表,本項(xiàng)目建立的表主要為:搜索答案詳情表(字段包括title,document,category等),搜索關(guān)鍵詞詳情表(字段包括number,search Word等)以及關(guān)鍵詞與title的映射表(字段包括number,title等);(6)數(shù)據(jù)導(dǎo)入。在新建好的表中導(dǎo)入搜集到的數(shù)據(jù);(7)數(shù)據(jù)驗(yàn)證。待數(shù)據(jù)導(dǎo)入結(jié)束,測(cè)試導(dǎo)入的正確性,通過SQL的相關(guān)查詢語句驗(yàn)證表內(nèi)數(shù)據(jù)的條數(shù),以及抽樣查看表中數(shù)據(jù)與導(dǎo)入數(shù)據(jù)的一致性(例如:select*from my Table where ds='20190222' and searchWord is not null,查詢表中行數(shù):select count(*) from myTable where ds='20190222')。見圖1。
2 數(shù)據(jù)庫(kù)內(nèi)容與功能
中醫(yī)膝痹病數(shù)據(jù)庫(kù),包括臨證醫(yī)案記錄288條,臨床經(jīng)驗(yàn)378條,理論研究265條、針灸推拿126條、按摩導(dǎo)引56條等,數(shù)據(jù)庫(kù)具備文獻(xiàn)檢索、信息統(tǒng)計(jì)、數(shù)據(jù)挖掘等功能。建成的專題數(shù)據(jù)庫(kù)以統(tǒng)一格式存儲(chǔ)中醫(yī)膝痹病各類文獻(xiàn)不同格式的信息,但依照資料類型分為古籍文獻(xiàn)模塊、名老中醫(yī)病例模塊、病案模塊、期刊文獻(xiàn)模塊、學(xué)位論文模塊、會(huì)議論文模塊、研究進(jìn)展模塊。本數(shù)據(jù)庫(kù)收集清及以前各醫(yī)家、近現(xiàn)代名老中醫(yī)文獻(xiàn)資料,通過建立中醫(yī)膝痹病古籍?dāng)⒃~表,歸納膝痹病的病名、證候診斷、中醫(yī)治則治法、中藥、方劑、辨證論治規(guī)律,同時(shí)對(duì)方劑和中藥進(jìn)行相關(guān)性分析,以了解治療某證候的各味中藥使用頻率,達(dá)到運(yùn)用這一數(shù)據(jù)庫(kù)可以查到治療膝痹病的某一方劑,再?gòu)姆絼┎榈较嚓P(guān)的中藥材,對(duì)膝痹病復(fù)方及單味藥進(jìn)行深入研究。
數(shù)據(jù)庫(kù)系統(tǒng)提供統(tǒng)一的檢索界面,支持多種途徑檢索,如題名、朝代、著者、辨證分型、治療方法等,也支持“=”“(”“)”及邏輯算符“或”“與”“非”等多種檢索方式;可按缺省設(shè)置、全部字段或任選字段等模式自由顯示檢索結(jié)果,若該文獻(xiàn)帶有全文下載,按照要求點(diǎn)擊后即可獲取原文或相關(guān)章節(jié);若該板塊帶有數(shù)據(jù)統(tǒng)計(jì)功能,則可按照需求進(jìn)行相關(guān)數(shù)據(jù)統(tǒng)計(jì)[6]。
數(shù)據(jù)庫(kù)的管理員在登錄時(shí)需要先輸入提前設(shè)定好的口令,登錄成功后才能在系統(tǒng)中進(jìn)行相關(guān)管理活動(dòng),例如對(duì)條文信息查閱、修改編輯以及對(duì)數(shù)據(jù)庫(kù)中現(xiàn)有的條文進(jìn)行刪除等管理,管理員還具有對(duì)條文關(guān)鍵詞的管理權(quán)限。
普通的用戶則需要進(jìn)入到數(shù)據(jù)庫(kù)軟件檢索頁面,然后輸入所需要信息的關(guān)鍵詞進(jìn)行檢索并瀏覽相關(guān)信息。
3 數(shù)據(jù)庫(kù)維護(hù)
據(jù)庫(kù)建設(shè)完成后,若在使用中發(fā)現(xiàn)數(shù)據(jù)錯(cuò)誤、文獻(xiàn)特征不準(zhǔn)確或數(shù)據(jù)內(nèi)容不全面時(shí),可以及時(shí)修正。同時(shí)本數(shù)據(jù)庫(kù)注重動(dòng)態(tài)更新,能夠及時(shí)補(bǔ)充和添加心得等相關(guān)內(nèi)容資料,設(shè)定每間隔半年就進(jìn)行一次數(shù)據(jù)的維護(hù)及更新。本數(shù)據(jù)庫(kù)的建設(shè)理念不僅在數(shù)據(jù)內(nèi)容上保證了全面性和連續(xù)性,而且在資源整合上充分體現(xiàn)了發(fā)展性和不間斷性,使數(shù)據(jù)庫(kù)在質(zhì)量和生命力長(zhǎng)久方面得以保證。
信息化社會(huì),科技發(fā)展日新月異,新知識(shí)、新技術(shù)不斷涌現(xiàn),中醫(yī)藥數(shù)字化信息建設(shè)勢(shì)在必行。中醫(yī)膝痹病數(shù)據(jù)庫(kù)以信息技術(shù)為基礎(chǔ),以中醫(yī)藥膝痹知識(shí)為資源,為開展中醫(yī)膝痹病教學(xué)、科研與診療技術(shù)創(chuàng)新提供知識(shí)發(fā)現(xiàn)的基礎(chǔ)設(shè)施。研究團(tuán)隊(duì)力求構(gòu)建一個(gè)基本成型的膝痹病專題文獻(xiàn)數(shù)據(jù)庫(kù),實(shí)現(xiàn)本領(lǐng)域文獻(xiàn)的規(guī)范化、標(biāo)準(zhǔn)化及統(tǒng)一化管理,以建成高質(zhì)量的特色文獻(xiàn)數(shù)據(jù)庫(kù),通過“中醫(yī)膝痹病臨床文獻(xiàn)”的網(wǎng)絡(luò)傳播,提高對(duì)中醫(yī)膝痹病的學(xué)術(shù)研究水平,推進(jìn)我國(guó)中醫(yī)骨傷事業(yè)的發(fā)展。
參考文獻(xiàn)
[1] 王? 健,王耀光.基于數(shù)據(jù)挖掘的當(dāng)代中醫(yī)治療慢性腎炎蛋白尿證治方藥規(guī)律研究[J].上海中醫(yī)藥雜志,2019,53(4):17-21.
[2] 張? 越,劉鴻燕,秦盼盼,等.我國(guó)中醫(yī)藥信息化基礎(chǔ)標(biāo)準(zhǔn)發(fā)展現(xiàn)狀研究[J].醫(yī)學(xué)信息學(xué)雜志,2015,36(12):8-12.
[3] 韓其琛,趙亞偉,姚鄭,等.基于敘詞表的領(lǐng)域知識(shí)圖譜初始種子集自動(dòng)生成算法[J].中文信息學(xué)報(bào),2018,32(8):1-8.
[4] 李? 兵,張華敏,李莎莎,等.中醫(yī)古籍知識(shí)深度利用方法與知識(shí)庫(kù)構(gòu)建[J].中國(guó)數(shù)字醫(yī)學(xué),2018,13(8):33-35.
[5] 劉? 濤,舒紅平.基于無監(jiān)督學(xué)習(xí)的中醫(yī)古籍文獻(xiàn)本體構(gòu)建方法研究[J].電子技術(shù)與軟件工程,2016(12):169.
[6] 劉? 梨,龔后武,張?jiān)戮?,?中醫(yī)古籍四大經(jīng)典中中醫(yī)護(hù)理文獻(xiàn)的整理與數(shù)據(jù)庫(kù)的建立[J].護(hù)理研究,2017,31(13):1608-1610.