国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

癲癇中醫(yī)癥狀術(shù)語規(guī)范化研究*

2020-08-01 07:44張妮楠曹馨宇林睿凡史華新周洪偉
關(guān)鍵詞:同義語料術(shù)語

張妮楠,曹馨宇,林睿凡,王 斌,史華新,周洪偉**,謝 琪**

(1. 中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所 北京 100700;2. 中國標(biāo)準(zhǔn)化研究院基礎(chǔ)標(biāo)準(zhǔn)化研究所 北京 100191;3. 中國中醫(yī)科學(xué)院醫(yī)院管理處 北京 100700)

癲癇是一種以具有持久性的致癇傾向?yàn)樘卣鞯哪X部疾病,有著不同病因基礎(chǔ)、臨床表現(xiàn)各異但以反復(fù)癲癇發(fā)作為共同特征的慢性腦部疾病狀態(tài),是神經(jīng)內(nèi)科最常見的疾病之一,我國患病率在4‰-7‰之間[1]。系統(tǒng)評(píng)價(jià)與meta 分析顯示,中西醫(yī)結(jié)合治療癲癇療效優(yōu)于單純西藥治療,中藥發(fā)揮了減少西藥毒副作用增強(qiáng)療效的作用[2-4]。中醫(yī)常采用自然語言描述疾病癥狀,各學(xué)者及臨床人員對(duì)本病的描述各異,中醫(yī)癥狀缺乏統(tǒng)一的標(biāo)準(zhǔn),導(dǎo)致癥狀命名不統(tǒng)一,定義不嚴(yán)謹(jǐn),影響數(shù)據(jù)挖掘分析和臨床療效評(píng)價(jià)結(jié)果。臨床診療數(shù)據(jù)向科研數(shù)據(jù)轉(zhuǎn)化是目前研究趨勢(shì),臨床診療數(shù)據(jù)的價(jià)值得到了越來越多的關(guān)注,術(shù)語的規(guī)范化是這一轉(zhuǎn)化過程的基礎(chǔ)和步驟,而顯得尤為重要。

1 構(gòu)建癲癇中醫(yī)癥狀語料庫

1.1 語料選取方法

語料(corpus),即語言材料;用于分析和研究語言數(shù)據(jù)的集合體為語料庫;遵循語料庫適用性、忠實(shí)性、一致性原則[5],本研究通過文獻(xiàn)調(diào)研、專家咨詢,得到癲癇相關(guān)標(biāo)準(zhǔn)、教材共24部,其中有明確定義、診斷和辨證分型的共6 部,摘取其中相關(guān)部分合成同一個(gè)文本,以逗號(hào)為標(biāo)識(shí)符對(duì)原始語料進(jìn)行分詞。

1.2 語料來源特征

本研究所選語料來源有如下特征:《中藥新藥臨床研究指導(dǎo)原則》針對(duì)76 個(gè)病證,采用現(xiàn)行通用的中西醫(yī)病、證名,對(duì)于癲癇中醫(yī)的各個(gè)證型做了詳細(xì)的解釋?!杜R床診療指南-癲癇分冊(cè)》分別介紹癲癇的定義、分類、診斷、預(yù)后等,本研究主要選取癲癇中醫(yī)藥診療部分?!栋B病顳葉癲癇中醫(yī)診療方案》為顳葉癲癇的疾病診斷、證候診斷、中醫(yī)藥治療和調(diào)護(hù)以及療效評(píng)價(jià)提供了系統(tǒng)的診療方案?!吨嗅t(yī)病癥診斷療效標(biāo)準(zhǔn)》規(guī)定了中醫(yī)內(nèi)科57個(gè)病證,介紹了癲癇的病證名、診斷依據(jù)、證候分類、療效評(píng)定,適用于中醫(yī)臨床醫(yī)療質(zhì)量評(píng)定,中醫(yī)科研和教學(xué)。《中醫(yī)內(nèi)科常見病診療指南-西醫(yī)疾病部分》共86 種疾病,采用西醫(yī)病名,提供西醫(yī)診斷依據(jù),適應(yīng)病證結(jié)合診療模式,本研究選取中醫(yī)藥治療癲癇部分?!吨嗅t(yī)內(nèi)科學(xué)》作為代表教材,納入54個(gè)病證,其中對(duì)癲癇的病因病機(jī)、診治原則、證治分類、病癥鑒別、辨證要點(diǎn)進(jìn)行詳細(xì)描述,具體見(表1)。

表1 語料來源、特點(diǎn)及語料數(shù)量

1.3 語料庫構(gòu)建

將文本數(shù)據(jù),以逗號(hào)為標(biāo)識(shí)符對(duì)原始語料分詞,采用雙人錄入模式,基于Microsoft Excel 2013 構(gòu)建語料庫,對(duì)語料進(jìn)行檢查核實(shí),確保語料的準(zhǔn)確性、完整性。

2 癲癇中醫(yī)癥狀術(shù)語的規(guī)范

本研究以《術(shù)語工作原則與方法》《中醫(yī)藥學(xué)名詞審定原則與方法》為依據(jù),以《WHO 西太平洋地區(qū)傳統(tǒng)醫(yī)學(xué)名詞術(shù)語國際標(biāo)準(zhǔn)》[6]《中醫(yī)藥學(xué)名詞》[7]《中醫(yī)藥常用名詞術(shù)語詞典》[8]《中醫(yī)大辭典》[9]《中醫(yī)癥狀鑒別診斷學(xué)》[10]《中醫(yī)臨床常見癥狀術(shù)語規(guī)范》[11]等為藍(lán)本,提取癲癇中醫(yī)癥狀術(shù)語的具體方法如下。

2.1 核心癥狀提取

癲癇語料中存在癥狀如“或有吼叫”,以副詞加動(dòng)詞形式出現(xiàn),其中動(dòng)詞“吼叫”是該癥狀的核心詞,副詞“或有”是其修飾成份,對(duì)于此類術(shù)語提取其核心癥狀,去掉其修飾成份。通過核心癥狀提取,獲取了癲癇癥狀術(shù)語3條(表2)。

表2 提取核心癥狀術(shù)語

癲癇語料中存在癥狀以動(dòng)詞或名詞加形容詞形式出現(xiàn),沒有修飾副詞,如“精神萎靡”“手足蠕動(dòng)”,本身即為核心癥狀術(shù)語,可直接提取,由此獲癲癇癥狀術(shù)語34條(表3)。

2.2 邏輯關(guān)系保留

術(shù)語間存在一些有描述性邏輯關(guān)系[12]的術(shù)語,保留其邏輯關(guān)系。例如“局限性抽搐”中的“局限性”來修飾限定“抽搐”的范圍,而癲癇發(fā)作時(shí)依據(jù)抽搐的部位往往能夠反映腦部的病灶起源,對(duì)臨床診斷具有價(jià)值。疼痛是常見自覺癥狀之一,疼痛的性質(zhì)特點(diǎn)有助于分析疼痛的病因病機(jī),如術(shù)語“頭部刺痛”指疼痛尖銳如針刺之感,主因瘀血所致,疼痛位置較多固定;頭竄通指疼痛游走不定,多因風(fēng)邪所致;疼痛性質(zhì)不同用藥也不同,因此保留癥狀間邏輯關(guān)系。由此獲癲癇癥狀術(shù)語3條(表4)。

2.3 復(fù)合癥狀拆解

復(fù)合癥狀多由兩個(gè)癥狀組成,臨床上這些癥狀涉及多個(gè)病性或病位且多不同時(shí)出現(xiàn),因此這部分癥狀應(yīng)予以拆分,拆分后的癥狀,既可以單獨(dú)統(tǒng)計(jì)癥狀-藥物的關(guān)聯(lián)性,也可通過術(shù)語關(guān)系統(tǒng)計(jì)挖掘癥狀間-藥物的關(guān)聯(lián)性。本研究拆解了不同病位或相同病位不同性質(zhì)的復(fù)合癥狀19 條,形成癥狀術(shù)語38 條見(表5)。如“抽搐吐涎”,實(shí)際應(yīng)用中有很多患者僅出現(xiàn)“抽搐”癥狀,并不伴有“吐涎”,兩者不同時(shí)出現(xiàn)頻率較大,因此對(duì)其進(jìn)行拆分。對(duì)復(fù)合的舌診、脈診本文以《中醫(yī)診斷學(xué)》中脈象和舌象為依據(jù),以內(nèi)涵最小單元[13]為原則進(jìn)行拆解,例如“脈滑數(shù)”,滑脈主痰飲、食滯、實(shí)熱,脈數(shù)主熱證。每一脈象都有其特殊的臨床意義。因此可將其拆解為最小單元?!疤Π啄仭辈鸾獬伞疤Π住焙汀疤δ仭保滋χ骱C、表證,膩苔主濕濁、痰飲、食積,本研究拆解了復(fù)合舌診脈診13條,去重形成術(shù)語14條。

表3 直接提取癲癇癥狀術(shù)語

表4 含邏輯關(guān)系術(shù)語

表5 拆解復(fù)合癥狀術(shù)語

2.4 首選術(shù)語制定

癥狀規(guī)范化過程會(huì)遇到癥狀名稱不統(tǒng)一,一癥多名的現(xiàn)象。本研究引入首選術(shù)語(preferred terms)的概念,首選術(shù)語是指通過規(guī)則從語料庫中提取的某一概念作為第一選擇的術(shù)語,亦指當(dāng)一個(gè)概念出現(xiàn)正名和別名時(shí),根據(jù)臨床用語習(xí)慣或使用頻率,選其一為首選術(shù)語。同義術(shù)語(synonym term)為與首選術(shù)語概念相同的其它術(shù)語[14-15]。同義術(shù)語的存在豐富了疾病的語言表達(dá)但卻不利于學(xué)科之間、學(xué)術(shù)之間的交流,不利于數(shù)據(jù)的統(tǒng)計(jì)與分析,影響了辨證論治和潛方用藥的判斷,所以有必要厘清同義術(shù)語和首選術(shù)語。對(duì)同義術(shù)語的處理,分別查其內(nèi)涵與外延,并將其映射到相應(yīng)的首選術(shù)語。例如,《中醫(yī)藥學(xué)名詞》載錄的不寐(insomnia)指經(jīng)常性的睡眠減少,或不易入睡,或睡眠短淺而易醒,甚或徹夜不眠的表現(xiàn),又稱失眠。失眠(insomnia)是指由于各種原因引起的睡眠不足。一般包括睡眠時(shí)間、深度及恢復(fù)體力的不足,可有入睡困難、頻繁醒轉(zhuǎn)和早醒等形式。失眠患者白天出現(xiàn)精神不振、疲乏、易激惹、困倦和情緒不佳等表現(xiàn)。又如牙關(guān)緊閉(trismus)指完全不能自行張口,向下用力不能使口張開的臨床征象,咀嚼肌僵硬感。見于癲癇、破傷風(fēng)、顳頜關(guān)節(jié)等病??卩洌╨ockjaw)指牙關(guān)緊閉,張口困難,口合不來癥狀。還有一類術(shù)語查閱了北京大學(xué)中國語言學(xué)研究中心、術(shù)語在線、wordnet 等均沒有釋義,按照文獻(xiàn)等級(jí)、使用頻次、用語習(xí)慣等,選其一為首選術(shù)語,如卒然撲倒、突然跌倒、突然昏倒、突然昏仆,其中突然昏仆在國標(biāo)《中醫(yī)臨床診療術(shù)語國家標(biāo)準(zhǔn)(疾病部分)》中被提及,其他三個(gè)詞均出自行標(biāo),則以國標(biāo)為準(zhǔn)則選其為首選術(shù)語。在本研究中,首選術(shù)語和同義術(shù)語有14對(duì)見(表6)。

首選術(shù)語和同義術(shù)語的映射可分為以下兩種類型:(1)語義完全一致的古今術(shù)語,選取尿黃、大便干燥、牙關(guān)緊閉、失眠、胸悶,現(xiàn)今表達(dá)為首選術(shù)語。(2)語義接近,不影響臨床挖掘分析應(yīng)用的術(shù)語,選取喉中痰鳴、吼叫、兩目凝視、兩目上視、突然昏仆、神疲、頭暈、煩躁、精神恍惚,其在參考藍(lán)本中出現(xiàn)頻率高的作為首選術(shù)語。

表6 首選術(shù)語及同義術(shù)語

表7 癥狀術(shù)語分類

3 癲癇中醫(yī)癥狀術(shù)語的分類

經(jīng)過對(duì)癲癇中醫(yī)癥狀術(shù)語的規(guī)范化處理,得到了120 條癥狀術(shù)語,參照癥狀體征分類框架[16]對(duì)其進(jìn)行分類見(表7)。

4 討論

中醫(yī)癥狀術(shù)語是中醫(yī)辨病論治和辨證論治過程中重要的和主要的依據(jù),其準(zhǔn)確性和規(guī)范性尤為重要。中醫(yī)癥狀規(guī)范化歷程中,有學(xué)者[17-18]提出從中醫(yī)癥狀學(xué)角度出發(fā)明確癥狀的內(nèi)涵和外延,對(duì)癥狀進(jìn)行量化分級(jí)等。有學(xué)者[19-20]提出從語法學(xué)知識(shí),構(gòu)建中醫(yī)癥狀基本詞匯表和中醫(yī)癥狀術(shù)語表達(dá)類型。有學(xué)者[14,21]依據(jù)文獻(xiàn)梳理的方法以正名和別名的形式,溯源癥狀名詞的演變。信息學(xué)的興起加速了中醫(yī)信息化的步伐,有學(xué)者[22-24]通過計(jì)算技術(shù)基于CRFs 模型、LSTM-CRF 模型和模式自動(dòng)獲取等技術(shù)方法,對(duì)現(xiàn)病史文本癥狀術(shù)語、中醫(yī)醫(yī)案癥狀術(shù)語、中醫(yī)臨床癥狀術(shù)語進(jìn)行識(shí)別和抽提。諸多探索促進(jìn)了中醫(yī)癥狀術(shù)語規(guī)范化的研究進(jìn)展,但是當(dāng)進(jìn)行具體實(shí)施操作時(shí),則是仁者見仁智者見智。計(jì)算機(jī)模型的介入加速了規(guī)范化的步伐,但是計(jì)算機(jī)模型一般僅對(duì)單一的文本格式,能獲得一個(gè)滿意的準(zhǔn)確率和召回率,當(dāng)該模型應(yīng)用于其他文本數(shù)據(jù),例如從呼吸科的文本挖掘換到腦病科的文本挖掘,其準(zhǔn)確率和召回率未必達(dá)標(biāo),為了能讓計(jì)算機(jī)技術(shù)真正普及到中醫(yī)術(shù)語的規(guī)范化應(yīng)用中,應(yīng)該在提取原則上達(dá)成共識(shí),有統(tǒng)一的標(biāo)準(zhǔn)。

本研究進(jìn)行癲癇癥狀術(shù)語的整理,其一,現(xiàn)存的幾部癲癇規(guī)范均為診療指南或標(biāo)準(zhǔn),涉及癲癇癥狀的術(shù)語量少,因各標(biāo)準(zhǔn)發(fā)布單位不同、應(yīng)用目的不一,標(biāo)準(zhǔn)與標(biāo)準(zhǔn)之間存在表達(dá)多樣性,無法進(jìn)行數(shù)據(jù)挖掘分析;其二,現(xiàn)行出版或發(fā)布的術(shù)語書籍或標(biāo)準(zhǔn)多為診療術(shù)語,即為癥狀術(shù)語也多涉及各系統(tǒng)、各科的癥狀,不能準(zhǔn)確、成簇、詳實(shí)的刻畫癲癇專病的臨床表現(xiàn);其三,中醫(yī)癥狀術(shù)語缺乏統(tǒng)一的標(biāo)準(zhǔn),不能指導(dǎo)癲癇中醫(yī)癥狀術(shù)語直接進(jìn)行數(shù)據(jù)挖掘分析,因此本研究欲從已發(fā)布的規(guī)范文件入手,構(gòu)建癲癇中醫(yī)癥狀術(shù)語字典,通過分析術(shù)語的內(nèi)涵和外延來比較癥狀術(shù)語間的異同,引入首選術(shù)語和同義術(shù)語的概念,為豐富術(shù)語字典提供理論基礎(chǔ),為中醫(yī)癥狀規(guī)范化從數(shù)據(jù)挖掘角度提供可借鑒的方法,以期挖掘數(shù)據(jù)的共性規(guī)律與差異性規(guī)律;其四,從學(xué)科建設(shè)角度出發(fā),中醫(yī)學(xué)對(duì)癲癇的認(rèn)識(shí)從古至今日趨完善,關(guān)于癲癇的現(xiàn)代研究也逐漸增多,但在癲癇專病術(shù)語表達(dá)應(yīng)用上卻未能實(shí)現(xiàn)統(tǒng)一,導(dǎo)致從理論證據(jù)向數(shù)字證據(jù)轉(zhuǎn)化形成障礙,因此癲癇癥狀術(shù)語規(guī)范化不僅能為行業(yè)內(nèi)提供通行的術(shù)語,也能為術(shù)語字典的構(gòu)建提供良好的開端。其五,癲癇中醫(yī)癥狀術(shù)語相對(duì)于西醫(yī)癥狀術(shù)語有它獨(dú)特的特點(diǎn),國際抗癲癇聯(lián)盟[25]在2001 年給出了癲癇發(fā)作時(shí)的癥狀術(shù)語,例如“認(rèn)知損傷”他們定義為認(rèn)知性操作減低,包括知覺、注意力、情緒、記憶、執(zhí)行能力、操作和語言等其中一項(xiàng)或多項(xiàng),而中醫(yī)將其描述為“不省人事、昏不識(shí)人、意識(shí)喪失”等諸如此類的術(shù)語來描述。兩者之間的差別在于中醫(yī)善于更形象化,具體化的刻畫發(fā)作這一過程,西醫(yī)則在于總結(jié)性的概括一系列癥狀。癥狀是千變?nèi)f化的,促就了中醫(yī)獨(dú)特的望聞問切和病證結(jié)合的診療模式,但是臨床癥狀的多樣性和復(fù)雜性也束縛了中醫(yī)藥的國際化和數(shù)量化。故癲癇中醫(yī)癥狀術(shù)語規(guī)范化整理勢(shì)在必行。

本研究的規(guī)范癥狀術(shù)語的語料來源于規(guī)范性指南、標(biāo)準(zhǔn)可信度高。按照科技術(shù)語命名原則,通過4個(gè)術(shù)語抽取原則整理癲癇中醫(yī)癥狀術(shù)語,參照癥狀體征分類框架[16],從醫(yī)生客觀觀察和患者主觀感受出發(fā)按照望、聞、問、切,將術(shù)語框架分為四大類,再按照其中小類對(duì)術(shù)語進(jìn)行歸類,最終形成癲癇癥狀術(shù)語120條,通過定義每條術(shù)語的內(nèi)涵和外延,從語義關(guān)系上辨析得到癲癇癥狀首選術(shù)語106 條,癲癇癥狀同義術(shù)語14條,并建立了首選術(shù)語和同義術(shù)語之間的映射關(guān)系。

臨床病歷中癥狀術(shù)語更加豐富多樣,涉及癥狀較復(fù)雜,多涉及癥狀屬性的描述如,疼痛性質(zhì)、程度、持續(xù)時(shí)間、加重緩解因素等,門診病歷數(shù)據(jù)不僅涉及癲癇的主癥、兼癥、伴隨癥狀,還涉及其他診斷,這些術(shù)語在概念和層次上較標(biāo)準(zhǔn)文件中術(shù)語復(fù)雜,本研究為使研究結(jié)果更加豐富和適用,欲在后期研究中以癲癇病歷為語料庫在驗(yàn)證本次研究結(jié)果的同時(shí)增補(bǔ)癲癇癥狀術(shù)語,形成癲癇專病中醫(yī)癥狀術(shù)語字典,為癲癇數(shù)據(jù)挖掘分析做好術(shù)語標(biāo)準(zhǔn)化的工作。

猜你喜歡
同義語料術(shù)語
祈使句小練
面向低資源神經(jīng)機(jī)器翻譯的回譯方法
until用法鞏固精練
瀕危語言與漢語平行語料庫動(dòng)態(tài)構(gòu)建技術(shù)研究
國內(nèi)外語用學(xué)實(shí)證研究比較:語料類型與收集方法
有感于幾個(gè)術(shù)語的定名與應(yīng)用
從術(shù)語學(xué)基本模型的演變看術(shù)語學(xué)的發(fā)展趨勢(shì)
英語教學(xué)中真實(shí)語料的運(yùn)用
同義句轉(zhuǎn)換專項(xiàng)練習(xí)50題
同義句轉(zhuǎn)換專練