成福春 張平 劉華 房敏
摘要:本文討論了編碼之中常用到的按位累加取模、多項(xiàng)式乘法累加取模等校驗(yàn)位算法的優(yōu)缺點(diǎn),尤其是對系統(tǒng)化醫(yī)學(xué)術(shù)語集(SNOMED)編碼采用二面體群D5校驗(yàn)位算法作了較深入的討論。二面體群D5算法不僅可以校驗(yàn)出所有一位錯(cuò)誤及相鄰位置換位錯(cuò)誤,而且不需要增加字母x,是一種非常理想的校驗(yàn)位算法。國內(nèi)目前尚無一套既具有信息技術(shù)特征,又具有中醫(yī)學(xué)科本身特征的編碼化的術(shù)語集,SNOMED編碼采用二面體群D5校驗(yàn)位算法,對于中醫(yī)術(shù)語編碼具有重要的借鑒意義。
關(guān)鍵詞:中醫(yī)術(shù)語;術(shù)語編碼;系統(tǒng)化醫(yī)學(xué)術(shù)語集;校驗(yàn)位算法;二面體群D5
醫(yī)學(xué)術(shù)語及其編碼化,對于規(guī)范臨床數(shù)據(jù)采集,數(shù)據(jù)檢索分析利用、提升醫(yī)療質(zhì)量以及研究的深度,具有重要意義。系統(tǒng)化醫(yī)學(xué)術(shù)語集臨床術(shù)語(systematized nomenclature of medicine clinical terms,SNOMED CT)通過編碼進(jìn)行世界范圍內(nèi)的統(tǒng)一術(shù)語交流,即代碼唯一,或稱概念唯一。但是代碼所代表的內(nèi)容其形式可以多樣,如英文形式、中文形式或者各國語言形式。通過定義代碼與代碼之間的關(guān)系,來體現(xiàn)學(xué)科本身的邏輯與語義。
1.系統(tǒng)化醫(yī)學(xué)術(shù)語集一臨床術(shù)語編碼簡介
在SNOMED CT術(shù)語體系中,賦予每一個(gè)特定術(shù)語一個(gè)代碼,即擴(kuò)展版的SNOMED CT概念標(biāo)識符(SCTID字段)。代碼本身不要求有特別的含義,只是代表這個(gè)術(shù)語本身,利于計(jì)算機(jī)處理。
在代碼結(jié)構(gòu)中,具有相關(guān)的屬性信息,如extension item identifier(擴(kuò)展項(xiàng)目標(biāo)識符),共8位,代表具體的項(xiàng)目編碼;namespace identifier(名稱空間標(biāo)識符),共7位,代表維護(hù)代碼的機(jī)構(gòu);partition identifier(部分標(biāo)識符),2位,10代替概念,20代表描述,30代表關(guān)系;最后一位是check-digit(校驗(yàn)位),便于計(jì)算機(jī)自動糾錯(cuò)。SNOMED通過3張表來體現(xiàn),即概念表、定義表、關(guān)系表。SCTID是概念表中的最重要的字段。目前擴(kuò)展版的SCTID字段結(jié)構(gòu)如圖1。