国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

XML數(shù)據(jù)交換技術(shù)在中醫(yī)智能化診斷數(shù)據(jù)集成中的應(yīng)用

2015-12-02 20:37:31余江維余泉
現(xiàn)代電子技術(shù) 2015年22期
關(guān)鍵詞:數(shù)據(jù)集成中醫(yī)

余江維+余泉

摘 要: 在中醫(yī)四診信息融合智能化診斷系統(tǒng)中,四診信息來自于多個不同的異構(gòu)數(shù)據(jù)源。針對目前數(shù)據(jù)集成問題的研究現(xiàn)狀,分析異構(gòu)數(shù)據(jù)源的結(jié)構(gòu),結(jié)合中醫(yī)智能化診斷系統(tǒng),利用XML Schema設(shè)計MDD(元數(shù)據(jù)字典)的通用模型、處理XML文檔的DOM對象模型、以及數(shù)據(jù)庫連接的OLE DB技術(shù),提出一種以XML文件為中介的數(shù)據(jù)集成方法,實現(xiàn)了中醫(yī)智能化診斷系統(tǒng)中四診信息的有機集成。

關(guān)鍵詞: 中醫(yī); 智能化診斷系統(tǒng); 數(shù)據(jù)集成; 異構(gòu)數(shù)據(jù)源; XML

中圖分類號: TN958?34; TP391.4 文獻標識碼: A 文章編號: 1004?373X(2015)22?0048?03

0 引 言

中醫(yī)智能化診斷是根據(jù)中醫(yī)的四診理論,利用計算機人工智能技術(shù)進行中醫(yī)證候的自動化診斷過程。在此過程中,計算機對中醫(yī)知識的獲取、表現(xiàn)方式及內(nèi)部的推導(dǎo)機制是核心內(nèi)容。中醫(yī)的四診包含望診、聞診、問診、切診等諸方面。本研究主要探討在四診信息的獲取中,四診信息異構(gòu)數(shù)據(jù)源的集成問題。

1 異構(gòu)數(shù)據(jù)源

當(dāng)前數(shù)據(jù)信息源在形式上差別較大,無統(tǒng)一模式。數(shù)據(jù)庫類型、運行平臺、數(shù)據(jù)格式、數(shù)據(jù)的加載和卸載方法等千差萬別。在異構(gòu)數(shù)據(jù)源環(huán)境中,有文本、Oracle,Sybase,SQL Server,DB2,Access等多種類型。

不同數(shù)據(jù)源有不同的存儲結(jié)構(gòu)、組織表達形式、信息描述等差異,進而造成數(shù)據(jù)的抽取困難。在異構(gòu)數(shù)據(jù)源環(huán)境中,必須建立一個數(shù)據(jù)源與數(shù)據(jù)源之間的中間層,作為數(shù)據(jù)通信的中間接口。集成數(shù)據(jù)庫的命令通過中間接口傳送到不同的數(shù)據(jù)源;各數(shù)據(jù)源把發(fā)送的數(shù)據(jù)轉(zhuǎn)換成中間接口的格式,通過中間接口發(fā)送到集成數(shù)據(jù)庫中[1]。

2 中醫(yī)智能化診斷系統(tǒng)框架

按中醫(yī)四診原理,智能化診斷系統(tǒng)由舌診、脈診、面色診、問診及穴位診等子系統(tǒng)組成,其構(gòu)架如圖1所示。其中,綜合診斷系統(tǒng)與SQL數(shù)據(jù)庫在服務(wù)器端,其他子系統(tǒng)位于不同PC的客戶端。各子系統(tǒng)之間、子系統(tǒng)與綜合診斷系統(tǒng)之間存在異構(gòu)性。

3 XML數(shù)據(jù)交換技術(shù)

XML又稱為可擴展標記語言(Extensible Markup Language),是一種元標識語言,提供了結(jié)構(gòu)化資料的一種自我描述,是一種開放的數(shù)據(jù)結(jié)構(gòu)。XML不但描述數(shù)據(jù)內(nèi)容,而且描述數(shù)據(jù)的結(jié)構(gòu),使數(shù)據(jù)之間的關(guān)系得到很好的體現(xiàn)。XML具有結(jié)構(gòu)化程度高、平臺獨立性強、保存格式簡單、便于擴充延展及網(wǎng)上傳輸?shù)忍匦?,因此XML非常適合于不同數(shù)據(jù)庫間的信息交換。以XML為中介實現(xiàn)數(shù)據(jù)交換是當(dāng)前研究的熱點,正成為網(wǎng)絡(luò)資料交換的標準。

XML數(shù)據(jù)交換,一是從數(shù)據(jù)源中抽取交換的數(shù)據(jù),轉(zhuǎn)化為XML交換文檔;二是對交換文檔的格式進行轉(zhuǎn)換,并映射數(shù)據(jù)源和目的庫中的相關(guān)字段,進而把數(shù)據(jù)載入到目的庫中。在不同的應(yīng)用系統(tǒng)中,采用統(tǒng)一的XML標簽和格式生成XML文檔,是實現(xiàn)數(shù)據(jù)動態(tài)交換的基本要求。

目前常見的數(shù)據(jù)交換技術(shù)主要有[2]: EDI系統(tǒng)、中介層、數(shù)據(jù)倉庫和中間數(shù)據(jù)等方式。XML采用中間方式,利用XML文件作為中間數(shù)據(jù),提供數(shù)據(jù)通用格式,達到數(shù)據(jù)交換的目的。

4 基于XML的Web異構(gòu)數(shù)據(jù)源之間的數(shù)據(jù)集成

數(shù)據(jù)集成是將多個數(shù)據(jù)庫、數(shù)據(jù)多維立方體或一般文件中的數(shù)據(jù),存放在一個格式統(tǒng)一的數(shù)據(jù)庫中。

在數(shù)據(jù)集成的邏輯關(guān)系中,Web服務(wù)在客戶與數(shù)據(jù)倉庫之間??蛻魧颖仨毥?jīng)過XML接口訪問數(shù)據(jù)源數(shù)據(jù),保證了源數(shù)據(jù)的安全。標準XML編碼,能很好地支持異構(gòu)數(shù)據(jù)源之間的數(shù)據(jù)交換;同時,基于HTTP和SOAP協(xié)議的Web服務(wù)技術(shù),讓數(shù)據(jù)可以無障礙地越過防火墻。邏輯結(jié)構(gòu)如圖2所示。

元數(shù)據(jù)(Metadata)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,是對數(shù)據(jù)源信息的描述[3],是標準的XML文件。元數(shù)據(jù)字典(MDD)對元數(shù)據(jù)進行管理,依靠XML的XML Schema技術(shù)設(shè)計和建模,與公共數(shù)據(jù)模型保持一致性,方便與XML數(shù)據(jù)集成器合作。元數(shù)據(jù)字典必須注冊所有參與的數(shù)據(jù)源。

XML數(shù)據(jù)集成器并不存儲具體數(shù)據(jù),只存儲所有數(shù)據(jù)的集成模式。XML數(shù)據(jù)集成器,對客戶層屏蔽數(shù)據(jù)源的差異,向客戶層保證相同的數(shù)據(jù)視圖,充當(dāng)數(shù)據(jù)總線,把實際數(shù)據(jù)源轉(zhuǎn)變成用戶數(shù)據(jù)視圖。對不同數(shù)據(jù)源的數(shù)據(jù),用XML Schema技術(shù)設(shè)計一個公共數(shù)據(jù)模式(Common Data Model,CDM)進行統(tǒng)一處理。不同數(shù)據(jù)源有不同的模式,對他們進行集成時,數(shù)據(jù)字典(MDD)是解決他們異構(gòu)性[4??5]的重要方法。

(1) 命名異構(gòu):一是相同的對象和屬性在不同的源數(shù)據(jù)中用不同的名字表示(異名同義),二是不同的對象用相同的名字表示(同名異義)。命名異構(gòu)成為不同模式之間語義沖突的重要原因。在設(shè)計集成系統(tǒng)時,必須在元數(shù)據(jù)字典(MDD)中利用一個統(tǒng)一的名字表示每個數(shù)據(jù)源相應(yīng)的字段。例如商品的價格,在兩個數(shù)據(jù)源中,一個用price,一個用cost,在MDD中統(tǒng)一用Price表示。

cost

(2) 結(jié)構(gòu)異構(gòu)性:指元數(shù)據(jù)信息的組成方式在數(shù)據(jù)源間各不相同。用定義全局模式的方法解決。關(guān)心的數(shù)據(jù)成分在全局模式中定義,并許可在集成數(shù)據(jù)時讓某些成分為空(Nul1)。

例如,在定義全局模式時,允許價格(Price)為空。

·····

(3) 值的異構(gòu)性:數(shù)據(jù)單位、數(shù)據(jù)精度在不同的數(shù)據(jù)源中不同??梢栽谠獢?shù)據(jù)中定義數(shù)據(jù)單位、數(shù)據(jù)精度,進而與全局模式中定義的數(shù)據(jù)進行響應(yīng)轉(zhuǎn)換。

price

(4) 數(shù)據(jù)模型的異構(gòu)性:不同數(shù)據(jù)源通過各自的Wrapper/Agent解決數(shù)據(jù)模型的異構(gòu)性。首先定義一個公用的統(tǒng)一的數(shù)據(jù)模型(CDM),再把從單個數(shù)據(jù)源中提取的局部數(shù)據(jù)轉(zhuǎn)換成CDM中間模型數(shù)據(jù)。事實上,單個數(shù)據(jù)源通過自身的Wrapper/Agent結(jié)構(gòu),就能把從中提取的局部數(shù)據(jù)轉(zhuǎn)變成符合CDM要求的XML文檔數(shù)據(jù)。

(5) 時間異構(gòu)性:隨著時間的推移,數(shù)據(jù)源的結(jié)構(gòu)描述、屬性表示和取值發(fā)生變化??梢酝ㄟ^MDD管理軟件對數(shù)據(jù)源的元數(shù)據(jù)描述進行增添、刪除或修改。

6 結(jié) 語

在數(shù)字化網(wǎng)絡(luò)化信息環(huán)境中,以XML為代表的技術(shù)體系已經(jīng)成為信息組織、處理和交換的基本技術(shù)。XML技術(shù)和數(shù)據(jù)庫技術(shù)的結(jié)合,得到廣泛使用。本文介紹了基于XML數(shù)據(jù)交換的實現(xiàn)原理,分析了利用MDD解決模式集成中異構(gòu)性的方法,以及在中醫(yī)智能化診斷系統(tǒng)中的主要應(yīng)用。實驗表明,基于XML Schema技術(shù)設(shè)計的MDD模型能夠高效地管理異構(gòu)數(shù)據(jù)源數(shù)據(jù)[6]。XML數(shù)據(jù)交換技術(shù)在中醫(yī)智能化診斷系統(tǒng)中,對異構(gòu)數(shù)據(jù)源之間的數(shù)據(jù)交換與集成有非常重要的作用。

參考文獻

[1] 謝星峰,鄒平.基于異構(gòu)數(shù)據(jù)庫環(huán)境數(shù)據(jù)抽取的系統(tǒng)結(jié)構(gòu)研究:Java和XML的解決方案[J].計算機與數(shù)字工程,2005,33(3):28?30.

[2] 王松旺,樊秀娥,姜韜,等.XML數(shù)據(jù)交換技術(shù)在公共衛(wèi)生科學(xué)數(shù)據(jù)共享中的應(yīng)用[J].中國衛(wèi)生工程學(xué),2007(1):49?50.

[3] ELISA B, ELENA F. XML and data integration [J]. IEEE Internet Computing, 200l, 11(12): 75?76.

[4] BERTINO E, CATANIA B. Integrating XML and databases [J]. IEEE Internet Computing, 200l, 7(8): 84?88.

[5] CHANG Y S, HO M H, YUAN S M. Aunified interface for integrating information retrieval [J]. Computer Standards&Interfaces, 2001, 6(23): 325?340.

[6] 盧正鼎,張素智.集成Web數(shù)據(jù)的系統(tǒng)框架與實現(xiàn)方法[J].小型微型計算機系統(tǒng),2003,24(10):1759?1762.

猜你喜歡
數(shù)據(jù)集成中醫(yī)
引產(chǎn)術(shù)后胎盤殘留的中醫(yī)治療方法
今日健康(2016年12期)2016-11-17 14:53:45
中醫(yī)英譯的誤譯現(xiàn)象探析
芻議中醫(yī)養(yǎng)生理念在瑜伽教學(xué)中的融入
體育時空(2016年8期)2016-10-25 20:56:21
關(guān)于中西醫(yī)結(jié)合治療乳腺增生病38例臨床觀察
成本與制造數(shù)據(jù)集成分析
基于Biztalk的異構(gòu)醫(yī)療信息系統(tǒng)數(shù)據(jù)集成研究
信息系統(tǒng)集成與數(shù)據(jù)集成策略研究
基于數(shù)據(jù)集成的水上項目國家隊數(shù)據(jù)庫網(wǎng)絡(luò)管理平臺的設(shè)計與開發(fā)
临沂市| 奈曼旗| 涡阳县| 广水市| 来宾市| 溧水县| 临城县| 金溪县| 喀喇沁旗| 府谷县| 红安县| 夏河县| 扬州市| 内乡县| 尉犁县| 古田县| 修武县| 定陶县| 平阴县| 蒙城县| 长宁区| 七台河市| 承德县| 元氏县| 海晏县| 宕昌县| 原阳县| 河南省| 嘉定区| 温宿县| 吉首市| 鄂托克前旗| 永和县| 清远市| 伊通| 高淳县| 察雅县| 鸡泽县| 灌南县| 保定市| 尖扎县|