邱燕玲
摘要:隨著企業(yè)信息化的發(fā)展,人們對異構(gòu)數(shù)據(jù)庫的需求越來越多,許多信息都需要對異構(gòu)數(shù)據(jù)庫中的數(shù)據(jù)進行訪問。因此,目前急需一種解決異構(gòu)數(shù)據(jù)庫信息共享問題的全新解決方案。異構(gòu)數(shù)據(jù)庫集成技術(shù)是實現(xiàn)信息共享的一種方式,最終建立一種統(tǒng)一的接口對數(shù)據(jù)庫進行訪問,用戶只需指定所需數(shù)據(jù)即可。該文的研究中,首先通過資料的查閱對傳統(tǒng)的異構(gòu)數(shù)據(jù)庫集成方法進行分析,之后對XML和數(shù)據(jù)庫技術(shù)進行了研究和討論,最后根據(jù)研究的結(jié)構(gòu)提出了一種基于XML的B/S構(gòu)架的異構(gòu)數(shù)據(jù)庫信息共享方案,異構(gòu)數(shù)據(jù)庫信息共享技術(shù)的研究具有重要的歷史意義和市場應(yīng)用價值。
關(guān)鍵詞:異構(gòu)數(shù)據(jù)庫;XML;信息共享;B/S
中圖分類號:TP271文獻標(biāo)識碼:A文章編號:1009-3044(2012)115-3484-02
1異構(gòu)數(shù)據(jù)庫信息共享技術(shù)研究
1.1課題研究的背景及意義
隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)庫技術(shù)被廣發(fā)的應(yīng)用,由于同文件系統(tǒng)的異構(gòu)性相同,所以數(shù)據(jù)庫可以被單獨的進行管理和控制。這就出現(xiàn)了異構(gòu)現(xiàn)象,從模式的異構(gòu)、操作系統(tǒng)語言的異構(gòu)一直到數(shù)據(jù)類型的異構(gòu)等。數(shù)據(jù)庫異構(gòu)性主要表現(xiàn)的方面是:計算機體系結(jié)構(gòu)的異構(gòu)性、操作系統(tǒng)的異構(gòu)性、DMBS自身的異構(gòu)性和數(shù)據(jù)結(jié)構(gòu)語法的異構(gòu)性等。特別是近年來,很多大型的企業(yè)會根據(jù)各部門的具體需要建立符合自身發(fā)展和業(yè)務(wù)特點的軟硬件環(huán)境,分別建立了不同的信息管理系統(tǒng)。并且這些系統(tǒng)大多數(shù)都采用不同的操作系統(tǒng)、數(shù)據(jù)庫類型和編碼方式。從某種程度上說,對于這些企業(yè)來說,使用的這些子系統(tǒng)會提高局部的管理效率,但在數(shù)據(jù)層上,企業(yè)之間的子系統(tǒng)是彼此分離的,這就會存在著邏輯差異,沒有一個統(tǒng)一的標(biāo)準(zhǔn),隨著管理時間的增長,最終就會形成一種信息的“孤島”現(xiàn)象,這種現(xiàn)象造成了部門和單位之間都是相對獨立的數(shù)據(jù)源。信息和組織的不同構(gòu)成了一個巨大的異構(gòu)數(shù)據(jù)環(huán)境。目前企業(yè)和企業(yè)之間、部門和部門之間的信息交換和共享對企業(yè)發(fā)展甚至整個國家經(jīng)濟的發(fā)展都起著關(guān)鍵的作用,所以越來越迫切的需要一種最大限度的完成信息共享、交換、集成和再利用的統(tǒng)一信息平臺來滿足人們?nèi)找嬖鲩L的信息需求[1]。
本文提出一種基于XML的B/S三層構(gòu)架模式的異構(gòu)數(shù)據(jù)庫信息共享方案,利用XML的一些特性實現(xiàn)數(shù)據(jù)的實時查詢功能,進行企業(yè)和部門之間的信息資源共享,這種方案在企業(yè)信息化建設(shè)中具有一定的推廣價值。
1.2本文研究的主要內(nèi)容
本文首先對國內(nèi)外異構(gòu)數(shù)據(jù)庫信息共享技術(shù)進行研究,確定本文主要采用B/S模式和XML實現(xiàn)異構(gòu)數(shù)據(jù)庫信息共享,主要研究內(nèi)容如下:
通過相關(guān)資料和文獻的查閱,確定本文的主要研究方案并對可行性進行分析;
詳細介紹了異構(gòu)數(shù)據(jù)庫問題的產(chǎn)生、發(fā)展和現(xiàn)狀,進而引出了信息共享技術(shù)在異構(gòu)數(shù)據(jù)庫信息共享應(yīng)用中的重要性;對本文研究的主要內(nèi)容進行總結(jié)。
2異構(gòu)數(shù)據(jù)庫問題的產(chǎn)生及需求
2.1異構(gòu)數(shù)據(jù)庫問題的產(chǎn)生
數(shù)據(jù)庫系統(tǒng)的出現(xiàn)給人們帶來了信息管理的新方式,目前數(shù)據(jù)庫已被廣泛應(yīng)用在不同信息領(lǐng)域成為計算機應(yīng)用領(lǐng)域的重要支柱技術(shù)。任何想在web上進行信息管理的系統(tǒng)都要以異構(gòu)數(shù)據(jù)庫理論為依托進行,這就要求我們建立一種便于系統(tǒng)集成和擴展的全新的異構(gòu)數(shù)據(jù)庫系統(tǒng)。
信息共享面臨的另一個問題是協(xié)同[2]問題的解決。它的特點是不再強調(diào)集中控制而是注重協(xié)同協(xié)作。把問題分成諸多小問題來解決。他們主要注重的是:對分布式和異構(gòu)環(huán)境的支持、對信息和知識共享的支持、對協(xié)作和對系統(tǒng)動態(tài)性的支持。傳統(tǒng)的數(shù)據(jù)庫對數(shù)據(jù)的維護主要采用靜態(tài)方式;數(shù)據(jù)庫業(yè)務(wù)模式是資源競爭而不是協(xié)作;并且不能隨外界環(huán)境的變化而改變。這些問題的提出,促進了異構(gòu)數(shù)據(jù)庫的深入研究,在原有基礎(chǔ)上提出一種更加完善的共享方式。
2.2異構(gòu)數(shù)據(jù)庫的特征
異構(gòu)數(shù)據(jù)庫是在傳統(tǒng)的分布式數(shù)據(jù)庫基礎(chǔ)上發(fā)展起來的,兩者之間的主要差別是:對于分布式數(shù)據(jù)庫系統(tǒng)來講,它具有單一的邏輯數(shù)據(jù)庫,但是在異構(gòu)數(shù)據(jù)庫系統(tǒng)中存在的是多個異構(gòu)自主的數(shù)據(jù)庫系統(tǒng)集成而形成的分布式數(shù)據(jù)庫系統(tǒng)。特征主要表現(xiàn)為:分布性、異構(gòu)性和自主性。
2.3對異構(gòu)數(shù)據(jù)庫的需求
2.3.1全局數(shù)據(jù)模型
全局數(shù)據(jù)模型主要負責(zé)的是用戶和數(shù)據(jù)元之間的協(xié)調(diào),進而實現(xiàn)數(shù)據(jù)操作的透明化,這部分最重要的工作是建立一種全局數(shù)據(jù)字典,負責(zé)對數(shù)據(jù)庫中的全部數(shù)據(jù)進行描述和定義,對全局用戶進行局部轉(zhuǎn)換,完成異構(gòu)數(shù)據(jù)庫信息共享。
2.3.2全局的定位功能
在動態(tài)環(huán)境數(shù)據(jù)管理應(yīng)用中,我們需要有一種完善的機制負責(zé)對數(shù)據(jù)庫中的信息源進行定位的服務(wù)并且要對系統(tǒng)成員的注冊和取消等的記錄負責(zé),通過這種動態(tài)的管理最終完成各個部分之間的可知性需求。
由于企業(yè)之間資源管理的異構(gòu)性,所以一定會產(chǎn)生很多不同標(biāo)準(zhǔn)的數(shù)據(jù)庫管理標(biāo)準(zhǔn),我們要對這些企業(yè)用戶進行靈活的管理,確保系統(tǒng)間進行數(shù)據(jù)傳輸時的安全性。
3 XML技術(shù)
3.1 XML簡介
XML( Extensible Markup Language )標(biāo)準(zhǔn)的主要對HML進行補充用在Web中的電子數(shù)據(jù)的交換中。和HTML技術(shù)相似,AML也是一種用于數(shù)據(jù)顯示的標(biāo)記性語言,利用這種技術(shù)還可以通過網(wǎng)絡(luò)技術(shù)在瀏覽器中對數(shù)據(jù)進行顯示。XML技術(shù)即具有語義標(biāo)記語言又具有元標(biāo)記語言。并且XML還定義了和其他領(lǐng)域相關(guān)的語義和結(jié)構(gòu)化的標(biāo)記語言。所以XML技術(shù)的出現(xiàn),使得用戶可以自己創(chuàng)建所需的標(biāo)記,需要時通知瀏覽器如何顯示即可,對用戶來說是一種非常便捷的應(yīng)用技術(shù)。
3.2 XML技術(shù)的特點
1)XML技術(shù)的使用具有一定意義的標(biāo)記性
以前使用的HTML技術(shù)只能給瀏覽器提供相應(yīng)的讀取功能,不能對數(shù)據(jù)的語義進行傳達。XML不僅可以提供讀取功能還具有語義傳達功能;
2)XML數(shù)據(jù)的顯示方式和語義分開
XML是一種對數(shù)據(jù)內(nèi)容進行描述的語言,本身對數(shù)據(jù)的顯示方式?jīng)]有決定權(quán),顯示數(shù)據(jù)主要取決于XSL;
3)XML具有嚴格的語法控制性
4)XML可以對標(biāo)記自定義
在XML中用戶可以按照自己的需求對標(biāo)記進行增減,比如說數(shù)學(xué)標(biāo)記語言MATHML[3]和電子商務(wù)標(biāo)記語言EBXML等。
對于XML實現(xiàn)的異構(gòu)數(shù)據(jù)庫信息共享系統(tǒng)來說,最大的優(yōu)勢是對各種數(shù)據(jù)的管理。任何系統(tǒng)都可以對XML數(shù)據(jù)進行讀取,不必擔(dān)心系統(tǒng)版本不支持的問題。
3.3 XML和異構(gòu)數(shù)據(jù)庫集成
XML技術(shù)給異構(gòu)數(shù)據(jù)庫信息共享的交換提供了一種標(biāo)準(zhǔn)的格式和一種新的信息共享方式。利用Schema或者是DTD來對標(biāo)準(zhǔn)進行描述;利用XSL和XSLT技術(shù)來增強數(shù)據(jù)的轉(zhuǎn)換能力。其中Xquery查詢語言可以提取XML文檔中的集合數(shù)據(jù),也可以利用映射的方法獲取XML文檔中的信息數(shù)據(jù)。上述的這些特點都表明:XML技術(shù)在異構(gòu)數(shù)據(jù)庫信息共享系統(tǒng)中應(yīng)用是可行的[4]。
4基于XML異構(gòu)數(shù)據(jù)庫信息共享系統(tǒng)的設(shè)計
企業(yè)的不同部門之間由于數(shù)據(jù)庫種類和操作系統(tǒng)的不同造成了一個規(guī)模巨大的異構(gòu)數(shù)據(jù)庫系統(tǒng)結(jié)構(gòu)。本章主要通過XML技術(shù)把各部門網(wǎng)絡(luò)異構(gòu)數(shù)據(jù)庫連接在一起實現(xiàn)信息數(shù)據(jù)的共享。
在已存在的異構(gòu)數(shù)據(jù)庫之間實現(xiàn)信息的共享,最基本的工作是要在這些不同種類的數(shù)據(jù)庫平臺中建立一個統(tǒng)一標(biāo)準(zhǔn)的通信平臺,利用這種通信的平臺實現(xiàn)信息數(shù)據(jù)訪問的透明化。以此同時,各個部門都是相對獨立的,考慮到數(shù)據(jù)的安全性問題,用戶對于共享的數(shù)據(jù)只有讀取查閱的權(quán)限而沒有修改權(quán)限,為保證安全性本文采用B/S模式,足夠滿足系統(tǒng)的需求。
系統(tǒng)在異構(gòu)的信息源和用戶之間建立一種web服務(wù)的中間層,利用這個中間層來代替通訊平臺的功能進行通信。然后利用ADO[5]相關(guān)的數(shù)據(jù)訪問技術(shù)來實現(xiàn)異構(gòu)數(shù)據(jù)源和中間服務(wù)層的鏈接。通過這種技術(shù),在客戶端,用戶只需要使用瀏覽器就能對數(shù)據(jù)進行共享的瀏覽和下載等。提交申請后就可以獲取數(shù)據(jù),然后動態(tài)生成XML格式的文檔,通過web服務(wù)器將XML文檔發(fā)送到發(fā)出請求的客戶端中。這就完成了用戶數(shù)據(jù)共享資源的系統(tǒng)需求功能。
我們利用XML和web技術(shù)雖然實現(xiàn)了信息共享,但是在實際的工作中,由于某些崗位的業(yè)務(wù)特殊性,涉及到的一些數(shù)據(jù)時不能對外公開的,如公安系統(tǒng)中對公民的個人、家庭和社會關(guān)系等信息是非常敏感的,這些信息都是不準(zhǔn)許通過網(wǎng)絡(luò)進行傳播的。上述的采用ADO訪問技術(shù),由于web連接的是整個數(shù)據(jù)庫系統(tǒng),不能限定到具體數(shù)據(jù)庫中的具體表,那么對于上述特殊業(yè)務(wù)的部門會有一定的損失,這是我們不愿發(fā)生的?;诖吮驹趙eb服務(wù)器中間層提供限定范圍查詢的方式來解決上述安全性隱私的問題。
在這種新的方案中,首先服務(wù)器的中間層要建立屬于自己的小型的數(shù)據(jù)庫,并且對web服務(wù)層提供的管理模塊管理員對異構(gòu)數(shù)據(jù)源進行相應(yīng)的管理。把腳本中可以對外共享的一些表和表中的具體的字段和關(guān)系等個公開的在數(shù)據(jù)庫中進行保存處理。至此完成了基于XML的B/S三層結(jié)構(gòu)的異構(gòu)數(shù)據(jù)庫信息共享系統(tǒng)的設(shè)計。
5結(jié)束語
本文采用XML技術(shù)對異構(gòu)數(shù)據(jù)庫信息共享技術(shù)進行研究,分析了基于XML技術(shù)實現(xiàn)易購信息共享的可行性;然后介紹了XML技術(shù)的特點及應(yīng)用在異構(gòu)數(shù)據(jù)共享系統(tǒng)中的優(yōu)勢;最后對系統(tǒng)進行設(shè)計,提出一種在web服務(wù)器中間件中插入控制查詢范圍的設(shè)計方法提高了系統(tǒng)的安全性,為特殊行業(yè)的數(shù)據(jù)提供了安全隱私的保障。
參考文獻:
[1]徐德智. XML數(shù)據(jù)庫查詢及其模式集成研究[D].長沙:中南大學(xué),2004.
[2]江濤,劉東波,劉巍.基于XML的異構(gòu)數(shù)據(jù)集成中間件研究[J].科學(xué)技術(shù)與工程, 2007, 38(5): 48-51.
[3]朱峰.異構(gòu)數(shù)據(jù)集成中間件的設(shè)計與實現(xiàn)[D].蘇州:蘇州大學(xué),2005.
[4]鄭淑麗.多數(shù)據(jù)庫集成環(huán)境下查詢優(yōu)化研究[J].微電子學(xué)與計算機,2004,21(6):13-16.
[5] Erdmann M, Studer R. How to structure and access XML documents with ontologies [J]. Data and Knowledge Engineering, 2001, 36(3): 317-33.