摘要:闡明了分專業(yè)數(shù)據(jù)集成管理、兩級數(shù)據(jù)集成管理和一級數(shù)據(jù)集成管理三種方案的優(yōu)缺點(diǎn),并從系統(tǒng)架構(gòu)、數(shù)據(jù)采集、數(shù)據(jù)存儲和對應(yīng)用系統(tǒng)的支持四個方面對三種方案進(jìn)行了全面對比分析。
關(guān)鍵詞:井場數(shù)據(jù);一體化;集成方案;對比分析
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2014)01-00011-03
1 概述
為了適應(yīng)復(fù)雜的鉆井條件和地下地質(zhì)條件,提高油氣勘探開發(fā)綜合效益,國內(nèi)外油田企業(yè)不同程度的實(shí)施了井場數(shù)據(jù)一體化集成管理應(yīng)用,為科學(xué)鉆井,油氣安全高效勘探開發(fā)提供了重要支撐。從國內(nèi)外油田行業(yè)發(fā)展趨勢來看,構(gòu)建井場數(shù)據(jù)一體化集成管理應(yīng)用平臺是推動油氣勘探開發(fā)信息化建設(shè)快速發(fā)展的必然選擇。
構(gòu)建井場數(shù)據(jù)一體化集成管理應(yīng)用平臺最基礎(chǔ)工作是進(jìn)行井場數(shù)據(jù)中心建設(shè)。井場各專業(yè)按照自身應(yīng)用需要建立了專業(yè)數(shù)據(jù)模型,采用相應(yīng)的數(shù)據(jù)存儲方式,要實(shí)現(xiàn)井場所有專業(yè)數(shù)據(jù)集成存儲和統(tǒng)一交互應(yīng)用,首要工作是進(jìn)行井場數(shù)據(jù)一體化集成。在已經(jīng)取得大量信息化成果的基礎(chǔ)上建立一體化集成數(shù)據(jù)中心,需要保證信息化既有成果應(yīng)用的延續(xù)性,對這種數(shù)據(jù)庫集成管理方案進(jìn)行分析尤為重要。
2 分專業(yè)數(shù)據(jù)集成管理方案
圖1
2.1 主要優(yōu)勢
在數(shù)據(jù)模型設(shè)計上,保持專業(yè)數(shù)據(jù)庫現(xiàn)狀不變,通過數(shù)據(jù)集成技術(shù)實(shí)現(xiàn)數(shù)據(jù)的互連互通和統(tǒng)一訪問,支持局級層面應(yīng)用。源頭數(shù)據(jù)管理上,數(shù)據(jù)庫的部署和擺放完全保持現(xiàn)有模式,源頭數(shù)據(jù)采集后直接進(jìn)到各專業(yè)應(yīng)用庫支持專業(yè)應(yīng)用。實(shí)時數(shù)據(jù)在專業(yè)應(yīng)用庫層面支持基層應(yīng)用。
分專業(yè)數(shù)據(jù)集成管理方案是對現(xiàn)有數(shù)據(jù)庫的搭橋,未改變現(xiàn)有數(shù)據(jù)管理模式。該方案在管理模式上基本不變,只是通過數(shù)據(jù)集成技術(shù)實(shí)現(xiàn)各專業(yè)庫之間的互連互通,現(xiàn)有應(yīng)用系統(tǒng)也無需改造。因此管理模式上不需大的改變,推行上較容易。
數(shù)據(jù)中心建設(shè)周期短,見效快。由于數(shù)據(jù)中心是對現(xiàn)有數(shù)據(jù)庫的互聯(lián)互通,避免了統(tǒng)一數(shù)據(jù)模型建設(shè)帶來的模型設(shè)計工作量和專業(yè)數(shù)據(jù)庫向數(shù)據(jù)中心進(jìn)行數(shù)據(jù)遷移的工作量。
無需改變現(xiàn)有應(yīng)用系統(tǒng),繼承性好?,F(xiàn)有專業(yè)應(yīng)用系統(tǒng)無需改造,還可以繼續(xù)運(yùn)行在各專業(yè)數(shù)據(jù)庫基礎(chǔ)上。
2.2 主要缺點(diǎn)
數(shù)據(jù)傳輸、加工環(huán)節(jié)較多,加大了數(shù)據(jù)出錯的概率,造成了數(shù)據(jù)的冗余和不一致,降低了數(shù)據(jù)的可信程度。
目前專業(yè)數(shù)據(jù)庫之間存在的數(shù)據(jù)冗余、標(biāo)準(zhǔn)沖突等問題依然存在。由于模型之間相互獨(dú)立,業(yè)務(wù)規(guī)則難以統(tǒng)一,不能形成規(guī)范化的應(yīng)用開發(fā)管理,將造成未來應(yīng)用系統(tǒng)的開發(fā)混亂。許多數(shù)據(jù)源頭多處產(chǎn)生,同樣的數(shù)據(jù)多次錄入,重復(fù)存儲,造成了大量的數(shù)據(jù)冗余。
分專業(yè)的數(shù)據(jù)模型不能很好支持油田集成化應(yīng)用。數(shù)據(jù)集成需要對專業(yè)庫作深入細(xì)致的分析、比對,數(shù)據(jù)映射關(guān)系錯綜復(fù)雜,數(shù)據(jù)清理、加工難度較大。同時,在數(shù)據(jù)服務(wù)管理層,需要針對不同應(yīng)用開發(fā)大量的中間件,可復(fù)用性差,開發(fā)與管理難度較大。
數(shù)據(jù)中心搭橋即使解決了數(shù)據(jù)共享的問題,但仍然存在著專業(yè)數(shù)據(jù)庫結(jié)構(gòu)制約應(yīng)用的問題。由于各專業(yè)數(shù)據(jù)庫模型的結(jié)構(gòu)設(shè)計不成熟,穩(wěn)定性差。隨著新技術(shù)的引進(jìn)和應(yīng)用的拓展,專業(yè)庫標(biāo)準(zhǔn)將隨之發(fā)生變化,導(dǎo)致數(shù)據(jù)對應(yīng)關(guān)系、 數(shù)據(jù)對應(yīng)用的支持都要作相應(yīng)的調(diào)整。因此,結(jié)構(gòu)的任何改變都將造成中間件、應(yīng)用系統(tǒng)不穩(wěn)定性的逐級放大。
數(shù)據(jù)中心難以實(shí)現(xiàn)有效的數(shù)據(jù)應(yīng)用服務(wù)。該方案數(shù)據(jù)中心只起到了存儲和簡單的數(shù)據(jù)提供的作用,數(shù)據(jù)管理的分散化,造成數(shù)據(jù)提供缺乏權(quán)威性。
3 兩級數(shù)據(jù)集成管理
3.1 主要優(yōu)勢
在數(shù)據(jù)模型設(shè)計上,該方案同方案一,參考國際標(biāo)準(zhǔn),建立符合油田的自身特點(diǎn)和未來發(fā)展需求的統(tǒng)一數(shù)據(jù)模型。在源頭數(shù)據(jù)管理上,數(shù)據(jù)庫的部署與油田現(xiàn)有模式相似,源頭數(shù)據(jù)庫以分布式的形式建立在各二級單位,源頭數(shù)據(jù)直接進(jìn)到各專業(yè)應(yīng)用庫,經(jīng)過數(shù)據(jù)審核后再提交一體化數(shù)據(jù)庫。實(shí)時數(shù)據(jù)的采集直接進(jìn)入專業(yè)應(yīng)用數(shù)據(jù)庫支持基層應(yīng)用,實(shí)時數(shù)據(jù)經(jīng)抽析、加工生成分析數(shù)據(jù),經(jīng)審查后加載到一體化數(shù)據(jù)庫。
數(shù)據(jù)模型與國際標(biāo)準(zhǔn)接軌,數(shù)據(jù)的存儲和組織更加科學(xué),可擴(kuò)展性強(qiáng),能夠滿足未來技術(shù)發(fā)展需要。
按照業(yè)務(wù)主題組織的數(shù)據(jù)模型能夠?qū)鐚I(yè)的綜合應(yīng)用提供無縫支持,實(shí)現(xiàn)“業(yè)務(wù)聯(lián)動、信息共享”。
源頭數(shù)據(jù)的管理模式保持現(xiàn)有模式不變,推行難度小。目前數(shù)據(jù)管理模式是從基層隊逐級上報,不同的業(yè)務(wù)部門分管內(nèi)部的數(shù)據(jù)資源。該方案保留了現(xiàn)有源頭數(shù)據(jù)管理模式。
對現(xiàn)有應(yīng)用系統(tǒng)的沖擊小。因?yàn)樵诟鞫墕挝槐A袅嗽袑I(yè)數(shù)據(jù)庫,使得原有系統(tǒng)能夠在不作任何改變的情況下繼續(xù)運(yùn)行。
3.2 主要缺點(diǎn)
多套模型并存,映射關(guān)系復(fù)雜,相互間數(shù)據(jù)遷移難度大。該方案建立了一體化數(shù)據(jù)庫統(tǒng)一數(shù)據(jù)模型,同時保留專業(yè)數(shù)據(jù)庫原數(shù)據(jù)模型。多套數(shù)據(jù)模型之間存在復(fù)雜的映射關(guān)系,造成從專業(yè)數(shù)據(jù)庫到數(shù)據(jù)中心數(shù)據(jù)遷移難度大。因?yàn)閷I(yè)數(shù)據(jù)庫的任何結(jié)構(gòu)改變都會造成模型間映射關(guān)系的改變,從而導(dǎo)致雙向的數(shù)據(jù)遷移困難。
源頭數(shù)據(jù)多點(diǎn)存儲,不能進(jìn)行統(tǒng)一管理,從技術(shù)上無法保證源點(diǎn)數(shù)據(jù)的唯一。源點(diǎn)數(shù)據(jù)不唯一將使數(shù)據(jù)中心失去數(shù)據(jù)的權(quán)威性。缺乏了數(shù)據(jù)權(quán)威性將直接導(dǎo)致基于數(shù)據(jù)中心的應(yīng)用無法推行。
容易造成專業(yè)應(yīng)用與數(shù)據(jù)中心脫節(jié),與專業(yè)庫自成體系,使一體化數(shù)據(jù)庫價值得不到體現(xiàn)。因?yàn)楸M管建立了統(tǒng)一的數(shù)據(jù)模型,但是由于源頭數(shù)據(jù)直接進(jìn)入專業(yè)應(yīng)用數(shù)據(jù)庫,容易導(dǎo)致專業(yè)應(yīng)用數(shù)據(jù)庫的自成體系運(yùn)轉(zhuǎn),造成現(xiàn)有專業(yè)分割的局面繼續(xù)存在。而對于一體化數(shù)據(jù)庫的數(shù)據(jù)支持逐漸弱化為一項(xiàng)數(shù)據(jù)上傳任務(wù)。
沒有實(shí)現(xiàn)信息的扁平化管理,不能適應(yīng)油田未來改革發(fā)展的需要。建立了一體化數(shù)據(jù)庫,但是數(shù)據(jù)管理模式仍舊是從基層隊逐級上報,層層管理,背離油田未來信息扁平化管理的大思路。
4 一級數(shù)據(jù)集成管理
4.1 主要優(yōu)勢
在數(shù)據(jù)模型設(shè)計上,該方案參考國際標(biāo)準(zhǔn),結(jié)合油田的自身特點(diǎn)和未來發(fā)展需求,建立一個涵蓋地學(xué)研究、生產(chǎn)運(yùn)行和經(jīng)營管理所有信息于一體的統(tǒng)一模型,徹底打破當(dāng)前信息系統(tǒng)專業(yè)分割的格局,形成一個與國際公司接軌的數(shù)據(jù)管理模式,既能滿足各專業(yè)的應(yīng)用需求,又能支持跨專業(yè)的綜合應(yīng)用。
在源頭數(shù)據(jù)管理上,鉆井、錄井、測井等各專業(yè)通過數(shù)據(jù)采集系統(tǒng),按照源頭數(shù)據(jù)采集標(biāo)準(zhǔn)和采集管理流程,經(jīng)過質(zhì)量控制和數(shù)據(jù)審核后直接加載到油田一體化數(shù)據(jù)庫主庫。實(shí)時數(shù)據(jù)的采集直接進(jìn)入專業(yè)應(yīng)用數(shù)據(jù)庫,實(shí)時數(shù)據(jù)經(jīng)抽析、加工生成分析數(shù)據(jù),經(jīng)審查后加載到一體化數(shù)據(jù)庫。
數(shù)據(jù)模型與國際標(biāo)準(zhǔn)接軌,數(shù)據(jù)的存儲和組織更加科學(xué),可擴(kuò)展性強(qiáng),能夠滿足未來技術(shù)發(fā)展需要。隨著油田管理的精細(xì)化,信息化應(yīng)用需求也將越來越大,數(shù)據(jù)種類、數(shù)量也將不斷地增大。參照國際POSC標(biāo)準(zhǔn)設(shè)計一套科學(xué)的數(shù)據(jù)模型,可以較好地適應(yīng)業(yè)務(wù)發(fā)展的需要。同時為未來的國際化合作奠定了信息基礎(chǔ)。
按照業(yè)務(wù)主題組織的數(shù)據(jù)模型能夠?qū)鐚I(yè)的綜合應(yīng)用提供無縫支持,實(shí)現(xiàn)“業(yè)務(wù)聯(lián)動、信息共享”。因?yàn)榈讓拥臄?shù)據(jù)是一套,所以某一業(yè)務(wù)數(shù)據(jù)改變,其它相關(guān)的業(yè)務(wù)應(yīng)用就可以看到,大大提高了不同業(yè)務(wù)之間的聯(lián)動。集成的數(shù)據(jù)組織模式可以快速、準(zhǔn)確地提供數(shù)據(jù)服務(wù),減少應(yīng)用人員收集數(shù)據(jù)的時間,降低企業(yè)的“無效”工作時間。對提高研究人員效率和改善管理決策有非常重要的意義和價值。
有效解決目前專業(yè)數(shù)據(jù)庫之間存在的數(shù)據(jù)冗余、標(biāo)準(zhǔn)沖突等問題。只有數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一,在應(yīng)用系統(tǒng)中才能準(zhǔn)確、唯一地理解數(shù)據(jù)的語義,消除數(shù)據(jù)應(yīng)用的歧義性,有利于應(yīng)用系統(tǒng)的規(guī)范化開發(fā)和持續(xù)發(fā)展。
易于建立起完善的數(shù)據(jù)服務(wù)體系。數(shù)據(jù)中心不僅是數(shù)據(jù)存儲中心,而且還是數(shù)據(jù)服務(wù)中心。通過源頭采集入庫的數(shù)據(jù),只有通過應(yīng)用,才能進(jìn)一步對數(shù)據(jù)進(jìn)行再次校核,一體化數(shù)據(jù)庫為所有的應(yīng)用提供按需的服務(wù)支持,應(yīng)用又反過來驗(yàn)證和完善數(shù)據(jù)中心的數(shù)據(jù),這樣就建立起采集、應(yīng)用、完善、再應(yīng)用的良性數(shù)據(jù)服務(wù)循環(huán)體系。
4.2 主要缺點(diǎn)
與現(xiàn)有數(shù)據(jù)管理模式差別較大,推行難度比較大。目前數(shù)據(jù)管理模式是從基層隊逐級上報,不同的業(yè)務(wù)部門分管內(nèi)部的數(shù)據(jù)資源,目前所有的應(yīng)用都是建立在該模式之上,因此要實(shí)現(xiàn)集中管理,應(yīng)用系統(tǒng)的遷移存在較大難度。
新數(shù)據(jù)管理模式將對現(xiàn)有應(yīng)用系統(tǒng)帶來較大的沖擊?,F(xiàn)有的應(yīng)用系統(tǒng)都是基于目前的勘探、開發(fā)數(shù)據(jù)結(jié)構(gòu)設(shè)計的,大都沒有能夠按照先進(jìn)的軟件工程方法設(shè)計,系統(tǒng)對數(shù)據(jù)結(jié)構(gòu)的依賴較大。如果數(shù)據(jù)結(jié)構(gòu)改變,將會有較大的修改工作量。
數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn)設(shè)計的技術(shù)難度比較高。由于數(shù)據(jù)中心要實(shí)現(xiàn)井場所有數(shù)據(jù)資產(chǎn)的管理和對外提供數(shù)據(jù)服務(wù),所以不僅保存生產(chǎn)源頭數(shù)據(jù),還要保存勘探開發(fā)研究成果數(shù)據(jù)、管理決策數(shù)據(jù),既包含結(jié)構(gòu)化數(shù)據(jù),又包括非結(jié)構(gòu)化數(shù)據(jù)。怎樣有機(jī)地將不同類型的數(shù)據(jù)集成為一個整體,還有很多需要解決的技術(shù)關(guān)鍵,如圖形標(biāo)準(zhǔn)與專業(yè)數(shù)據(jù)集成技術(shù)等。隨著全球化進(jìn)程的加快,將來可能要和國際同行業(yè)進(jìn)行數(shù)據(jù)交換,因此數(shù)據(jù)標(biāo)準(zhǔn)要和國際標(biāo)準(zhǔn)靠攏,但目前在國內(nèi)真正深入研究石油行業(yè)數(shù)據(jù)國際標(biāo)準(zhǔn)的企業(yè)或大專院校很少。
5 結(jié)論
分專業(yè)數(shù)據(jù)集成管理方案不符合未來數(shù)據(jù)管理的發(fā)展趨勢,比較符合現(xiàn)階段實(shí)際情況,能做到數(shù)據(jù)的互連互通,見效快,數(shù)據(jù)管理仍然是分專業(yè)管理。兩級數(shù)據(jù)集成管理方案可以做到數(shù)據(jù)的集中存儲,但仍然存在標(biāo)準(zhǔn)不統(tǒng)一的問題,容易造成分專業(yè)自成體系,一體化數(shù)據(jù)庫不能有效發(fā)揮作用的被動局面。一級數(shù)據(jù)集成管理方案可以實(shí)現(xiàn)數(shù)據(jù)的集中存儲、統(tǒng)一數(shù)據(jù)服務(wù)和規(guī)范源頭數(shù)據(jù)采集,避免分散管理、標(biāo)準(zhǔn)難統(tǒng)一的弊端,符合未來數(shù)據(jù)管理的發(fā)展趨勢,但對當(dāng)前的數(shù)據(jù)管理模式?jīng)_擊較大。
參考文獻(xiàn):
[1] 陳志泊,李冬梅,王春玲.數(shù)據(jù)庫原理與應(yīng)用教程[M].北京:人民郵電出版社,2002.
[2] Sunopsis,The Future of Data Integration Technologies,A META Group White Paper,F(xiàn)ebruary 2002.