国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

油氣田非結(jié)構(gòu)化成果數(shù)據(jù)庫設(shè)計

2024-05-18 06:48:48王娟蔡亮竇敬姜淇
電腦知識與技術(shù) 2024年8期
關(guān)鍵詞:數(shù)據(jù)庫設(shè)計

王娟 蔡亮 竇敬 姜淇

摘要:當(dāng)今對于石油行業(yè)這些將信息視為命脈的企業(yè)來說,如何對非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行合理的存儲和管理成為值得關(guān)注的問題之一。目前,國外油氣田非結(jié)構(gòu)化業(yè)務(wù)成果展示基本分散在不同的專業(yè)軟件中,沒有提供集中統(tǒng)一的Web端展示。而國內(nèi)油氣田非結(jié)構(gòu)化業(yè)務(wù)成果展示也分散在不同的專業(yè)軟件中。換句話說,國內(nèi)油氣田非結(jié)構(gòu)化成果數(shù)據(jù)庫平臺亟待開發(fā)。因此,文章旨在研究和設(shè)計油氣田非結(jié)構(gòu)化成果數(shù)據(jù)庫,同時圍繞數(shù)字油田具體的應(yīng)用需求,對系統(tǒng)中涉及的一些關(guān)鍵點進(jìn)行了深入研究。

關(guān)鍵詞:油田數(shù)字化;非結(jié)構(gòu)化數(shù)據(jù);數(shù)據(jù)庫設(shè)計;軟件平臺設(shè)計

中圖分類號:TP311? ? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2024)08-0085-03

開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)

0 引言

長慶油田勘探開發(fā)過程中產(chǎn)生大量非結(jié)構(gòu)化數(shù)據(jù),包括四性關(guān)系卡片、測井藍(lán)圖、錄井綜合圖、試油(氣)地質(zhì)設(shè)計、巖心照片、老井措施總結(jié)報告等三百余類,格式多樣。這些數(shù)據(jù)的查看和展示需要支持跨平臺、跨設(shè)備、兼容各種瀏覽器。同時支持圖件的放大、縮小、旋轉(zhuǎn)、拖拽等操作,以及圖件的標(biāo)注、數(shù)據(jù)疊加、搜索、權(quán)限控制等功能[1]。因此,需要開展數(shù)據(jù)智能標(biāo)注技術(shù)研究,形成一套高性能、安全的多終端成果展示與數(shù)據(jù)交互關(guān)聯(lián)技術(shù),作為通用技術(shù)中臺,與長慶夢想云平臺進(jìn)行集成,為各類非結(jié)構(gòu)化數(shù)據(jù)應(yīng)用提供支撐[2-3]。

然而,工程專業(yè)技術(shù)服務(wù)行業(yè)的發(fā)展空間與工程建設(shè)投資之間存在著緊密的聯(lián)系,國民經(jīng)濟持續(xù)發(fā)展和固定資產(chǎn)投資快速增長是牽引工程勘察設(shè)計行業(yè)快速發(fā)展的源動力[4]。多年以來,我國全社會固定資產(chǎn)投資保持了持續(xù)增長的勢頭。未來我國固定資產(chǎn)投資規(guī)模仍將保持較高的增速。與之緊密相關(guān)的工程專業(yè)技術(shù)服務(wù)行業(yè)仍然具有較好的市場前景[5]。因此,為了更好地支持科研和生產(chǎn),需要研究基于H5的油氣田非結(jié)構(gòu)化成果展示技術(shù),研究基于H5的大型圖片切片預(yù)覽技術(shù),研究基于H5的在線圖文標(biāo)注技術(shù),還需要研究基于長慶油田云環(huán)境的分布式文檔存儲技術(shù)。

1 非結(jié)構(gòu)化成果數(shù)據(jù)庫

1.1 數(shù)據(jù)的概述

實際上,在現(xiàn)實中,數(shù)據(jù)的存儲并非目的,而是為了合理利用。數(shù)據(jù)的應(yīng)用從一個側(cè)面來說就是為了能夠被讀懂,無論是人類可讀還是機器可讀。結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)決定了不同的處理方式。結(jié)構(gòu)化的數(shù)據(jù)可以用于查詢、加減乘除等數(shù)學(xué)運算、相等、比較大小、與或非等邏輯運算,還包括計算、求和等統(tǒng)計運算。而非結(jié)構(gòu)化數(shù)據(jù)則往往需要還原出來,供人們觀看、聽取,如文章、圖片、聲音、視頻等。人們可以理解這些信息,然后指導(dǎo)機器進(jìn)行拼裝、刪除、添加、剪輯等處理。

如果機器要分析這些數(shù)據(jù),則需采用OCR等技術(shù)來識別圖片中的文字,NLP等技術(shù)來識別文字的詞性或含義。因此,非結(jié)構(gòu)化數(shù)據(jù)的處理方式與處理數(shù)據(jù)庫的技術(shù)完全不同。例如,一篇純文本文章存入數(shù)據(jù)庫后,結(jié)構(gòu)化處理工具只能將其視為一個整體進(jìn)行處理,這表明純文本并不一定是結(jié)構(gòu)化數(shù)據(jù)。舉個例子,在學(xué)術(shù)領(lǐng)域中,讓機器準(zhǔn)確判斷一個人名的姓和名的任務(wù)并不容易。不能簡單地假設(shè)姓氏在名字的左邊一個字,名字的右邊兩個字。這涉及需要對復(fù)姓的存在進(jìn)行深入了解。例如,“歐陽”和“西門”是復(fù)姓,而“歐陽修”和“西門慶”是古時較為出名的姓名。人們之所以知道“歐陽修”是姓“歐陽”,是因為他是復(fù)姓。因此,我們需要先收集所有的復(fù)姓。對于原始的三字姓名,我們可以先判斷前兩個字是否為復(fù)姓,即它們是否在復(fù)姓表中。如果是,則可以確定前兩個字是姓,最后一個字是名(即2+1) ;如果不在復(fù)姓表中,則可以確定第一個字是姓,后面兩個字是名(即1+2) 。然而,不能每次都認(rèn)為左邊兩個字“歐陽”一定是姓“歐陽”,因為“歐陽某”也有可能是單姓“歐”,名“陽某”。同理,“夏候某”可能姓“夏侯”,也可能姓“夏”。通過這個例子,可以體會到非結(jié)構(gòu)化數(shù)據(jù)帶來的拆分和處理的難題。

1.2 非結(jié)構(gòu)化數(shù)據(jù)的概述

非結(jié)構(gòu)化數(shù)據(jù)其格式非常多樣,標(biāo)準(zhǔn)也是多樣性的。而且在技術(shù)上,非結(jié)構(gòu)化信息比結(jié)構(gòu)化信息更難標(biāo)準(zhǔn)化和理解。因此,存儲、檢索、發(fā)布以及利用需要更加智能化的IT技術(shù),比如海量存儲、智能檢索、知識挖掘、內(nèi)容保護、信息的增值開發(fā)利用等。簡單地說,非結(jié)構(gòu)化數(shù)據(jù)主要指那些無法用固定結(jié)構(gòu)來邏輯表達(dá)實現(xiàn)的數(shù)據(jù),比如用戶散落在論壇、微博、微信或其他渠道發(fā)表的關(guān)于產(chǎn)品的各種評價或吐槽。然而,國內(nèi)的企業(yè)級客戶在進(jìn)行大數(shù)據(jù)分析時,仍以分析結(jié)構(gòu)化數(shù)據(jù)為主。

再具體到典型案例中,例如醫(yī)療影像系統(tǒng)、教育視頻點播、視頻監(jiān)控、國土GIS、設(shè)計院、文件服務(wù)器(PDM/FTP) 、媒體資源管理等具體應(yīng)用,這些行業(yè)對于存儲需求包括數(shù)據(jù)存儲、數(shù)據(jù)備份以及數(shù)據(jù)共享等。而且,從形態(tài)上,非結(jié)構(gòu)化數(shù)據(jù)主要包含三大塊:第一是文本文字;第二是圖像、圖片等;第三是視頻流、電視流。和結(jié)構(gòu)化數(shù)據(jù)相比,非結(jié)構(gòu)化數(shù)據(jù)最本質(zhì)的區(qū)別包括三個層面:非結(jié)構(gòu)化數(shù)據(jù)的容量比結(jié)構(gòu)化數(shù)據(jù)要大,產(chǎn)生的速度比結(jié)構(gòu)化數(shù)據(jù)要快,數(shù)據(jù)來源具有多樣性。

根據(jù)IDC的調(diào)查,目前企業(yè)結(jié)構(gòu)化數(shù)據(jù)僅占到全部數(shù)據(jù)量的20%,其余80%都是以文件形式存在的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些非結(jié)構(gòu)化數(shù)據(jù)每年增長率達(dá)60%。如何管理好這80%的數(shù)據(jù),是企業(yè)構(gòu)建協(xié)同辦公的關(guān)鍵一環(huán)。非結(jié)構(gòu)化數(shù)據(jù)的存儲和流轉(zhuǎn)主要采用郵件、FTP以及QQ等IM工具。然而,這些工具傳遞文件時速度不穩(wěn)定,安全性得不到保障,并且無法很好地滿足企業(yè)中一對多的高頻數(shù)據(jù)傳遞場景。

由于非結(jié)構(gòu)化數(shù)據(jù)中沒有限定的結(jié)構(gòu)形式,表示靈活,蘊含了豐富的信息。因此,在大數(shù)據(jù)分析挖掘中,掌握非結(jié)構(gòu)化數(shù)據(jù)處理技術(shù)是至關(guān)重要的。處理非結(jié)構(gòu)化數(shù)據(jù)包括:Web頁面信息內(nèi)容提??;結(jié)構(gòu)化處理(包括文本的詞匯切分、詞性分析、歧義處理等);語義處理(包括實體提取、詞匯相關(guān)度、句子相關(guān)度、篇章相關(guān)度、句法分析等);文本建模(包括向量空間模型、主題模型等);隱私保護(包括社交網(wǎng)絡(luò)的連接型數(shù)據(jù)處理、位置軌跡型數(shù)據(jù)處理等)。處理非結(jié)構(gòu)化數(shù)據(jù)時,還需注意這幾點:非結(jié)構(gòu)化數(shù)據(jù)文件數(shù)量過多、過大;非結(jié)構(gòu)化數(shù)據(jù)歸集檢索調(diào)取效率低;傳統(tǒng)架構(gòu)無法按需彈性配置存儲空間。

2 數(shù)據(jù)庫設(shè)計前期工作

2.1 設(shè)計的數(shù)據(jù)需求

經(jīng)過對開發(fā)研究業(yè)務(wù)過程中對數(shù)據(jù)的需求,在總體上可分為兩大類。其一是對基礎(chǔ)數(shù)據(jù)的需求,包括油氣田公司已經(jīng)形成的專業(yè)基礎(chǔ)數(shù)據(jù),如物探、鉆井、錄井、測井、試油、分析化驗、油氣田生產(chǎn),井下作業(yè)等數(shù)據(jù)。另一類為研究過程中產(chǎn)生的成果數(shù)據(jù)。在這里,重點論述開發(fā)綜合研究對研究成果數(shù)據(jù)的需求。

在開發(fā)綜合研究過程中,各類研究成果數(shù)據(jù)附有必要的屬性(素引)信息,使盆地諸要素有機地組織在一起,實現(xiàn)盆地地質(zhì)體的多維可視化表征和展示。首先是地質(zhì)目標(biāo)的空間信息,包括盆地、構(gòu)造單元、工區(qū)、區(qū)塊、層位、井等的空間位置信息,展示分析時用相關(guān)數(shù)據(jù)在三維空間上的投放和展示。其次是專業(yè)研究信息,包括地層、構(gòu)造、沉積、儲層、油氣田藏等專業(yè)分類,展示分析時由這些信息支持按照研究專題進(jìn)行數(shù)據(jù)提取和投放展示。再其次是研究業(yè)務(wù)信息,包括油氣田開發(fā)研究中的開發(fā)方案編制、精細(xì)油藏描述研究等,支持研究成果數(shù)據(jù)按照研究業(yè)務(wù)進(jìn)行投放和展示分析。此外,研究成果數(shù)據(jù)可以按照研究項目、業(yè)務(wù)組織結(jié)構(gòu)等進(jìn)行投放展示,從多方位展示開發(fā)研究成果,滿足研究和決策管理的應(yīng)用需求。開發(fā)綜合研究需要各研究階段的成果圖件、成果附表、成果數(shù)據(jù)體、成果報告和多媒體。

2.2 設(shè)計的技術(shù)架構(gòu)

油氣田開發(fā)研究成果數(shù)據(jù)建設(shè)體現(xiàn)在與業(yè)務(wù)相結(jié)合的特點,以油田中心數(shù)據(jù)庫和A1、A2數(shù)據(jù)庫為數(shù)據(jù)源,通過系統(tǒng)提供的數(shù)據(jù)管理與服務(wù)平臺推送專題研究需要的數(shù)據(jù)。業(yè)務(wù)人員在研究工作空間中開展專題研究工作,形成的研究成果歸檔到研究成果數(shù)據(jù)庫。以地層劃分、沉積研究和試油試采生產(chǎn)分析業(yè)務(wù)工作為例,開展開發(fā)研究成果數(shù)據(jù)建設(shè)架構(gòu)設(shè)計。

2.3 設(shè)計的質(zhì)量控制

在進(jìn)行地質(zhì)與油藏工程軟件測試與管理業(yè)務(wù)時,本研究采取以下合理的質(zhì)量控制方法。

1) 設(shè)定明確的測試目標(biāo)和標(biāo)準(zhǔn):在開始測試之前,確保所有測試人員了解測試目標(biāo)和標(biāo)準(zhǔn),以便能夠正確評估軟件的質(zhì)量。

2) 制定詳細(xì)的測試計劃:制定詳細(xì)的測試計劃,包括測試范圍、測試環(huán)境、測試方法和測試資源等信息,以確保測試的全面性和有效性。

3) 進(jìn)行全面的功能測試:對軟件的各項功能進(jìn)行全面測試,包括輸入輸出測試、功能性測試、兼容性測試等,以確保軟件功能的完整性和正確性。

4) 進(jìn)行性能測試:對軟件的性能進(jìn)行測試,包括負(fù)載測試、壓力測試和穩(wěn)定性測試等,以確保軟件在實際使用情況下的性能穩(wěn)定性和可靠性。

5) 進(jìn)行安全性測試:對軟件的安全性進(jìn)行測試,包括漏洞測試、權(quán)限測試和數(shù)據(jù)安全性測試等,以確保軟件在使用過程中的安全性和可信度。

2.4 設(shè)計的風(fēng)險評估

針對實施過程中可能發(fā)生的風(fēng)險,本研究采取以下切實可行的風(fēng)險評估、管理辦法及應(yīng)對措施:

風(fēng)險評估:在項目開始之前,對可能發(fā)生的風(fēng)險進(jìn)行評估,包括技術(shù)風(fēng)險、成本風(fēng)險和進(jìn)度風(fēng)險等,以確定風(fēng)險的影響程度和發(fā)生概率。

風(fēng)險管理:制定詳細(xì)的風(fēng)險管理計劃,包括風(fēng)險識別、風(fēng)險分析、風(fēng)險控制和風(fēng)險監(jiān)控等,以確保項目能夠及時應(yīng)對和控制風(fēng)險。

應(yīng)對措施:根據(jù)風(fēng)險的影響程度和發(fā)生概率,制定相應(yīng)的應(yīng)對措施,包括風(fēng)險避免、風(fēng)險轉(zhuǎn)移、風(fēng)險緩解和風(fēng)險接受等,以減輕風(fēng)險帶來的影響。

風(fēng)險跟蹤與監(jiān)控:定期跟蹤和監(jiān)控項目中存在的風(fēng)險,及時更新風(fēng)險管理計劃,并采取相應(yīng)的措施來控制和應(yīng)對風(fēng)險的發(fā)生。

總之通過合理的質(zhì)量控制方法和科學(xué)的風(fēng)險評估、管理辦法及應(yīng)對措施,可以提高地質(zhì)與油藏工程軟件測試與管理業(yè)務(wù)的質(zhì)量和效率,降低項目風(fēng)險帶來的影響。

3 系統(tǒng)設(shè)計思路

3.1 設(shè)計思路

一體化的設(shè)計思路。要完成企業(yè)信息的一體化建立,首先需雙方共同協(xié)商討論,建立統(tǒng)一的企業(yè)信息化標(biāo)準(zhǔn)模型,對企業(yè)所有的業(yè)務(wù)規(guī)范、接口規(guī)范、管理規(guī)范、命名規(guī)范,以及各系統(tǒng)之間的對接關(guān)系建立統(tǒng)一的標(biāo)準(zhǔn)模型。為各個系統(tǒng)建立統(tǒng)一的數(shù)據(jù)存儲中心,搭建統(tǒng)一的數(shù)據(jù)交換平臺。采用分級處理,統(tǒng)一匯總的企業(yè)信息存儲中心。

定制化與產(chǎn)品化結(jié)合的設(shè)計思路。針對長慶油田的實際情況分析,在所有的系統(tǒng)中,將采用定制化軟件與成熟產(chǎn)品化軟件相互結(jié)合的設(shè)計思路。按需定制功能,模塊擴展靈活,基于H5的油氣田開發(fā)成果綜合展示技術(shù)研究項目這一課題與本研究以往接觸的項目有很多相似之處。借鑒以往的開發(fā)經(jīng)驗并與本次項目建設(shè)相互融合,打造一套定制化的系統(tǒng),以客戶需求為導(dǎo)向,避免軟件功能的閑置,最大限度地滿足用戶的需求以及行業(yè)的特殊性。

可擴展性的設(shè)計思路??蓴U展設(shè)計的價值觀不應(yīng)是現(xiàn)在解決將來的問題,而是尋求未來發(fā)展之后現(xiàn)在的解決方案是否仍然有效,是否仍然可以被繼承擴展而適應(yīng)新的需求。即本研究考慮的不是將未來的解納入到現(xiàn)在的體系中,而是考慮現(xiàn)在的解決方案在未來體系中的位置。

3.2 設(shè)計流程及方法

本研究嚴(yán)格按照軟件工程方式方法,按計劃分步驟實施本系統(tǒng)。根據(jù)調(diào)研需求和軟件開發(fā)流程以及客戶系統(tǒng)實施時間要求等各方面因素綜合考慮后,項目開發(fā)實施分為以下幾個步驟。

1) 詳細(xì)需求調(diào)研:主要就系統(tǒng)的業(yè)務(wù)范疇和使用人員作詳細(xì)的溝通討論,最終在完全理解所有需求的情況下,開始進(jìn)入下一環(huán)節(jié)。

2) 系統(tǒng)詳細(xì)設(shè)計文檔編寫:詳細(xì)設(shè)計文檔是緊跟需求調(diào)研的重要步驟,也是形成軟件開發(fā)文件的起始步驟,依據(jù)詳細(xì)業(yè)務(wù)調(diào)研,把需求用文字詳細(xì)描述并得到客戶認(rèn)同為目的。主要包括功能詳細(xì)設(shè)計和數(shù)據(jù)庫設(shè)計。

3) 軟件代碼編碼:根據(jù)詳細(xì)設(shè)計完成代碼編寫,將文字內(nèi)容代碼化的一個過程。

4) 軟件測試:軟件開發(fā)完成后進(jìn)入測試階段,盡量多方位測試軟件中存在的bug,并給以修復(fù)和完善。

5) 系統(tǒng)實施及培訓(xùn):甲方使用環(huán)境的安裝和部署,并且培訓(xùn)系統(tǒng)使用人員。

6) 系統(tǒng)試運行、正式運行:安裝實施完畢的系統(tǒng)通常都有試運行期和正式運行的階段性劃分。試運行期主要是使用人員適應(yīng)軟件辦公的一個過渡過程。

7) 系統(tǒng)驗收:試用期結(jié)束,符合系統(tǒng)目標(biāo)并達(dá)到驗收標(biāo)準(zhǔn),進(jìn)入系統(tǒng)驗收階段。

4 結(jié)論

隨著成果數(shù)據(jù)大量產(chǎn)生并持續(xù)標(biāo)準(zhǔn)化的發(fā)展,對數(shù)據(jù)的快速查看有了更高的要求。因此,本研究實現(xiàn)了相關(guān)工作人員在油氣田生產(chǎn)等業(yè)務(wù)過程中,能夠簡便快捷地隨時調(diào)用和查看相關(guān)的成果數(shù)據(jù),并為研究、生產(chǎn)和決策人員提供數(shù)據(jù)依據(jù),以便促進(jìn)科研、優(yōu)化生產(chǎn)、提質(zhì)增效,充分發(fā)揮數(shù)據(jù)價值。

本研究在本平臺的設(shè)計基礎(chǔ)上不斷增加了新的功能,以滿足用戶的新需求。其中主要考慮部分是數(shù)據(jù)庫表與表之間的聯(lián)系以及字段的合理配置,以確保系統(tǒng)未來幾年數(shù)據(jù)增長也能滿足使用。這項研究對下一步開展勘探研究成果和油氣田評價研究成果數(shù)據(jù)體系研究具有重要的參考價值,對實現(xiàn)研究成果一體化管理與再利用具有潛在意義。

參考文獻(xiàn):

[1] 楊建鵬.基于NoSQL的油田數(shù)據(jù)管理研究[J].信息系統(tǒng)工程,2019(1):56.

[2] 馬立平,任寶生,趙明.油田產(chǎn)能建設(shè)項目后評價輔助系統(tǒng)設(shè)計與實現(xiàn)[J].計算機應(yīng)用與軟件,2011,28(6):161-163,204.

[3] 沈明.油田開發(fā)生產(chǎn)數(shù)據(jù)庫在油藏管理中的應(yīng)用實踐[J].西部探礦工程,2010,22(12):29-30,33.

[4] 于紅梅.油田Web數(shù)據(jù)庫系統(tǒng)的體系設(shè)計[J].油氣田地面工程,2013,32(2):27-28.

[5] 張巖.數(shù)字油田公共數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計構(gòu)思[J].中國管理信息化,2017,20(5):159-160.

【通聯(lián)編輯:聞翔軍】

猜你喜歡
數(shù)據(jù)庫設(shè)計
醫(yī)療設(shè)備信息管理系統(tǒng)的設(shè)計與實現(xiàn)
圖書館入館教育考試系統(tǒng)分析與設(shè)計
試論數(shù)據(jù)庫設(shè)計在網(wǎng)站開發(fā)中的應(yīng)用
基于WEB的科研信息管理系統(tǒng)的設(shè)計與實現(xiàn)
軟件開發(fā)中數(shù)據(jù)庫設(shè)計理論的實踐
面向等級考試,探討高校理工科計算機基礎(chǔ)課程教學(xué)改革
考試周刊(2016年47期)2016-06-29 22:15:13
網(wǎng)站管理系統(tǒng)中數(shù)據(jù)庫設(shè)計的應(yīng)用研究
《數(shù)據(jù)庫原理及應(yīng)用》在線考試系統(tǒng)的設(shè)計
基于PHP+MySql的學(xué)生請銷假系統(tǒng)的設(shè)計
農(nóng)村宅基地確權(quán)數(shù)據(jù)自動提取方法研究與應(yīng)用
德惠市| 南平市| 南陵县| 桦甸市| 神池县| 中卫市| 九台市| 防城港市| 嫩江县| 渝中区| 巴林右旗| 炎陵县| 梓潼县| 香港| 临桂县| 商城县| 冕宁县| 南部县| 会昌县| 宁化县| 长岛县| 阿鲁科尔沁旗| 新建县| 静安区| 华阴市| 博爱县| 正镶白旗| 墨竹工卡县| 视频| 林州市| 乌鲁木齐县| 博罗县| 彰化县| 安义县| 华亭县| 嘉荫县| 上林县| 若尔盖县| 防城港市| 开封县| 缙云县|