国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于鉆孔數(shù)據(jù)的可視化空間分析方法研究

2021-12-03 06:39:25陶德保
科技信息·學(xué)術(shù)版 2021年31期
關(guān)鍵詞:可視化技術(shù)

陶德保

摘要:論文以鉆孔數(shù)據(jù)的空間多維分析模型入手,主要研究了數(shù)據(jù)多維分析模型的發(fā)展和實(shí)現(xiàn),提出適合鉆孔數(shù)據(jù)管理的空間數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)分析的多維數(shù)據(jù)模型,并在此基礎(chǔ)上提出了一種空間數(shù)據(jù)挖掘的模型結(jié)構(gòu),用三種空間數(shù)據(jù)挖掘算法分析了礦化段之間的相關(guān)性??臻g數(shù)據(jù)的可視化以及基于可視化技術(shù)的空間分析、空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)已經(jīng)發(fā)展成為空間信息處理的重要手段和關(guān)鍵技術(shù)。本文還介紹了基于OPENGL的幾種可視化模型,實(shí)現(xiàn)了空間數(shù)據(jù)挖掘結(jié)果的交互式可視化。

關(guān)鍵詞:鉆孔數(shù)據(jù);空間數(shù)據(jù)倉(cāng)庫(kù);空間數(shù)據(jù)挖掘;可視化技術(shù)

1 引言

鉆井領(lǐng)域數(shù)據(jù)復(fù)雜,既有定量測(cè)量的數(shù)據(jù),又有定性的文字描述,它們量綱不一、形式多樣。僅儲(chǔ)層特性的數(shù)據(jù)就涉及到測(cè)井儀器、測(cè)井方法、測(cè)井原理、儀器所探測(cè)的深度、儀器分辨率等。如何把這些反映同一儲(chǔ)層特性的數(shù)據(jù)結(jié)合起來(lái),無(wú)冗余,而又不漏失地反映井、礦的特性,一直是鉆井領(lǐng)域資料解釋的重點(diǎn)。數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的和隨時(shí)間變化的數(shù)據(jù)集合。它是一項(xiàng)基于數(shù)據(jù)管理和運(yùn)用的綜合性技術(shù)和解決方案,是一種有效的數(shù)據(jù)存儲(chǔ)和組織形式。經(jīng)過(guò)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)處理以后的數(shù)據(jù)是集成的、穩(wěn)定的、干凈的,從而有利于在后面集成并運(yùn)用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析處理。但是目前,在大多數(shù)知識(shí)發(fā)現(xiàn)的過(guò)程中,數(shù)據(jù)仍然被視為是靜態(tài)的,人機(jī)交互類似于傳統(tǒng)的數(shù)據(jù)庫(kù)操作。這樣一來(lái),只有在處理結(jié)果出來(lái)之后才能評(píng)判數(shù)據(jù)輸入的好壞,挖掘算法選擇的優(yōu)劣。而將地理可視化與空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)相集成,可以使知識(shí)發(fā)現(xiàn)的各個(gè)階段具有高度的交互性和靈活性。

2基于空間數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘模型設(shè)計(jì)

空間數(shù)據(jù)倉(cāng)庫(kù)(Spatial Data Warehouse-SDW)是GIS技術(shù)與數(shù)據(jù)倉(cāng)庫(kù)(Data Warehouse-DW) 技術(shù)相結(jié)合的產(chǎn)物,它是在DW基礎(chǔ)上,引入空間維數(shù)據(jù),根據(jù)主題從不同的GIS 應(yīng)用系統(tǒng)中截取不同規(guī)模時(shí)空尺度上的信息,從而為地學(xué)研究以及有關(guān)環(huán)境資源政策的制定提供最好的信息服務(wù)。圖1是本文提出的一個(gè)基于空間數(shù)據(jù)倉(cāng)庫(kù)的空間數(shù)據(jù)挖掘的模型結(jié)構(gòu)。用戶發(fā)出知識(shí)發(fā)現(xiàn)的命令,知識(shí)發(fā)現(xiàn)模塊從空間數(shù)據(jù)倉(cāng)庫(kù)中獲取感興趣的數(shù)據(jù) (與任務(wù)相關(guān)的數(shù)據(jù))。知識(shí)發(fā)現(xiàn)模塊根據(jù)要求和領(lǐng)域知識(shí)庫(kù),從那些與任務(wù)相關(guān)的數(shù)據(jù)中發(fā)現(xiàn)知識(shí),發(fā)現(xiàn)的知識(shí)提供給用戶應(yīng)用。一般這一過(guò)程要交互地反復(fù)進(jìn)行才能得到最終滿意的結(jié)果。

3空間元數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)及生成算法

為實(shí)現(xiàn)基于鉆孔數(shù)據(jù)的空間多維分析,本系統(tǒng)主要從四個(gè)維度來(lái)分析原始數(shù)據(jù)庫(kù)中的信息,分別為地層維、礦化段維、礦化量維和鉆井維。可以利用標(biāo)準(zhǔn)模板庫(kù)(STL)中的鏈表和向量模板來(lái)設(shè)計(jì)出其數(shù)據(jù)結(jié)構(gòu)。地層數(shù)據(jù)結(jié)構(gòu)的結(jié)構(gòu)圖如下(P代表Point3D):

圖中采用了一個(gè)鏈表來(lái)存儲(chǔ)所有的底層數(shù)據(jù),鏈表中包含了多個(gè)地層數(shù)據(jù)單元,每個(gè)單元由一個(gè)vctor和地層名組成,而vctor中存儲(chǔ)了該地層的所有數(shù)據(jù)點(diǎn)。本系統(tǒng)中還用了很多數(shù)據(jù)結(jié)構(gòu),例如在做數(shù)據(jù)分析時(shí),基本的分析單元是礦化段,用于礦體插值的礦化點(diǎn)數(shù)據(jù)結(jié)構(gòu)等,其設(shè)計(jì)思想同地層數(shù)據(jù)結(jié)構(gòu)是相同的,即先設(shè)計(jì)出基本數(shù)據(jù)單元,再結(jié)合STL中的LIST和VCTOR來(lái)組織數(shù)據(jù)。需要注意的是系統(tǒng)在整個(gè)設(shè)計(jì)過(guò)程中,要充分考慮程序的可擴(kuò)展性,對(duì)系統(tǒng)采用模塊劃分,各模塊功能明確;同時(shí)在設(shè)計(jì)數(shù)據(jù)機(jī)構(gòu)時(shí),可以采用了范性編程的思想,利于系統(tǒng)的進(jìn)一步完善和擴(kuò)充。

在多維數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)的基礎(chǔ)上,我們要對(duì)數(shù)據(jù)庫(kù)中的原始信息進(jìn)行精確的分析,采用ADO連接數(shù)據(jù)庫(kù),從原始數(shù)據(jù)庫(kù)中提取出需要的數(shù)據(jù),跟設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)相對(duì)應(yīng)起來(lái),這樣就得到了系統(tǒng)的元數(shù)據(jù)。以地層數(shù)據(jù)為例,首先要分析數(shù)據(jù)庫(kù)中所有與地層相關(guān)的表,然后用SQL語(yǔ)句在多張表中查詢所需要的字段信息,將查到的信息進(jìn)行篩選、提取,然后存入我們所設(shè)計(jì)的數(shù)據(jù)結(jié)構(gòu)中,這樣就為進(jìn)一步的數(shù)據(jù)分析提供了數(shù)據(jù)準(zhǔn)備。其他元數(shù)據(jù)的獲取方法同地層數(shù)據(jù)類似,限于篇幅,在此不做詳細(xì)說(shuō)明。

4可視化空間數(shù)據(jù)挖掘

通過(guò)離散鉆孔數(shù)據(jù)的空間挖掘我們希望能夠找出礦體的空間分布規(guī)律,從而為進(jìn)一步的三維礦體模擬提供一定的先驗(yàn)知識(shí),使其模擬結(jié)果更為精確。這部分屬于整個(gè)數(shù)據(jù)挖掘模型中的知識(shí)庫(kù)中的內(nèi)容,由于鉆孔數(shù)據(jù)的復(fù)雜性與不確定性,首先要對(duì)礦體的平面分布做一個(gè)大致的估計(jì),在這個(gè)基礎(chǔ)上再做空間數(shù)據(jù)分析,這樣得到的結(jié)果會(huì)更為精確。

4.1礦化量統(tǒng)計(jì)分析

礦化量表示的是每個(gè)鉆井所對(duì)應(yīng)的礦化情況,即將空間分布的礦化段數(shù)據(jù)投影到一個(gè)平面上,用一個(gè)平面來(lái)表示礦井對(duì)應(yīng)的點(diǎn)的礦化情況。根據(jù)每個(gè)鉆井下的礦化段的長(zhǎng)度L和每段的礦化度K,得出了每個(gè)鉆井的礦化量:

定義這個(gè)參數(shù)后,可以得到表示每口鉆井礦化情況的一個(gè)量化的值,用此參數(shù)進(jìn)行平面距離倒數(shù)加權(quán)插值(IDW),將插值結(jié)果可視化,則從平面的角度表示出礦體的礦化分布情況。圖4是對(duì)研究區(qū)域在的礦化量做IDW插值后使用OPENGL生成的平面效果圖,顏色越深的部分表示其含礦的量也越大。通過(guò)以上的分析,我們就找到了礦化量在地表的大致分布規(guī)律,在這個(gè)基礎(chǔ)上我們對(duì)礦化段在三維空間的分布規(guī)律進(jìn)行空間聚類分析。

4.2空間聚類分析

本文中采用的是K-means空間聚類算法。傳統(tǒng)的K均值聚類算法存在兩個(gè)固有的缺點(diǎn):(1)對(duì)于隨機(jī)的初始值選取可能會(huì)導(dǎo)致不同的聚類結(jié)果,甚至存在著無(wú)解的情況;(2)該算法是基于目標(biāo)函數(shù)的算法,通常采用梯度法求解極值,由于梯度法的搜索方向是沿著能量減小的方向進(jìn)行,使得算法很容易陷入局部極值,而且對(duì)于孤立點(diǎn)是敏感的。

為了克服傳統(tǒng)的K-均值聚類算法收斂時(shí)易陷入局部極值問題和對(duì)初始選值敏感性的缺點(diǎn),同時(shí)又能保持K-均值算法快速收斂的特點(diǎn),我們?cè)谶x擇初始值時(shí)結(jié)合礦化量的統(tǒng)計(jì)分析結(jié)果,用礦化量平面上的極值點(diǎn)來(lái)確定K-MEANS算法的初始聚類中心,其算法步驟如下:

1)根據(jù)礦化量統(tǒng)計(jì)分析結(jié)果,找出礦化量平面上的極值*S。

2)合并相近的極值點(diǎn)*S,得到初始的聚類中心S。

3)獲取聚類數(shù)目k ,置迭代誤差閾值e= 0.00001(可根據(jù)需要設(shè)置)。

聚類數(shù)目由用戶指定,用戶可以通過(guò)圖5中的對(duì)話框隨時(shí)改變聚類的數(shù)目,直到得到滿意的聚類效果。不過(guò)聚類數(shù)目有最大限制,其最大值不能超過(guò)Sj的長(zhǎng)度。通過(guò)空間分析,我們可以發(fā)現(xiàn)空間聚類的效果同礦化量的平面分布有著較好的對(duì)應(yīng)關(guān)系,可以將礦區(qū)大致分為三塊區(qū)域,還得到了鉆井及礦化段間的相關(guān)性信息,有利于我們從宏觀上把握礦區(qū)的礦體分布。

5結(jié)論

本文提出的基于鉆孔數(shù)據(jù)的空間數(shù)據(jù)挖掘方法,首先提出了礦化量的概念,將礦化段的分布情況做一個(gè)平面分析,通過(guò)距離倒數(shù)插值對(duì)礦體的分布做大致的估計(jì),在這個(gè)基礎(chǔ)上對(duì)K-MEANS聚類算法做改進(jìn),用礦化量的極值點(diǎn)來(lái)初始化K-MEANS中的初始聚類中心,使得分析結(jié)果更具科學(xué)性;然后將分析結(jié)果進(jìn)行可視化,從而大大地提高了人機(jī)交互的水平。但此方法仍存在一些不足,如各種地質(zhì)資料、專家知識(shí)和工程經(jīng)驗(yàn)不能及時(shí)融入到實(shí)際數(shù)據(jù)分析中,系統(tǒng)中所用到的可視化模型不能表現(xiàn)更為復(fù)雜的地質(zhì)構(gòu)造。由于地質(zhì)現(xiàn)象的高度復(fù)雜性和不確定性,上述問題將隨著研究和實(shí)際應(yīng)用的深入而逐步得到解決。

參考文獻(xiàn):

[1]雍世和,洪有密. 測(cè)井資料綜合解釋與數(shù)字處理[M ]. 北京石油工業(yè)出版社,1982.

[2]劉毅勇,何雄,李金山等.空間數(shù)據(jù)挖掘:變數(shù)據(jù)為知識(shí).計(jì)算機(jī)世界報(bào),2005.8.15.

[3]李德仁,王樹良,李德毅等.論空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的理論與方法[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版).2002.27(3):221-223

[4]Mapinfo Corporation.Mapinfo and Data Warehouse:A Mapinfo White Paper.1996.

[5]杜明義,郭達(dá)志.空間數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與模型研究[J].計(jì)算機(jī)工程與應(yīng)用1999( 12) 32- 34.

[6]郭仁忠.空間分析.高等教育出版社,北京,2001.10.

[7]Ujjwal M,Sanghamitra B.Genetic Algorithm Based Clustering Technique[J].Patten Recognition,2000,33(9):1455.

[8]Huang Z.Extensions to the k-Means Algorithm for clustering Large Data Sets with Categorical Values [J].DataMining and Knowledge.

[9]王家耀,張雪萍,周海燕.一個(gè)用于空間聚類分析的遺傳K-均值算法.計(jì)算機(jī)工程,2006.2.

[10]Dave Shreiner,Mason Woo,Jackie Neider,Tom Davis. OpenGL編程指南(第四版).人民郵電出版社,北京,2005.4.

猜你喜歡
可視化技術(shù)
基于電力調(diào)度自動(dòng)化的可視化技術(shù)探討
探析園藝植物可視化的研究現(xiàn)狀
關(guān)于數(shù)字城市三維建模可視化技術(shù)分析
西部資源(2017年1期)2017-03-27 21:43:26
淺析計(jì)算機(jī)圖形學(xué)、計(jì)算機(jī)視覺與可視化技術(shù)
可視化技術(shù)在公安數(shù)學(xué)教學(xué)中的應(yīng)用
考試周刊(2017年1期)2017-01-20 21:04:33
基于可視化技術(shù)的南美白對(duì)蝦養(yǎng)殖水質(zhì)的數(shù)據(jù)分析研究
基于可視化技術(shù)的城市道路交通數(shù)據(jù)可視探討
基于BI結(jié)合可視化技術(shù)在勞動(dòng)競(jìng)賽系統(tǒng)中的應(yīng)用
可視化技術(shù)在電力信息系統(tǒng)運(yùn)維中的應(yīng)用
淺析微課制作中的可視化技術(shù)
仪征市| 水富县| 拜泉县| 合川市| 惠东县| 沭阳县| 手游| 农安县| 肃南| 尤溪县| 镇雄县| 五大连池市| 漳浦县| 岳普湖县| 大冶市| 和田县| 大宁县| 义乌市| 宜君县| 巴楚县| 温泉县| 博乐市| 绥德县| 察隅县| 比如县| 大姚县| 太康县| 锦州市| 读书| 大新县| 根河市| 铁岭县| 施甸县| 绩溪县| 台山市| 景洪市| 青龙| 壤塘县| 崇文区| 西贡区| 邢台县|