董文娟,朱遠(yuǎn)鑫,萬明剛,呂一兵
(長江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北荊州 434023)
沉積物粒度參數(shù)的變化受搬運(yùn)介質(zhì)、搬運(yùn)方式、沉積環(huán)境和氣候等因素控制,不同粒度組分的形成與搬運(yùn)與沉積環(huán)境密切相關(guān),處理、分析粒度數(shù)據(jù)可以進(jìn)一步確定沉積環(huán)境,這對(duì)現(xiàn)代沉積學(xué)的研究,乃至古代沉積物的沉積環(huán)境分析無疑都具有重要的理論和現(xiàn)實(shí)意義.
在相關(guān)研究中,Sahu等[1]在對(duì)不同成因的樣品進(jìn)行分析研究的基礎(chǔ)上,得到了各類沉積環(huán)境間的判別函數(shù),曲政[2]給出了一種單樣品粒度分布表征的方法.薛清太[3]通過測試分析發(fā)現(xiàn)沉積巖粒度中值分布、泥質(zhì)含量、分選性等是影響油藏巖石滲透能力的重要因素,而正態(tài)分布和Φ正態(tài)分布能較好地描述低滲透砂巖油藏中沉積物的粒度分布特征,楊銳等[4]根據(jù)數(shù)理統(tǒng)計(jì)方法對(duì)粒度參數(shù)進(jìn)行無偏估計(jì),使之較以往參數(shù)估計(jì)更加符合無系統(tǒng)誤差的評(píng)選標(biāo)準(zhǔn),并利用這一方法對(duì)長樂東部海岸的風(fēng)沙進(jìn)行了系統(tǒng)的粒度參數(shù)分析,張平等[5]對(duì)典型穩(wěn)定湖相沉積物和典型風(fēng)成黃土粒度參數(shù)做了定量化分析,然后利用多元判別分析的Fisher準(zhǔn)則建立了湖相與風(fēng)成沉積物兩種沉積相的判別函數(shù).在上述研究的基礎(chǔ)上,本文將判別分析理論應(yīng)用于沉積環(huán)境的綜合評(píng)判中,建立沉積環(huán)境判別與分類的Bayes判別分析模型,選用粒度的平均粒徑、標(biāo)準(zhǔn)偏差、偏差、峰值4個(gè)指標(biāo)作為判別因子,結(jié)合多元統(tǒng)計(jì)分析建立沉積環(huán)境判別與分類的Bayes判別函數(shù).研究表明,所建立的Bayes判別函數(shù)可較理想地應(yīng)用于沉積環(huán)境的判別與分類中,同時(shí),將其應(yīng)用于實(shí)際工程中取得了較為理想的效果.
已知有 g個(gè)p維總體G1,G2,…,Gg,每個(gè)總體Gi可以認(rèn)為是屬于 Gi的指標(biāo),X= (X1,X2,…, Xp)T,取值的全體,它們分別具有互不相同的p維概率密度函數(shù),f1(x),f2(x),…,fg(x),對(duì)于任一給定的新樣品關(guān)于指標(biāo) X的觀測值,x=(x1,x2,…, xp)T,關(guān)鍵是要判斷該樣品屬于 g個(gè)總體中的哪一個(gè).因而,判別分析是根據(jù)所研究個(gè)體的某些指標(biāo)的觀察值來推斷該個(gè)體所屬類型的一種統(tǒng)計(jì)學(xué)方法.在這些判別方法中,Bayes判別是使誤判的平均損失達(dá)到最小的一種判別分析方法.
設(shè)2個(gè)p維正態(tài)分布總體G1,G2,其概率密度函數(shù)為,
式中,μi,∑i為兩總體的均值向量和協(xié)方差矩陣, |∑i|為∑i的行列式,i=1,2.
假設(shè),∑1=∑2=∑,根據(jù)馬氏(Mahalano-bis)距離和判別函數(shù)的概念可得,
式中,
稱為Bayes判別函數(shù).
現(xiàn)將式(3)推廣到多正態(tài)總體的情形.設(shè)有 g個(gè)p維總體G1,G2,…,Gg,其概率密度函數(shù)如式(1)所示,此時(shí),i=1,2,…,g.假設(shè)各正態(tài)總體的協(xié)方差矩陣相等,即,∑1=∑2=…=∑g=∑,則其Bayes判別函數(shù)為,
實(shí)際應(yīng)用中,若μi,∑i未知,可以訓(xùn)練樣本做估計(jì),即以訓(xùn)練樣本的樣本均值x—(i)和樣本方差 Si作為μi和∑i的估計(jì),此時(shí),
式中,k=1,2,…,g.
設(shè)總體 G1,G2,…,Gg的先驗(yàn)概率分布分別為, q1,q2,…,qg,誤判損失為,c(j|i)(i,j=1,2,…, g,i≠j),記c(i|j)=0.在等誤判損失下,其Bayes判別準(zhǔn)則為,
多正態(tài)總體Bayes判別準(zhǔn)則可解釋為:對(duì)于給定的樣品x,計(jì)算g個(gè)總體在x處的概率密度函數(shù)值(以Bayes函數(shù)值 Wi(x)代替),最大值所屬的總體Gi即為x所屬的類別.
為考察上述判別準(zhǔn)則的優(yōu)良性,采用以訓(xùn)練樣本為基礎(chǔ)的刀切法來計(jì)算誤判率 pw.該方法的基本思想是:每次從訓(xùn)練樣本中剔除一個(gè)樣本,利用剩下的 n1+…+ng-1個(gè)訓(xùn)練樣本建立判別函數(shù),再用所得到的判別函數(shù)對(duì)剔除的樣本進(jìn)行分類,重復(fù)以上步驟,以其誤判的比例作為誤判概率的估計(jì).具體過程如下:
①從總體G1,容量為n1的訓(xùn)練樣本開始,依次剔除其中的一個(gè)樣本,用剩下的(n1-1)+…+ng個(gè)樣本,建立相應(yīng)的判別函數(shù);
②利用得到的判別函數(shù)對(duì)剔除的樣本做判別;
③重復(fù)步驟 ①、②直到總體G1中n1個(gè)樣本依次被剔除和判別,其中被誤判的樣本數(shù)記為 n′1;
④利用上面的方法,繼續(xù)對(duì) G2,…,Gg中的樣本進(jìn)行剔除和判別,直到所有n1+…+ng個(gè)樣本均被剔除和判別后,得到誤判的訓(xùn)練樣本總個(gè)數(shù)為n′1+…+n′g,其誤判率為,
沉積物粒度參數(shù)的變化受搬運(yùn)介質(zhì)、搬運(yùn)方式、沉積環(huán)境和氣候等因素控制,參考相關(guān)研究成果[2-6],本文選擇粒度的平均粒徑、標(biāo)準(zhǔn)偏差、偏差、峰值等4個(gè)指標(biāo)作為判別因子,并將沉積環(huán)境分為潮汐水道、水下分流河道和水下決口扇3種沉積環(huán)境,建立沉積環(huán)境綜合評(píng)判的Bayes模型.
珠江口盆地某凹陷是晚新生代古珠江三角洲—濱岸沉積體系形成、發(fā)育及演化的主要場所.我們?cè)趯?duì)該凹陷某區(qū)域進(jìn)行沉積微相劃分時(shí)進(jìn)行了大量的粒度實(shí)驗(yàn),得到了一系列與沉積微相對(duì)應(yīng)的粒度數(shù)據(jù),取其中20個(gè)樣本作為訓(xùn)練樣本,建立Bayes判別函數(shù),其具體樣本數(shù)據(jù)如表1所示.
假定:誤判損失相等,總體先驗(yàn)分布相同,并且3個(gè)總體服從協(xié)方差矩陣相等的正態(tài)分布,并按上述方法建立Bayes判別函數(shù).
首先,計(jì)算相應(yīng)的判別函數(shù),具體過程如下:
由表1中的樣品可知,
根據(jù)式(5)計(jì)算得到:
(1)計(jì)算各判別變量的均值.
表1 3種沉積環(huán)境的樣本數(shù)據(jù)
(2)計(jì)算各判別樣本的方差.
根據(jù)式(6)、(7)得到:
根據(jù)式(4)計(jì)算得到判別函數(shù):
(3)判別準(zhǔn)則的評(píng)價(jià).
從總體潮汐水道,容量為 n1=5的訓(xùn)練樣本開始,依次剔除其中的一個(gè)樣本,用剩下的(n1-1)+…+ng=19個(gè)樣本,建立相應(yīng)的判別函數(shù),并對(duì)剔除的樣本做判別,重復(fù)上述操作,直到潮汐水道中n1=5個(gè)樣本依次被剔除和判別,得到被誤判的樣本數(shù)記為,n′1=1;利用上面的方法,繼續(xù)對(duì)水下分流河道、水下決口扇中的樣本進(jìn)行剔除和判別;直到所有 n1+…+ng=20個(gè)樣本均被剔除和判別后,得到誤判的訓(xùn)練樣本總個(gè)數(shù)為,n′1+…+n′g=1+ 2+1=4,誤判率為,
為了檢驗(yàn)上述判別方法的有效性,我們利用所得到的判別函數(shù)對(duì)其余的55個(gè)粒度參數(shù)進(jìn)行判別分析,其判定結(jié)果見表2.
表2 55個(gè)樣本的識(shí)別結(jié)果
由表2可知,樣本整體準(zhǔn)確率為80%.由此可見,本文所提出的Bayes判別模型具有較高的工程適用價(jià)值.
沉積環(huán)境判別與分類是一個(gè)較為復(fù)雜的問題,還有許多的問題需要研究和解決.本文結(jié)合多元統(tǒng)計(jì)數(shù)學(xué)知識(shí),以Bayes判別分析方法建立沉積環(huán)境綜合評(píng)判的數(shù)學(xué)模型,為沉積環(huán)境的判別與分類提供了一種數(shù)量化與定量化的途徑.同時(shí),由于模型采用刀切法對(duì)判別準(zhǔn)則進(jìn)行評(píng)價(jià),結(jié)果較為客觀合理,因而具有較高的工程實(shí)用價(jià)值.
[1]趙澄林,朱筱敏.沉積巖石學(xué)(第三版)[M].北京:石油工業(yè)出版社,2001.
[2]曲政.沉積物粒度數(shù)據(jù)表征方法的研究[J].中國粉體技術(shù),2001,7(4):24-31.
[3]薛太清.低滲透砂巖油藏沉積物粒度分布特征研究[J].沉積學(xué)報(bào),2006,24(3):414-418.
[4]楊銳,雷懷彥.沉積物粒度參數(shù)的無偏估計(jì)及其在長樂海岸的應(yīng)用[J].海洋地質(zhì)動(dòng)態(tài),2007,23(10):33-36.
[5]張平,宋春暉.穩(wěn)定湖相沉積物和風(fēng)成黃土粒度判別函數(shù)的建立及其意義[J].沉積學(xué)報(bào),2008,26(3):501-507.