董文娟,朱遠(yuǎn)鑫,萬明剛
(長(zhǎng)江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
基于Fisher判別準(zhǔn)則的沉積環(huán)境判別與分類方法
董文娟,朱遠(yuǎn)鑫,萬明剛
(長(zhǎng)江大學(xué)信息與數(shù)學(xué)學(xué)院,湖北 荊州 434023)
基于Fisher判別準(zhǔn)則建立了沉積環(huán)境判別與分類的Fisher判別分析模型。模型選用粒度的平均粒徑、標(biāo)準(zhǔn)偏差、偏差以及峰值等4個(gè)指標(biāo)作為判別因子,利用方差分析的思想選擇判別系數(shù)建立相應(yīng)的判別函數(shù),以該函數(shù)計(jì)算待判樣品的Fisher判別函數(shù)值,以最大值對(duì)應(yīng)的總體作為樣品的歸屬。判別結(jié)果表明,所建立的沉積環(huán)境判別與分類的Fisher判別模型具有一定的實(shí)用價(jià)值。
粒度;沉積環(huán)境;分類;Fisher判別分析
沉積物粒度參數(shù)的變化受搬運(yùn)介質(zhì)、搬運(yùn)方式、沉積環(huán)境和氣候等因素控制,因此,沉積物粒度分析對(duì)揭示氣候變化和環(huán)境的演變具有重要意義。粒度參數(shù)平均粒徑、標(biāo)準(zhǔn)偏差、偏差、峰值是沉積物粒度4個(gè)重要參數(shù)。不同粒度組分的形成與搬運(yùn)與沉積環(huán)境密切相關(guān),處理、分析粒度數(shù)據(jù)可以進(jìn)一步確定沉積環(huán)境,這對(duì)于現(xiàn)代沉積學(xué)的研究,乃至古代沉積物的沉積環(huán)境分析無疑都具有重要的理論和現(xiàn)實(shí)意義。
文獻(xiàn)[1]給出了一種單樣品粒度分布表征方法——粒度母體分解圖;文獻(xiàn)[2]通過測(cè)試分析發(fā)現(xiàn)沉積巖粒度中值分布、泥質(zhì)含量、分選性等是影響油藏巖石滲透能力的重要因素,正態(tài)分布能較好地描述低滲透砂巖油藏中沉積物的粒度分布特征;文獻(xiàn)[3]根據(jù)數(shù)理統(tǒng)計(jì)方法對(duì)粒度參數(shù)進(jìn)行無偏估計(jì),使之較以往參數(shù)估計(jì)更加符合無系統(tǒng)誤差的評(píng)選標(biāo)準(zhǔn),并利用這一方法對(duì)長(zhǎng)樂東部海岸的風(fēng)沙進(jìn)行了系統(tǒng)的粒度參數(shù)分析;文獻(xiàn)[4]對(duì)典型穩(wěn)定湖相沉積物和典型風(fēng)成黃土粒度參數(shù)進(jìn)行定量化分析,然后利用多元判別分析的Fisher準(zhǔn)則建立了湖相與風(fēng)成沉積物2種沉積相的判別函數(shù); 文獻(xiàn)[5]以粒度參數(shù)為輸入變量,設(shè)計(jì)了沉積環(huán)境判別與分類的神經(jīng)網(wǎng)絡(luò)模型。
下面,筆者將判別分析理論應(yīng)用于沉積環(huán)境的綜合評(píng)判中,建立沉積環(huán)境判別與分類的Fisher判別分析模型。
1.1Fisher判別分析的基本思想
判別分析的基本思想,一般是將高維的數(shù)據(jù)點(diǎn),利用投影映射到低維空間上,從而方便進(jìn)行研究。Fisher判別準(zhǔn)則是利用方差分析方法對(duì)k個(gè)總體G1,G2,…,Gk中抽取具有p個(gè)指標(biāo)的樣本數(shù)據(jù)構(gòu)造判別函數(shù):R(x)=c1x1+…+cpxp=cTx,其中系數(shù)c=(c1,…,cp)的確定原則是使得每個(gè)組內(nèi)的離差最小,最后利用所得的判別函數(shù)對(duì)待測(cè)的樣品進(jìn)行判別。
1.2Fisher判別分析數(shù)學(xué)模型
設(shè)有k個(gè)總體G1,…,Gk,從中抽取樣本數(shù)分別為n1,…,nk的樣本,令n=n1+…+nk,其中每個(gè)樣品具有p個(gè)指標(biāo)。假設(shè)判別函數(shù)為:
R(x)=c1x1+…+cpxp=cTxc=(c1,…,cp)Tx=(x1,…,xp)T
(1)
不妨記:
A=cTμiB=cTsic
(2)
Fisher判別準(zhǔn)則就是利用方差分析的思想來選取判別系數(shù)組成的向量c,使得:
(3)
達(dá)到最大,其中qi為正的加權(quán)系數(shù),一般取(qi=ni-1);E,F(xiàn)分別為組間和組內(nèi)離差平方和:
(4)
地基沉降的原因主要可以分成2方面:一方面是內(nèi)部原因,即地基本身就存在不穩(wěn)定性,例如,陜西地區(qū)的土壤類型是黃土,就會(huì)更加容易發(fā)生沉降;另一方面就是外部原因,在外部存在著過于強(qiáng)大的附加壓力,超過了地基所能負(fù)荷的最大限度,從而使得地基發(fā)生變形,導(dǎo)致地基基礎(chǔ)下沉。
Ec=λFc
(5)
由代數(shù)知識(shí)可知,該式非零的特征根的個(gè)數(shù)m不超過min(k-1,p);因?yàn)镋為非負(fù)定,則非零特征根必為正根,有λ1≥λ2≥…≥λm>0。則可以構(gòu)造m個(gè)判別函數(shù):
Rl(x)=c(l)xl=1,…,m
(6)
1.3Fisher判別準(zhǔn)則及檢驗(yàn)
采取加權(quán)法和不加權(quán)法對(duì)待測(cè)樣本x(x1,x2,…,xp)T進(jìn)行歸類。
不加權(quán)法:
(6)
加權(quán)法:
(7)
表1 3種沉積環(huán)境的粒度樣本數(shù)據(jù)
(8)
珠江口盆地某凹陷是晚新生代古珠江三角洲-濱岸沉積體系形成、發(fā)育及演化的主要場(chǎng)所。在對(duì)該凹陷某區(qū)域進(jìn)行沉積微相劃分時(shí)進(jìn)行了大量的粒度試驗(yàn),得到了一系列與沉積微相對(duì)應(yīng)的粒度數(shù)據(jù),取其中15個(gè)樣本作為訓(xùn)練樣本,建立Fisher判別函數(shù)。其具體樣本數(shù)據(jù)見表1。
由表1可知,k=3,p=4,i=1,2,3,n=n1+n2+n3=15。
1)計(jì)算各判別變量的均值:
μ1=[2.2895,1.0884,0.2809,1.4689]μ2=[3.7933,1.9737,0.2680,1.1387]
μ3=[3.3747,1.5325,0.6657,1.8988]
2)計(jì)算各判別樣本的方差:
3)計(jì)算組間和組內(nèi)離差陣:
最后得到判別函數(shù)為:
R(x)=0.4296x1+0.5660x2+0.0519x3+0.227
利用上述判別函數(shù)對(duì)其余60個(gè)粒度參數(shù)進(jìn)行判別分析,其判別結(jié)果見表2。
表2 60個(gè)樣本的識(shí)別結(jié)果
由表2可知,所建立的沉積環(huán)境判別與分類的Fisher判別模型整體誤判率為23.3%,具有一定的實(shí)用價(jià)值。
結(jié)合多元統(tǒng)計(jì)數(shù)學(xué)知識(shí),以Fisher判別分析方法建立沉積環(huán)境綜合評(píng)判的數(shù)學(xué)模型,為沉積環(huán)境的判別與分類提供了數(shù)量化與定量化的途徑。值得指出的是在上述實(shí)例中除潮汐水道的判別率較高以外,其余2種沉積環(huán)境的判別率較低。出現(xiàn)整體判別率不高的原因主要在于基于Fisher準(zhǔn)則的判別分析法是線性判別,產(chǎn)生的誤差較大,適合兩組間的判別。對(duì)于多組沉積環(huán)境的判別,可以嘗試采取Bayesian判別分析法。
[1]曲政.沉積物粒度數(shù)據(jù)表征方法的研究[J].中國粉體技術(shù), 2001,7(4):24-31.
[2]薛太清.低滲透砂巖油藏沉積物粒度分布特征研究[J].沉積學(xué)報(bào), 2006, 24(3):414-418.
[3]楊銳,雷懷彥,劉建輝,等.沉積物粒度參數(shù)的無偏估計(jì)及其在長(zhǎng)樂海岸的應(yīng)用[J].海洋地質(zhì)動(dòng)態(tài), 2007,23(10):33-36.
[4]張平,宋春暉,楊用彪,等.穩(wěn)定湖相沉積物和風(fēng)成黃土粒度判別函數(shù)的建立及其意義[J].沉積學(xué)報(bào), 2008,26(3):501-507.
[5]方志江,曲政.基于粒度數(shù)據(jù)的沉積環(huán)境自動(dòng)識(shí)別方法的研究[J].煤, 1999,3:60-63.
[6]高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京: 北京大學(xué)出版社, 2005.
[編輯] 洪云飛
10.3969/j.issn.1673-1409.2011.05.002
TE19
A
1673-1409(2011)05-0005-03