国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

巖土參數(shù)概率分布的系統(tǒng)推斷研究*

2022-04-21 12:53:38孔令奇李翠娟
工業(yè)建筑 2022年1期
關(guān)鍵詞:概率密度函數(shù)正態(tài)概率分布

孔令奇 李翠娟

(1.成都工業(yè)學(xué)院材料與環(huán)境工程學(xué)院, 成都 610031; 2.西南交通大學(xué)土木工程學(xué)院, 成都 610031)

巖土參數(shù)的概率分布模型是研究邊坡可靠度的前提[1]。近年來,研究人員一直致力于巖土參數(shù)概率分布的推斷方法研究。對(duì)于巖土參數(shù)這樣的工程隨機(jī)變量,其樣本概率分布總體的估計(jì)無外乎分為參數(shù)估計(jì)法和非參數(shù)估計(jì)法[2]?;趨?shù)估計(jì)法推斷巖土參數(shù)概率密度函數(shù)的研究已經(jīng)取得了一些重要結(jié)論——巖土參數(shù)不嚴(yán)格服從正態(tài)分布[3-5]。利用正態(tài)分布和對(duì)數(shù)正態(tài)分布表示巖土參數(shù)概率分布存在經(jīng)典分布的定義區(qū)間和巖土參數(shù)實(shí)際分布區(qū)間不匹配的問題[6-8]。采用正態(tài)、對(duì)數(shù)正態(tài)等無界分布會(huì)使結(jié)果失去實(shí)際工程意義[4]。beta 分布可有效地反映巖土參數(shù)的分布特點(diǎn),是經(jīng)典分布有限范圍內(nèi)的最優(yōu)分布[4-5]。研究人員發(fā)現(xiàn)某些情況下參數(shù)法擬合巖土參數(shù)概率分布時(shí)存在較大誤差[9],故而提出非參數(shù)擬合方法。文獻(xiàn)[10]系統(tǒng)考察了非參數(shù)擬合的方法如:最大熵法[1,11-12]、正態(tài)信息擴(kuò)散法(NIS)[13]和正交多項(xiàng)式法[15]在推斷巖土參數(shù)概率分布時(shí)的優(yōu)劣,最終給出正態(tài)信息擴(kuò)散法為相對(duì)最優(yōu)推斷方法的結(jié)論。文獻(xiàn)[14]進(jìn)一步證明正態(tài)信息擴(kuò)散法在大樣本巖土參數(shù)概率分布推斷中的有效性,但該方法在應(yīng)用的過程中存在窗寬選擇的難題[16]。

迄今,研究人員提出了眾多的巖土參數(shù)概率分布推斷方法,對(duì)于工程人員來說,面對(duì)一組新測(cè)試樣本時(shí)仍存在著選擇哪種理論分布推斷樣本概率分布的難題。

為此,對(duì)于大量的巖土參數(shù)測(cè)試樣本,將借助數(shù)據(jù)挖掘技術(shù)中的模糊C-均值聚類方法,探尋巖土參數(shù)概率分布的統(tǒng)計(jì)規(guī)律;對(duì)于一組新測(cè)試的巖土參數(shù)樣本,基于其數(shù)字特征值和判別分析方法,將其分類,獲得概率分布模型;解析巖土參數(shù)分布特征對(duì)正態(tài)信息擴(kuò)散法最優(yōu)窗寬的影響,提出正態(tài)信息擴(kuò)散法最優(yōu)窗寬的確定方法。為巖土參數(shù)概率分布推斷提供簡(jiǎn)單、有效的方法。

1 巖土參數(shù)統(tǒng)計(jì)特征值

對(duì)任意的隨機(jī)變量,除了可用其概率密度函數(shù)來表示外,還可以用各階矩來刻畫該隨機(jī)變量[17]。如果能確定巖土參數(shù)的概率密度函數(shù)和相應(yīng)的數(shù)字特征,就可全面地描述巖土參數(shù)的概率特征[2,17]。大量的研究工作主要關(guān)注巖土參數(shù)概率密度函數(shù)的獲得,忽視了其主要數(shù)值特征分布規(guī)律的研究。工程中可以用巖土參數(shù)的某些關(guān)鍵量或主要數(shù)值特征量去近似地描述它的概率特征,這些特征值需能表征巖土參數(shù)測(cè)試樣本的波動(dòng)性、離散型和分布的不對(duì)稱性[2,17]。為此,定義了有效系數(shù),為2階原點(diǎn)矩與平均值之比,用來表征巖土參數(shù)測(cè)試樣本的波動(dòng)程度;變異系數(shù)表征巖土參數(shù)樣本的離散性,為樣本的方差與均值之比,一般當(dāng)變異系數(shù)cv>0.2時(shí),說明巖土參數(shù)樣本的離散性很嚴(yán)重[2];偏度系數(shù)表征巖土參數(shù)分布的不對(duì)稱性。當(dāng)樣本數(shù)量較大時(shí),可以采用更高階矩來描述其數(shù)字特征,由于巖土參數(shù)測(cè)試樣本數(shù)量通常較小,屬于小樣本,高階矩將失去意義[2]。

為了從統(tǒng)計(jì)中尋找規(guī)律,收集了19組巖土參數(shù)測(cè)試樣本,來說明統(tǒng)計(jì)的思路和得出的關(guān)鍵結(jié)論。19組巖土參數(shù)測(cè)試樣本數(shù)據(jù)如表1所示。

工程中,當(dāng)各個(gè)隨機(jī)變量的量綱和數(shù)量級(jí)不一致時(shí),為了探尋海量數(shù)據(jù)內(nèi)在的規(guī)律性,需對(duì)樣本進(jìn)行變換處理,以消除各樣本量綱和數(shù)量級(jí)的限制。首先對(duì)巖土參數(shù)測(cè)試樣本進(jìn)行了極差歸一化變換處理[21],即:

(1)

表1內(nèi)收集得到的巖土參數(shù)測(cè)試樣本采樣于不同的地質(zhì)單元,且采用的測(cè)試設(shè)備及測(cè)量控制方法等也不盡相同[22]。對(duì)表1內(nèi)的樣本不難獲得其統(tǒng)計(jì)特征值(如表3所示),但很難從統(tǒng)計(jì)特征值中直觀地判斷采用何種理論分布推斷其概率密度函數(shù)。

表1 巖土參數(shù)測(cè)試樣本

2 巖土參數(shù)的聚類分析

2.1 模糊C-均值聚類

要從眾多的數(shù)據(jù)中抽取巖土參數(shù)固有的特征,獲得簡(jiǎn)潔的系統(tǒng)行為,模糊C-均值聚類分析是解決上述問題的有效手段之一。

傳統(tǒng)的系統(tǒng)聚類和K均值聚類法存在把每個(gè)測(cè)試樣本嚴(yán)格地劃分到某個(gè)類中的局限性,Bezdek借助模糊理論,提出模糊C-均值聚類方法[23]。該方法通過迭代計(jì)算不斷修正隸屬度矩陣,極小化所有測(cè)試樣本到聚類中心的距離和隸屬度的加權(quán),最終通過優(yōu)化目標(biāo)獲得每個(gè)測(cè)試樣本對(duì)所有類中心的隸屬度,實(shí)現(xiàn)對(duì)大量測(cè)試樣本進(jìn)行分類的目的。

設(shè)矩陣X由n個(gè)測(cè)試樣本(x1x2…xn)的p個(gè)特征值構(gòu)成。

(2)

c個(gè)類的聚類中心記為V={v1,v2,…,vc},其中vi=(vi1,vi2,…,vic),i=1,2,…,c,2≤c≤n。

(3)

其中dik=‖xk-vi‖

式中:U=(uik)c×n為隸屬度矩陣。

模糊C-均值聚類法的具體步驟如下[17,21]:

2)計(jì)算迭代至第l步的聚類中心V(l):

(4)

3)修正U(l),計(jì)算J(l)。

(5a)

i=1,2,…,c;k=1,2,…,c

(5b)

4)判斷收斂的條件:

(6)

式中:εu為終止容限。

如滿足收斂條件,終止迭代,否則l=l+1,然后轉(zhuǎn)至第2步。

2.2 巖土參數(shù)聚類

針對(duì)表1的19組數(shù)據(jù)進(jìn)行模糊C-均值聚類分析。分類的個(gè)數(shù)取決于聚類數(shù)形圖和不一致系數(shù)[17],將19組測(cè)試樣本分成4類,迭代收斂的條件取εu=10-6。19組巖土參數(shù)的隸屬度矩陣如表2所示。

表2 隸屬度矩陣

由表2可見:如1號(hào)測(cè)試樣本壓縮系數(shù)屬于第4類的隸屬度最大為0.926 9,所以將其歸為第4類,其他測(cè)試樣本分類方法相同。表3給出了歸聚為一類的巖土參數(shù)測(cè)試樣本的統(tǒng)計(jì)特征值。

由表3明顯可見,歸聚為一類的巖土參數(shù)測(cè)試樣本數(shù)字特征值相近,表明其概率分布相近。由概率論和數(shù)理統(tǒng)計(jì)可知,直方圖以很高的概率接近隨機(jī)變量的概率密度函數(shù)[2],歸聚為一類的巖土參數(shù)測(cè)試樣本的直方圖如圖1~4所示。

a—樣本序號(hào)2; b—樣本序號(hào)7; c—樣本序號(hào)9; d—樣本序號(hào)11; e—樣本序號(hào)13?!猙eta分布; ----正態(tài)信息擴(kuò)散法。

表3 聚類之后的樣本的統(tǒng)計(jì)特征值

3 巖土參數(shù)概率分布選擇

3.1 推斷巖土參數(shù)的概率密度函數(shù)

大量巖土參數(shù)測(cè)試樣本進(jìn)行分類后,目標(biāo)是獲得各類巖土參數(shù)測(cè)試樣本的概率分布形式。在既有研究成果的基礎(chǔ)上,采用的巖土參數(shù)概率密度擬合方法為beta分布和正態(tài)信息擴(kuò)散法。

3.1.1標(biāo)準(zhǔn)beta分布

標(biāo)準(zhǔn)beta分布為[17]

(7)

式中:α1、α2為B分布參數(shù)。

文獻(xiàn)[17]提出根據(jù)標(biāo)準(zhǔn)beta分布的均值、方差與分布參數(shù)α1、α2的關(guān)系,同時(shí)考慮概率性質(zhì)和巖土參數(shù)的數(shù)字特征,只要獲得巖土參數(shù)測(cè)試樣本的平均值和有效值,即可獲得beta分布的參數(shù)α1和α2。

3.1.2正態(tài)信息擴(kuò)散法

正態(tài)信息擴(kuò)散法的概率密度函數(shù)為:

(8)

式中:K()為核函數(shù);h為窗寬;n為樣本個(gè)數(shù);X1,X2,…,Xn為取自總體X的樣本。

詳細(xì)的原理過程見文獻(xiàn)[6,24-25],窗寬h采用文獻(xiàn)[14]給出的窗寬計(jì)算式:

(9)

式中:δ為樣本觀測(cè)值的標(biāo)準(zhǔn)差。

3.2 擬合效果評(píng)價(jià)指標(biāo)

K-S檢驗(yàn)法的檢驗(yàn)量是整個(gè)取值范圍內(nèi)的最大偏差值,且與顯著性水平有關(guān),不能提供某一分布擬合是良好的絕對(duì)信息[2]。為了從全局角度評(píng)估beta分布和正態(tài)信息擴(kuò)散法對(duì)巖土參數(shù)概率密度函數(shù)的擬合質(zhì)量,采用均方差指標(biāo)ηMSE對(duì)擬合曲線進(jìn)行效果校驗(yàn)[17]:

a—樣本序號(hào)4; b—樣本序號(hào)6; c—樣本序號(hào)8; d—樣本序號(hào)16; e—樣本序號(hào)17; f—樣本序號(hào)18; g—樣本序號(hào)19。——beta分布; ----正態(tài)信息擴(kuò)散法。

a—樣本序號(hào)3; b—樣本序號(hào)5; c—樣本序號(hào)14; d—樣本序號(hào)15?!猙eta分布; ----正態(tài)信息擴(kuò)散法。

a—樣本序號(hào)1; b—樣本序號(hào)10; c—樣本序號(hào)12。——beta分布; ----正態(tài)信息擴(kuò)散法。

(10)

式中:fi為理論頻率;S*(xi)為頻率直方圖中每個(gè)子區(qū)間的相對(duì)頻率;m為區(qū)間個(gè)數(shù)。

3.3 巖土參數(shù)測(cè)試樣本的概率密度函數(shù)推斷

3.3.1各類樣本概率密度擬合效果分析

圖1~4分別給出了第1~4類巖土參數(shù)測(cè)試樣本beta分布和正態(tài)信息擴(kuò)散法擬合效果。

由圖1~4可見,歸聚為一類的巖土參數(shù)樣本概率分布形狀基本相同。表4給出了巖土參數(shù)測(cè)試樣本的beta分布參數(shù)和正態(tài)信息擴(kuò)散法的窗寬。表5給出了兩種擬合方法的誤差分析。其中表4中的h指按式(9)計(jì)算所得值。

表4 擬合參數(shù)求解結(jié)果

表5 擬合誤差分析

由表3~5可見:1)第1類測(cè)試樣本有效系數(shù)和偏度系數(shù)均較?。坏?類測(cè)試樣本對(duì)比第1類測(cè)試樣本,有效系數(shù)相當(dāng),偏度系數(shù)較大;這兩類測(cè)試樣本反映的概率分布特征為波動(dòng)性較小,這兩類巖土參數(shù)測(cè)試樣本采用beta分布和正態(tài)信息擴(kuò)散法進(jìn)行擬合均有效,誤差均在0.1以內(nèi)[17],且正態(tài)信息擴(kuò)散法擬合最優(yōu)窗寬均為h。2)第3類測(cè)試樣本的有效系數(shù)和偏度系數(shù)明顯變大,測(cè)試樣本反映的概率分布特征為波動(dòng)性較大,不對(duì)稱性明顯。第3類測(cè)試樣本采用beta分布擬合時(shí)誤差均大于0.1,正態(tài)信息擴(kuò)散法擬合誤差小于0.1,所以,對(duì)于第3類測(cè)試樣本推薦采用正態(tài)信息擴(kuò)散法進(jìn)行擬合其概率密度函數(shù),最優(yōu)窗寬仍為h。3)對(duì)于第4類測(cè)試樣本,顯著特征是有效系數(shù)更大,變異系數(shù)四類中最大,測(cè)試樣本反映的概率分布特征為波動(dòng)性、離散性嚴(yán)重。beta分布擬合誤差更大,當(dāng)采用正態(tài)信息擴(kuò)散法擬合其概率密度函數(shù)時(shí),式(9)給出的窗寬h顯然已不能體現(xiàn)樣本的較大波動(dòng)性。

3.3.2正態(tài)信息擴(kuò)散法最優(yōu)窗寬確定

正態(tài)信息擴(kuò)散法的窗寬選擇一直是個(gè)難題,為此,提出對(duì)波動(dòng)性較大的巖土參數(shù)測(cè)試樣本窗寬選擇方法,具體步驟如下:

1)按式(9)計(jì)算窗寬h的初始值;2)依次改變窗寬的大小為h/2、h/3、h/4、…,進(jìn)行粗選窗寬,設(shè)為h′,粗選窗寬的確定依據(jù)為均方差最??;3)確定粗選窗寬h′后,以更小的步長(zhǎng)微調(diào)粗選窗寬h′(文中以0.000 5為步長(zhǎng),增大、減小窗寬h′),確定最優(yōu)窗寬h″,最優(yōu)窗寬的確定依據(jù)為均方差最小。

仿真分析發(fā)現(xiàn),對(duì)于波動(dòng)性較大的測(cè)試樣本,工程誤差允許范圍內(nèi),可選擇粗選窗寬h′為最優(yōu)窗寬。

對(duì)于第4類測(cè)試樣本,窗寬取為h和尋優(yōu)之后的窗寬h″的對(duì)比曲線如圖5所示。

a—樣本序號(hào)1; b—樣本序號(hào)10; c—樣本序號(hào)12。

當(dāng)窗寬取為h時(shí),3組測(cè)試樣本的均方差分別為0.239 8、0.466 4、0.293 1。當(dāng)窗寬取為h″時(shí),均方誤差分別為0.093 8、0.036 3、0.043 4。證明本文方法的有效性。

4 工程實(shí)例分析

測(cè)試樣本取自南昌地鐵二號(hào)線翠苑路站[18],該地鐵二號(hào)線粉質(zhì)黏土壓縮系數(shù)參數(shù)30個(gè)測(cè)試樣本:27.3,18.6,22.9,23.7,21.9,20.7,22.7,21.7,23.1,22.0,23.0,21.5,21.5,22.8,21.3,23.7,25.2,23.0,23.1,24.1,21.5,23.7,22.2,25.6,20.4,23.6,22.3,20.7,22.5,19.0 MP-1。通過計(jì)算,該測(cè)試樣本經(jīng)過極差歸一化處理后的有效系數(shù)為1.1,變異系數(shù)為0.21,偏度系數(shù)為0.25。根據(jù)判別分析方法,判斷該組測(cè)試樣本屬于第1類。采用beta分布和正態(tài)信息擴(kuò)散法都可推斷其概率密度函數(shù)。采用beta分布推斷其概率分布,測(cè)試樣本的平均值為0.449 4,有效值為0.493 2,求得beta分布的參數(shù)α1=2.560 6和α2=2.471 1。獲得beta分布的概率密度函數(shù)為:

(11)

繪制其頻率直方圖和beta分布擬合曲線如圖6所示。均方差為0.017 1。

圖6 beta分布擬合曲線

為驗(yàn)證方法的有效性,提取文獻(xiàn)[18]提供的23個(gè)黏聚力測(cè)試樣本:14.515 5,14.645 0,14.671,14.877 9,15.018 7,15.232 9,15.257 5,15.269 8,15.287,15.377 5,15.395 3,15.402 7,15.495 5,15.587 6,15.635,15.654 1,15.710 8,16.003,16.029 2,16.121,16.141 5,16.878 7,17.142 3 kPa。通過計(jì)算,該測(cè)試樣本經(jīng)過極差歸一化處理后的有效系數(shù)為1.18,變異系數(shù)為0.25,偏度系數(shù)為0.78。采用判別分析方法,判斷該組測(cè)試樣本屬于第3類。采用正態(tài)信息擴(kuò)散法推斷其概率密度函數(shù),最優(yōu)窗寬為h=0.139 8。采用正態(tài)信息擴(kuò)散法擬合其概率分布如圖7所示,為了對(duì)比,亦給出beta分布擬合曲線。

——beta分布; —·—正態(tài)信息擴(kuò)散法。

正態(tài)信息擴(kuò)散分布法擬合曲線的均方差指標(biāo)為0.087 2,beta分布擬合曲線的均方差指標(biāo)為0.317 9。

以上工程實(shí)例表明,對(duì)于一組新的測(cè)試樣本,只要先計(jì)算出其數(shù)值特征值,即可簡(jiǎn)單、有效地確定采用何種理論模型推斷其概率分布。

5 結(jié)束語(yǔ)

通過模糊C-均值聚類方法分析,對(duì)19組巖土參數(shù)測(cè)試樣本進(jìn)行分類統(tǒng)計(jì)分析,統(tǒng)計(jì)結(jié)果能有效地展現(xiàn)巖土參數(shù)測(cè)試樣本概率分布選擇的規(guī)律性,結(jié)論如下:

1)基于參數(shù)估計(jì)的beta分布只適用于推斷波動(dòng)性較小的巖土參數(shù)測(cè)試樣本的概率分布(如第1類和第2類)。

2)正態(tài)信息擴(kuò)散法當(dāng)窗寬取為h時(shí),僅適用于推斷波動(dòng)性和離散性不嚴(yán)重的巖土參數(shù)測(cè)試樣本的概率分布(如第1、2、3類);對(duì)于波動(dòng)性、離散性嚴(yán)重的巖土參數(shù)測(cè)試樣本,正態(tài)信息擴(kuò)散法在推斷其概率分布時(shí)最優(yōu)窗寬需根據(jù)具體樣本尋優(yōu)選擇,采用較小的窗寬才能反映出樣本的波動(dòng)性。

限于篇幅,僅以參數(shù)估計(jì)法中的beta分布和非參數(shù)估計(jì)的正態(tài)信息擴(kuò)散法兩種典型概率模型為例,其他概率分布的判斷過程與此相同。采用聚類分析后,巖土參數(shù)測(cè)試樣本的概率分布推斷不再是一個(gè)復(fù)雜的、反復(fù)試錯(cuò)的過程,整個(gè)工作將變得系統(tǒng)化、程序化。

猜你喜歡
概率密度函數(shù)正態(tài)概率分布
冪分布的有效估計(jì)*
離散型概率分布的ORB圖像特征點(diǎn)誤匹配剔除算法
已知f(x)如何求F(x)
關(guān)于概率分布函數(shù)定義的辨析
科技視界(2016年19期)2017-05-18 10:18:46
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
基于概率分布的PPP項(xiàng)目風(fēng)險(xiǎn)承擔(dān)支出測(cè)算
基于泛正態(tài)阻抗云的諧波發(fā)射水平估計(jì)
半?yún)?shù)EV模型二階段估計(jì)的漸近正態(tài)性
基于概率密度函數(shù)的控制系統(tǒng)性能評(píng)價(jià)
非高斯隨機(jī)分布系統(tǒng)自適應(yīng)控制算法的研究
高州市| 闻喜县| 宕昌县| 咸阳市| 遵义县| 饶平县| 常州市| 金华市| 基隆市| 云南省| 石城县| 东乡| 枝江市| 武威市| 义马市| 洱源县| 大连市| 嵊泗县| 宜丰县| 竹山县| 信阳市| 青浦区| 安达市| 屏东县| 正宁县| 长寿区| 张家界市| 隆回县| 泸水县| 临高县| 泽州县| 仲巴县| 金阳县| 柘城县| 鄂温| 庆云县| 左权县| 晋城| 晋中市| 喀什市| 大洼县|