劉永紅 屈希峰
混凝土強(qiáng)度關(guān)乎土木結(jié)構(gòu)安全,影響混凝土強(qiáng)度的因素諸多,文章采用機(jī)器學(xué)習(xí)LGBM回歸算法分析臺(tái)灣重華大學(xué)信息管理系葉怡成教授的混凝土強(qiáng)度試驗(yàn)相關(guān)數(shù)據(jù),通過數(shù)據(jù)分析驗(yàn)證影響混凝土強(qiáng)度各因素的重要性,并回歸預(yù)測(cè)混凝土強(qiáng)度。該分析方法可用在其他室內(nèi)試驗(yàn)或監(jiān)測(cè)檢測(cè)領(lǐng)域,為決策提供依據(jù)。
土木工程; 機(jī)器學(xué)習(xí); 混凝土強(qiáng)度; LGBM回歸算法
TU528B〗
[定稿日期]2021-06-22
[作者簡(jiǎn)介]劉永紅(1979~),男,碩士,高級(jí)工程師,從事巖土工程設(shè)計(jì)與施工工作。
混凝土強(qiáng)度是現(xiàn)代土木工程結(jié)構(gòu)安全的基本保障,更是建筑施工從業(yè)人員在項(xiàng)目中經(jīng)常要面對(duì)的重要問題。一般情況下,混凝土具有較高的抗壓強(qiáng)度(抗拉強(qiáng)度相對(duì)較低,約為抗壓強(qiáng)度120~110),因此,抗壓強(qiáng)度是施工過程中控制和評(píng)定混凝土質(zhì)量的主要指標(biāo)。根據(jù)GB 50010-2010《混凝土結(jié)構(gòu)設(shè)計(jì)規(guī)范》規(guī)定:“混凝土強(qiáng)度等級(jí)應(yīng)按立方體抗壓強(qiáng)度標(biāo)準(zhǔn)值確定。立方體抗壓強(qiáng)度標(biāo)準(zhǔn)值系指按照標(biāo)準(zhǔn)做法制作養(yǎng)護(hù)的邊長(zhǎng)為150 mm的立方體試件,在28 d齡期用標(biāo)準(zhǔn)試驗(yàn)方法測(cè)得的具有95 %保證率的抗壓強(qiáng)度”[5-6]。
根據(jù)工程經(jīng)驗(yàn),混凝土強(qiáng)度與水灰比、濕度、溫度及骨料等因素密切相關(guān)。例如:相同水泥強(qiáng)度等級(jí)下,水灰比越小,水泥石的強(qiáng)度就越高,其與骨料之間的黏結(jié)力也就越大,混凝土強(qiáng)度也就越高。假如濕度不足,會(huì)減緩水泥水化反應(yīng),進(jìn)而會(huì)使得混凝土結(jié)構(gòu)變得松散,滲水性變大,導(dǎo)致混凝土的強(qiáng)度降低。其次,混凝土硬化的關(guān)鍵在于水泥的水化作用是否充分,溫度升高時(shí),水泥水化速度加快,混凝土強(qiáng)度上升也快?;炷翉?qiáng)度最主要取決于水泥石強(qiáng)度與骨料表面的黏結(jié)強(qiáng)度,增大骨料的強(qiáng)度也有助于提升混凝土強(qiáng)度。本文通過分析臺(tái)灣重華大學(xué)信息管理系葉怡成教授的混凝土強(qiáng)度試驗(yàn)數(shù)據(jù),通過數(shù)據(jù)分析證實(shí)以上工程試驗(yàn)結(jié)論,并采用LGBM回歸算法預(yù)測(cè)混凝土強(qiáng)度[1]、[8]。
1 數(shù)據(jù)描述
本文所采用的Concrete Compressive Strength數(shù)據(jù)集[9],該數(shù)據(jù)集中包含1 030組數(shù)據(jù),每組數(shù)據(jù)由9個(gè)參數(shù)組成,分別為:水泥、礦渣、粉煤灰、水、減水劑、粗骨料、細(xì)骨料、養(yǎng)護(hù)齡期、抗壓強(qiáng)度(表1、表2)。
從表2檢測(cè)結(jié)果整體描述可以看出該數(shù)據(jù)集無缺失值以及各數(shù)據(jù)的分布范圍。
2 特征重要性分析
2.1 特性向量相關(guān)性
統(tǒng)計(jì)學(xué)的相關(guān)系數(shù)經(jīng)常使用的有3種:皮爾森(pearson)相關(guān)系數(shù)和斯皮爾曼(spearman)相關(guān)系數(shù)和肯德爾(kendall)相關(guān)系數(shù)。其中,皮爾森相關(guān)系數(shù)是衡量線性關(guān)聯(lián)性的程度,p的一個(gè)幾何解釋是其代表兩個(gè)變量的取值根據(jù)均值集中后構(gòu)成的向量之間夾角的余弦,計(jì)算如公式(1)所示。
如果有兩個(gè)向量:X、Y,最終計(jì)算出的相關(guān)系數(shù)的含義可以有如下理解:
(1)當(dāng)相關(guān)系數(shù)為0時(shí),X和Y兩變量無關(guān)系。
(2)當(dāng)X的值增大(減?。琘值增大(減?。?,兩個(gè)變量為正相關(guān),相關(guān)系數(shù)在0.00與1.00之間。
(3)當(dāng)X的值增大(減?。琘值減?。ㄔ龃螅?,兩個(gè)變量為負(fù)相關(guān),相關(guān)系數(shù)在-1.00與0.00之間。
相關(guān)系數(shù)的絕對(duì)值越大,相關(guān)性越強(qiáng),相關(guān)系數(shù)越接近于1或-1,相關(guān)度越強(qiáng),相關(guān)系數(shù)越接近于0,相關(guān)度越弱。經(jīng)計(jì)算分析,與混凝土強(qiáng)度(目標(biāo)集)相關(guān)的前8列數(shù)據(jù)(測(cè)試集)的相關(guān)性如圖1所示。
ρx,y=cov(X,Y)σxσy=EX-μxY-μyσxσy=
E(XY)-E(X)E(Y)EX2-E2(X)EY2-E2(Y)(1)
根據(jù)圖1可以看出,減水劑與粉煤灰呈正相關(guān);減水劑與水呈負(fù)相關(guān);減水劑與礦渣無關(guān)系。
2.2 特征重要性排行
為進(jìn)一步分析各因素對(duì)混凝土強(qiáng)度的影響程度,對(duì)各特征向量的重要性進(jìn)行排行,如圖2所示。
根據(jù)圖2,可以看出減水劑和水泥對(duì)混凝土的強(qiáng)度影響較大,究其原因,它們決定著水泥石強(qiáng)度與骨料表面的黏結(jié)強(qiáng)度;而隨著養(yǎng)護(hù)齡期增加,混凝土中的水化反應(yīng)更充分,粘結(jié)強(qiáng)度更高。礦渣和粉煤灰都能部分替代水泥,節(jié)約成本,改善混凝土的和易性;但其會(huì)加大混凝土收縮量,細(xì)度不達(dá)標(biāo)時(shí)還可能造成泌水。粗細(xì)骨料自身抗壓強(qiáng)度很高,其對(duì)混凝土強(qiáng)度的影響相對(duì)較小。除了參與化學(xué)反應(yīng)的少量水之外,其他多余的水主要是增加混凝土和易性,這部分水與混凝土強(qiáng)度呈負(fù)相關(guān),更進(jìn)一步說明了減水劑的重要性。
3 LGBM回歸分析
3.1 LGBM計(jì)算原理
LGBM由微軟提供,它和XGBoost一樣是對(duì)GBDT(梯度下降樹)的高效實(shí)現(xiàn),原理上它和GBDT及XGBoost類似,都采用損失函數(shù)的負(fù)梯度作為當(dāng)前決策樹的殘差近似值,去擬合新的決策樹。LGBM采用histogram算法,其核心是將連續(xù)的浮點(diǎn)特征離散成k個(gè)離散值,并構(gòu)造寬度為k的Histogram。然后遍歷訓(xùn)練數(shù)據(jù),統(tǒng)計(jì)每個(gè)離散值在直方圖中的累計(jì)統(tǒng)計(jì)量。在進(jìn)行特征選擇時(shí),只需要根據(jù)直方圖的離散值,遍歷尋找最優(yōu)的分割點(diǎn)[2-3]。
假設(shè)訓(xùn)練集有n個(gè)實(shí)例x1…xn,特征維度為s。每次梯度迭時(shí),模型數(shù)據(jù)變量的損失函數(shù)的負(fù)梯度方向表示為g1,…,gn,決策樹通過最優(yōu)切分點(diǎn)(最大信息增益點(diǎn))將數(shù)據(jù)分到各個(gè)節(jié)點(diǎn)。GBDT通過分割后的方差衡量信息增益,例如O表示某個(gè)固定節(jié)點(diǎn)的訓(xùn)練集,分割特征j的分割點(diǎn)d定義為:
Vj|O(d)=1nO∑xi∈O:xij≤dgi2njl|O(d)+∑xi∈O:xij>dgi2njr|O(d)(2)
式中:
nO=∑Ixi∈O,njlo=∑Ixi∈O:xi≥d,njr|O=
∑Ixi∈O:xi>d
遍歷每個(gè)特征的每個(gè)分裂點(diǎn),找到dj=argmaxdVj(d),并計(jì)算最大的信息增益Vj(dj),然后,將數(shù)據(jù)根據(jù)特征j的分裂點(diǎn)dj將數(shù)據(jù)分到左右子節(jié)點(diǎn)[4]、[7]。
3.2 LGBM回歸分析
本文分析使用Python語(yǔ)言,安裝LGBM庫(kù),在Jupyter Notebook中加載數(shù)據(jù)進(jìn)行分析(圖3)。
圖3中,Best Fit為離散點(diǎn)的最佳擬合曲線,Identiy為回歸預(yù)測(cè)曲線,直觀體現(xiàn)了預(yù)測(cè)的一致性。R2即r2_score,數(shù)值計(jì)算采用式(2),區(qū)間通常在(0,1)之間;模型越好R2越趨近1,模型越差R2越趨近0。
3.3 模型測(cè)試
隨機(jī)選擇5行數(shù)據(jù)進(jìn)程測(cè)試,用機(jī)器學(xué)習(xí)訓(xùn)練好的模型進(jìn)行預(yù)測(cè),結(jié)果見表3。
4 結(jié)論
(1)減水劑和水泥對(duì)混凝土的強(qiáng)度影響較大,若設(shè)計(jì)或施工過程中弄錯(cuò)混凝土標(biāo)號(hào),將會(huì)導(dǎo)致嚴(yán)重工程質(zhì)量事故。
(2)未養(yǎng)護(hù)或養(yǎng)護(hù)不到位,會(huì)導(dǎo)致混凝土強(qiáng)度不足、前期強(qiáng)度增長(zhǎng)慢等病害。
(3)礦渣和粉煤灰對(duì)混凝土強(qiáng)度也有較大貢獻(xiàn),可部分替代水泥。
(4)水量與混凝土強(qiáng)度負(fù)相關(guān),施工過程中要嚴(yán)格控制加水量。
(5)采用LGBM回歸分析預(yù)測(cè)混凝土強(qiáng)度,誤差可以滿足工程需要。若野外室內(nèi)試驗(yàn)條件有限,可以通過影響因素預(yù)預(yù)估混凝土強(qiáng)度。
(6)本文的分析方法可用在其他室內(nèi)試驗(yàn)或監(jiān)測(cè)檢測(cè)領(lǐng)域,為決策提供依據(jù)。
參考文獻(xiàn)
[1] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.
[2] 盧錦玲,郭魯豫,張夢(mèng)雪,等.基于MGS-LGBM算法的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估[J].電力科學(xué)與工程,2020(3):1-9.
[3] 張旭東,錢仲文,沈思琪,等.一種基于LSTM與LGBM的電力負(fù)荷預(yù)測(cè)算法[J].系統(tǒng)工程,2019,37(1):152-158.
[4] 王向鵬. 基于不平衡三分類LGBM模型的貸后風(fēng)險(xiǎn)預(yù)警研究[D].蘭州:蘭州大學(xué),2019.
[5] 李輝.基于BP神經(jīng)網(wǎng)絡(luò)的水泥細(xì)度軟測(cè)量方法[J].中國(guó)水泥,2016(7):107-109.
[6] 李仲欣,韋灼彬,沈錦林.相關(guān)向量機(jī)在珊瑚混凝土抗壓強(qiáng)度預(yù)測(cè)中的應(yīng)用[J].混凝土,2016(7):1-6.
[7] 唐華松,姚耀文.數(shù)據(jù)挖掘中決策樹算法的探討[J].計(jì)算機(jī)應(yīng)用研究,2001,18(8):18-19.
[8] XGBoost:A Scalable Tree Boosting System. Chen T,Guestrin C. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2016.
[9] Yeh I.C. Modeling of strength of high performance concrete using artificial neural networks[J]. Cement and Concrete Research,1998,28(12):1797-1808.
3045501908295