李 寧,楊鎮(zhèn)華,馬偉中,李 昊,王行行
(1.甘肅省公路交通建設(shè)集團(tuán)有限公司,甘肅 蘭州 730030;2.蘭州交通大學(xué)土木工程學(xué)院,甘肅 蘭州 730070;3.甘肅省公路發(fā)展集團(tuán)有限公司甘肅省路網(wǎng)監(jiān)測重點實驗室)
混凝土的早期開裂現(xiàn)象是影響混凝土質(zhì)量的重要原因之一,其中自收縮又是開裂的主要原因。近年來,混凝土領(lǐng)域采用內(nèi)養(yǎng)護(hù)劑作為一種混凝土養(yǎng)護(hù)新措施得到了關(guān)注與應(yīng)用。內(nèi)養(yǎng)護(hù)劑作為預(yù)先吸水并在特定的條件下釋放水分的一種均勻分散在混凝土內(nèi)部的養(yǎng)護(hù)材料,具有高吸水性、高保水性和高穩(wěn)定性的特點。其中,高吸水樹脂(SAP)是一種具有很高吸水倍率的高分子聚合物材料,其內(nèi)部的空間網(wǎng)絡(luò)結(jié)構(gòu)能夠吸收并且存儲水分,在混凝土內(nèi)部起到蓄水池的作用,當(dāng)與外部溶液的滲透壓發(fā)生變化時會釋放出水分改善混凝土內(nèi)部相對濕度,從而達(dá)到內(nèi)養(yǎng)護(hù)的作用。但是,部分研究表明,摻加預(yù)吸水內(nèi)養(yǎng)護(hù)劑的混凝土各齡期強(qiáng)度都有不同程度的減小,且內(nèi)養(yǎng)護(hù)劑摻量越高,強(qiáng)度降低越明顯。因此,全面了解SAP 抗壓強(qiáng)度變化規(guī)律,科學(xué)預(yù)測SAP的抗壓強(qiáng)度,對于SAP的應(yīng)用具有重要借鑒意義。
近年來,采用機(jī)器學(xué)習(xí)回歸算法來預(yù)測混凝土抗壓強(qiáng)度的方式已受到國內(nèi)外學(xué)者的廣泛關(guān)注。其中,研究人員通常會選取人工神經(jīng)網(wǎng)絡(luò)的算法,對混凝土強(qiáng)度進(jìn)行預(yù)測分析[1]。陳洪根等人[2]構(gòu)建了以粉煤灰混凝土的七個影響因素為輸入變量的強(qiáng)度預(yù)測模型,通過模型訓(xùn)練和測試結(jié)果的相關(guān)系數(shù)對比證實了基于BP神經(jīng)網(wǎng)絡(luò)的粉煤灰混凝土抗壓強(qiáng)度預(yù)測方法的可行性。趙明亮等人[3]以混凝土公司總結(jié)出的原材料表波動因素和配合比設(shè)計為輸入層,通過BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測中低混凝土7 d 和28 d 抗壓強(qiáng)度,發(fā)現(xiàn)該方法具有很強(qiáng)的非線性映射能力,其預(yù)測的強(qiáng)度結(jié)果精度可達(dá)0.95以上。陳慶等人[4]引入遺傳算法(GA)優(yōu)化了UHPC抗壓強(qiáng)度預(yù)測的BP 神經(jīng)網(wǎng)絡(luò)模型的初始權(quán)值和閾值,通過模擬訓(xùn)練UHPC 抗壓強(qiáng)度預(yù)測GA-BP 神經(jīng)網(wǎng)絡(luò),建立了基于不同性能需求的配合比設(shè)計方法。雖然BP神經(jīng)網(wǎng)絡(luò)在混凝土強(qiáng)度預(yù)測方面表現(xiàn)優(yōu)異,但BP 神經(jīng)網(wǎng)絡(luò)仍存在訓(xùn)練過程收斂速度較慢、魯棒性較差、容易陷入局部最優(yōu)解而不是全局最優(yōu)解等一系列問題[5]。
本文建立了一個基于機(jī)器學(xué)習(xí)的CatBoost 回歸算法[6]的SAP混凝土抗壓強(qiáng)度預(yù)測模型,以水膠比、SAP摻量、預(yù)吸水倍數(shù)和養(yǎng)護(hù)齡期作為預(yù)測模型的輸入指標(biāo),以混凝土的抗壓強(qiáng)度為研究對象,通過SAP 混凝土制備及其強(qiáng)度檢測構(gòu)建了156份數(shù)據(jù)樣本,與常見的機(jī)器學(xué)習(xí)算法(包括LightGBM 算法和XGBoost 算法)進(jìn)行比較,利用各指標(biāo)對抗壓強(qiáng)度的影響驗證該模型預(yù)測效果。研究結(jié)果可對SAP 混凝土抗壓強(qiáng)度精確預(yù)測和順利施工提供一定指導(dǎo)作用。
水泥選用P·O42.5 級普通硅酸鹽水泥,具體性能指標(biāo)見表1。粉煤灰選用Ⅱ級粉煤灰,主要化學(xué)成分見表2。
表1 水泥的性能指標(biāo)
表2 粉煤灰化學(xué)成分
細(xì)骨料采用級配良好的水洗河砂,細(xì)度模數(shù)2.45,表觀密度2646.5 kg/m3,含泥量0.66%。各項指標(biāo)符合《建設(shè)用砂》(GB/T 14684—2022)規(guī)定。
粗骨料選用反擊破碎碎石,粒徑5 mm~31.5 mm,連續(xù)級配,表面比較粗糙、質(zhì)地堅硬,表觀密度2670.8 kg/m3,壓碎指標(biāo)10.3%。各項指標(biāo)符合《建設(shè)用碎石、卵石》(GB/T 14685—2022)規(guī)定。
外加劑為聚羧酸系高性能減水劑,減水率為27%。高吸水樹脂(SAP)為實驗室自制聚丙烯酸-丙烯酰胺。
水符合《生活飲用水衛(wèi)生標(biāo)準(zhǔn)》(GB 5749—2006)的規(guī)定,拌和用水所含物質(zhì)不能對混凝土試驗結(jié)果造成影響,且不能具有腐蝕性。
SAP選用自制的SAP進(jìn)行后續(xù)試驗。
本文主要研究SAP 對混凝土力學(xué)性能、收縮性能、抗裂性能及微觀結(jié)構(gòu)的影響。水膠比采用0.30、0.35和0.38三種,混凝土配合比根據(jù)《普通混凝土配合比設(shè)計規(guī)程》(JGJ 55—2011)的相關(guān)要求計算得出,具體見表3。
表3 混凝土配合比
按照《普通混凝土力學(xué)性能試驗方法標(biāo)準(zhǔn)》(GB/T 50081—2016)中的要求對混凝土抗壓強(qiáng)度進(jìn)行測試,以水膠比、SAP 摻量和預(yù)吸水倍數(shù)為變量,制備混凝土樣品并測定其3 d、7 d、14 d、28 d的抗壓強(qiáng)度。
CatBoost算法是由PROKHORENKOVA L 等[7]于2017年提出的基于梯度提升決策樹的算法框架。CatBoost算法是梯度提升機(jī)器學(xué)習(xí)的算法,梯度提升是一種迭代算法,通?;跊Q策樹。先建立一個基礎(chǔ)模型,該模型具有較高的誤差,考慮到該模型的誤差,再建立另一個模型,通過這種方式,經(jīng)過數(shù)千次迭代后,誤差被最小化。該算法具有更高的準(zhǔn)確性和泛化能力,能夠高效合理地處理類別型特征、梯度偏差、預(yù)測偏移等問題,其決策樹結(jié)構(gòu)使模型能夠可視化,根據(jù)輸入層數(shù)據(jù)的特征重要性評估增強(qiáng)模型的可解釋性,且過擬合的發(fā)生概率也顯著降低[8,9]。LENKA S R 等[10]采用五種基礎(chǔ)模型與CatBoost等十四個集成模型對比數(shù)據(jù)集的性能,比較結(jié)果表明在準(zhǔn)確度等五項指標(biāo)(均方誤差、均方根誤差、平均絕對誤差、平均絕對百分比誤差、相關(guān)系數(shù))中CatBoost 評分顯著優(yōu)于其他模型。TANHA J 等[11]研究發(fā)現(xiàn),CatBoost 對多類不平衡數(shù)據(jù)集的求解顯示出比其他算法更好的特性。
輕量級梯度提升機(jī)(Light Gradient Boosting Machine,LightGBM)是GBDT 算法的另一種發(fā)展形式,采用葉子節(jié)點的深度限制策略,通過在當(dāng)前葉子節(jié)點中尋找增益值最大的節(jié)點進(jìn)行分裂,限制樹的深度,從而避免過度擬合,并縮短最優(yōu)深度樹的搜索時間。在保持分裂次數(shù)不變的情況下,能夠通過降低誤差來提升精度。LightGBM 中的決策樹子模型是采用按葉子分裂的方法分裂節(jié)點的,因此其計算代價比較小,也正是因為選擇了這種分裂方式,需要控制樹的深度和每個葉子節(jié)點的最小數(shù)據(jù)量,從而避免過擬合現(xiàn)象的發(fā)生。徐國天等[12]融合了XGBoost 和LightGBM 創(chuàng)建了雙層模型的惡意軟件檢測方法,單獨使用LightGBM 只能作為第二層模型對數(shù)據(jù)正常與否進(jìn)行判斷,并不能對數(shù)據(jù)進(jìn)行過濾以及獲取最優(yōu)參數(shù)的組合。
XGBoost 算法以模型的性能與計算速度相平衡為目標(biāo)函數(shù),采用二階泰勒展開式加快了求解速度,減少了模型的運行時間。利用正則項對模型復(fù)雜度進(jìn)行控制以避免過度擬合現(xiàn)象發(fā)生。XGBoost 是近年來新興的一種高效算法,能夠自動利用CPU 的多線程進(jìn)行并行處理,在效率及精度上都具有優(yōu)勢。王紅愛[13]利用XGBoost 算法對旅客退票率進(jìn)行了分類,并驗證了算法的有效性。
抗壓強(qiáng)度是混凝土力學(xué)性能中最重要的指標(biāo)之一,是工程設(shè)計中首先要考慮的因素。本文研究了不同水膠比混凝土在不同SAP 摻量下的抗壓強(qiáng)度,試驗結(jié)果如圖1所示。
圖1 三種水膠比下不同SAP摻量混凝土抗壓強(qiáng)度隨齡期的變化
由圖1 可知,隨著養(yǎng)護(hù)齡期延長,混凝土抗壓強(qiáng)度迅速增大,表明養(yǎng)護(hù)齡期對混凝土抗壓強(qiáng)度有較大影響。不同水膠比條件下混凝土抗壓強(qiáng)度增長趨勢基本一致。在水膠比為0.3 的條件下,水泥混凝土抗壓強(qiáng)度與SAP 摻量之間沒有明顯的規(guī)律性,但從整體上看,混凝土抗壓強(qiáng)度隨SAP 摻量增大而減小。其原因可能是由于干摻SAP 在低水膠比時,使早期參與水化反應(yīng)自由水進(jìn)一步減少,水化程度較小,早期產(chǎn)生干縮較大,在宏觀上表現(xiàn)出強(qiáng)度下降。在水膠比分別為0.35 與0.38的情況下,SAP 在一定摻量下能夠提高混凝土抗壓強(qiáng)度。其原因可能在于SAP 具有“吸水—釋水”的性質(zhì),反應(yīng)前期SAP 吸收了一部分拌和水而形成“蓄水庫”,致使較少水分參與水化反應(yīng),水化反應(yīng)發(fā)展到一定階段時,由于內(nèi)部水分缺失造成其內(nèi)外層存在濕度差,SAP 中存儲的“蓄水庫”就會開始釋放水,從而使得水化反應(yīng)能夠持續(xù)發(fā)生。
SAP控制了混凝土水化進(jìn)程,避免了混凝土內(nèi)部由于水分不足導(dǎo)致干縮應(yīng)力的出現(xiàn),使混凝土宏觀性能得到改善。但由于混凝土強(qiáng)度受各種因素(如水膠比、SAP 摻量)共同作用,很難從一般變化曲線中分析得出各種因素對其抗壓強(qiáng)度的影響規(guī)律,以及從各個方面進(jìn)行參數(shù)調(diào)節(jié),從而達(dá)到控制混凝土抗壓強(qiáng)度大小的目的。因此,采用機(jī)器學(xué)習(xí)算法來預(yù)測摻SAP 混凝土的強(qiáng)度以方便獲得各個參數(shù)對于混凝土抗壓強(qiáng)度的影響,并且得出能夠根據(jù)各種影響參數(shù)對混凝土抗壓強(qiáng)度進(jìn)行合理預(yù)測的方法,從而為SAP 混凝土的實際工程應(yīng)用奠定基礎(chǔ)。
3.2.1 數(shù)據(jù)預(yù)處理和評價指標(biāo)
①模型初始化。
根據(jù)輸人變量和輸出變量來確定模型輸人層、隱藏層、輸出層的節(jié)點個數(shù),拆分對應(yīng)的節(jié)點(包括特征值和邊界值)并構(gòu)建學(xué)習(xí)器。
②隱藏層輸出計算。
③輸出層輸出計算。
對于任意一葉節(jié)點對應(yīng)的樣本,其擬合最佳輸出值為:
式中,c為葉節(jié)點的輸出值,結(jié)合所有葉節(jié)點的輸出值即可得到所需的擬合函數(shù),即:
式中,I{xi}為示性函數(shù)。
綜上,經(jīng)過第t輪迭代后,可以得到-一個強(qiáng)學(xué)習(xí)器,既:
④判斷機(jī)器學(xué)習(xí)算法迭代是否結(jié)束。
用機(jī)器學(xué)習(xí)算法總體誤差是否達(dá)到精度要求來判斷,如沒有達(dá)到精度要求則需返回步驟②。
3.2.2 機(jī)器學(xué)習(xí)算法的參數(shù)訓(xùn)練
①參數(shù)選取。
機(jī)器學(xué)習(xí)算法的訓(xùn)練參數(shù)來源于SAP混凝土相關(guān)實驗結(jié)果,涉及四個輸人參數(shù)(水膠比、SAP摻量、預(yù)吸水倍數(shù)、養(yǎng)護(hù)齡期)和一個輸出參數(shù)(混凝土抗壓強(qiáng)度)。
水膠比主要反映混凝土用水量與膠凝材料的用量,本文設(shè)定0.30、0.35、0.38三種水膠比;SAP摻量選擇0、0.1%、0.3%和0.5%四個等級;預(yù)吸水倍數(shù)選擇0、10、20、30四個等級;養(yǎng)護(hù)齡期(Day)設(shè)定3d、7d、14d、28 d四個階段養(yǎng)護(hù)齡期。
混凝土抗壓強(qiáng)度Fe(MPa)反映混凝土強(qiáng)度等級。
②參數(shù)歸一化和標(biāo)準(zhǔn)化處理。
原始數(shù)據(jù)可能因為缺失值,數(shù)據(jù)類型、量綱不一致,特征值的取值范圍相差較大而影響模型的精度和訓(xùn)練速度。因此,在確定模型參數(shù)后,將數(shù)據(jù)通過式(6)進(jìn)行歸一化處理,將特征數(shù)值線性映射至[0,1]區(qū)間。
但歸一化方法對奇異值敏感,故可以使用標(biāo)準(zhǔn)化
處理,將特征數(shù)值映射到均值為0、方差為1的正態(tài)分布中,如式(7)所示。
式中,X*為標(biāo)準(zhǔn)化后的特征值;μ為特征值均值;σ為特征方差。
3.2.3 機(jī)器學(xué)習(xí)算法精度評價指標(biāo)
通過建立統(tǒng)--的量化評價標(biāo)準(zhǔn)來衡量機(jī)器學(xué)習(xí)算法的預(yù)測效果,本文選擇均方誤差(MSE)、均方根誤差(RMSE)、相關(guān)系數(shù)(R2)為具體量化指標(biāo),各指標(biāo)計算公式見式(8)~式(10)。
3.2.4 模型的構(gòu)建與分析
通過SAP對混凝土抗壓強(qiáng)度影響的實驗,構(gòu)建SAP混凝土抗壓強(qiáng)度數(shù)據(jù)集。通過控制不同的變量確定表4所展示的156組數(shù)據(jù),其中隨機(jī)選取109組數(shù)據(jù)用來模型訓(xùn)練,即作為訓(xùn)練集,剩余47組數(shù)據(jù)作為測試集用來驗證模型的可靠性。
表4 混凝土配合比設(shè)計
依據(jù)抗壓強(qiáng)度數(shù)據(jù)集對模型進(jìn)行訓(xùn)練和模型驗證,其機(jī)器學(xué)習(xí)回歸算法流程圖如圖2所示。
圖2 機(jī)器學(xué)習(xí)流程圖
在回歸模型中,各種特性的重要性占比如圖3 所示。從圖中可以看出,水膠比所占比例最大,為55.5%,這對模型的精度影響較大;養(yǎng)護(hù)齡期次之,占36.0%;SAP 摻量對于預(yù)測結(jié)果影響不大,占4.7%;預(yù)吸水倍數(shù)對該模型影響最小,占比不到4%。
圖3 模型的特征重要性占比
為了更好地度量不同模型對混凝土抗壓強(qiáng)度的預(yù)測效果,將CatBoost模型與LightGBM 模型和XGBoost模型的抗壓強(qiáng)度預(yù)測結(jié)果進(jìn)行比對分析。表5 給出了三種機(jī)器學(xué)習(xí)算法在訓(xùn)練集和測試集中的具體量化指標(biāo),具體包括均方誤差(MSE)、均方根誤差(RMSE)和決定系數(shù)(R2)。對決定系數(shù)而言,模型的結(jié)果越接近1,模型準(zhǔn)確度越高。其余兩項指標(biāo),取值越小模型準(zhǔn)確度越高。
表5 模型評估結(jié)果
由表5 可以看出,無論是訓(xùn)練集還是測試集,三種機(jī)器學(xué)習(xí)回歸算法中,CatBoost 回歸算法的三項評價指標(biāo)均為最優(yōu),其決定系數(shù)(R2)為0.981,XGBoost 算法次之,其決定系數(shù)(R2)為0.921,LightGBM 的性能較差,其決定系數(shù)(R2)為0.907。說明CatBoost 算法模型預(yù)測的數(shù)據(jù)與真實數(shù)據(jù)擬合程度較高,預(yù)測結(jié)果的準(zhǔn)確性和可靠性優(yōu)于XGBoost 和LightGBM 算法。此外,三種機(jī)器學(xué)習(xí)算法在訓(xùn)練集中的決定系數(shù)均在0.9 以上,表明輸入層和輸出層之間具有較強(qiáng)的相關(guān)性。
此外,CatBoost 模型訓(xùn)練集的RMSE 為0.439,決定系數(shù)為0.998,測試集的RMSE 為1.315,決定系數(shù)為0.981,可見該CatBoost 模型對混凝土抗壓強(qiáng)度預(yù)測的泛化能力強(qiáng),對摻加SAP 的混凝土抗壓強(qiáng)度預(yù)測精準(zhǔn)度較好。
不同模型的實測值和預(yù)測值誤差分析如圖4所示,散點圖的中心線代表強(qiáng)度預(yù)測值恰好等于實際值,小方塊為數(shù)據(jù)集中的樣本點。
圖4 三種模型抗壓強(qiáng)度實際值與預(yù)測值散點圖
由圖4 可以看出,與XGBoost 和LightGBM 相比,CatBoost 回歸算法的預(yù)測結(jié)果主要集中在誤差線內(nèi)。表6 為不同模型誤差分析表,CatBoost 模型預(yù)測結(jié)果在誤差線范圍內(nèi)數(shù)據(jù)個數(shù)占總樣本數(shù)的92.9%,高于XGBoost 和LightGBM 模型,可見CatBoost 模型預(yù)測效果最好。
表6 不同模型誤差分析表
本文建立了基于機(jī)器學(xué)習(xí)回歸算法的SAP 混凝土抗壓強(qiáng)度預(yù)測模型,分析SAP 對混凝土抗壓強(qiáng)度的影響,將CatBoost 與LightGBM 以及XGBoost 模型進(jìn)行對比,得到如下結(jié)論:
①當(dāng)水膠比為0.35 和0.38 時,摻加0.1%和0.3%的SAP 可以提高混凝土的抗壓強(qiáng)度,SAP 的“吸水—釋水”特性通過控制水化反應(yīng)程度控制干燥收縮內(nèi)應(yīng)力,從而提高混凝土的抗壓強(qiáng)度。
②在預(yù)測模型的四個輸入變量中,水膠比和養(yǎng)護(hù)齡期對混凝土強(qiáng)度的貢獻(xiàn)率較大,分別為55.5%和36.0%,SAP 摻量和預(yù)吸水倍數(shù)貢獻(xiàn)率較小,分別為4.7%和3.8%。
③相比于LightGBM 和XGBoost 模型,CatBoost 具有更高的精度和更強(qiáng)的泛化能力,其測試集決定系數(shù)為0.981,三項評價指標(biāo)(均方誤差、均方根誤差和決定系數(shù))均優(yōu)于LightGBM以及XGBoost模型。
④機(jī)器學(xué)習(xí)回歸算法在混凝土抗壓強(qiáng)度預(yù)測方面有獨特的優(yōu)勢,但大部分機(jī)器學(xué)習(xí)模型不能對預(yù)測結(jié)果進(jìn)行解釋,有關(guān)各個特征值之間的交互作用及局部預(yù)測有何具體影響的可解釋機(jī)器學(xué)習(xí)模型的框架亟需引入。