国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的氣固流化床最小流化速度預(yù)測(cè)

2021-11-20 03:10:46包國(guó)強(qiáng)顧維根穆維國(guó)李志強(qiáng)李妍嬌周恩會(huì)趙躍民
潔凈煤技術(shù) 2021年5期
關(guān)鍵詞:床體決定系數(shù)流化

包國(guó)強(qiáng),顧維根,穆維國(guó),周 南,崔 森,李志強(qiáng),,李妍嬌,周恩會(huì),,4,趙躍民,,4,董 良,,4

(1.國(guó)家能源集團(tuán) 新疆能源有限責(zé)任公司,新疆 烏魯木齊 830002;2.中國(guó)礦業(yè)大學(xué) 人工智能研究院,江蘇 徐州 221116;3.中國(guó)礦業(yè)大學(xué) 化工學(xué)院, 江蘇 徐州 221116;4.煤炭加工與高效潔凈利用教育部重點(diǎn)實(shí)驗(yàn)室(中國(guó)礦業(yè)大學(xué)),江蘇 徐州 221116)

0 引 言

氣固流化床由于其傳熱、傳質(zhì)效率高,床層穩(wěn)定性好等特點(diǎn),已被廣泛應(yīng)用于煤化工、煤燃燒和煤炭分選等工業(yè)領(lǐng)域[1-3]。其中最小流化速度是流化床運(yùn)行最重要參數(shù)之一。作為固定床向流化床變化的轉(zhuǎn)折點(diǎn),最小流化速度是流態(tài)化領(lǐng)域研究的熱點(diǎn)。其中ERGUN和ORNING[4]提出的床層壓降方程用于預(yù)測(cè)最小流化速度應(yīng)用較為普遍。

由于機(jī)器學(xué)習(xí)[5-6]預(yù)測(cè)精度較高,在學(xué)術(shù)界和工業(yè)界影響逐漸增大,并在化工領(lǐng)域也得到了廣泛的應(yīng)用。機(jī)器學(xué)習(xí)可大幅降低模型復(fù)雜性,提高預(yù)測(cè)精度,并得到更為完善且更適用的模型[7]。在機(jī)器學(xué)習(xí)中,決策樹(shù)是一種決策支持工具,是利用樹(shù)狀圖形或模型來(lái)輔助決策[8]。隨機(jī)森林是一種相對(duì)較新的數(shù)據(jù)挖掘方法,是在分類和決策樹(shù)的基礎(chǔ)上發(fā)展起來(lái),用于處理變量之間的非線性關(guān)系[9]。隨機(jī)森林算法實(shí)現(xiàn)簡(jiǎn)單、精度高、抗過(guò)擬合能力強(qiáng),當(dāng)面對(duì)非線性數(shù)據(jù)時(shí),適于作為基準(zhǔn)模型[10]。

針對(duì)最小流化速度,由于實(shí)際過(guò)程中很難獲得顆粒的球形度以及床層的最小空隙率,因此,各國(guó)學(xué)者對(duì)ERGUN的方法進(jìn)行了簡(jiǎn)化處理,建立了許多經(jīng)典模型[11-22]。經(jīng)典模型雖能在一定程度上對(duì)最小流化速度進(jìn)行預(yù)測(cè),但模型通常是根據(jù)幾個(gè)影響因素的幾個(gè)試驗(yàn)點(diǎn)開(kāi)發(fā),模型預(yù)測(cè)精度存在較大誤差。因此,有必要通過(guò)機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法,從顆粒性質(zhì)(密度、粒度)與設(shè)備條件等方面綜合考慮,研究氣固流化床的最小流化速度,以系統(tǒng)評(píng)估對(duì)最小流化速度的綜合影響。筆者采用隨機(jī)森林驗(yàn)證了其預(yù)測(cè)最小流化速度的可行性,并考察了設(shè)備參數(shù)、顆粒密度和顆粒粒度共3個(gè)影響因素在預(yù)測(cè)最小流化速度時(shí)的相對(duì)重要性。隨機(jī)森林模型的準(zhǔn)確預(yù)測(cè)和模型背后的新見(jiàn)解為最小流化速度提供了全面的理解,并為流態(tài)化理論計(jì)算以及工業(yè)放大提供了指導(dǎo)。

1 研究方法

1.1 數(shù)據(jù)的收集

諸多學(xué)者在理論分析和試驗(yàn)測(cè)定的基礎(chǔ)上,建立了許多經(jīng)驗(yàn)或半經(jīng)驗(yàn)的關(guān)聯(lián)式計(jì)算最小流態(tài)化速度,見(jiàn)表1。

表1 氣固流化床中最小流化速度模型

K1、K2為學(xué)者基于最小流化速度公式Remf=

(K2+K2Ar)1/2-K1(其中,Remf和Ar分別為最小流化氣速條件下的雷諾數(shù)和阿基米德數(shù),根據(jù)顆粒形狀和顆粒間堆積空隙率對(duì)其修正所得到的參數(shù))。但由于研究所采用的物料不同,得到的關(guān)聯(lián)式在預(yù)測(cè)的準(zhǔn)確性和適用性方面也不盡相同。通過(guò)整理相關(guān)文獻(xiàn),考察了顆粒性質(zhì)(密度、粒度)與設(shè)備條件(床體直徑)對(duì)最小流化速度的影響。最小流化速度的試驗(yàn)數(shù)據(jù)見(jiàn)表2。由表2可得到26個(gè)輸入變量、最小流化速度的上下限,并通過(guò)箱線圖得到了特征數(shù)據(jù)的統(tǒng)計(jì)分布。任何2個(gè)變量之間的線性相關(guān)性由皮爾遜相關(guān)系數(shù)衡量。

表2 Geldart A類顆粒最小流化速度的試驗(yàn)結(jié)果

皮爾遜相關(guān)系數(shù)r定義為

(1)

1.2 隨機(jī)森林回歸和驗(yàn)證

數(shù)據(jù)規(guī)范化(歸一化)處理是數(shù)據(jù)挖掘的一項(xiàng)基礎(chǔ)工作。不同評(píng)價(jià)指標(biāo)往往具有不同的量綱,數(shù)值間的差別可能很大,不處理可能會(huì)影響數(shù)據(jù)分析結(jié)果。為了消除指標(biāo)之間的量綱和取值范圍差異的影響,需要進(jìn)行標(biāo)準(zhǔn)化處理,將數(shù)據(jù)按照比例縮放,使之落入一個(gè)特定的區(qū)域,便于進(jìn)行綜合分析。作為輸入的影響因素的數(shù)據(jù)首先通過(guò)公式(2)進(jìn)行數(shù)據(jù)歸一化處理:

(2)

應(yīng)用隨機(jī)森林對(duì)氣固流化床的預(yù)測(cè)模型進(jìn)行訓(xùn)練和優(yōu)化。隨機(jī)森林的實(shí)施分為以下3個(gè)子步驟[7]:① 隨機(jī)采樣,將數(shù)據(jù)集替換為多個(gè)子樣本;② 用不同的子樣本訓(xùn)練決策樹(shù),其中每棵樹(shù)根據(jù)訓(xùn)練數(shù)據(jù)的自舉復(fù)制盡可能地生長(zhǎng),每個(gè)葉子節(jié)點(diǎn)輸出節(jié)點(diǎn)中所有標(biāo)簽值的平均值;③ 最后通過(guò)對(duì)所有樹(shù)的性能進(jìn)行平均,獲得最終估計(jì)值。將全部數(shù)據(jù)隨機(jī)分為訓(xùn)練組和測(cè)試組,比例為70∶30。隨機(jī)森林模型的5個(gè)調(diào)諧參數(shù)包括決策樹(shù)的數(shù)量、尋找最佳分割時(shí)要考慮的特征數(shù)量、樹(shù)的最大深度、分割內(nèi)部節(jié)點(diǎn)所需的最小樣本數(shù)量以及位于葉節(jié)點(diǎn)所需的最小樣本數(shù)量。決定系數(shù)也稱為擬合優(yōu)度,用于評(píng)價(jià)擬合的好壞,決定系數(shù)越高,代表可以被解釋的程度越高,回歸模型的效果越好。使用決定系數(shù)[30-31]可在測(cè)試集上評(píng)估模型的性能。

決定系數(shù)定義為

(3)

超參數(shù)是用訓(xùn)練組的數(shù)據(jù)通過(guò)網(wǎng)格搜索算法確定的。對(duì)決策樹(shù)的數(shù)量應(yīng)用循環(huán)語(yǔ)句,通過(guò)10倍交叉驗(yàn)證找到最佳超參數(shù),衡量指標(biāo)是決定系數(shù),然后使用最佳參數(shù)重新訓(xùn)練模型,并用剩余的30%數(shù)據(jù)進(jìn)行測(cè)試。通過(guò)網(wǎng)格搜索算法,分割最小數(shù)量、樹(shù)的最大深度、節(jié)點(diǎn)內(nèi)最小樣本數(shù)量、最小子葉節(jié)點(diǎn)數(shù)分別為2、10、2、1。決策樹(shù)的數(shù)量取每10個(gè)數(shù)作為一個(gè)階段,來(lái)觀察決定系數(shù)的變化,通過(guò)運(yùn)行網(wǎng)格搜索算法,結(jié)果如圖1所示,當(dāng)決策樹(shù)的數(shù)量達(dá)到151時(shí),決定系數(shù)最高。

圖1 決定系數(shù)與決策樹(shù)數(shù)量關(guān)系Fig.1 Relation diagram between decisioncoefficient and decision tree quantity

部分相關(guān)圖和相對(duì)重要性分?jǐn)?shù)用于解釋影響變量的重要性。FRIEDMAN[32]為了理解預(yù)測(cè)對(duì)每個(gè)影響變量的依賴性質(zhì),引入了部分依賴圖。通過(guò)選擇影響變量的多個(gè)值,使用其他影響變量的所有情況下的每個(gè)值預(yù)測(cè)輸出,然后計(jì)算所有情況下的平均輸出,可以獲得部分相關(guān)圖。單個(gè)隨機(jī)森林中影響變量的相對(duì)重要性分?jǐn)?shù)可以通過(guò)由該影響變量確定的所有分割平方改進(jìn)總和來(lái)獲得[33]。

2 結(jié)果和討論

2.1 特征變量統(tǒng)計(jì)結(jié)果和任意2個(gè)變量線性關(guān)系

根據(jù)收集的數(shù)據(jù)集,獲得了特征數(shù)據(jù)的箱線圖統(tǒng)計(jì)分布,如圖2所示。設(shè)備條件(床體直徑)、顆粒性質(zhì)(密度、粒度)以及最小流化速度的數(shù)值分布變化范圍和離散幅度較大,且不同特征變量的數(shù)量級(jí)相差較大。其中,床體直徑變化在3.5~20.0 cm;顆粒密度變化在1 150~4 600 g/cm3;顆粒粒度變化在20~143 μm;最小流化速度變化在0.10~0.87 cm/s。綜上可知,各變量數(shù)據(jù)值極差較高,對(duì)預(yù)測(cè)模型的魯棒性具有一定的挑戰(zhàn)。為了進(jìn)一步分析收集的數(shù)據(jù)集各個(gè)特征變量間的相互關(guān)系,對(duì)各個(gè)變量進(jìn)行了皮爾遜相關(guān)系數(shù)分析,相關(guān)系數(shù)R的絕對(duì)值越大,特征之間的相關(guān)性越大。收集特征變量間相關(guān)性矩陣熱圖如圖3所示。由圖3可知,最小流化速度與顆粒粒徑、顆粒密度和床體直徑均呈正相關(guān),相關(guān)系數(shù)分別為0.79、0.31、0.14。顆粒粒徑對(duì)其影響最大,顆粒粒徑增大,最小流化速度也隨之增大。應(yīng)用機(jī)器學(xué)習(xí)方法建立了一個(gè)高質(zhì)量的預(yù)測(cè)模型,并探討了各影響因素的相對(duì)重要性以及輸入變量之間的相互作用。

圖2 收集特征變量的箱線圖Fig.2 Box plot for collecting characteristic variables

圖3 收集特征變量間相關(guān)性矩陣熱圖Fig.3 Collect the heat map of correlation matrixbetween characteristic variables

2.2 最小流化速度的隨機(jī)森林模型性能評(píng)估

隨機(jī)森林算法的超參數(shù)與最佳模型相對(duì)應(yīng),通過(guò)10倍交叉驗(yàn)證,分別用于對(duì)不同輸入變量的最小流化速度預(yù)測(cè)模型的再訓(xùn)練。開(kāi)發(fā)模型的性能如圖4所示。圖4(a)顯示了最佳隨機(jī)森林模型在測(cè)試集上預(yù)測(cè)的最小流化速度預(yù)測(cè)值與試驗(yàn)值的對(duì)比結(jié)果,圖4(b)顯示了最佳隨機(jī)森林模型在測(cè)試上獲得了最大決定系數(shù)0.875,實(shí)現(xiàn)了較低的損失和較高的決定系數(shù)。因此,最佳隨機(jī)森林模型可以很好地推廣到測(cè)試集上,最佳隨機(jī)森林模型在預(yù)測(cè)最小流化速度方面較為準(zhǔn)確。

圖4 測(cè)試集上最佳隨機(jī)森林模型的性能Fig.4 Performance of the optimal random forest model on the test set

2.3 最小流化速度預(yù)測(cè)部分相關(guān)圖

床層直徑、顆粒密度和顆粒粒度的數(shù)值作為因素特征用于最小流化速度預(yù)測(cè),評(píng)估了各因素對(duì)最小流化速度的相對(duì)重要性。如圖5所示,所有重要性分?jǐn)?shù)的總和被定標(biāo)為1,各特征因素的重要性由大到小依次為:顆粒粒徑、顆粒密度和床體直徑。該排序與文中各個(gè)變量的皮爾遜相關(guān)系數(shù)分析的相關(guān)性結(jié)果一致。顆粒粒徑的重要性得分為0.783,成為最小流化速度最敏感的變量,超過(guò)了顆粒密度的權(quán)重,遠(yuǎn)超過(guò)了床體直徑的權(quán)重。床體直徑的重要性得分為0.018 78,對(duì)最小流化速度的影響較小。顆粒粒度對(duì)最小流化速度的影響最大,而床體直徑影響最小,該結(jié)論與付芝杰[34]的研究結(jié)論相符。

圖5 影響變量的重要性得分Fig.5 Importance score of the influencing variables

在確定了每個(gè)輸入特征變量的相對(duì)重要性之后,需要更好地理解輸入變量和輸出變量之間的依賴關(guān)系。一般來(lái)說(shuō),當(dāng)一個(gè)影響變量發(fā)生變化時(shí),輸出響應(yīng)越大,該影響變量就越顯著。此外,通過(guò)分析輸出隨該影響變量的變化,可以觀察到影響變量和輸出變量之間呈正相關(guān)或負(fù)相關(guān)。通過(guò)對(duì)所有特征的值進(jìn)行平均,部分相關(guān)圖被用于可視化某1個(gè)或2個(gè)特征對(duì)最小流化速度的總體影響趨勢(shì)。單向部分依賴性的結(jié)果如圖6所示,其中x軸上的刻度表示目標(biāo)特征值的分形,反映了數(shù)密度。由圖6可知,顆粒粒度對(duì)最小流化速度的影響呈近似線性上升,但斜率隨著粒徑的升高而逐漸減小,如圖6(a)所示。顆粒密度對(duì)最小流化速度的整體影響線性上升波動(dòng)較低,顆粒密度在1 150~4 600 g/cm3時(shí),斜率隨著密度的升高而幾乎保持不變,如圖6(b)所示。床體直徑對(duì)最小流化速度的影響最小,其依賴性為近似水平的直線,如圖6(c)所示。部分相關(guān)圖和影響變量的相對(duì)重要性分?jǐn)?shù)揭示了重要的發(fā)現(xiàn),并指出最小流化速度預(yù)測(cè)的研究潛力。

圖6 預(yù)測(cè)最小流化速度的最佳隨機(jī)森林模型中特征變量的部分相關(guān)圖Fig.6 Partial correlation diagram of characteristic variables in an optimal random forest model for predicting the minimum fluidization rate

3 結(jié) 論

1)利用隨機(jī)森林的機(jī)器學(xué)習(xí)方法,從床層直徑、顆粒密度和顆粒粒度3個(gè)方面預(yù)測(cè)了氣固流化床的最小流化速度。最小流化速度與顆粒粒徑、顆粒密度和床體直徑均呈正相關(guān),皮爾遜相關(guān)系數(shù)分別為0.79、0.31、0.14,顆粒粒徑與最小流化速度相關(guān)性最強(qiáng)。

2)通過(guò)網(wǎng)格搜索算法,得到了最佳隨機(jī)森林模型,并在測(cè)試上獲得了最大決定系數(shù)0.875,實(shí)現(xiàn)了較低的損失和較高的決定系數(shù)。

3)通過(guò)部分相關(guān)圖和影響變量的相對(duì)重要性分?jǐn)?shù)分析,得知顆粒粒徑對(duì)氣固流化床的最小流化速度的變化起主要作用。同時(shí),得到了各特征因素對(duì)最小流化速度的影響方式,同時(shí)驗(yàn)證了收集特征變量間的皮爾遜相關(guān)系數(shù)分析的正確性。

猜你喜歡
床體決定系數(shù)流化
一種面向起身困難患者可自動(dòng)更換床單的病床設(shè)計(jì)
機(jī)械(2023年1期)2023-03-03 07:21:36
基于Python語(yǔ)言路徑分析矩陣算法運(yùn)演
催化裂化裝置外取熱器筒體泄漏原因分析及應(yīng)對(duì)措施
云南化工(2020年6期)2020-07-01 03:38:50
不同規(guī)格香港牡蠣殼形態(tài)性狀對(duì)重量性狀的影響
異位發(fā)酵床墊料利用期限及微生物組成差異分析
2種貝齡合浦珠母貝數(shù)量性狀的相關(guān)與通徑分析
高溫流化糙米儲(chǔ)藏穩(wěn)定性的研究
烘焙林業(yè)廢棄物生物質(zhì)與煤粉不同配比混合顆粒的流化特性
基于顏色讀數(shù)識(shí)別物質(zhì)濃度的數(shù)學(xué)模型研究
新生兒暖箱內(nèi)床體傾斜與角度控制的實(shí)現(xiàn)
霞浦县| 绥芬河市| 皮山县| 旌德县| 苏尼特右旗| 龙山县| 正蓝旗| 凭祥市| 廊坊市| 区。| 静乐县| 江油市| 泰来县| 阳山县| 太保市| 张家港市| 芒康县| 阿拉尔市| 长乐市| 凭祥市| 汉寿县| 子长县| 景泰县| 邯郸市| 北川| 安龙县| 边坝县| 兴安县| 白山市| 阜康市| 宝鸡市| 登封市| 大名县| 揭东县| 郎溪县| 白朗县| 通化县| 上犹县| 文昌市| 云南省| 云龙县|