国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類思想的轉(zhuǎn)爐終點(diǎn)碳含量預(yù)測方法

2022-11-28 12:12:00賀東風(fēng)黃涵銳
冶金能源 2022年6期
關(guān)鍵詞:數(shù)據(jù)項(xiàng)鐵水類別

賀東風(fēng) 黃涵銳

(北京科技大學(xué) 冶金與生態(tài)工程學(xué)院)

轉(zhuǎn)爐終點(diǎn)碳含量作為轉(zhuǎn)爐煉鋼的控制目標(biāo)之一,其預(yù)測精準(zhǔn)度一直是實(shí)現(xiàn)轉(zhuǎn)爐智能控制的關(guān)鍵。學(xué)者們研發(fā)了眾多高精度的轉(zhuǎn)爐終點(diǎn)預(yù)測模型[1-3],但由于轉(zhuǎn)爐冶煉的復(fù)雜性,高精度模型在應(yīng)用過程中往往達(dá)不到預(yù)期效果,對實(shí)際冶煉的幫助有限。所用模型存在適應(yīng)性問題,而現(xiàn)有轉(zhuǎn)爐冶煉多依靠人工經(jīng)驗(yàn)判斷,即根據(jù)鐵水溫度、成分含量和物料種類等爐況不同,采取相應(yīng)的冶煉策略。若將各類爐況混為一談進(jìn)行建模、預(yù)測,會(huì)導(dǎo)致模型精度降低。

過去的研究為提高模型精度,往往選擇篩選出典型的爐況進(jìn)行預(yù)測,即針對部分關(guān)鍵屬性進(jìn)行擇優(yōu),并在此基礎(chǔ)上建模預(yù)測,因此在實(shí)際應(yīng)用時(shí),當(dāng)關(guān)鍵屬性不符合范圍要求的案例出現(xiàn)時(shí),模型的精度將大幅降低[4-6]。

文章提出利用聚類算法將相似爐況的冶煉數(shù)據(jù)歸納分類,更好地挖掘各種爐況下轉(zhuǎn)爐冶煉的規(guī)律。具體方案:將煉鋼過程加入的各類不同爐料數(shù)據(jù)納入模型考慮,并采用適合煉鋼高維復(fù)雜數(shù)據(jù)的SNN共享最近鄰算法,用于表征數(shù)據(jù)間的相似情況。將其與近鄰傳播聚類算法結(jié)合后,對現(xiàn)有數(shù)據(jù)進(jìn)行聚類,并針對不同爐況類別下數(shù)據(jù)分別建立基于BP神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)爐終點(diǎn)碳含量預(yù)測模型。

1 基于SNN_AP思路的轉(zhuǎn)爐預(yù)測模型

1.1 SNN_AP聚類思路

為了更準(zhǔn)確地利用訓(xùn)練樣本內(nèi)包含的不同內(nèi)在規(guī)律,需用聚類算法將數(shù)據(jù)分類。由于轉(zhuǎn)爐冶煉數(shù)據(jù)具有維數(shù)高、密度大和種類少的特性,文章提出基于SNN相似度的AP聚類算法。

近鄰傳播算法(Affinity Propagation)是基于數(shù)據(jù)間相似度的聚類算法中的一種,于2007年由Frey等人提出[7]。AP算法的基本思想是通過根據(jù)n個(gè)數(shù)據(jù)點(diǎn)之間的相似度計(jì)算得到一些信息,在信息傳遞的基礎(chǔ)上進(jìn)行聚類[8]。由于AP聚類算法具有運(yùn)行結(jié)果穩(wěn)定、無需主動(dòng)選定類別數(shù)量和不依賴數(shù)據(jù)的優(yōu)點(diǎn)[9],文章選用其作為劃分?jǐn)?shù)據(jù)集的核心算法。以數(shù)據(jù)量為n的m維數(shù)據(jù)集Dn×m為例,此算法以集內(nèi)兩數(shù)據(jù)i、k間相似度s(i,k)為基礎(chǔ),提出了兩個(gè)信息量參數(shù):用于描述點(diǎn)k適合作為數(shù)據(jù)點(diǎn)i的聚類中心的程度的吸引度r,由此組成的吸引度矩陣R;用于描述點(diǎn)i選擇點(diǎn)k作為其聚類中心的適合程度的歸屬度a,由此組成的歸屬度矩陣A。

R=[r(i,k)]n×n

(1)

A=[a(i,k)]n×n

(2)

兩種信息量代表了不同的競爭目的。r(i,k)表達(dá)的是點(diǎn)k作為中心點(diǎn)對點(diǎn)i的吸引程度。a(i,k)則代表當(dāng)k作為中心點(diǎn)時(shí),點(diǎn)i歸屬于點(diǎn)k的合適程度。

R、A兩個(gè)信息矩陣均由數(shù)據(jù)集內(nèi)數(shù)據(jù)的相似度矩陣計(jì)算得出,相似度矩陣是AP算法的基石,能否得到合適的相似度矩陣將決定聚類效果的優(yōu)劣[10]。經(jīng)典AP聚類算法基于歐式絕對距離對數(shù)據(jù)間相似度進(jìn)行描述。對于轉(zhuǎn)爐冶煉的生產(chǎn)數(shù)據(jù)而言,由于其高密度、高維數(shù)的特點(diǎn),采用歐式絕對距離無法滿足對其相似性描述的要求。充分考慮數(shù)據(jù)情況及影響后,引入一種以數(shù)據(jù)點(diǎn)之間共享最近鄰為指標(biāo)的相似性度量方式。

SNN(Shared Nearest Neighbour)相似度全稱為共享最近鄰相似度[11],是基于最近鄰思想的一種相似度,其認(rèn)為若兩數(shù)據(jù)點(diǎn)有共同的最近鄰數(shù)據(jù),則兩數(shù)據(jù)點(diǎn)相似,共同的最近鄰數(shù)據(jù)量即為兩者間相似度。SNN相似度提出之初就是為了解決高維數(shù)據(jù)相似描述的問題,目前也已有文獻(xiàn)實(shí)踐證明這種方法對工業(yè)生產(chǎn)中的高維數(shù)據(jù)有效[12]。其定義公式:

SNN(zi,zj)=|V(zi)∩V(zj)|

(3)

式中:V(z)為與量測點(diǎn)z距離最接近的K個(gè)數(shù)據(jù)點(diǎn)的集合,稱為z點(diǎn)的最近鄰數(shù)據(jù)集。此處K值代表算法計(jì)算過程中選取的量測點(diǎn)z最近鄰點(diǎn)的個(gè)數(shù),其數(shù)值大小對SNN相似度效果影響較大,需經(jīng)過實(shí)驗(yàn)人為選擇最適合目標(biāo)數(shù)據(jù)集的數(shù)值;||表示數(shù)據(jù)集內(nèi)元素個(gè)數(shù)。若點(diǎn)間沒有共同的近鄰點(diǎn),則SNN(zi,zj)=0。

傳統(tǒng)近鄰傳播聚類算法以負(fù)的歐式絕對距離度量兩數(shù)據(jù)相似度,基本規(guī)則是數(shù)據(jù)越負(fù),兩點(diǎn)越不相似,自相似度為最大值0。若要以SNN相似度度量代替歐氏絕對距離度量,需對SNN相似度結(jié)果進(jìn)行調(diào)整。文章最終所用相似度計(jì)算公式為:

(4)

式中:當(dāng)i≠k時(shí),所用方法是在計(jì)算數(shù)據(jù)點(diǎn)兩兩之間的SNN相似度后,將其減去最近鄰點(diǎn)個(gè)數(shù)K。當(dāng)i=k時(shí),相似度s(i,i)代表點(diǎn)本身能夠作為聚類中心的參考度,值越大優(yōu)先度越高。由于距離相似度量的特性,這個(gè)值默認(rèn)為零,是整個(gè)相似度矩陣S中的最大值,不利于算法正確聚類,因此需在開始前額外設(shè)置參考度值P,用以輸入模型。

SNN_AP算法的具體計(jì)算過程為:

(1)計(jì)算數(shù)據(jù)集的相似度矩陣S=[s(i,k)]n×n,同時(shí)將R、A兩個(gè)矩陣進(jìn)行初始化。

(2)以相似度矩陣S=[s(i,k)]n×n為基礎(chǔ),在迭代計(jì)算過程中,對吸引度矩陣R=[r(i,k)]n×n、歸屬度矩陣A=[a(i,k)]n×n兩個(gè)信息量矩陣進(jìn)行交替更新。更新公式分兩步,分別為:

吸引度更新公式:

rt+1(i,k)=(1-λ)·rt+1(i,k)+λ·rt(i,k)

(5)

歸屬度更新公式:

at+1(i,k)=(1-λ)·at+1(i,k)+λ·at(i,k)

(6)

式中:t代表迭代次數(shù),rt(i,k)即表示第t次迭代時(shí)點(diǎn)k對點(diǎn)i的吸引度。在進(jìn)行迭代更新計(jì)算后,為防止迭代過程中計(jì)算結(jié)果發(fā)生劇烈振蕩,算法引入阻尼系數(shù)λ,在每次迭代計(jì)算后對結(jié)果進(jìn)行優(yōu)化。λ值可根據(jù)計(jì)算情況在0.5至1之間進(jìn)行修改。

每次迭代計(jì)算完成后,算法以一定規(guī)則為準(zhǔn)選擇出聚類中心。以r(i,i)+a(i,i)>0作為條件,即當(dāng)點(diǎn)i對自身的責(zé)任度和自身的可信度之和大于0時(shí),選擇對應(yīng)點(diǎn)作為聚類中心。

(3)重復(fù)進(jìn)行步驟(2)。當(dāng)多次迭代計(jì)算得到的聚類中心集均未變化,或迭代次數(shù)達(dá)到預(yù)設(shè)最大值時(shí),結(jié)束迭代,并得到最終的聚類中心點(diǎn)集。

(4)以max{a(i,j)+r(i,j)}作為規(guī)則,將中心點(diǎn)外的其余點(diǎn)分配至合適的聚類中心下,從而得到最終的隸屬關(guān)系與聚類結(jié)果。

1.2 聚類模型建立

文章選用數(shù)據(jù)來自某鋼廠某類鋼種10個(gè)月的實(shí)際生產(chǎn)數(shù)據(jù),篩除異常記錄后可用數(shù)據(jù)共計(jì)2 776爐次。

基于冶金原理[13],在計(jì)算各數(shù)據(jù)項(xiàng)與終點(diǎn)碳含量間的灰色關(guān)聯(lián)度后,選用其中與終點(diǎn)碳含量關(guān)聯(lián)較高的12個(gè)數(shù)據(jù)項(xiàng)作為模型的考慮因素,具體見表1。

表1 聚類模型所用數(shù)據(jù)

為求證這些數(shù)據(jù)項(xiàng)對終點(diǎn)碳含量結(jié)果的影響,將上述數(shù)據(jù)整理,用于輸入聚類模型,并最終得到聚類中心與聚類結(jié)果。

1.3 基于SNN_AP聚類思路的終點(diǎn)碳含量預(yù)測模型

在得到分類的數(shù)據(jù)后,針對每類數(shù)據(jù)分別建立預(yù)測模型,以驗(yàn)證該聚類方法對提升預(yù)測模型精度的效果。文章選用BP神經(jīng)網(wǎng)絡(luò)模型作為預(yù)測方式,具體模型結(jié)構(gòu)將根據(jù)每類數(shù)據(jù)情況進(jìn)行調(diào)整。模型整體結(jié)構(gòu)見圖1。

圖1 基于SNN_AP聚類思路的終點(diǎn)碳含量預(yù)測模型結(jié)構(gòu)

2 仿真結(jié)果與分析

按照1.2、1.3章節(jié)的描述,將數(shù)據(jù)輸入聚類模型中,最近鄰個(gè)數(shù)K選擇300,阻尼系數(shù)取0.95,參考度P取-45。最終數(shù)據(jù)被分為9類。其中心點(diǎn)部分?jǐn)?shù)據(jù)項(xiàng)見表2。

表2 SNN_AP聚類中心部分?jǐn)?shù)據(jù)項(xiàng)

聚類后每類情況均有一定數(shù)據(jù)量作為保證,認(rèn)為滿足進(jìn)行預(yù)測建模的數(shù)據(jù)量要求。觀察聚類結(jié)果后發(fā)現(xiàn),分類后各類別中部分關(guān)鍵數(shù)據(jù)項(xiàng)分布情況出現(xiàn)了較明顯的差異,其中氧氣耗量、鐵水溫度、鐵水重量、鐵水Si含量、廢鋼量五項(xiàng)數(shù)據(jù)的類間差異性最為顯著。針對這些數(shù)據(jù)項(xiàng)進(jìn)行描述,每類數(shù)據(jù)與未分類時(shí)全局?jǐn)?shù)據(jù)的均值、標(biāo)準(zhǔn)差見表3。作為對比,將分布情況差異并不明顯的鐵水Mn含量數(shù)據(jù)也羅列其中。

表3 SNN_AP聚類結(jié)果各類數(shù)據(jù)關(guān)鍵數(shù)據(jù)

首先,每類數(shù)據(jù)各數(shù)據(jù)項(xiàng)的均值較未分類時(shí)均發(fā)生變化,這種變化能一定程度說明數(shù)據(jù)的某種工況特征。以類別2為例,氧氣耗量、鐵水溫度、鐵水重量、鐵水Si含量、廢鋼量平均值分別為3 824.87 m3、1 312 ℃、84.84 t、0.38%、13 t,皆低于全局均值。說明在鐵水較少且溫度較低的工況下,實(shí)際冶煉中傾向選擇加入較少廢鋼,所耗氧氣也會(huì)降低。而在類別9中,鐵水重量為88.09 t高于全局均值,平均鐵水溫度1 324 ℃亦高于全局均值,這種情況下鐵水熱量條件較好,可以接受更多的廢鋼,因此平均廢鋼量19 t高于全局均值,相對應(yīng)的,此類別平均氧氣耗量4 631.50 m3也較全局均值有明顯增加。

其次,在幾項(xiàng)關(guān)鍵數(shù)據(jù)的標(biāo)準(zhǔn)差值方面,大多數(shù)類別均較全局?jǐn)?shù)據(jù)標(biāo)準(zhǔn)差有所降低。標(biāo)準(zhǔn)差是反映數(shù)據(jù)集的離散程度的指標(biāo)之一,各類別內(nèi)部數(shù)據(jù)項(xiàng)的標(biāo)準(zhǔn)差下降,表明類別內(nèi)部這一數(shù)據(jù)更為集中。以氧氣耗量數(shù)據(jù)為例,每個(gè)類別的氧氣耗量標(biāo)準(zhǔn)差都有不同程度的降低,類別1的標(biāo)準(zhǔn)差達(dá)到82.24 m3,較全局標(biāo)準(zhǔn)差有明顯減少。這說明每個(gè)類別中的氧氣耗量數(shù)據(jù)均相較全局?jǐn)?shù)據(jù)更加集中,驗(yàn)證了同一類別數(shù)據(jù)內(nèi)部本身的相似性。

值得注意的是,部分類別中有部分?jǐn)?shù)據(jù)項(xiàng)的標(biāo)準(zhǔn)差沒有變化甚至增大,例如各類別中鐵水Mn含量標(biāo)準(zhǔn)差均較全局標(biāo)準(zhǔn)差0.10%相近,類別4的鐵水Mn標(biāo)準(zhǔn)差則略增至0.11%。這說明在實(shí)際生產(chǎn)調(diào)整冶煉方案時(shí),并未將這項(xiàng)數(shù)據(jù)納入考慮,或針對該數(shù)據(jù)進(jìn)行的冶煉方案調(diào)整并未對鋼水中碳含量造成明顯影響。例如鐵水Mn含量,轉(zhuǎn)爐吹煉生產(chǎn)過程中一般不做處理;鐵水Si含量則主要影響轉(zhuǎn)爐造渣制度,對吹煉制度和碳含量影響較小。

綜上,經(jīng)過聚類算法后,類與類之間數(shù)據(jù)在幾項(xiàng)關(guān)鍵數(shù)據(jù)項(xiàng)中已經(jīng)產(chǎn)生了差異,且類別內(nèi)部數(shù)據(jù)也有一定的統(tǒng)一性,可見算法在區(qū)分不同類別數(shù)據(jù)上有一定效果。這種類間差異性與類內(nèi)統(tǒng)一性在實(shí)際冶煉中表現(xiàn)為爐況的不同,實(shí)際應(yīng)用時(shí)可根據(jù)鐵水重量、鐵水溫度等參數(shù)的不同情況作為冶煉數(shù)據(jù)類別判斷的標(biāo)準(zhǔn)。

針對聚類得到9個(gè)類別數(shù)據(jù),分別建立BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測。選用的網(wǎng)絡(luò)結(jié)構(gòu)與最終預(yù)測結(jié)果見表4。表中的激活函數(shù)、隱藏層節(jié)點(diǎn)數(shù)、學(xué)習(xí)率為建立神經(jīng)網(wǎng)絡(luò)所需的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)。以終點(diǎn)碳含量預(yù)測結(jié)果在一定絕對誤差值范圍內(nèi)的命中率作為衡量模型性能的指標(biāo),分別是±0.01%、±0.02%、±0.03%。

表4 各類別下最佳BP模型結(jié)構(gòu)

可以看到,未分類時(shí)的全局預(yù)測模型命中率在±0.02%內(nèi)命中率達(dá)到56.55%,±0.03%內(nèi)命中率達(dá)到75.54%,而經(jīng)過SNN_AP聚類后,依據(jù)每類數(shù)據(jù)分別建立的幾個(gè)模型的命中率均有不同幅度的提升,最終模型總命中率在±0.02%內(nèi)命中率達(dá)到64.52%,±0.03%內(nèi)命中率達(dá)到82.27%,模型命中率有較為明顯提升。

3 結(jié)論

(1)文章針對生產(chǎn)數(shù)據(jù)維數(shù)高、密度大的特點(diǎn),使用改進(jìn)的SNN_AP聚類算法,對數(shù)據(jù)集進(jìn)行了聚類劃分,并分析了聚類后類內(nèi)數(shù)據(jù)情況,最終得到的聚類結(jié)果中,同類別數(shù)據(jù)具有一致性,不同類別間數(shù)據(jù)差異明顯,認(rèn)為聚類模型對區(qū)分工況是有效的。

(2)在對各類別數(shù)據(jù)分別建模預(yù)測后發(fā)現(xiàn),聚類后各工況下模型精度均有提升,說明將不同工況數(shù)據(jù)區(qū)分后分別建模預(yù)測以提升模型精度的方式是有效的,可以作為提升轉(zhuǎn)爐預(yù)測模型精度的一種重要思路。

猜你喜歡
數(shù)據(jù)項(xiàng)鐵水類別
山鋼5100m3高爐提高鐵水裝準(zhǔn)率的實(shí)踐
山東冶金(2022年1期)2022-04-19 13:40:16
一種多功能抽簽選擇器軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
甘肅科技(2020年19期)2020-03-11 09:42:42
低鐵比條件下低硅、低溫鐵水加煤塊冶煉生產(chǎn)實(shí)踐
山東冶金(2019年5期)2019-11-16 09:09:06
非完整數(shù)據(jù)庫Skyline-join查詢*
基于Python的Asterix Cat 021數(shù)據(jù)格式解析分析與實(shí)現(xiàn)
基于Bootstrap的高爐鐵水硅含量二維預(yù)報(bào)
盧成:發(fā)展集裝箱鐵水聯(lián)運(yùn)大有可為
專用汽車(2016年8期)2016-03-01 04:15:13
服務(wù)類別
新校長(2016年8期)2016-01-10 06:43:59
論類別股東會(huì)
商事法論集(2014年1期)2014-06-27 01:20:42
中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
乐山市| 万山特区| 深水埗区| 石林| 腾冲县| 池州市| 饶阳县| 双桥区| 磴口县| 邵东县| 天峻县| 临湘市| 宜城市| 海丰县| 赤水市| 富平县| 尼玛县| 瓮安县| 科尔| 安西县| 黔南| 长顺县| 阳谷县| 双城市| 桐梓县| 通榆县| 曲靖市| 辽阳市| 云安县| 金秀| 安乡县| 万荣县| 德化县| 屯昌县| 班戈县| 西乡县| 基隆市| 买车| 兴文县| 东平县| 龙江县|