何毅 李斌 普軼
摘 ?要: 松散回潮是煙草生產(chǎn)的關(guān)鍵環(huán)節(jié),通過(guò)影響煙絲的含水率,進(jìn)而決定煙絲的品質(zhì)和口感。目前松散回潮的產(chǎn)品質(zhì)量控制面臨著工藝復(fù)雜、變量眾多和產(chǎn)品要求高等多個(gè)挑戰(zhàn),需要用更精準(zhǔn)的方法提升煙絲出料含水率的預(yù)測(cè)控制。本文介紹了一種基于梯度提升樹方法的煙草回潮機(jī)出料含水率預(yù)測(cè)方法,可應(yīng)用到回潮機(jī)的加水量和加濕量的控制中,能提高制絲階段煙絲含水率的穩(wěn)定性,從而提高煙絲的品質(zhì)和口感。該模型以歷史數(shù)據(jù)中的入口水分、熱風(fēng)溫度、工藝流量、不同批次和牌號(hào)的產(chǎn)品信息為輸入,綜合考慮生產(chǎn)因素和環(huán)境因素的影響,實(shí)現(xiàn)了回潮機(jī)的出料含水率預(yù)測(cè),滿足了工藝生產(chǎn)要求。模型具有處理非線性問(wèn)題的能力,提高了含水率的預(yù)測(cè)精度,滿足了常用的統(tǒng)計(jì)學(xué)評(píng)估指標(biāo),并實(shí)現(xiàn)了自學(xué)習(xí)能力,可改善對(duì)煙絲含水率的控制并提升煙絲的品質(zhì)。
關(guān)鍵詞: 預(yù)測(cè);回潮;出料含水率;梯度提升樹
中圖分類號(hào): TP273 ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ?DOI:10.3969/j.issn.1003-6970.2020.06.032
本文著錄格式:何毅,李斌,普軼,等. 基于梯度提升樹的煙草回潮機(jī)出料含水率預(yù)測(cè)[J]. 軟件,2020,41(06):151157
【Abstract】: The loose moisture regain is a crucial process in tobacco production, which determines the moisture ratio of tobacco, with a great effect on the quality and savour of tobacco. At present, the product quality control of loose moisture regain faces many challenges, such as process complexity, a large number of variables and high product requirements. Therefore, it is necessary to increase the prediction accuracy of tobacco thread moisture ratio at machine outlet. This paper introduces a gradient boosting decision tree (GBDT) method to predict outlet moisture ratio of tobacco moisture regain machine, which can be applied to the control of outlet moisture and water flow rate. This method effectively improved the stability of moisture ratio of tobacco at the thread making stage, so as the quality and flavor of tobacco. This prediction took inputs from historical data, including inlet moisture, hot air temperature, craft flow, product information of different batches and brands, which integrated environmental and manufacturing effect. The craft requirements were used to evaluate prediction accuracy of outlet moisture ratio. The method can deal with nonlinear problems, and reach a high prediction accuracy. The method also satisfies statistical evaluation indexes and embodies self-learning capability, so the control of moisture ratio and quality of tobacco can be improved.
【Key words】: Prediction; Moisture regain; Outlet moisture ratio; Gradient boosting decision trees
0 ?引言
在煙草生產(chǎn)各環(huán)節(jié)中,制絲生產(chǎn)是對(duì)卷煙品質(zhì)起決定作用的關(guān)鍵環(huán)節(jié),其中煙絲回潮環(huán)節(jié)的水分控制,包括加水量和熱風(fēng)溫度,直接對(duì)其后續(xù)的烘絲和制絲環(huán)節(jié)的品質(zhì)控制起重要影響 [1]。作為關(guān)鍵制絲工藝,回潮過(guò)程直接影響了揮發(fā)性成分的釋放量和致香成分的釋放總量[2],對(duì)氯含量、糖堿比,鉀氯比和氮堿比等均有較大的影響[3]。不同等級(jí)的煙葉,含水率和吸濕性能具有不同的特點(diǎn),安徽中煙的陳春雷等通過(guò)對(duì)煙葉分組改進(jìn)了加水策略,提高了煙葉的質(zhì)量[4]?;陬A(yù)測(cè)的控制改進(jìn)可使用回歸和神經(jīng)網(wǎng)絡(luò)等方法。在水分控制環(huán)節(jié),福建中煙的常明彬等引入了環(huán)境的溫濕度作為自變量,建立了多元回歸模型預(yù)測(cè)出松散回潮加水量,并以此作為控制依據(jù),可獲得更佳的產(chǎn)品質(zhì)量[5]。貴州中煙的陳啟迪等利用Peleg[6]提出的二參數(shù)非指數(shù)經(jīng)驗(yàn)回歸模型方程,采用物料初始含水率和加水量預(yù)測(cè)回潮機(jī)出料含水率,優(yōu)化了煙葉的出料含水率[7]。河南中煙的劉穗君等通過(guò)統(tǒng)計(jì)回歸,建立了松散回潮出料含水率精準(zhǔn)控制模型,提高了生產(chǎn)過(guò)程控制水平[8]。福建龍巖煙草工業(yè)有限責(zé)任公司的陳曉杜等則使用了Elman神經(jīng)網(wǎng)絡(luò),利用其動(dòng)力學(xué)特征和穩(wěn)定性的優(yōu)勢(shì),以松散回潮加水比例和環(huán)境溫濕度為自變量,能預(yù)測(cè)出料含水率[9]。山東中煙的王龍柱等利用基于徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò)模型,向模型中輸入制葉段實(shí)時(shí)數(shù)據(jù)松散回潮出料含水率、潤(rùn)葉加料出料含水率,預(yù)測(cè)烘絲機(jī)的葉絲生絲含水率值,為調(diào)整松散回潮提供了依據(jù)[10]。
以往研究中,未能同時(shí)考慮環(huán)境參數(shù)和生產(chǎn)工藝對(duì)出料含水率的共同影響;研發(fā)的預(yù)測(cè)模型則基于工藝組合改進(jìn)或者線性回歸等較為簡(jiǎn)單的方法,對(duì)系統(tǒng)復(fù)雜性的處理能力不足;同時(shí)計(jì)算得到的結(jié)果精度比較有限,缺乏與復(fù)雜系統(tǒng)的出料含水率預(yù)測(cè)控制相結(jié)合的能力。
為解決以上局限,本研究考慮了不同影響因子對(duì)出料含水率的影響,使用了包括溫濕度在內(nèi)的環(huán)境參數(shù)和工藝參數(shù)作為自變量,利用梯度提升樹算法建立預(yù)測(cè)模型。經(jīng)預(yù)測(cè)結(jié)果檢驗(yàn),梯度提升樹模型能快速準(zhǔn)確地預(yù)測(cè)回潮機(jī)出口的出料含水率,預(yù)測(cè)結(jié)果優(yōu)于傳統(tǒng)線性回歸和神經(jīng)網(wǎng)絡(luò)方法,可在未來(lái)作為自動(dòng)加水系統(tǒng)的決策依據(jù)。
1 ?研究背景
煙草回潮的出料含水率控制主要受環(huán)境因素和工藝參數(shù)的影響。研究表明,氣候不僅是對(duì)煙葉原料生產(chǎn)影響最大的生態(tài)條件之一,同時(shí)還會(huì)影響到加工過(guò)程中的煙葉含水率等多個(gè)因素[11]。工藝參數(shù)則主要是生產(chǎn)工藝過(guò)程的物料流量和機(jī)器入口煙葉溫度與含水率等,由煙葉自身所決定。
紅河卷煙廠所在地區(qū)的氣候特征為:(1)相對(duì)濕度大,平均濕度75%,日照較豐富,年日照時(shí)數(shù)2176.4小時(shí)。(2)日氣溫波動(dòng)較大,溫濕度條件對(duì)空調(diào)能耗影響較大。(3)氣溫和熱量條件在世界主要煙區(qū)中較為優(yōu)秀,光照和雨水分布與煙葉生長(zhǎng)規(guī)律一致,有利于香氣物質(zhì)積累和高質(zhì)量煙葉的生產(chǎn)[12]。
在工藝要求方面,煙草回潮的生產(chǎn)要求主要取決于產(chǎn)品的牌號(hào)和類型,生產(chǎn)過(guò)程有明確的排程安排,按排程決定回潮機(jī)的運(yùn)轉(zhuǎn)使用和生產(chǎn)量等的計(jì)劃。出料含水率是整個(gè)過(guò)程最重要的工藝參數(shù)和控制目標(biāo)。
在回潮機(jī)工藝指標(biāo)的控制和預(yù)測(cè)過(guò)程中,預(yù)測(cè)出料含水率有重要意義:一方面預(yù)測(cè)結(jié)果可在回潮過(guò)程中為加水量提供決策依據(jù),可以提高出料含水率控制水平,增強(qiáng)其控制的穩(wěn)定性,使出料的溫濕度更符合產(chǎn)品的設(shè)計(jì)參數(shù)。通過(guò)提高出料溫濕度控制水平,還可提高產(chǎn)品品質(zhì)特別是揮發(fā)性成分和致香成分的總釋放量。另一方面,依托出料含水率的預(yù)測(cè)模型,可更精準(zhǔn)的管理回潮機(jī)的運(yùn)行和優(yōu)化,從而實(shí)現(xiàn)回潮過(guò)程的精細(xì)化管理,增強(qiáng)精益生產(chǎn)制造能力。
2 ?研究方法
預(yù)測(cè)的目的是幫助松散回潮過(guò)程更好地控制煙葉含水率,從而為制絲工序提供符合要求的煙葉。煙葉經(jīng)過(guò)真空回潮工序后,進(jìn)入到松散回潮工序,然后進(jìn)行松散、加溫和加濕,通過(guò)控制該過(guò)程中的加水總量和熱風(fēng)溫度,使出口的片煙達(dá)到工藝要求的溫度和出料含水率,從而能擁有充足的致香成分并提高可揮發(fā)性成分的釋放總量。松散回潮工序控制和預(yù)測(cè)的難點(diǎn)在于,一方面在生產(chǎn)過(guò)程中,相關(guān)的參數(shù)數(shù)量多,包括加水時(shí)間、熱風(fēng)溫度、蒸汽壓力等,且均存在一定波動(dòng);另一方面整個(gè)工序持續(xù)時(shí)間長(zhǎng),然而僅有入口處和出口處的物料含水率可被測(cè)量,而機(jī)器內(nèi)部的物料含水率未知。為解決模型參數(shù)多、非線性強(qiáng)的特點(diǎn),本研究采用了梯度提升樹模型來(lái)應(yīng)對(duì)非線性復(fù)雜問(wèn)題,并同時(shí)使用了環(huán)境參數(shù)和工藝參數(shù)作為模型輸入。
預(yù)測(cè)算法的工作流程如圖1所示。首先,算法從MES系統(tǒng)(Manufacturing Execution System,制造企業(yè)生產(chǎn)過(guò)程執(zhí)行管理系統(tǒng))上獲取回潮機(jī)的運(yùn)行數(shù)據(jù);其次,根據(jù)對(duì)生產(chǎn)過(guò)程的理解,從數(shù)據(jù)中提取關(guān)鍵參數(shù),包括回潮機(jī)周邊環(huán)境參數(shù)即溫度和濕度,以及回潮機(jī)工藝參數(shù)包括熱風(fēng)溫度、加水量、煙絲牌號(hào)、薄片流量、煙絲工藝流量和回潮機(jī)出口的出料含水率歷史數(shù)據(jù);之后對(duì)數(shù)據(jù)作清洗操作,剔除偏差超過(guò)合理范圍的值;然后將數(shù)據(jù)拆分為訓(xùn)練集和測(cè)試集,用訓(xùn)練集訓(xùn)練出梯度提升樹模型并驗(yàn)證其精度是否達(dá)到要求;測(cè)試集的環(huán)境和工藝參數(shù)作為該模型在測(cè)試階段的輸入,與系統(tǒng)采集的真實(shí)值對(duì)比。完成以上預(yù)測(cè)算法運(yùn)算過(guò)程后,程序?qū)⑤敵瞿P秃秃饬款A(yù)測(cè)結(jié)果的統(tǒng)計(jì)學(xué)指標(biāo)。
2.1 ?參數(shù)選擇和探索分析
根據(jù)對(duì)既往研究和工程項(xiàng)目的調(diào)研,環(huán)境溫濕度、回潮機(jī)加水量和熱風(fēng)溫度、牌號(hào)、煙絲和薄片的工藝流量是影響出料含水率的關(guān)鍵參數(shù)。為進(jìn)一步提高模型的精度,本研究中使用了以上的所有參數(shù)作為輸入變量。
獲取了模型所需的參數(shù)的數(shù)據(jù)后,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。首先,環(huán)境溫濕度和工藝參數(shù)的數(shù)采時(shí)間間隔存在差異,環(huán)境溫濕度數(shù)采的頻率較低,需要對(duì)數(shù)據(jù)做時(shí)間點(diǎn)對(duì)齊處理。之后,需要補(bǔ)齊加密溫濕度采集點(diǎn)的空缺時(shí)間點(diǎn)上的值,并對(duì)來(lái)自不同數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行時(shí)間點(diǎn)排序。其次,還需要對(duì)數(shù)據(jù)中的異常值進(jìn)行處理,即尋找到明顯偏離了正常范圍的數(shù)據(jù)點(diǎn),并予以刪除,從而避免由異常值導(dǎo)致的模型預(yù)測(cè)誤差較大的情況。
數(shù)據(jù)的預(yù)處理還包括將字符型的牌號(hào)數(shù)據(jù)轉(zhuǎn)化為數(shù)值型的數(shù)據(jù)。原始數(shù)據(jù)中的變量牌號(hào)記錄了正在生產(chǎn)的產(chǎn)品牌號(hào),以字符串的形式儲(chǔ)存。為了滿足訓(xùn)練預(yù)測(cè)算法的需求,需要將字符串轉(zhuǎn)化為數(shù)值。該轉(zhuǎn)化過(guò)程中使用了獨(dú)熱碼編碼的方式,也就是對(duì)于每一個(gè)牌號(hào),新增一個(gè)變量,當(dāng)生產(chǎn)的產(chǎn)品為該牌號(hào)時(shí),則將該變量的值賦值為1,否則就賦值為0。
2.2 ?預(yù)測(cè)算法和自學(xué)習(xí)策略
梯度提升樹算法(Gradient Boosting Decision Tree),簡(jiǎn)稱為GBDT算法,是一種基于決策樹的集成算法。GBDT可用于對(duì)離散值和連續(xù)值的預(yù)測(cè),基本思想是加法模型和前向分布算法,然后以CART決策樹作為基學(xué)習(xí)器。其中加法模型公式為:
為提高預(yù)測(cè)算法精度,更好地適應(yīng)不斷變化的工況和生產(chǎn)條件,模型建成后還嵌入了自學(xué)習(xí)策略。自學(xué)習(xí)策略是根據(jù)工藝要求,通過(guò)設(shè)定預(yù)測(cè)值和真實(shí)值之間的差異的允許閾值,當(dāng)差值超過(guò)閾值之后,啟動(dòng)模型重訓(xùn)練,自動(dòng)將新的工況和工藝納入模型,達(dá)到自動(dòng)學(xué)習(xí)新工況和工藝的目的。自學(xué)習(xí)策略可提高模型對(duì)新工況和煙草品種的預(yù)測(cè)精度,擴(kuò)大模型的應(yīng)用范圍,增強(qiáng)模型應(yīng)對(duì)不同工況和煙草品牌的泛化能力。
2.3 ?結(jié)果評(píng)估方法
本研究預(yù)測(cè)的是煙草回潮機(jī)的出料含水率,預(yù)測(cè)結(jié)果的評(píng)估主要有四種指標(biāo),分兩類如下所述:
在結(jié)果評(píng)估中,將梯度提升樹模型和其他的預(yù)測(cè)算法比如線性回歸、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等,進(jìn)行預(yù)測(cè)精度的比較。然后利用測(cè)試集數(shù)據(jù),獲取輸入?yún)?shù)導(dǎo)入到模型中,計(jì)算出輸出參數(shù),并進(jìn)行預(yù)測(cè)偏差和統(tǒng)計(jì)量的分析,以驗(yàn)證預(yù)測(cè)模型在驗(yàn)證集上的效果。
3 ?應(yīng)用效果
3.1 ?數(shù)據(jù)描述
松散回潮過(guò)程中涉及的參數(shù)可分為三類,包括環(huán)境參數(shù),工藝參數(shù)和控制參數(shù)。其中環(huán)境參數(shù)和工藝參數(shù)共同決定了控制參數(shù)的值,回潮機(jī)通過(guò)改變控制參數(shù)來(lái)滿足出料含水率的要求。這三類參數(shù)包含的物理量如下所述:
(1)環(huán)境參數(shù),記錄回潮機(jī)周邊的溫濕度,即其所處的廠房里的溫度和濕度;
(2)工藝參數(shù),包括物料在回潮機(jī)入口處的含水率,物料中煙絲和薄片的流量,煙絲的牌號(hào)等;
(3)控制參數(shù),是回潮機(jī)需要控制的參數(shù),用來(lái)改變物料的溫濕度,控制參數(shù)包括熱風(fēng)溫度和加水量。
表1中列出了所有自變量的名稱、參數(shù)類型、處理方式和變量類型。對(duì)于所有變量,都需執(zhí)行去除異常值的操作,以剔除嚴(yán)重偏移數(shù)據(jù)正常范圍的異常值。對(duì)于環(huán)境溫度和濕度,由于數(shù)據(jù)采集的時(shí)間間隔較大,還需將其時(shí)間點(diǎn)與工藝參數(shù)對(duì)齊,并在此過(guò)程補(bǔ)全空缺值。對(duì)于煙絲牌號(hào),則使用獨(dú)熱碼編碼,將字符型的牌號(hào)數(shù)據(jù)轉(zhuǎn)化為能被程序直接使用的數(shù)值。
3.2 ?數(shù)據(jù)探索性分析
根據(jù)既往的項(xiàng)目經(jīng)驗(yàn)和文獻(xiàn)綜述,環(huán)境溫度和濕度會(huì)對(duì)物料的含水率和溫度產(chǎn)生一定影響[5]。圖2中展示了環(huán)境溫濕度的變化,由圖中可以看出,紅河總體比較溫暖,夏季漫長(zhǎng),氣溫超過(guò)30度的天數(shù)較多,同時(shí)濕度較大,存在濕度超過(guò)90%的情況。
熱風(fēng)溫度和加水量是回潮過(guò)程的控制變量,影響出料含水率和出料溫度,是回潮過(guò)程中的控制參數(shù)。由圖3可知,熱風(fēng)溫度和加水流量并不是完全協(xié)調(diào)一致的在運(yùn)作,熱風(fēng)溫度出現(xiàn)較低溫度的情況要少于加水流量出現(xiàn)較低值的情況??傮w上,加水流量在300-500千克/小時(shí)之間,剔除極小值后,加水流量總體較為穩(wěn)定,而熱風(fēng)溫度則較為穩(wěn)定,并會(huì)出現(xiàn)溫度較高的情況。
圖4是入口含水率、工藝流量和加水量、熱風(fēng)溫度的直方圖。從中可以看出,入口水分的數(shù)據(jù)分布比較均勻,大部分值聚集在平均數(shù)附近,而加水流量的數(shù)據(jù)存在向較大值傾斜的特點(diǎn),出現(xiàn)較大的流量的情況要多于出現(xiàn)較小流量的情況,同時(shí)出現(xiàn)了少許加水流量值非常低的值。工藝流量整體上集中在三個(gè)數(shù)值區(qū)域內(nèi),其中出現(xiàn)頻率最高的值接近8000,而熱風(fēng)溫度則有兩個(gè)數(shù)值較為集中分布的區(qū)域,分別是在58度和60.5度附近,其中58度附近的值的數(shù)量最多。
3.3 ?模型訓(xùn)練與驗(yàn)證
在模型的訓(xùn)練和驗(yàn)證的過(guò)程中,將數(shù)據(jù)分割為兩個(gè)數(shù)據(jù)集:訓(xùn)練集和測(cè)試集,訓(xùn)練集用來(lái)訓(xùn)練模型,而測(cè)試集則用來(lái)驗(yàn)證模型的效果。在本次研究中,將經(jīng)過(guò)處理的數(shù)據(jù)按7∶3的比例分割為訓(xùn)練集和測(cè)試集。同時(shí)考慮到生產(chǎn)工藝具有時(shí)間特性,即不同工藝數(shù)據(jù)的數(shù)據(jù)采集是按時(shí)間逐漸發(fā)生的,所以按照時(shí)間前后,將前70%的數(shù)據(jù)設(shè)定為訓(xùn)練集,將后30%的數(shù)據(jù)分割為測(cè)試集。
在訓(xùn)練集上對(duì)模型進(jìn)行訓(xùn)練,經(jīng)評(píng)估其精度滿足要求后,可在測(cè)試集上進(jìn)行模型的驗(yàn)證。預(yù)測(cè)值和真實(shí)值的對(duì)比如下,RMSE達(dá)到了0.54,而MAPE達(dá)到了3.16,較小的RMSE和MAPE體現(xiàn)了模型的精度較高,滿足了對(duì)出料含水率進(jìn)行精準(zhǔn)預(yù)測(cè)的要求。用于模型訓(xùn)練和驗(yàn)證的計(jì)算過(guò)程僅耗時(shí)約1.29秒,滿足了系統(tǒng)進(jìn)行快速響應(yīng)和控制的需求。圖5中展示了模型的預(yù)測(cè)值和數(shù)采系統(tǒng)測(cè)得的真實(shí)值之間的對(duì)比,藍(lán)色的線分割了訓(xùn)練集和測(cè)試集,藍(lán)色線以左是訓(xùn)練集,以右是測(cè)試集。可見(jiàn)訓(xùn)練階段與測(cè)試階段預(yù)測(cè)值和真實(shí)值均較為接近,另可見(jiàn)數(shù)采系統(tǒng)采集的部分?jǐn)?shù)據(jù)存在波動(dòng)大的情況,需要在實(shí)際生產(chǎn)中盡量消除。
模型設(shè)定了自學(xué)習(xí)能力,當(dāng)預(yù)測(cè)誤差超過(guò)了根據(jù)工藝標(biāo)準(zhǔn)設(shè)置的閾值之后,啟動(dòng)模型的重新訓(xùn)練機(jī)制,將新的數(shù)據(jù)納入到模型中,以增強(qiáng)模型對(duì)新的工況的預(yù)測(cè)能力。經(jīng)過(guò)測(cè)試,模型可發(fā)現(xiàn)誤差超過(guò)閾值的情況,并啟動(dòng)重訓(xùn)練從而達(dá)到應(yīng)對(duì)新工況或者新煙草品種的能力。
3.4 ?預(yù)測(cè)對(duì)標(biāo)分析
為驗(yàn)證梯度提升樹模型的性能和效果,選取多個(gè)模型進(jìn)行預(yù)測(cè)評(píng)估指標(biāo)的對(duì)比,對(duì)比模型包括線性回歸模型,支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等;線性回歸采用了最小二乘法;支持向量機(jī)的參數(shù)設(shè)置為:核函數(shù)選用徑向基函數(shù)核,懲罰因子為1000,松弛變量為算法自動(dòng)計(jì)算選取;神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率為0.03,隱含層層數(shù)為100,激活函數(shù)使用ReLU函數(shù),批大小等參數(shù)則由算法自主計(jì)算獲得。
在模型效果的對(duì)比中,使用的評(píng)估指標(biāo)為偏差率、RMSE、R-square、MAPE和計(jì)算耗時(shí)。這三個(gè)模型都是常見(jiàn)的預(yù)測(cè)方法[13-14],在多種場(chǎng)景中得到普遍的應(yīng)用,其中回歸模型和神經(jīng)網(wǎng)絡(luò)在煙草行業(yè)也有一定的應(yīng)用。模型對(duì)比的結(jié)果如下表所示。
根據(jù)最終的預(yù)測(cè)指標(biāo)比較知,和其他模型相比,在偏差率、RMSE、R-square、MAPE等指標(biāo)上,梯度提升樹模型均取得了最優(yōu)的結(jié)果。而在計(jì)算速度上,回歸模型耗時(shí)最少,取得了最優(yōu)的計(jì)算速度,但是梯度提升樹模型的計(jì)算速度依然超過(guò)了神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)模型,并且能夠滿足3-5分鐘完成一次預(yù)測(cè)的要求。同時(shí),本研究使用了幾個(gè)具有代表性的模型評(píng)估指標(biāo),可以應(yīng)用于預(yù)測(cè)回潮出口狀態(tài)的各種模型的評(píng)估和對(duì)比上。
針對(duì)出料含水率的預(yù)測(cè),基于梯度提升樹算法建立的預(yù)測(cè)模型取得了理想的效果,預(yù)測(cè)精度高,誤差小,且計(jì)算速度快,可幫助運(yùn)行人員控制加水量,作為加水過(guò)程的生產(chǎn)決策依據(jù)。
4 ?結(jié)論
在松散回潮過(guò)程的品控中,為保證出料含水率滿足生產(chǎn)工藝和卷制要求,本文引入了機(jī)器學(xué)習(xí)方法中的梯度提升樹生成預(yù)測(cè)模型,并引入了自學(xué)習(xí)機(jī)制實(shí)現(xiàn)模型迭代,從而實(shí)現(xiàn)了松散回潮過(guò)程的加水量的精準(zhǔn)控制。通過(guò)采集關(guān)鍵工藝指標(biāo)和氣象數(shù)據(jù),訓(xùn)練了一個(gè)基于入口含水率和物料流量的加水閥門控制模型,可利用預(yù)測(cè)調(diào)節(jié)閥門開度和加水量,并通過(guò)自學(xué)習(xí)方法實(shí)現(xiàn)模型的自主迭代和升級(jí),預(yù)測(cè)結(jié)果在統(tǒng)計(jì)學(xué)和工藝指標(biāo)上均滿足了要求。選用紅河卷煙廠的回潮數(shù)據(jù),對(duì)模型的效果進(jìn)行了驗(yàn)證,驗(yàn)證結(jié)果表明,模型預(yù)測(cè)的出料含水率數(shù)值和真實(shí)的數(shù)據(jù)之間誤差小,計(jì)算速度快,滿足了現(xiàn)場(chǎng)調(diào)試和未來(lái)嵌入到智能化控制系統(tǒng)的要求。
本文率先在煙草行業(yè)的業(yè)務(wù)中使用了梯度提升樹模型,使用的模型具有精度高,計(jì)算速度快的優(yōu)點(diǎn),對(duì)復(fù)雜的生產(chǎn)工藝和機(jī)理的模擬效果較好,可部署在時(shí)效性比較強(qiáng)的系統(tǒng)上。在利用測(cè)試集進(jìn)行檢驗(yàn)后,發(fā)現(xiàn)模型在新的數(shù)據(jù)集上依然能發(fā)揮預(yù)期的效果。同時(shí),梯度提升樹也存在著模型較為復(fù)雜,理解困難不夠直觀,以及對(duì)數(shù)據(jù)中的極端偏差的處理能力較弱的缺點(diǎn),需要在未來(lái)進(jìn)一步的優(yōu)化提高。
回潮機(jī)出料含水率的預(yù)測(cè)也對(duì)人的經(jīng)驗(yàn)觀察和控制邏輯的設(shè)計(jì)執(zhí)行具有指導(dǎo)意義,可以用來(lái)指導(dǎo)回潮機(jī)的加水量,當(dāng)前的模型未能整合過(guò)程能力指數(shù)Cpk和生產(chǎn)過(guò)程質(zhì)量控制,可以在下一步的工作中予以實(shí)現(xiàn)。在本研究的基礎(chǔ)上,后續(xù)可以增加各項(xiàng)經(jīng)濟(jì)指標(biāo)的評(píng)估,實(shí)現(xiàn)模型的成本輸入和收益輸出等功能。并將預(yù)測(cè)方法和自動(dòng)控制策略進(jìn)一步的結(jié)合,實(shí)現(xiàn)生產(chǎn)過(guò)程的進(jìn)一步優(yōu)化和自動(dòng)化提升,提高生產(chǎn)線自主診斷生產(chǎn)指標(biāo)偏移的能力,并將預(yù)測(cè)控制方案拓展到熱風(fēng)溫度控制和卷包制絲等其他的工序中。
參考文獻(xiàn)
[1] 段榮華. 基于專家-模糊PID控制的松散回潮出口水分控制系統(tǒng)設(shè)計(jì)[J]. 計(jì)算機(jī)測(cè)量與控制, 2019, 27(1): 85-91.
[2] 張宏宇, 劉春波, 張濤, 等. 關(guān)鍵制絲工藝對(duì)煙氣成分中揮發(fā)性成分的影響[J]. 化學(xué)研究與應(yīng)用, 2015, 27(3): 274-79.
[3] 邵惠芳, 趙蓉蓉, 范磊, 等. 松散回潮回風(fēng)溫度對(duì)煙葉化學(xué)成分與中性致香物質(zhì)的影響[J]. 中國(guó)農(nóng)業(yè)科技導(dǎo)報(bào), 2016, 18(6): 138-45
[4] 陳春雷, 陳杰. 不同等級(jí)煙葉吸濕性能的研究[J]. 檢測(cè)與標(biāo)準(zhǔn), 2018, 43(10): 44-46.
[5] 常明彬, 李曉. 基于環(huán)境溫濕度條件的松散回潮加水量預(yù)測(cè)模型研究[J]. 海峽科學(xué), 2016, (2): 17-20.
[6] Peleg, Micha. An Empirical Model for the Description of Moisture Sorption Curves[J]. Journal of Food Science, 1988, 53: 1216-1219.
[7] 盧先杰, 陳啟迪, 馬亞, 等. 基于Peleg方程的松散回潮不同等級(jí)葉組配方的吸水動(dòng)力學(xué)分析[J]. 實(shí)驗(yàn)研究, 2016, 10(33): 17-18.
[8] 劉穗君, 王玉芳, 李超, 等. 基于統(tǒng)計(jì)回歸分析的松散回潮出口含水率精準(zhǔn)控制系統(tǒng)[J]. 煙草科技, 2017, 50(3): 88-93.
[9] 陳曉杜, 郭天文, 曹琦. 基于Elman神經(jīng)網(wǎng)絡(luò)的卷煙制絲松散回潮出口含水率控制方法[J]. 安徽農(nóng)學(xué)通報(bào), 2016, 22(08), 118-119.
[10] 王龍柱, 馬洪晶, 孫欽蘭, 等. 基于RBF神經(jīng)網(wǎng)絡(luò)的葉絲生絲含水率預(yù)測(cè)[J]. 自動(dòng)化與信息工程, 2017, (2): 34-36
[11] 趙漸云. 彌勒煙區(qū)主要生態(tài)因子分析與相似類型煙葉替代研究[D]. 2014.
[12] 趙如文, 王惠, 楊韜, 等. 云南彌勒煙區(qū)氣候條件分析[J]. 貴州氣象, 2008, 32(6): 21-22.
[13] Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition[M]. 2009
[14] 李航. 統(tǒng)計(jì)學(xué)習(xí)基礎(chǔ)[M]. 2012.