国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)技術(shù)的烘絲機(jī)出口水分影響因素研究

2016-03-22 21:53:26陸琨薛訓(xùn)明唐皓辰徐永虎姜華葉為
電腦知識與技術(shù) 2016年2期

陸琨 薛訓(xùn)明 唐皓辰 徐永虎 姜華 葉為全

摘要:眾所周知,影響烘絲機(jī)出口水分的主要因素是來料流量、來料水分、滾筒溫度和熱風(fēng)溫度等,具體到這些因素的重要性排序尚無明確的研究結(jié)論。該文在系統(tǒng)研究的基礎(chǔ)上了構(gòu)建其數(shù)學(xué)模型,并采用多元線性回歸算法、神經(jīng)網(wǎng)絡(luò)算法、決策樹算法三種監(jiān)督學(xué)習(xí)算法對此問題進(jìn)行了系統(tǒng)研究,從而確定烘絲機(jī)影響因素的重要性排序。

關(guān)鍵詞:烘絲機(jī)出口水分;因素重要性排序;多元線性回歸算法;神經(jīng)網(wǎng)絡(luò)算法;決策樹算法

中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2016)02-0191-03

Abstract: The moisture in the tobacco dryers outlet is affected by the quantity of materials, water content of materials, the temperature of roller and the temperature of hot wind, etc. But the order of these factors importance can not be determined. Using multiple linear regression algorithm, neural network algorithm and decision tree algorithm to train several batches of data, the difference betweenthe predicted water content near outlet and the actual water content can be compared. Then the optimum model is determined. Therefore we can determine the order of the importance of factors which affects the moisture in the dryers outlet.

Key words: the moisture in the dryers outlet; the order of the factors importance; multiple linear regression algorithm; neural network algorithm; decision tree algorithm

大數(shù)據(jù)(bigdata)挖掘已經(jīng)成為當(dāng)今信息技術(shù)發(fā)展的典型代表,是整個社會和企業(yè)的“新寶藏”。在煙草行業(yè)“精益管理”的浪潮中,充分利用數(shù)據(jù)分析技術(shù),提升管理水平,是企業(yè)制勝的關(guān)鍵。對合肥卷煙廠來說,企業(yè)取消法人資格后,更加關(guān)注的是產(chǎn)品質(zhì)量和制造力的提升。合肥卷煙廠從2014年開始大數(shù)據(jù)智能管理平臺建設(shè),旨在通過企業(yè)數(shù)據(jù)倉庫集成所有系統(tǒng)數(shù)據(jù),通過業(yè)務(wù)鏈數(shù)據(jù)流分析提升管理水平。烘絲機(jī)出口水分作為影響卷煙質(zhì)量與感官的重要因素,是衡量企業(yè)制造能力的重要指標(biāo)。本文以烘絲機(jī)出口水分的影響因素重要性排序研究為例,探討了如何利用大數(shù)據(jù)思維和數(shù)據(jù)挖掘技術(shù)確定烘絲機(jī)出口水分影響因素的重要性排序。此研究成果對減少產(chǎn)品質(zhì)量波動,提升產(chǎn)品品質(zhì)有重要的指導(dǎo)意義。

1 影響烘絲機(jī)出口水分的因素

烘絲的主要目的是降低煙絲的含水率,并將其控制在工藝要求范圍內(nèi),盡可能減少水分波動。烘絲的手法主要有氣流式和薄板式兩種。

合肥卷煙廠選用的是HAUNI薄板式烘絲機(jī),該設(shè)備采用“滾筒+飽和蒸汽”方式,讓煙絲在筒內(nèi)薄板上均勻緩慢移動蒸發(fā)水分,同時輔以對流熱風(fēng)干燥,實現(xiàn)對煙絲含水率的精準(zhǔn)控制[2]。

本文結(jié)合專家分析法和長期生產(chǎn)實踐,認(rèn)為影響烘絲出口水分的因素主要有:

1)來料水分:烘絲機(jī)入口煙絲流量由流量秤精準(zhǔn)控制,在入口煙絲流量穩(wěn)定的情況下,烘絲機(jī)滾筒轉(zhuǎn)速、熱風(fēng)溫度、蒸汽壓力、筒壁溫度等核心指標(biāo)均穩(wěn)定的情況下,出口水分和入口水分呈正向相關(guān)關(guān)系;

2) 進(jìn)料煙絲流量:在烘絲機(jī)滾筒轉(zhuǎn)速、熱風(fēng)溫度、蒸汽壓力、筒壁溫度等核心指標(biāo)均穩(wěn)定的情況下,烘絲機(jī)流量秤設(shè)定流量值越高且流量穩(wěn)定,出口水分越大,反之越低;

3)熱風(fēng)溫度:在入口煙絲流量、蒸汽壓力、筒壁溫度、滾筒轉(zhuǎn)速均不變的情況下,熱風(fēng)溫度越低,出口水分越高,反之則越低;

4) 筒壁溫度越高,出口水分越低;筒壁溫度越低,出口水分越高。

2 重要性分析的算法選擇

在選擇算法的時候分為兩種類型,一種是監(jiān)督學(xué)習(xí),一種是無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)是在被告知訓(xùn)練樣本屬于“哪個”類的監(jiān)督下學(xué)習(xí),數(shù)據(jù)會使用訓(xùn)練數(shù)據(jù)集中得到的規(guī)則進(jìn)行學(xué)習(xí)。無監(jiān)督學(xué)習(xí)是在學(xué)習(xí)的類集合和數(shù)量都是事先未知的情況下,通過一系列數(shù)據(jù)觀察來建立數(shù)據(jù)中類。已知煙草流量、入口水分、熱風(fēng)溫度、筒壁溫度是影響烘絲機(jī)出口水分的因素,因此選擇了監(jiān)督學(xué)習(xí)的算法。監(jiān)督學(xué)習(xí)算法分為概率統(tǒng)計分類法、線性分類法、非線性分類法。

2.1 概率統(tǒng)計分類法

貝葉斯后驗概率公式是概率統(tǒng)計分類方法的基礎(chǔ)和核心。其主要思想是計算樣本在不同類別中存在的可能性,并預(yù)測樣本所屬類別[3]。

如公式(1)所示,它是貝葉斯理論的后驗概率公式。其中[PCi]是貝葉斯決策理論的先驗概率,[Px|ci]的是每個類的條件概率,依據(jù)[Px|ci]的大小,即可斷定X屬于那個類。

2.2 線性分類法

線性分類就是通過一個或者多個超平面,將特征空間按類別劃分為獨立子空間。用來表示超平面的決策函數(shù)可以表示為[gX=WTX+WO],其中W表示權(quán)值向量,WO被稱為偏置(bias)。對于[gx>0,]被劃分為正類,其他的被劃分為負(fù)類。由于本次訓(xùn)練集中具備多個數(shù)據(jù)影響因素,因此需采用多元線性回歸,由多個自變量的最優(yōu)組合共同來預(yù)測或估計因變量。

2.3 非線性分類法

當(dāng)兩類樣本分布具有多峰性質(zhì)并互相交錯時,簡單的線性判別函數(shù)往往會帶來較大的分類錯誤。常采用多平面多迭代的非線性分類法。非線性分類法中最常用的就是神經(jīng)網(wǎng)絡(luò)算法。

一個簡單的神經(jīng)網(wǎng)絡(luò)由三部分組成:輸入層()、隱含層以及輸出層[y=f(net)=11+e(-net)]。作為一個可以適應(yīng)復(fù)雜問題的自發(fā)式的統(tǒng)計模式識別技術(shù),神經(jīng)網(wǎng)絡(luò)算法具有強(qiáng)大功能,只要給出足夠數(shù)量的隱含層的神經(jīng)單元、適當(dāng)?shù)姆蔷€性函數(shù)以及權(quán)值,任何判決都可以利用三層神經(jīng)網(wǎng)絡(luò)來實現(xiàn)。

2.3.1 挖掘流程與結(jié)果評估

數(shù)據(jù)樣本為烘絲機(jī)每批次葉絲流量、入口水分、熱風(fēng)溫度、筒壁溫度的CPK值。由于上述數(shù)據(jù)的數(shù)據(jù)源為PLC采集的實時數(shù)據(jù),在數(shù)據(jù)處理上,首先通過TAG點采集各項指標(biāo)的實時數(shù)據(jù),采集頻率為10秒/次,存入實時數(shù)據(jù)庫,并計算得到各項數(shù)據(jù)CPK值,存入Hadoop數(shù)據(jù)倉庫,得到8000批樣本數(shù)據(jù),部分?jǐn)?shù)據(jù)如表1。由于各點數(shù)據(jù)來自PLC通信的實時數(shù)據(jù)采集,難免出現(xiàn)異常數(shù)據(jù),因此,在數(shù)據(jù)建模過程中,首先對樣本數(shù)據(jù)執(zhí)行異常值剔除操作。

通過對數(shù)據(jù)樣本特征的分析和對業(yè)務(wù)的理解,選取多元線性回歸分析模型、神經(jīng)網(wǎng)絡(luò)模型和C&R樹算法模型[4]進(jìn)行數(shù)學(xué)建模,并利用 IBM SPSS工具進(jìn)行數(shù)據(jù)挖掘,得到模擬的烘絲機(jī)出口水分值,表中-1是垃圾數(shù)據(jù),在挖掘過程中已剔除。如表2所示:

評判三種模型優(yōu)劣的指標(biāo)為誤差、標(biāo)準(zhǔn)差和線性相關(guān)度。其中誤差表示出口水分預(yù)測值與實際值之間的差異,標(biāo)準(zhǔn)差反應(yīng)預(yù)測出口水分?jǐn)?shù)據(jù)的離散程度,線性相關(guān)表示出口水分的預(yù)測值和實際值的線性相關(guān)程度的大小(正數(shù)表示正相關(guān))。評判指標(biāo)結(jié)果如表3所示:

由此確定烘絲機(jī)出口水分最重要的影響因素為烘絲機(jī)筒壁溫度,影響權(quán)重為0.6,熱風(fēng)溫度影響權(quán)重為0.21,入口水分影響權(quán)重為0.14,葉絲流量影響因素為0.05。

3 結(jié)束語

此項研究對指導(dǎo)烘絲機(jī)操作具有重要的指導(dǎo)意義,在此研究結(jié)果的指導(dǎo)下,合肥卷煙廠烘絲機(jī)出口水分偏差從2013年的0.03提升至2014年的0.01,效果顯著。上述案例是合肥卷煙廠大數(shù)據(jù)智能管理平臺應(yīng)用的一個典型案例,在深化量化融合、挖掘數(shù)據(jù)價值的道路上,合肥卷煙廠繼續(xù)探索。

參考文獻(xiàn):

[1] 徐俊山, 康惠駿. 烘絲機(jī)煙絲含水率的預(yù)測PI控制[J]. 電氣傳動自動化, 2007(29).

[2] 許龍. 減小烘絲機(jī)出口煙絲水分瞬間波動幅值[J]. 企業(yè)技術(shù)開發(fā), 2011(2).

[3] 裴治捷. 淺析統(tǒng)計學(xué)中貝葉斯估計方法和經(jīng)典頻率學(xué)派估計方法的不同[J]. 科技視界, 2014(28).

[4] 劉亞秋, 李海濤, 景維鵬. 基于Hadoop的海量嘈雜數(shù)據(jù)決策樹算法的實現(xiàn)[J]. 計算機(jī)應(yīng)用, 2015(4).

仁怀市| 乐陵市| 延长县| 绩溪县| 揭阳市| 东兰县| 渝中区| 自贡市| 南漳县| 肇东市| 噶尔县| 平陆县| 广宗县| 大邑县| 喀什市| 陆良县| 静乐县| 新巴尔虎左旗| 墨玉县| 绍兴县| 太康县| 陆良县| 汝州市| 义乌市| 镇沅| 夹江县| 永定县| 察哈| 江阴市| 德令哈市| 沾益县| 扬州市| 威信县| 张家港市| 开平市| 司法| 义乌市| 铜鼓县| 乐山市| 山西省| 通榆县|