孔祥昊 裘哲勇 趙紀(jì)政 沈梓崴 李冠華
摘 要:文章采用統(tǒng)計(jì)學(xué)理論分析了卷煙過(guò)程中煙支重量反饋控制系統(tǒng)所監(jiān)測(cè)的多項(xiàng)指標(biāo)的海量數(shù)據(jù)。首先,對(duì)海量數(shù)據(jù)進(jìn)行預(yù)處理,并通過(guò)假設(shè)檢驗(yàn)得出數(shù)據(jù)服從正態(tài)分布。其次,計(jì)算各項(xiàng)指標(biāo)間的灰關(guān)聯(lián)度,得到各項(xiàng)指標(biāo)間的關(guān)聯(lián)度矩陣。最后,通過(guò)逐步回歸分析得到各項(xiàng)指標(biāo)間具有顯著相關(guān)性的最優(yōu)回歸方程,并給出能夠根據(jù)各監(jiān)測(cè)指標(biāo)的變化對(duì)煙支重量進(jìn)行反饋調(diào)節(jié)的控制系統(tǒng)模型。
關(guān)鍵詞:海量數(shù)據(jù);正態(tài)分布;灰關(guān)聯(lián)度分析;逐步回歸分析
中圖分類(lèi)號(hào):TS47 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)21-0012-04
Abstract: In this paper, the statistical theory is used to analyze the mass data of many indexes monitored by cigarette weight feedback control system in the course of cigarette production. First of all, the massive data are preprocessed, and the hypothetical test shows that the data obeys the normal distribution. Secondly, the grey correlation degree of each index is calculated, and the correlation degree matrix of each index is obtained. Finally, through stepwise regression analysis, the optimal regression equation with significant correlation among the indicators is obtained, and the control system model which can adjust the cigarette weight feedback according to the changes of each monitoring index is given.
Keywords: mass data; normal distribution; grey relational analysis; stepwise regression analysis
1 概述
煙支卷制是現(xiàn)代的煙支制造過(guò)程中十分關(guān)鍵的一個(gè)步驟,而煙支重量在卷煙過(guò)程中是一個(gè)被嚴(yán)格控制的物理量,是卷煙生產(chǎn)廠(chǎng)商非常關(guān)注的重要指標(biāo),其直接影響著煙支填充密度、卷煙吸阻、硬度等,對(duì)煙支的燃燒與吸食質(zhì)量也產(chǎn)生一定的影響。將煙支的重量控制在合理的范圍內(nèi),不僅能夠在保證煙支的質(zhì)量的前提下提升吸食體驗(yàn),還能夠減少不合格率從而降低生產(chǎn)成本。本實(shí)驗(yàn)以卷煙重量為中心,對(duì)卷煙生產(chǎn)過(guò)程中,煙支重量反饋控制系統(tǒng)所監(jiān)測(cè)的重量偏差、車(chē)速、風(fēng)室壓力和吸絲帶目標(biāo)位置等指標(biāo)的海量數(shù)據(jù)進(jìn)行數(shù)理分析,得出各指標(biāo)之間的關(guān)系。
2 數(shù)據(jù)預(yù)處理
由于采集數(shù)據(jù)的異步性,數(shù)據(jù)需要進(jìn)行預(yù)處理,其過(guò)程主要遵循以下5個(gè)原則:
(1)由于車(chē)速和風(fēng)室負(fù)壓的采集頻率為1s/次,而吸絲帶的目標(biāo)位置、當(dāng)前位置以及煙支的重量偏差的采集頻率為1ms/次,認(rèn)為車(chē)速、風(fēng)室負(fù)壓在1s內(nèi)不會(huì)改變,將1s內(nèi)的數(shù)據(jù)補(bǔ)全。
(2)車(chē)速不超過(guò)7990支/分時(shí),認(rèn)為卷煙系統(tǒng)處于不平穩(wěn)狀態(tài),將該部分采集到的數(shù)據(jù)丟棄。
(3)丟棄指標(biāo)殘缺的樣本,不做分析。
(4)計(jì)算平整器移動(dòng)量:
平整器移動(dòng)量=平整器目標(biāo)位置-平整器當(dāng)前位置。
4 各參數(shù)之間的相關(guān)性分析
經(jīng)過(guò)正態(tài)分析,煙支重量符合均值為μ=2.8503,方差為σ=55.5935的正態(tài)分布,能夠很好地預(yù)測(cè)出煙支加工過(guò)程中落在誤差設(shè)定在任何一個(gè)區(qū)間的煙支數(shù)量,即能夠有效地輔助預(yù)測(cè)出煙支的合格率,以便及時(shí)調(diào)整卷煙系統(tǒng)。但是,具體應(yīng)該調(diào)整卷煙系統(tǒng)的哪一個(gè)部分,才能減小煙支重量的誤差,需要進(jìn)一步考察各監(jiān)測(cè)指標(biāo)對(duì)煙支重量的影響。同時(shí),由于煙支重量反饋控制系統(tǒng)較為復(fù)雜,僅僅用幾個(gè)監(jiān)測(cè)指標(biāo)來(lái)衡量整個(gè)系統(tǒng)已經(jīng)將系統(tǒng)簡(jiǎn)化,所以不能單純考慮其余監(jiān)測(cè)指標(biāo)對(duì)煙支重量的影響,還應(yīng)該分析這些指標(biāo)之間有何種相互制約關(guān)系,以及煙支重量是如何反過(guò)來(lái)影響這些監(jiān)測(cè)指標(biāo)的。
4.1 灰關(guān)聯(lián)度分析
灰關(guān)聯(lián)度分析法是衡量在系統(tǒng)發(fā)展過(guò)程中變量間關(guān)聯(lián)程度的一種有效方法,若兩個(gè)因素同步變化程度較高,則可謂二者關(guān)聯(lián)程度較高;反之,則較低。代勁等人[4]提出灰理論缺乏行之有效的針對(duì)大數(shù)據(jù)集及多粒度的灰關(guān)聯(lián)分析方法,導(dǎo)致其使用不夠廣泛。本文基于煙支生產(chǎn)過(guò)程中產(chǎn)生的海量數(shù)據(jù),使用吳祖堂等人[5]在機(jī)械設(shè)備故障診斷中使用的灰關(guān)聯(lián)度分析方法,探究出煙支重量反饋控制系統(tǒng)中格監(jiān)測(cè)指標(biāo)之間的關(guān)系強(qiáng)弱,并用灰關(guān)聯(lián)度矩陣定量直觀(guān)地展示出來(lái)。具體步驟如下:
(1)確定參考變量和比較變量,將參考變量記作:
從表1的灰關(guān)聯(lián)度矩陣中可以得出結(jié)論:
(1)平整器當(dāng)前位置和目標(biāo)位置之間存在很強(qiáng)的相互制約關(guān)系。
(2)煙支的重量偏差與平整器的位置偏移量之間存在較強(qiáng)的相互制約關(guān)系。
(3)風(fēng)室壓力對(duì)平整器的位置偏移量有較大的影響。
4.3 逐步回歸分析
確立了各監(jiān)測(cè)指標(biāo)之間的關(guān)聯(lián)程度之后,若要想知道各指標(biāo)之間具體的函數(shù)化關(guān)系還需對(duì)數(shù)據(jù)進(jìn)一步分析。游士兵等人[6]使用了逐步回歸分析法建立了中國(guó)農(nóng)村居民收入預(yù)測(cè)模型,并闡明了逐步回歸分析法在多元線(xiàn)性回歸中的可行性和有效性。鄭晗等人[7]也使用逐步回歸的方法對(duì)影響煙支燃燒溫度的因素進(jìn)行了分析,再次證明了逐步回歸分析法得出的模型的實(shí)用性。
為了能夠得到較為簡(jiǎn)化又能準(zhǔn)確預(yù)測(cè)的煙支重量反饋控制模型,本文使用逐步回歸分析法,按照自變量對(duì)因變量的影響程度,從大到小將自變量逐個(gè)引入回歸方程。具體步驟如下:
(1)確定顯著的F檢驗(yàn)水平:
由于本文使用的數(shù)據(jù)量多達(dá)2500000條,則α取0.1時(shí),F(xiàn)0.1(1,∞)<2.71,所以可指定F=5。
(2)計(jì)算各變量的平均數(shù)
4.4 逐步回歸結(jié)果分析
將各監(jiān)測(cè)指標(biāo)分別作為參考變量,計(jì)算出5個(gè)最優(yōu)回歸方程,但是經(jīng)過(guò)最優(yōu)方程可信度檢測(cè)之后,只有兩個(gè)方程通過(guò)檢驗(yàn),如式(27)和式(28)所示,其中,x1為平整器目標(biāo)位置,x2為平整器當(dāng)前位置,x3為煙支重量偏差,x4為風(fēng)室壓力。
其中復(fù)相關(guān)系數(shù)為R=0.9954,df>1000,查顯著性檢驗(yàn)表自由度為1000得出R0.05=0.062(顯著性水平α=0.05)。復(fù)相關(guān)系數(shù)顯著,故x2、x3、x4與x1之間存在極為顯著的線(xiàn)性關(guān)系?;貧w方程估計(jì)標(biāo)準(zhǔn)誤差S=0.2083,回歸方程估測(cè)誤差僅為0.2083%,故樣本所建立的最優(yōu)回歸方程可靠性極高。于是我們可知:當(dāng)前位置、重量偏差、風(fēng)室負(fù)壓對(duì)目標(biāo)位置的影響都很顯著。
其中復(fù)相關(guān)系數(shù)R=0.9954遠(yuǎn)大于0.062,故變量x1、x3與變量x4存在顯著的線(xiàn)性關(guān)系。回歸方程估計(jì)標(biāo)準(zhǔn)誤差S=0.2089,回歸方程估測(cè)誤差僅為0.2089%,故樣本所建立的最優(yōu)回歸方程可靠性極高。于是我們可知:目標(biāo)位置、重量偏差對(duì)風(fēng)室壓力的影響都很顯著。
經(jīng)過(guò)逐步回歸分析之后,我們能夠得到基于監(jiān)測(cè)指標(biāo)的煙支重量反饋控制系統(tǒng)模型,如圖2所示:
5 結(jié)束語(yǔ)
通過(guò)以上分析可知,煙支重量反饋控制系統(tǒng)所檢測(cè)的各項(xiàng)指標(biāo)中,平整器目標(biāo)位置參數(shù)與其他幾項(xiàng)指標(biāo)參數(shù)間具有較強(qiáng)的相關(guān)性,以及其他指標(biāo)參數(shù)間也有一定的關(guān)聯(lián)度。經(jīng)過(guò)一系列的數(shù)學(xué)分析方法,最終得出了一個(gè)煙支重量反饋控制系統(tǒng)模型。
但本模型只是粗略地給出了各檢測(cè)指標(biāo)之間的相關(guān)權(quán)重,在實(shí)際運(yùn)用過(guò)程中權(quán)重會(huì)隨著監(jiān)測(cè)煙支指標(biāo)的波動(dòng)而發(fā)生相應(yīng)的調(diào)整。因此,堅(jiān)持對(duì)煙支重量反饋控制系統(tǒng)進(jìn)行常規(guī)的參數(shù)檢驗(yàn),及時(shí)調(diào)整卷煙系統(tǒng),才能保證煙支重量的精度,提高卷煙的質(zhì)量。
參考文獻(xiàn):
[1]何鳳霞. 對(duì)于大數(shù)定理和中心極限定理的分析與探討[A]. Information Engineering Research Institute, USA.Proceedings of 2015 3rd International Conference on Social Science and Education(ICSSE 2015 V75)[C].Information Engineering Research Institute, USA:,2015:4.
[2]陳常琦.大數(shù)定律和中心極限定理的思考與應(yīng)用[J].考試周刊,2017(50):9.
[3]張蒙生,趙保國(guó),張振華,等.煙支質(zhì)量計(jì)量抽檢方案的設(shè)計(jì)[J].工業(yè)計(jì)量,2007(S1):37-39.
[4]代勁,胡峰,劉歆.基于數(shù)據(jù)分布的快速灰關(guān)聯(lián)分析[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2015,45(01):283-290.
[5]吳祖堂,李岳,溫熙森.灰關(guān)聯(lián)分析在機(jī)械設(shè)備故障診斷中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,1999(06):127-133.
[6]游士兵,嚴(yán)研.逐步回歸分析法及其應(yīng)用[J].統(tǒng)計(jì)與決策,2017(14):31-35.
[7]鄭晗,張瑩,李賡,等.煙支燃燒溫度影響因素的多因素方差與逐步回歸分析[J].中國(guó)煙草學(xué)報(bào),2016,22(05):26-32.