梅曉仁 陳 鵬 高永勝
(1.湛江師范學(xué)院商學(xué)院,廣東省湛江市,524048;2.遼寧工程技術(shù)大學(xué)資源與環(huán)境工程學(xué)院,遼寧省阜新市,123000;3.神華集團(tuán)有限責(zé)任公司安全監(jiān)察局,北京市東城區(qū),100011)
基于SPSS的煤質(zhì)發(fā)熱量相關(guān)因素分析及其回歸模型研究*
梅曉仁1陳 鵬2高永勝3
(1.湛江師范學(xué)院商學(xué)院,廣東省湛江市,524048;2.遼寧工程技術(shù)大學(xué)資源與環(huán)境工程學(xué)院,遼寧省阜新市,123000;3.神華集團(tuán)有限責(zé)任公司安全監(jiān)察局,北京市東城區(qū),100011)
使用SPSS統(tǒng)計(jì)軟件的探索分析和相關(guān)分析功能,對(duì)某露天煤礦7#煤層的煤質(zhì)數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,得出該煤層中干基灰分和可應(yīng)用基低位發(fā)熱量?jī)蓚€(gè)煤質(zhì)指標(biāo)具有很強(qiáng)的負(fù)線性相關(guān)關(guān)系,并使用SPSS統(tǒng)計(jì)軟件的線性回歸功能建立了這兩個(gè)指標(biāo)的回歸模型。結(jié)果表明,該回歸模型可以對(duì)7#煤層的應(yīng)用基低位發(fā)熱量進(jìn)行預(yù)測(cè)。
煤發(fā)熱量 相關(guān)分析 回歸模型 SPSS統(tǒng)計(jì)軟件
煤的發(fā)熱量不僅是評(píng)價(jià)煤炭質(zhì)量的一項(xiàng)重要指標(biāo),而且是評(píng)價(jià)動(dòng)力用煤的一項(xiàng)重要經(jīng)濟(jì)參數(shù)。動(dòng)力用煤以發(fā)熱量計(jì)價(jià)能較準(zhǔn)確地反映煤炭的使用價(jià)值。但是,由于對(duì)測(cè)定發(fā)熱量的環(huán)境條件和操作人員的專業(yè)水平要求較高,測(cè)試儀器的維護(hù)難度也較大,因此,發(fā)熱量的測(cè)定一般都由專人負(fù)責(zé)。同時(shí),測(cè)定發(fā)熱量需要的時(shí)間較長(zhǎng),測(cè)定結(jié)果滯后,制約了煤炭企業(yè)在生產(chǎn)過程中對(duì)發(fā)熱量的監(jiān)控,給煤炭企業(yè)帶來(lái)了不必要的損失。
由于形成煤的原始物質(zhì)和沉積環(huán)境不同,因而煤的性質(zhì)和成分也各不相同。由于發(fā)熱量與水分、灰分等指標(biāo)存在相關(guān)關(guān)系,因此,本文探究用回歸模型計(jì)算發(fā)熱量指標(biāo),并使用SPSS統(tǒng)計(jì)分析軟件對(duì)發(fā)熱量的相關(guān)因素進(jìn)行相關(guān)分析和回歸模型研究,以求提供一種簡(jiǎn)便、實(shí)用的測(cè)定方法。
SPSS是Statistical Product and Service Solu-tions的縮寫,即統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案,是世界著名的統(tǒng)計(jì)分析軟件之一。它廣泛用于經(jīng)濟(jì)學(xué)、生物學(xué)、心理學(xué)、教育學(xué)、醫(yī)療衛(wèi)生、體育、農(nóng)業(yè)、林業(yè)、商業(yè)和金融等各個(gè)領(lǐng)域。
在實(shí)際問題中,變量之間往往有著密切的關(guān)系,但又不能由一個(gè)或幾個(gè)變量的值確定另一個(gè)變量的值,即當(dāng)自變量x取某一值時(shí),因變量y的值可能會(huì)有多個(gè)。這種變量之間的非一一對(duì)應(yīng)的、不確定性的關(guān)系,稱之為相關(guān)關(guān)系。SPSS通過繪制散點(diǎn)圖和計(jì)算相關(guān)系數(shù),來(lái)有效揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度。
在散點(diǎn)圖上,如果兩個(gè)變量之間的關(guān)系近似地表現(xiàn)為一條直線,則稱為線性相關(guān)。如果一個(gè)變量x變化,導(dǎo)致另一個(gè)變量y明顯變化,稱之為強(qiáng)相關(guān)。如果兩個(gè)變量之間的關(guān)系近似地表現(xiàn)為一條曲線,則稱之為非線性相關(guān)。如果兩個(gè)變量的數(shù)據(jù)點(diǎn)分布很分散,無(wú)任何規(guī)律,則稱兩個(gè)變量之間不相關(guān)。
相關(guān)系數(shù)以數(shù)值的方式精確地反映了變量之間線性關(guān)系的強(qiáng)弱程度。一般地,相關(guān)系數(shù)的取值在-1~+1之間。R>0,表示兩變量之間存在正線性相關(guān)關(guān)系;R<0,表示兩變量之間存在負(fù)線性相關(guān)關(guān)系;R=1,表示兩變量是完全正相關(guān)關(guān)系;R=-1,表示兩變量是完全負(fù)相關(guān)關(guān)系;R=0,兩變量不存在線性相關(guān)關(guān)系;|R|>0.8,表示兩變量之間具有較強(qiáng)的線性相關(guān)關(guān)系;|R|<0.3,表示兩變量之間線性相關(guān)關(guān)系較弱。
回歸分析是研究一個(gè)或者幾個(gè)變量的變動(dòng)對(duì)另一個(gè)變量的變動(dòng)的影響程度的方法,根據(jù)已知的資料或數(shù)據(jù),找出它們之間的關(guān)系表達(dá)式,用已知的自變量的值去推測(cè)因變量的值或范圍。線性回歸的統(tǒng)計(jì)學(xué)原理如下:
假定對(duì)一組變量x1,x2,…,xp,y作了n次觀測(cè),得到觀測(cè)值為:
線性回歸的一般數(shù)學(xué)模型是:
當(dāng)已知一組自變量和因變量的值后,使用SPSS提供的線性回歸分析方法就可以計(jì)算回歸方程的回歸系數(shù)和方差分析表中的參數(shù)等。
選取山西省某大型露天煤礦的7#煤層的煤質(zhì)數(shù)據(jù)作為研究對(duì)象。選取的指標(biāo)包括鉆孔號(hào)、煤樣厚度、分析基水分、干基灰分、可燃基揮發(fā)分、干基全硫、氫含量、可燃基高位發(fā)熱量和應(yīng)用基低位發(fā)熱量等9個(gè)指標(biāo),共94條數(shù)據(jù)?!?1.00”代表缺失值,如表1所示。
表1 7#煤層的煤質(zhì)數(shù)據(jù)統(tǒng)計(jì)表
啟動(dòng)SPSS后,單擊SPSS左下方的“Variable View”標(biāo)簽,進(jìn)入變量定義視圖。定義的變量如圖1所示。在“M issing”列中輸入“-1.00”表示缺失值,分析統(tǒng)計(jì)時(shí),SPSS自動(dòng)忽略該值。
單擊“Data View”標(biāo)簽,便可在數(shù)據(jù)編輯視圖中輸入數(shù)據(jù)??梢詫蝹€(gè)的數(shù)據(jù)一一錄入到SPSS中,也可以使用SPSS提供的導(dǎo)入功能,將已有的數(shù)據(jù)文件導(dǎo)入SPSS中,如果是Excel文件,則可以直接將Excel中的數(shù)據(jù)拷貝到SPSS中。
使用SPSS提供的探索分析,能夠檢查數(shù)據(jù)中的奇異值和極端值。SPSS提供了莖葉圖(Stem-and-Leaf Plots)、箱圖(Boxp lots)、正態(tài)分布檢驗(yàn)Q-Q概率圖、分層圖(Sp read vs level p lot)等方法對(duì)數(shù)據(jù)進(jìn)行探索分析。本文使用“箱圖(Boxp lots)”對(duì)應(yīng)用基低位發(fā)熱量指標(biāo)進(jìn)行分析,其它指標(biāo)分析的方法和過程與此相似。
依次單擊菜單“Analyze”→“Descriptive Statistics”→“Exp lore”,打開“Explore(探索分析)”對(duì)話框,將應(yīng)用基低位發(fā)熱量選擇到“Dependent List”,其它選項(xiàng)使用默認(rèn)值,如圖2所示。單擊“OK”按鈕,計(jì)算結(jié)果見圖3。從圖3中可以看出,應(yīng)用基低位發(fā)熱量有2個(gè)奇異值(圖中用“○”表示):第84組和第91組數(shù)據(jù),必須將其剔除,如果箱圖中出現(xiàn)“★”,則表示該記錄是極端值,也必須剔除。同樣,對(duì)其它各項(xiàng)指標(biāo)也進(jìn)行探索分析。這個(gè)過程可能要重復(fù)幾次。最后得到80組數(shù)據(jù)進(jìn)行相關(guān)性分析和回歸分析。
2.4.1 繪制散點(diǎn)圖
本文僅給出繪制干基灰分和應(yīng)用基低位發(fā)熱量?jī)蓚€(gè)指標(biāo)散點(diǎn)圖的方法和過程。依次單擊菜單“Graphs”→“Scatter/Dot”,打開“Scatter/Dot”對(duì)話框,選擇簡(jiǎn)單散點(diǎn)圖(Simp le Scatter),點(diǎn)擊“Define”按鈕,打開“Simp le Scatterp lot”對(duì)話框,將應(yīng)用基低位發(fā)熱量選擇到Y(jié) A xis(Y軸),將干基灰分選擇到X Axis(X軸),其它選項(xiàng)使用默認(rèn)值,單擊“OK”按鈕,繪制的散點(diǎn)圖如圖4所示??梢钥闯?干基灰分和應(yīng)用基低位發(fā)熱量具有很強(qiáng)的負(fù)線性相關(guān)關(guān)系,相關(guān)系數(shù)的平方值為0.986。
2.4.2 使用“二元相關(guān)分析”分析煤質(zhì)各指標(biāo)的相關(guān)性
依次單擊菜單“Analyze”→“Correlate”→“Bivariate”,打開“Bivariate Correlations”對(duì)話框,限于篇幅,本文僅選取分析基水分、干基灰分、應(yīng)用基低位發(fā)熱量3個(gè)指標(biāo)來(lái)計(jì)算相關(guān)系數(shù),將這些指標(biāo)選擇到“Variables”中,其它選項(xiàng)使用默認(rèn)值。單擊“OK”按鈕,計(jì)算這些指標(biāo)之間的相關(guān)系數(shù),計(jì)算結(jié)果見表2。由表2可以看出,在顯著性水平0.01下,應(yīng)用基低位發(fā)熱量與其它指標(biāo)顯著相關(guān)(表中用**標(biāo)示)。其中,應(yīng)用基低位發(fā)熱量與干基灰分具有很強(qiáng)的負(fù)相關(guān)關(guān)系,相關(guān)系數(shù)為-0.993。因此,可以建立應(yīng)用基低位發(fā)熱量與其它指標(biāo)之間的回歸模型。
依次單擊菜單“Analyze”→“Regression”→“Linear...”,打開“Linear Regression”對(duì)話框,將應(yīng)用基低位發(fā)熱量選擇到“Dependent(因變量)”中,將分析基水分、干基灰分選擇到“Independent(s)(自變量)”中,在“Method”中選擇向前篩選策略“Forward”,其它選項(xiàng)使用默認(rèn)值。單擊“OK”按鈕,得到模型綜述結(jié)果、方差分析表(見表3)和模型系數(shù)表(見表4)。模型綜述結(jié)果顯示,回歸過程只選擇了與因變量具有最高線性相關(guān)系數(shù)的干基灰分作為自變量,而自變量分析基水分沒有通過回歸方程的檢驗(yàn),不能進(jìn)入回歸方程,因此,本例只得到了一個(gè)回歸模型,即回歸模型1,其相關(guān)系數(shù)R=0.995,說(shuō)明因變量應(yīng)用基低位發(fā)熱量與自變量干基灰分相關(guān)性很強(qiáng);擬合優(yōu)度ˉR2=0.989,說(shuō)明自變量可以解釋因變量98.9%的變異性;從表3中可以看出,F統(tǒng)計(jì)量的顯著性概率Sig..=0.000,小于置信度0.05,說(shuō)明因變量和自變量的線性關(guān)系是顯著的,可建立線性回歸方程;從表4中可以看出,回歸模型的常數(shù)項(xiàng)為30.536,自變量的回歸系數(shù)為-0.352,t統(tǒng)計(jì)量的顯著性概率Sig.=0.000,小于置信度0.05,同樣說(shuō)明因變量和自變量的線性關(guān)系是顯著的。因此,得到回歸模型:
應(yīng)用基低位發(fā)熱量=30.536-0.352×干基灰分。
因此,使用該回歸模型可以對(duì)應(yīng)用基低位發(fā)熱量進(jìn)行預(yù)測(cè)。
表2 煤質(zhì)各指標(biāo)的相關(guān)系數(shù)表
表3 方差分析表
表4 模型系數(shù)表
本文以某露天煤礦的7#煤層的煤質(zhì)數(shù)據(jù)作為研究對(duì)象,詳細(xì)介紹了SPSS軟件在煤質(zhì)指標(biāo)數(shù)據(jù)處理、相關(guān)性分析和回歸分析中的使用方法和過程,為廣大礦山地質(zhì)工作者處理大量復(fù)雜數(shù)據(jù)提供一種簡(jiǎn)便易行的方法。
[1] 唐云杰.淺析煤的發(fā)熱量與灰分的對(duì)應(yīng)關(guān)系[J].中國(guó)煤炭,2004(11)
[2] 劉治青.煤中灰分與發(fā)熱量相關(guān)性和回歸方程[J].山西焦煤科技,2006(4)
[3] 陳洪博,白向飛,羅隕飛.煤的發(fā)熱量與水分、灰分的關(guān)系研究[J].煤質(zhì)技術(shù),2010(4)
[4] 馮桂東.用回歸方法研究煤的灰分、水分與發(fā)熱量的關(guān)系[J].江蘇煤炭,2001(1)
[5] 譚榮波,梅曉仁.SPSS統(tǒng)計(jì)分析實(shí)用教程[M].北京:科學(xué)出版社,2007
[6] 薛薇.SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2004
[7] 高祥寶,董寒青.數(shù)據(jù)分析與SPSS應(yīng)用[M].北京:清華大學(xué)出版社,2007
Correlative factors analysis and regression model research on coal calorific value using SPSS software
Mei Xiaoren1,Chen Peng2,Gao Yongsheng3
(1.Business School,Zhanjiang Normal University,Zhanjiang,Guangdong 524048,China;2.College of Resource and Environment Engineering,Liaoning Technical University,Fuxin,Liaoning 123000,China;3.Safety Supervision Bureau,Shenhua Group Corporation Limited,Dongcheng,Beijing 100011,China)
The coal quality data of No.7 coal mine of one open pit mine were analyzed using the Exp lore and Correlation Analysis functions of SPSS.It was concluded that the coal quality data of the dry ash and the low calorific value have strong negative linear correlation.The linear model of the two indexes w as built using the Linear Regression function of SPSS.The results show that the regression model can be used to forecast low calorific value of the coal seam.
calorific value,correlation analysis,regression model,SPSS
TQ533
A
廣東省自然科學(xué)基金項(xiàng)目(10452404801006352);湛江師范學(xué)院博士專項(xiàng)研究項(xiàng)目(ZW 5611)
梅曉仁(1973-),男,博士后,講師,現(xiàn)在湛江師范學(xué)院商學(xué)院從事企業(yè)管理、管理信息系統(tǒng)、礦業(yè)系統(tǒng)優(yōu)化研究。
(責(zé)任編輯 張毅玲)