国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多元線性回歸模型在北京市用水量預(yù)測(cè)中的應(yīng)用

2016-01-14 01:35:28朱蘋
科教導(dǎo)刊 2015年34期
關(guān)鍵詞:R語(yǔ)言多元線性回歸主成分分析

朱蘋

摘 要 本文利用多元線性回歸方法對(duì)北京市自來水總銷售量數(shù)據(jù)進(jìn)行建模。用主成分分析產(chǎn)生以北京市國(guó)民生產(chǎn)總值、常住人口數(shù)、污水處理率、年降水量、城市綠化覆蓋率為原始變量的線性組合作為主成分,而后利用比較標(biāo)準(zhǔn),建立“最優(yōu)”的回歸方程。模型通過殘差圖檢驗(yàn)可知回歸效果良好,具有預(yù)測(cè)能力。本文的建模方法以及模型為較準(zhǔn)確地預(yù)測(cè)北京市自來水總銷售量提供參考。

關(guān)鍵詞 自來水總銷售量 主成分分析 多元線性回歸 R語(yǔ)言

中圖分類號(hào):TV213.4 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdks.2015.12.076

Application of Multivariate Linear Regression Model

in Predict the Amount of Water in Beijing

ZHU Ping

(School of Science, Beijing Technology and Business University, Beijing 100048)

Abstract In this paper, the use of multiple linear regression method of Beijing Waterworks total sales data modeling. Beijing produced GDP, the resident population, the sewage treatment rate, annual rainfall, urban green coverage to a linear set of original variables of cooperation as the main ingredient, then the use of comparative standards, establish "optimal" principal component analysis of the regression equation. Model tested by residual plot shows that the return to good effect, with the predictive ability. Modeling methods and model reference herein to more accurately predict the Beijing Waterworks total sales.

Key words total sales of tap water; principal component analysis; multiple linear regression; R language

0 引言

水是人類賴以生存和發(fā)展的最重要的物質(zhì)資源之一。豐富的可利用水資源有利于加速城市發(fā)展和強(qiáng)化其容納能力,保障社會(huì)、經(jīng)濟(jì)、生態(tài)的可持續(xù)發(fā)展,促進(jìn)和諧社會(huì)建設(shè)。城市自來水總銷售量可以反映城市用水的長(zhǎng)期需求,因而準(zhǔn)確地預(yù)測(cè)城市自來水總銷售量,不僅有利于水資源的合理分配,而且為保障充足的城市生活用水量提供參考依據(jù)。在城市的發(fā)展和規(guī)劃中,政府始終對(duì)更加準(zhǔn)確地預(yù)測(cè)城市自來水總銷售量十分重視。在國(guó)內(nèi)外學(xué)者針對(duì)城市用水需求量預(yù)測(cè)的學(xué)術(shù)研究中,應(yīng)用的預(yù)測(cè)方法包括用水定額法、解釋性預(yù)測(cè)方法、灰色預(yù)測(cè)、時(shí)間序列分析法以及人工神經(jīng)網(wǎng)絡(luò)法等。本文選取北京市1985~2012年共28年的北京市自來水總銷售量數(shù)據(jù),并針對(duì)影響北京市自來水使用量的因素及其數(shù)據(jù)進(jìn)行收集處理,采用多元線性回歸法預(yù)測(cè)北京市自來水銷售總量,并取得較好的預(yù)測(cè)結(jié)果。

1 理論與概述

1.1 主成分分析①

主成分分析是通過降維技術(shù)把多個(gè)變量化成少數(shù)幾個(gè)主成分的方法。這些主成分表示為原始變量的線性組合,并且能夠反映原始變量的絕大部分信息。主成分的表達(dá)式:

= + +…+

= + +…+

= + +…+

其中,原始變量的標(biāo)準(zhǔn)化變量為,線性組合的系數(shù)稱為因子負(fù)荷量。主成分按其對(duì)反映原始數(shù)據(jù)信息特征的貢獻(xiàn)率大小排序?yàn)椋?>…>。

1.2 多元線性回歸分析②

在許多實(shí)際問題中影響因變量的自變量往往不止一個(gè),通常設(shè)為≥2個(gè),此時(shí)可以采用多元線性回歸模型:

設(shè)變量與變量,,…,間有線性關(guān)系 = + + … + + ,其中~(0,), ,,…,,和是未知參數(shù)。

2 多元線性回歸模型的建立

2.1 變量選取與原始數(shù)據(jù)

城市生活中的自來水主要通過自來水處理廠汲取江河湖泊及地下水、地表水,經(jīng)過凈化、消毒等工藝流程的處理,最后通過配水泵站輸送供人們生活、生產(chǎn)使用。城市的國(guó)民生產(chǎn)總值反映一個(gè)城市的經(jīng)濟(jì)水平,由于城市自來水滿足著人們對(duì)生產(chǎn)運(yùn)營(yíng)用水、公共服務(wù)用水以及居民家庭用水的需求,因而其總銷售量與城市的經(jīng)濟(jì)發(fā)展水平有著密不可分的關(guān)聯(lián),城市自來水需求總量越大可反映這個(gè)城市的經(jīng)濟(jì)發(fā)展較為迅速;城市的常駐人口數(shù)對(duì)居民家庭用水需求量有著決定性的影響;污水處理率可以反映城市的節(jié)水能力,處理率的提高有助于水資源的循環(huán)利用;城市的用水總量可能與城市的年降水量成負(fù)相關(guān),由于降水可減少農(nóng)作物灌溉、公共綠地噴灑、市政道路清潔作業(yè)等用水需求;城市綠化覆蓋率可以反映城市生態(tài)環(huán)境狀況,綠化覆蓋率的增加雖然會(huì)增加公共綠地澆灑的用水需求量,但同時(shí)可以保護(hù)水資源并改善生態(tài)環(huán)境。

綜合分析,選取北京市自來水總銷售量作為因變量,對(duì)北京市自來水總銷售量產(chǎn)生較多影響的五個(gè)影響因素作為自變量,分別為北京市國(guó)民生產(chǎn)總值(GDP)、北京市常住人口數(shù)、污水處理率、年降水量、城市綠化覆蓋率。利用1985~2007年數(shù)據(jù)③ 建立多元線性回歸模型,2008~2012年數(shù)據(jù)檢驗(yàn)?zāi)P皖A(yù)測(cè)能力。

2.2 數(shù)據(jù)的處理

數(shù)據(jù)說明:令為北京市國(guó)民生產(chǎn)總值(GDP)(單位:億元)、為北京市常住人口數(shù)(單位:萬人)、污水處理率(單位:%)、年降水量(單位:毫米)、城市綠化覆蓋率(單位:%)和自來水銷售總量(單位:萬)。

數(shù)據(jù)處理:通過觀察數(shù)據(jù)標(biāo)準(zhǔn)化后的散點(diǎn)圖和復(fù)相關(guān)系數(shù)及其對(duì)應(yīng)檢驗(yàn)的值,得知自變量間存在共線性問題。利用主成分分析的方法,解決變量之間的多重共線性問題(表1)。

表1 主成分分析結(jié)果

由載荷因子矩陣得:

= 0.4660.4780.470+0.3510.459,

= 0.2660.1650.2030.926,

= 0.363+0.4160.1310.82,

= 0.7580.2370.603,

= 0.826+0.449+0.332。

如圖1所示,利用主成分分析的方法,變量之間的多重共線性問題成功得到解決,同時(shí)得到5個(gè)自變量的主成分分析數(shù)據(jù)。

2.3 模型的選擇

“最優(yōu)”的回歸方程:利用比較標(biāo)準(zhǔn),建立“最優(yōu)”的回歸方程。

圖1 Y和主成分,,,,的散點(diǎn)圖

圖2 關(guān)于,回歸系數(shù)的檢驗(yàn)結(jié)果

(下轉(zhuǎn)第190頁(yè))(上接第168頁(yè))

表2 回歸子集及相應(yīng)的,,,:

通過以上實(shí)驗(yàn)結(jié)果(表2),根據(jù)這樣的格式較大,的值較小并且與自變量個(gè)數(shù)較接近,較小,的值較小的回歸方程較優(yōu)的比較標(biāo)準(zhǔn),進(jìn)行回歸的效果對(duì)比。④

從上述結(jié)果可知(圖2)所建立回歸模型顯著。“最優(yōu)”的回歸方程如下:

= 8.740?.38021.231

經(jīng)變換得到原坐標(biāo)下的關(guān)系表達(dá)式:

= 0.505+0.385+0.429+1.006+0.175

3 模型的檢驗(yàn)

如圖3殘差分析圖所示說明該模型回歸效果良好。

表3 預(yù)測(cè)值的相對(duì)誤差

如表3所示,通過利用2008~2012年數(shù)據(jù)對(duì)模型預(yù)測(cè)能力進(jìn)行檢驗(yàn),所得相對(duì)誤差足夠小,說明模型有效并具備預(yù)測(cè)能力。

4 結(jié)論

從以上分析可以看出,通過主成分分析解決了因變量之間嚴(yán)重的復(fù)共線性問題,利用全部主成分選擇建立“最優(yōu)”回歸方程,模型通過顯著性檢驗(yàn)并能夠用來預(yù)測(cè)。目前,北京市持續(xù)發(fā)展著供水水源多元化的格局,用以保障人們正常的生產(chǎn)、生活用水需求,但由于北京市人口數(shù)量已超負(fù)荷,使得北京市人均水資源占有量遠(yuǎn)低于國(guó)際人均水資源占有量的重度缺水標(biāo)準(zhǔn)。長(zhǎng)期以來自來水供求關(guān)系緊張的實(shí)際情況解釋了建立模型中所求參數(shù)均大于零的現(xiàn)象,GDP、人口數(shù)量和綠化覆蓋率的增長(zhǎng)會(huì)增加用水需求,污水處理率、年降水量的增長(zhǎng)有助于豐富水資源的同時(shí)增加自來水的供應(yīng)量,從而提高自來水總銷售量。本文通過科學(xué)的方法為較準(zhǔn)確地預(yù)測(cè)北京市自來水總銷售量提供參考。

注釋

① 薛毅.R統(tǒng)計(jì)建模與R軟件[M].清華大學(xué)出版社,2007:423-441.

② 王惠文.多元線性回歸的預(yù)測(cè)建模方法[J].北京航空航天大學(xué)學(xué)報(bào),2007.33(4):500-504.

③ 中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局,中國(guó)統(tǒng)計(jì)年鑒[M].中國(guó)統(tǒng)計(jì)出版社,2003-2012.

④ 肖枝洪.多元統(tǒng)計(jì)分析及其R實(shí)現(xiàn)[M].科學(xué)出版社,2013:69-82.

猜你喜歡
R語(yǔ)言多元線性回歸主成分分析
基于GPS軌跡數(shù)據(jù)進(jìn)行分析改善城市交通擁擠
基于組合模型的卷煙市場(chǎng)需求預(yù)測(cè)研究
基于多元線性回歸分析的冬季鳥類生境選擇研究
基于R語(yǔ)言的Moodle平臺(tái)數(shù)據(jù)挖掘技術(shù)的研究
我國(guó)上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實(shí)證研究
云學(xué)習(xí)平臺(tái)大學(xué)生學(xué)業(yè)成績(jī)預(yù)測(cè)與干預(yù)研究
主成分分析法在大學(xué)英語(yǔ)寫作評(píng)價(jià)中的應(yīng)用
江蘇省客源市場(chǎng)影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
考試周刊(2016年84期)2016-11-11 23:57:34
長(zhǎng)沙建設(shè)國(guó)家中心城市的瓶頸及其解決路徑
武川县| 巧家县| 屏东市| 阿图什市| 岑溪市| 伊宁县| 广丰县| 万山特区| 太和县| 丹棱县| 安康市| 辽宁省| 建阳市| 泌阳县| 常宁市| 荆州市| 额尔古纳市| 正安县| 昭平县| 安陆市| 乌拉特中旗| 喀喇| 阳朔县| 昌乐县| 泰兴市| 玉田县| 垫江县| 中阳县| 横峰县| 腾冲县| 原平市| 宜章县| 安西县| 太和县| 巨野县| 阳朔县| 白水县| 墨江| 长海县| 清水河县| 宁城县|