国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于ARMA模型的房地產(chǎn)銷售趨勢預(yù)測方法研究

2019-09-24 02:00鄧佳雯陳繼紅
電腦知識與技術(shù) 2019年19期

鄧佳雯 陳繼紅

摘要:數(shù)據(jù)挖掘是指從大量的、客觀的、有噪聲的、隨機(jī)的數(shù)據(jù)中,通過算法提取隱含在其中的信息。隨著房地產(chǎn)行業(yè)的不斷發(fā)展,數(shù)據(jù)量越來越龐大,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于房地產(chǎn)行業(yè),對銷售數(shù)據(jù)進(jìn)行處理和分析,從真正意義上體現(xiàn)數(shù)據(jù)的價值。本文以江蘇省某市房地產(chǎn)數(shù)據(jù)為案例進(jìn)行定量研究展示建模過程,基于ARMA模型并結(jié)合加權(quán)最小二乘法對模型進(jìn)行改進(jìn)。研究結(jié)果表明加權(quán)最小二乘法與ARMA模型的適應(yīng)性較好,且優(yōu)化模型在預(yù)測精度上有明顯的提高。旨在掌握行業(yè)目前所處態(tài)勢,并為房地產(chǎn)行業(yè)的開發(fā)計劃和營銷策略提供決策性指導(dǎo)。

關(guān)鍵詞:自回歸滑動平均模型;加權(quán)最小二乘法;單位根檢驗(yàn);房地產(chǎn)銷售數(shù)據(jù);趨勢預(yù)測

中圖分類號:TP391? ? ? 文獻(xiàn)標(biāo)識碼:A

文章編號:1009-3044(2019)19-0228-05

Abstract: Data mining refers to the extraction of implicit information from a large number of objective, noisy and random data through algorithms. With the continuous development of the real estate industry, the amount of data is getting larger and larger. The data mining technology is applied to the real estate industry to process and analyze the sales data, so as to truly reflect the value of data. In this paper, a real estate data of a city in jiangsu province is taken as a case to conduct a quantitative study to demonstrate the modeling process. The model is improved based on ARMA model and combined with weighted least square method. The result shows that the weighted least square method and ARMA model have good adaptability, and the optimization model has a significant improvement in the prediction accuracy. It aims to grasp the current situation of the industry and provide decision-making guidance for the development plan and marketing strategy of the real estate industry.

Key words: ARMA model; weighted least square estimate; ADF test;real estate sales data; trend prediction

國家統(tǒng)計局?jǐn)?shù)據(jù)顯示,房地產(chǎn)行業(yè)在稅收中的占比基本保持在百分之十五左右,占國民生產(chǎn)總值的份額也呈逐年遞增態(tài)勢,在國民經(jīng)濟(jì)發(fā)展中的重要性不言而喻。隨著房地產(chǎn)行業(yè)的不斷發(fā)展,房地產(chǎn)行業(yè)數(shù)據(jù)量越來越龐大,由于技術(shù)手段的不足,傳統(tǒng)的數(shù)據(jù)處理方式不能對收集的數(shù)據(jù)進(jìn)行科學(xué)、有效地加工和處理,影響當(dāng)前數(shù)據(jù)分析以及未來數(shù)據(jù)趨勢的預(yù)測,致使決策失誤。眾所周知,隨著管理體制的不斷深化改革,作為典型的數(shù)據(jù)密集型行業(yè),房地產(chǎn)行業(yè)的競爭也越來越激烈。與其他行業(yè)相比,房地產(chǎn)行業(yè)負(fù)載著更多的數(shù)據(jù)。誰能準(zhǔn)確地分析數(shù)據(jù),誰就能提供更好的服務(wù),從而獲得更多的機(jī)會,在市場競爭中取勝。房地產(chǎn)行業(yè)的分析樣本數(shù)據(jù)集來源于行業(yè)服務(wù)支撐系統(tǒng),包括房源信息,開發(fā)信息,銷售信息,賬務(wù)信息,客戶信息等,涵蓋了所有的業(yè)務(wù)信息。由于房地產(chǎn)行業(yè)的某些數(shù)據(jù)存在實(shí)時性和波動性,如此海量的數(shù)據(jù)如果沒有得到有效的分析和處理,數(shù)據(jù)的價值將無法體現(xiàn),因此亟需合理有效的預(yù)測手段。

1 房地產(chǎn)預(yù)測研究方法

文獻(xiàn)[1]中將馬爾科夫鏈的狀態(tài)轉(zhuǎn)移概率應(yīng)用到商品房價格預(yù)測中,在對2009 -2012年北京住房銷售數(shù)據(jù)進(jìn)行處理后,預(yù)測未來6個月的房價走勢。

文獻(xiàn)[2]通過建立VAR模型選取評價指標(biāo)對多倫多房價進(jìn)行預(yù)測,評價指標(biāo)主要有消費(fèi)價格指數(shù)、房價平均增幅的滯后三期、貸款利率等。

文獻(xiàn)[3]中分別用人工神經(jīng)網(wǎng)絡(luò)、Hedonic回歸模型對土耳其的房價進(jìn)行預(yù)測,對比結(jié)果表明人工神經(jīng)網(wǎng)絡(luò)的預(yù)測效果相對較好。

除此之外,張珊玉等人在灰色預(yù)測模型的基礎(chǔ)上加以改進(jìn),對某地區(qū)房價進(jìn)行了預(yù)測,同時也證明了灰色預(yù)測模型在房地產(chǎn)行業(yè)的適用性。

申瑞娜、曹昶基于支持向量機(jī)模型建立預(yù)測模型,并結(jié)合主成份分析法預(yù)測了上海市房價,預(yù)測結(jié)果顯示采用該方法構(gòu)建的模型預(yù)測效果較好。

國內(nèi)外對房價預(yù)測的研究方法主要有人工神經(jīng)網(wǎng)絡(luò)、各類回歸模型以及灰色預(yù)測等,表1列舉了常用的預(yù)測方法,并進(jìn)行對比分析。

表1? 常見預(yù)測方法的比較分析

[方法名稱 適用情況 灰色模型 針對數(shù)據(jù)量少、信息貧乏且不確定性系統(tǒng)進(jìn)行預(yù)測分析 人工神經(jīng)網(wǎng)絡(luò)模型 以神經(jīng)元的數(shù)學(xué)模型為基礎(chǔ)表述,由網(wǎng)絡(luò)拓?fù)?、?jié)點(diǎn)特點(diǎn)和學(xué)習(xí)規(guī)則來表示[4],通過不斷調(diào)整自身權(quán)重反映輸入和輸出的映射關(guān)系,網(wǎng)絡(luò)適應(yīng)能力較強(qiáng)。 隨機(jī)理論模型 常用于分析不確定性問題,主要包括隨機(jī)變量方法和隨機(jī)過程方法 支持向量回歸模型 通過假定預(yù)測,將數(shù)據(jù)分為兩部分,一部分用來建模,一部分用來檢驗(yàn) ARMA 基于時間序列分析,且時間序列是平穩(wěn)的。對異常變化值適應(yīng)性較強(qiáng),精確度高數(shù)據(jù)量較大的情況下運(yùn)行速度很快。 ]

目前房地產(chǎn)數(shù)據(jù)在實(shí)際應(yīng)用中還存在著許多不足,主要表現(xiàn)在:一是研究數(shù)據(jù)源的格式不規(guī)范、存在大量數(shù)據(jù)噪聲,難以確保數(shù)據(jù)的準(zhǔn)確性;二是預(yù)測和分析技術(shù)要適應(yīng)市場的變化,常規(guī)的統(tǒng)計分析方法還遠(yuǎn)遠(yuǎn)不夠;三是預(yù)測維度單一,籠統(tǒng)地分析價格漲幅意義不大。

房地產(chǎn)行業(yè)數(shù)據(jù)預(yù)測有這兩個趨勢,一是將銷售數(shù)據(jù)看作一個時間數(shù)列,選用恰當(dāng)?shù)哪P蛯︿N售趨勢進(jìn)行預(yù)測;二是將房價影響因素建立指標(biāo)體系,從而構(gòu)建預(yù)測模型。文中采用第一種方式,結(jié)合模型適用情況和待預(yù)測數(shù)據(jù)特征,同時為了準(zhǔn)確地預(yù)測銷售趨勢,在經(jīng)過數(shù)據(jù)預(yù)處理操作的基礎(chǔ)上采用ARMA模型構(gòu)建計量經(jīng)濟(jì)學(xué)模型,以客觀真實(shí)的預(yù)測方法進(jìn)行多維度分析討論,排除外在環(huán)境、人口、經(jīng)濟(jì)發(fā)展、季節(jié)等周期性因素的影響,并以某市房地產(chǎn)實(shí)際銷售數(shù)據(jù)為實(shí)例進(jìn)行預(yù)測。本課題涉及的時間序列處理后經(jīng)檢驗(yàn)均具平穩(wěn)性。因此ARMA模型適用于房地產(chǎn)銷售趨勢預(yù)測,理論上預(yù)測精度較高。

2 ARMA模型

自回歸-移動平均混合模型(Autoregressive moving average mode,簡稱ARMA模型)是任何線性時間序列模型的理論方程式[5],是一種常見的隨機(jī)時間序列模型,由自回歸模型和移動平均模型組成的,是對數(shù)據(jù)進(jìn)行預(yù)測的較為客觀科學(xué)的計量經(jīng)濟(jì)學(xué)方法之一[6]。

2.1 ARMA模型的基本思想

基于ARMA模型的房地產(chǎn)銷售趨勢預(yù)測的基本思想是:按時間順序?qū)⒎康禺a(chǎn)銷售變化數(shù)值視為隨機(jī)時間序列,其中待預(yù)測時間序列中第n個值不僅與第(n-1)個值存在關(guān)聯(lián),且與前(n-1)個時刻也存在關(guān)聯(lián),以此來預(yù)測第n個時刻的值[7]。只有預(yù)測對象為零均值的平穩(wěn)隨機(jī)時間序列,才可以使用ARMA建立預(yù)測模型。因此在建模之前,需要對時間序列進(jìn)行差分平穩(wěn)化和零均值處理。

參考文獻(xiàn):

[1] 連星. 太原市商品住宅價格預(yù)測研究[D]. 太原:山西財經(jīng)大學(xué), 2017.

[2] 劉揚(yáng). 哈爾濱市松北區(qū)商品住宅價格預(yù)測研究[D]. 哈爾濱:東北林業(yè)大學(xué), 2016.

[3] 葉桂芳. 基于國房景氣指數(shù)的我國房地產(chǎn)市場發(fā)展趨勢研究[D]. 廣州:暨南大學(xué), 2015.

[4] 和湘, 劉晟, 姜吉國. 基于機(jī)器學(xué)習(xí)的入侵檢測方法對比研究[J]. 信息網(wǎng)絡(luò)安全, 2018, 209(05):7-17.

[5] 章晨, 鄭循剛, 龔沁. 基于ARMA模型的我國房地產(chǎn)價格預(yù)測分析[J]. 生產(chǎn)力研究, 2012(2):27.

[6] Paulo Teles,Paulo S. A. Sousa. The effect of temporal aggregation on the estimation accuracy of ARMA models[J]. Communications in Statistics - Simulation and Computation,2018,47(10):2865-2885.

[7] 李瑞瑩, 康銳. 基于ARMA模型的故障率預(yù)測方法研究[J]. 系統(tǒng)工程與電子技術(shù), 2008, 30(8):1588-1591.

[8] 呂福琴. 基于自回歸和神經(jīng)網(wǎng)絡(luò)算法加權(quán)組合的負(fù)荷預(yù)測[J]. 廣東電力, 2011, 24(5):69-72.

[9] 葉瑰昀, 羅耀華, 劉勇. 基于ARMA模型的電力系統(tǒng)負(fù)荷預(yù)測方法研究[J]. 信息技術(shù), 2002(6):74-76.

[10] Jongoh Nam,Seonghyun Sim. Forecast accuracy of abalone producer prices by shell size in the Republic of Korea: Modified Diebold–Mariano tests of selected autoregressive models[J]. Aquaculture Economics & Management,2018,22(4):474-489.

[11] 趙彥艷. 隨機(jī)時間序列模型在煤炭價格預(yù)測中的應(yīng)用[D]. 濟(jì)南:山東大學(xué), 2010.

[12] 張俊民. 基于特征融合的ARMA短時睡眠狀態(tài)分析研究[D]. 上海:華東理工大學(xué), 2016.

[13] Wu X , Kumar V , Quinlan J R , et al. Top 10 algorithms in data mining[J]. Knowledge and Information Systems, 2008, 14(1):1-37.

[14] Berkhin P. A Survey of Clustering Data Mining Techniques[J]. Grouping Multidimensional Data, 2006, 43(1):25-71.

[15] Rhodes D R, Yu J, Shanker K, et al. ONCOMINE: a cancer microarray database and integrated data-mining platform[J]. Neoplasia, 2004, 6(1):1-6.

【通聯(lián)編輯:梁書】