孫珊珊
摘 要: 針對當前房地產(chǎn)價格預(yù)測精度低的難題,提出基于數(shù)據(jù)挖掘的房地產(chǎn)價格預(yù)測模型。首先對當前房地產(chǎn)價格預(yù)測研究的現(xiàn)狀進行分析,指出房地產(chǎn)價格變化的混沌性和隨機性;然后采用混沌理論對數(shù)據(jù)進行預(yù)處理,重建房地產(chǎn)價格預(yù)測模型的樣本,并采用相關(guān)向量機建立房地產(chǎn)價格預(yù)測模型;最后采用房地產(chǎn)價格數(shù)據(jù)進行驗證性測試。該模型可以描述房地產(chǎn)價格歷史數(shù)據(jù)中隱藏的變化特點,獲得了比其他模型更優(yōu)的房地產(chǎn)價格預(yù)測結(jié)果。
關(guān)鍵詞: 房地產(chǎn)市場; 價格預(yù)測; 混沌性變化; 非線性擬合
中圖分類號: TN911?34; TP391 文獻標識碼: A 文章編號: 1004?373X(2017)05?0126?04
Abstract: Since the prediction accuracy of the current real estate price is low, a real estate price forecasting model based on data mining is proposed. The study situation of the current real estate price prediction is analyzed to point out the chaos characteristics and randomness of the real estate price variation. The chaos theory is used to preprocess the data, and reconstruct the samples of the real estate price prediction model. The relevance vector machine is adopted to set up the real estate price prediction model. The data of the real estate price is employed to conduct the verification test. The model can describe the hidden change characteristics existing in the historical data of the real estate price, and obtain a better prediction result than that of other models.
Keywords: real estate market; price forecast; chaos change; nonlinear fitting
0 引 言
隨著經(jīng)濟不斷發(fā)展和城市化進程的加快,房地產(chǎn)市場異?;顒?,房地產(chǎn)價格不斷上升,同時房地產(chǎn)價格還受到一個地區(qū)的經(jīng)濟、國家政策以及綜合影響,房地產(chǎn)價格有時會出現(xiàn)一定的下降,因此房地產(chǎn)價格變化具有一定的規(guī)律性和隨機性[1]。對房地產(chǎn)價格進行預(yù)測,可以幫助政府和企業(yè)掌握一個地區(qū)、國家的房地產(chǎn)市場變化趨勢,維護社會安全和團結(jié),因此房地產(chǎn)價格建模與分析成為當前房地產(chǎn)市場中一個十分活躍的研究方向[2]。
為了有效地對房地產(chǎn)價格進行預(yù)測,人們對其進行相關(guān)分析和研究,房地產(chǎn)價格預(yù)測模型大致可以劃分為兩個階段:傳統(tǒng)預(yù)測模型階段和現(xiàn)代預(yù)測模型階段[3],傳統(tǒng)模型主要有多元線性回歸法,它通過擬合房地產(chǎn)價格的影響因子與房地產(chǎn)價格之間的變化關(guān)系,確定回歸模型的相關(guān)參數(shù)值,從而對房地產(chǎn)價格將來的變化趨勢進行估計,為房地產(chǎn)價格預(yù)測做出了一定的貢獻,然而該類模型缺陷十分明顯,因為假設(shè)房地產(chǎn)價格永遠呈直線上升趨勢,這與房地產(chǎn)價格的實際變化特點不相符,這主要是由于房地產(chǎn)價格的影響因素很多,因素間又相互影響以及干擾,導(dǎo)致房地產(chǎn)價格具有周期性,同時具有隨機性,甚至具有一定的混沌特性[4?5]?,F(xiàn)代模型主要針對房地產(chǎn)價格的隨機性和混沌性進行建模,主要有神經(jīng)網(wǎng)絡(luò)、支持向量機等,可以反映房地產(chǎn)價格的隨機性以及混沌性,獲得了比傳統(tǒng)模型更優(yōu)的房地產(chǎn)價格的預(yù)測結(jié)果[6?8]。
相關(guān)向量機(Relevance Vector Machine,RVM)是基于現(xiàn)代統(tǒng)計學理論的數(shù)據(jù)挖掘技術(shù),集成了神經(jīng)網(wǎng)絡(luò)學習效率高和支持向量機預(yù)測效果好的優(yōu)點,在網(wǎng)絡(luò)流量、經(jīng)濟時間序列等領(lǐng)域取得了不錯的應(yīng)用效果,為房地產(chǎn)價格預(yù)測提供了一種新的建模工具[9]。為了進一步提高房地產(chǎn)價格預(yù)測精度,本文提出基于數(shù)據(jù)挖掘的房地產(chǎn)價格預(yù)測模型。
1 房地產(chǎn)價格預(yù)測模型的總體設(shè)計
一個地區(qū)的房地產(chǎn)價格受到一系列因素的綜合影響,價格波動范圍很大,通常根據(jù)時間先后對房地產(chǎn)價格數(shù)據(jù)進行收集,它們組合成為一個時間序列[{x1,x2,…,xn},]當前時間點的房地產(chǎn)價格[xi]可能與[d]個相近時間點的房地產(chǎn)價格之間有一定的關(guān)聯(lián),因此可以將[d]個相近房地產(chǎn)價格值作為[xi]的輸入,構(gòu)建如下的數(shù)學模型:
擬合函數(shù)[f( )]的選擇直接決定了房地產(chǎn)價格預(yù)測結(jié)果的好壞,為了解決神經(jīng)網(wǎng)絡(luò)預(yù)測精度低、過擬合和支持向量機學習效率低的缺陷,本文采用性能優(yōu)異的相關(guān)向量機作為[f( )],建立整體性能優(yōu)異的房地產(chǎn)價格預(yù)測模型,其總體框架如圖1所示。
2 相關(guān)向量機描述
(2) 針對房地產(chǎn)價格的混沌性和隨機性,采用混沌理論確定其輸入向量數(shù)量,重建房地產(chǎn)價格學習樣本。
(3) 采用RBF函數(shù)作為相關(guān)向量機的核函數(shù),將訓(xùn)練集輸入到相關(guān)向量機進行學習,并對相關(guān)參數(shù)進行優(yōu)化,建立房地產(chǎn)價格模型。
4 房地產(chǎn)價格預(yù)測的實證分析
4.1 房地產(chǎn)價格數(shù)據(jù)
為了測試數(shù)據(jù)挖掘的房地產(chǎn)價格預(yù)測效果,采用某地區(qū)近10年的房地產(chǎn)價格數(shù)據(jù)作為研究對象,共有120個時間序列點,具體見圖2。最近的50個時間序列點作為驗證集,其他時間序列點用于建立房地產(chǎn)價格預(yù)測模型。
4.2 估計輸入向量的數(shù)量
由于房地產(chǎn)價格數(shù)據(jù)的混沌性較弱,因此采用關(guān)聯(lián)維法估計輸入向量的數(shù)量,結(jié)果如圖3所示。
對圖3進行分析可以清楚地看出,當輸入向量數(shù)據(jù)的數(shù)量達到7時,此時房地產(chǎn)價格的關(guān)聯(lián)維數(shù)已經(jīng)不再發(fā)生變化,十分穩(wěn)定,即該房地產(chǎn)價格的最優(yōu)輸入向量數(shù)為7,這表示當前時間點的房地產(chǎn)價格值受到最近7個時間點房地產(chǎn)價格的影響,否則重建房地產(chǎn)價格的時間序列。
4.3 實驗結(jié)果
50個房地產(chǎn)價格驗證樣本的單步預(yù)測結(jié)果如圖4所示,對圖4中的房地產(chǎn)價格預(yù)測結(jié)果進行分析可以發(fā)現(xiàn),采用數(shù)據(jù)挖掘技術(shù)可以發(fā)現(xiàn)房地產(chǎn)價格的變化特點,得到了較高的預(yù)測精度,而且房地產(chǎn)價格的預(yù)測偏差變化幅度小,變化十分平穩(wěn),這表明房地產(chǎn)價格預(yù)測結(jié)果是可靠的,有一定的實際應(yīng)用價值。
房地產(chǎn)價格的建模與預(yù)測主要是對將來房地產(chǎn)價格的變化趨勢進行把握,單步預(yù)測結(jié)果的實際應(yīng)用范圍有一定的局限性,因此需要進行多步提前的房地產(chǎn)價格預(yù)測,本文模型的提前4步房地產(chǎn)價格預(yù)測結(jié)果如圖5所示。對圖5的多步房地產(chǎn)價格預(yù)測結(jié)果進行分析可知,本文模型的多步房地產(chǎn)價格預(yù)測誤差明顯要大于單步預(yù)測誤差,預(yù)測精度相應(yīng)降低,然而房地產(chǎn)價格整體趨勢預(yù)測好可以幫助人們了解房地產(chǎn)價格市場的變化趨勢,具有十分重要的應(yīng)用價值。
為了進一步分析數(shù)據(jù)挖掘的房地產(chǎn)價格建模與預(yù)測優(yōu)越性,采用多元線性回歸法、支持向量機[10]、BP神經(jīng)網(wǎng)絡(luò)[11]對相同數(shù)據(jù)進行建模與預(yù)測,統(tǒng)計它們的預(yù)測精度和執(zhí)行時間,結(jié)果如表1所示。
對從表1的預(yù)測精度和執(zhí)行時間進行分析,可以得到如下結(jié)論:
(1) 在所有模型中,多元線性回歸法的建模速度比較快,房地產(chǎn)價格預(yù)測誤差最大,預(yù)測精度最低,是因為其屬于線性建模方法,雖然估計參數(shù)效率快,但是只能描述房地產(chǎn)價格的線性變化特點,無法反映房地產(chǎn)價格變化的隨機性,預(yù)測結(jié)果不可靠。
(2) BP神經(jīng)網(wǎng)絡(luò)、支持向量機的房地產(chǎn)價格預(yù)測精度要高于多元線性回歸法的預(yù)測精度,這是因為神經(jīng)網(wǎng)絡(luò)和支持向量機屬于非線性建模方法,可以對房地產(chǎn)價格隨機性變化特點進行描述,更好地把握了房地產(chǎn)價格的變化趨勢,然而支持向量機的建模時間太長,BP神經(jīng)網(wǎng)絡(luò)有個別時間點的房地產(chǎn)價格預(yù)測誤差比較大。
(3) 本文模型的房地產(chǎn)價格預(yù)測精度要高于對比模型,這是由于本文模型不存在多元線性回歸法只能預(yù)測線性變化特點的局限性,同時克服神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果不穩(wěn)定,不會出現(xiàn)支持向量機計算時間復(fù)雜度高的問題,且執(zhí)行效率要遠遠高于支持向量機,獲得了更加理想的房地產(chǎn)價格預(yù)測結(jié)果。
5 結(jié) 語
房地產(chǎn)價格的建模與預(yù)測具有十分重要的實際應(yīng)用意義,為了避免當前房地產(chǎn)價格預(yù)測模型存在的局限性,設(shè)計了基于數(shù)據(jù)挖掘技術(shù)的房地產(chǎn)價格預(yù)測模型,采用混沌理論對房地產(chǎn)價格數(shù)據(jù)進行預(yù)處理,確定房地產(chǎn)價格預(yù)測模型的輸入向量,然后采用相關(guān)向量機描述房地產(chǎn)價格的隨機性變化特點,最后通過仿真對比實驗結(jié)果表明,本文模型的房地產(chǎn)價格預(yù)測精度要高于當前其他經(jīng)典的房地產(chǎn)價格預(yù)測模型,而且執(zhí)行效率也具有一定的優(yōu)勢,在房地產(chǎn)市場管理中具有廣泛的應(yīng)用前景。
參考文獻
[1] 柳冬,王雯珺,汪壽陽.我國房地產(chǎn)價格影響要素分析與趨勢預(yù)測[J].經(jīng)濟與金融,2011,22(5):3?11.
[2] 周海波.房地產(chǎn)價格影響因素的實證研究[J].海南大學學報,2009,27(5):537?543.
[3] ANUNDSEN A K, JANSEN E S. Self?reinforcing effects between housing prices and credit [J]. Journal of housing econo?mics, 2013, 22(3): 192?212.
[4] 武田艷,占建軍,嚴韋.基于MIV?BP型網(wǎng)絡(luò)實驗的房地產(chǎn)價格影響因素研究[J].數(shù)學的實踐與認識,2015,45(18):43?50.
[5] 周亮,周正.基于時間序列的房地產(chǎn)價格指數(shù)預(yù)測方法探討[J].哈爾濱商業(yè)大學學報(社會科學版),2008(2):80?83.
[6] 楊勵雅,邵春福.基于BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的城市軌道交通周邊房地產(chǎn)價格的組合預(yù)測方法[J].吉林大學學報(工學版),2008,38(3):514?519.
[7] 李萬慶,張金水,孟文清.基于小波神經(jīng)網(wǎng)絡(luò)的房地產(chǎn)價格指數(shù)預(yù)測研究[J].河北工業(yè)大學學報(自然科學版),2008,25(1):74?76.
[8] 何芳,王小川,肖森予,等.基于MIV?BP型網(wǎng)絡(luò)實驗的房地產(chǎn)項目風險識別研究[J].運籌與管理,2013,22(2):229?234.
[9] 楊柳,張磊,張少勛,等.單核和多核相關(guān)向量機的比較研究[J].計算機工程,2010,36(12):195?197.
[10] 梁坤,聶會星,徐樅巍.基于支持向量機的北京市房地產(chǎn)價格指數(shù)預(yù)測[J].合肥工業(yè)大學學報,2011,34(4):588?592.
[11] 李大營,許偉,陳榮秋.基于粗糙集和小波神經(jīng)網(wǎng)絡(luò)模型的房地產(chǎn)價格走勢預(yù)測研究[J].經(jīng)濟與金融,2009,21(11):18?22.