周子英
(湖南工程學(xué)院 管理學(xué)院,湖南 湘潭 411104)
房地產(chǎn)價(jià)格受到房地產(chǎn)供給、需求以及預(yù)期等多種因素的影響,其價(jià)格的走勢存在一定的規(guī)律性[1]。近年來,由于中國的經(jīng)濟(jì)、城鎮(zhèn)化速度大力推進(jìn),導(dǎo)致房地產(chǎn)價(jià)格處于不斷上漲的態(tài)勢。由于房地產(chǎn)作為一種商品,必然受到供求關(guān)系的影響,此外,房地產(chǎn)作為一種生活的必須品,再加上其又具有保值增值的特性,具有一定的投資性,對消費(fèi)者的心理預(yù)期影響較大,因此,房地產(chǎn)價(jià)格預(yù)測受到了越來越多人的關(guān)注[2]。
針對房地產(chǎn)價(jià)格預(yù)測問題,國內(nèi)外專家進(jìn)行了大量研究,提出許多房地產(chǎn)價(jià)格預(yù)測方法。傳統(tǒng)房地產(chǎn)價(jià)格預(yù)測基于多元回歸預(yù)測法進(jìn)行建模,該方法簡單、易實(shí)現(xiàn),但難以準(zhǔn)確描述房地產(chǎn)價(jià)格的時(shí)變性、非平穩(wěn)性,預(yù)測結(jié)果不理想[2,3]。房地產(chǎn)價(jià)格受到多種因素影響,具有混沌性和周期性,為此,一些學(xué)者提出了基于神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)、隱馬爾科夫鏈、支持向量機(jī)等非線性的房地產(chǎn)價(jià)格預(yù)測模型,獲得比較理想的預(yù)測結(jié)果[4-7]。其中極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)是一種新型的前饋神經(jīng)網(wǎng)絡(luò),根據(jù)Moore-Penrose廣義逆矩陣?yán)碚?,將?xùn)練迭代轉(zhuǎn)化為線性方程組求解,一次可完成網(wǎng)絡(luò)訓(xùn)練,而傳統(tǒng)神經(jīng)網(wǎng)絡(luò)需要多次迭代過程確定網(wǎng)絡(luò)輸出權(quán)值,因此,ELM大幅度提高了網(wǎng)絡(luò)預(yù)測建模效率[8]。房地產(chǎn)價(jià)格歷史數(shù)據(jù)是一種典型的時(shí)間序列數(shù)據(jù),數(shù)據(jù)間具有明顯的時(shí)序關(guān)聯(lián)性,同時(shí),由于房地產(chǎn)價(jià)格數(shù)據(jù)具有非線性、時(shí)變性,隨著新的輸入、輸出數(shù)據(jù)不斷得到新的數(shù)據(jù),房地產(chǎn)價(jià)格在不斷地變化,為了使模型能準(zhǔn)確地反映出房地產(chǎn)價(jià)格,就要用新的數(shù)據(jù)描述模型,而與當(dāng)前狀態(tài)相關(guān)性較小的舊數(shù)據(jù)可以忽略或所占的比重應(yīng)降低;同時(shí)根據(jù)“近大遠(yuǎn)小”的原理(距離預(yù)測部分近的信息對未來預(yù)測結(jié)果影響更大),為此,需要對訓(xùn)練樣本進(jìn)行合理選擇,選擇與預(yù)測點(diǎn)關(guān)聯(lián)比較強(qiáng)的歷史樣本進(jìn)行房地產(chǎn)價(jià)格建模與預(yù)測。為此,有學(xué)者提出利用在線貫序極限學(xué)習(xí)機(jī)(OS-ELM)進(jìn)行時(shí)間預(yù)測預(yù)測,在預(yù)測時(shí),首先在初始訓(xùn)練階段計(jì)算出ELM神經(jīng)網(wǎng)絡(luò)的初始網(wǎng)絡(luò)權(quán)值,然后隨首新的訓(xùn)練樣本的加入,網(wǎng)絡(luò)權(quán)值亦可以在初始網(wǎng)絡(luò)權(quán)值的基礎(chǔ)上進(jìn)行遞推[9,10]。由于OS-ELM模型假設(shè)新、舊訓(xùn)練樣本對時(shí)間序列數(shù)據(jù)的預(yù)測結(jié)果具有同等程度的重要性,采用等權(quán)處理,難以準(zhǔn)確反映不同訓(xùn)練樣本對預(yù)測結(jié)果的不同影響;再者,OS-ELM模型只要獲得新訓(xùn)練樣本,就會(huì)機(jī)械的更新網(wǎng)絡(luò)輸出權(quán)值,缺乏靈活性,增加了不必要的計(jì)算量[11]。
為了提高房地產(chǎn)價(jià)格的預(yù)測精度,針對房地產(chǎn)價(jià)格時(shí)間序列的特殊性,提出了一種基于合理遺忘歷史樣本的房地產(chǎn)價(jià)格預(yù)測模型(ELM,RF-ELM),并通過房地產(chǎn)價(jià)格仿真實(shí)驗(yàn)對模型的預(yù)測性能加以驗(yàn)證。
前饋神經(jīng)網(wǎng)絡(luò)采用梯度下降算法調(diào)整網(wǎng)絡(luò)權(quán)重,存在學(xué)習(xí)速度慢、易陷入局部最小值、出現(xiàn)過度訓(xùn)練等缺陷,針對這些問題,Huang等根據(jù)摩爾-彭羅斯(MP)廣義逆矩陣?yán)碚撎岢隽藰O限學(xué)習(xí)機(jī)(ELM)算法,該算法可以通過一步計(jì)算就可以解析出網(wǎng)絡(luò)的權(quán)值,極大的是高了網(wǎng)絡(luò)的計(jì)算速度和泛化能力。設(shè)收集的訓(xùn)練集為:表示重構(gòu)后的間序列,τ為延遲時(shí)間,m為相空間重構(gòu)的嵌入維數(shù),那么基于ELM的預(yù)測模型為:
式中,αi為連接第i個(gè)神經(jīng)元的輸入權(quán)值;bi為第i個(gè)神經(jīng)元的偏差;k表示訓(xùn)練集的樣本數(shù);βi為第i個(gè)神經(jīng)元的輸出權(quán)值。
采用矩陣形式將式(1)變?yōu)椋?/p>
式中,Tk為輸出向量;βk為輸出權(quán)值;Hk為神經(jīng)元矩陣,表示如下:
對式(2)進(jìn)行求解得到如下輸出權(quán)值:
通過以上輸出權(quán)值,可得訓(xùn)練后的ELM預(yù)測模型為:
式中,t和x分別為模型的輸入和輸出。
ELM是一種離線學(xué)習(xí)算法,難以對訓(xùn)練樣本進(jìn)行合理選擇學(xué)習(xí),為此,學(xué)者提出了在線貫序極限學(xué)習(xí)機(jī)(OS-ELM),算法具體步驟如下:
(1):在滿足K≥L的條件下,根據(jù)時(shí)間序列Sk計(jì)算預(yù)測模型的初始輸出權(quán)值:
(2):設(shè)獲得新的訓(xùn)練樣本(xk+1,tk+1),那么可以將它組合到訓(xùn)練集中,然后根據(jù)式(6)計(jì)算輸出權(quán)值Pk+1與βk+1:
式 中 ,hk+1=[f(α1xk+1+b1)f(α2xk+1+b2) …f(αLxk+1+bl)]
(3):訓(xùn)練集的樣本數(shù)加1,并跳轉(zhuǎn)到step2。
(4):不斷重復(fù)上述步驟,直到所有訓(xùn)練集樣本均參加訓(xùn)練為止。
為解決OS-ELM在房地產(chǎn)價(jià)格預(yù)測時(shí)存在的不足,提出一種基于合理遺忘選擇歷史樣本的房地產(chǎn)價(jià)格模型(RF-ELM)。假設(shè)當(dāng)前訓(xùn)練集包含k個(gè)房地產(chǎn)價(jià)格樣本:(x1,t1),(x2,t2),…,(xk,tk),根據(jù)式(4)計(jì)算輸出權(quán)值βk,如果有新的房地產(chǎn)價(jià)格訓(xùn)練樣本(xk+1,tk+1)加入到訓(xùn)練集時(shí),那么輸出權(quán)值βk+1計(jì)算公式為:
式中,輸出權(quán)值βk+1的都由舊的房地產(chǎn)價(jià)格訓(xùn)練集構(gòu)成,需要對它們進(jìn)行加權(quán),這樣式(8)變成為:
式中,ω為遺忘因子。
通過引入ω,減弱舊訓(xùn)練樣本對預(yù)測結(jié)果影響,當(dāng)ω值過小時(shí),那么相對應(yīng)的舊訓(xùn)練樣本就被丟棄,新訓(xùn)練樣本對預(yù)測結(jié)果影響間接增強(qiáng)。令
對(9)式兩端同時(shí)求逆可得:
將式(11)代入式(9),輸出權(quán)值βk的遞推更新方式為:
在式(9)引入Sherman-Morrison矩陣進(jìn)行求逆,Pk的遞推更新方式為:
(1)選擇房地產(chǎn)價(jià)格時(shí)間序列的最佳延遲時(shí)間(τ)和嵌入維數(shù)(n),那么房地產(chǎn)價(jià)格時(shí)間序列x1,x2,…,xN轉(zhuǎn)化為訓(xùn)練樣本為輸入向量,ti=xi+n為輸出向量,K=N-n≥L。
(2)根據(jù)(X1,t1),(X2,t2),…,(Xk,tk)計(jì)算初始輸出權(quán)值:
式中,C為嶺回歸系數(shù);Ik為單位矩陣;
(3)將Xk+1=[xN-n+1,xN-n+2,…xN]T作為極限學(xué)習(xí)機(jī)的輸入,計(jì)算神經(jīng)元矩陣輸入向量hk1,得到房地產(chǎn)價(jià)格樣本xN+1的一步預(yù)測值:
(4)當(dāng)采集到房地產(chǎn)價(jià)格樣本xN+1的實(shí)際值后,首先根據(jù)式(7)對Pk進(jìn)行選擇性更新:
式中,tk+1=xN+1
(5)房地產(chǎn)價(jià)格訓(xùn)練集的樣本數(shù)加1,并跳轉(zhuǎn)到步驟(3),直到所有訓(xùn)練樣本訓(xùn)練完為止。
選取中國房屋銷售價(jià)格指數(shù)月度數(shù)據(jù)進(jìn)行實(shí)證分析,數(shù)據(jù)來源于中經(jīng)網(wǎng)統(tǒng)計(jì)數(shù)據(jù)庫1998年10月到2011年12月的房地產(chǎn)價(jià)格,共收集到158個(gè)數(shù)據(jù)點(diǎn),具體如圖1所示。
圖1 收集的房地產(chǎn)價(jià)格數(shù)據(jù)
為了使RF-ELM的房地產(chǎn)價(jià)格預(yù)測結(jié)果具有可比性,選擇OS-ELM、ELM作為對比模型。采用均方根誤差(RMSE)和平均相對百分比誤差(MPAE)作為模型的評價(jià)標(biāo)準(zhǔn),分別定義如下:
3.3.1 選擇時(shí)間延遲
首先采用采用互信息法進(jìn)行時(shí)間延遲(τ)的計(jì)算,如圖2所示。從圖2可知,當(dāng)τ=4時(shí),互信息函數(shù)達(dá)到第一極小值,所以房地產(chǎn)價(jià)格時(shí)間序列的最佳時(shí)間延遲為τ=4。
圖2 時(shí)間延遲(τ)的計(jì)算
3.3.2 嵌入維數(shù)確定
(1)根據(jù)互信息法求出τ=4,將嵌入維數(shù)的初值設(shè)為m=1。
(2)選擇合適的臨界距離r,根據(jù)式(20)計(jì)算Cn(r),向量距離采用∞范數(shù)計(jì)算,即兩個(gè)向量最大分量差作為向量距離。
式中,r表示臨界距離的大?。籑表示相點(diǎn)的個(gè)數(shù);θ表示Heaviside單位函數(shù)。
(3)采用最小二乘法對logC(r)n~logr曲線中的直線段進(jìn)行擬合,得到直線的斜率D,此時(shí),D表示關(guān)聯(lián)維數(shù)。
(4)為了獲得最佳嵌入維數(shù),將m值進(jìn)行累加,返回步驟(2)。
依據(jù)以上步驟進(jìn)行嵌入維數(shù)的求取,得到不同嵌入維數(shù)下的關(guān)聯(lián)維數(shù)變化曲線如圖5所示。從圖5可知,當(dāng)m=5時(shí),關(guān)聯(lián)維數(shù)已達(dá)到飽和狀態(tài),說明房地產(chǎn)價(jià)格時(shí)間序列的m=5。
圖3 嵌入維數(shù)(m)的計(jì)算
采用最佳參數(shù)τ=4,m=5對房地產(chǎn)價(jià)格序列進(jìn)行重構(gòu),然后將重構(gòu)后的訓(xùn)練集輸入RF-ELM模型進(jìn)行訓(xùn)練,建立最優(yōu)房地產(chǎn)價(jià)格預(yù)測模型,并對測試集進(jìn)行預(yù)測。
3.4.1 房地產(chǎn)價(jià)格單步預(yù)測性能對比
RF-ELM參數(shù)為:遺忘因子ω=0.55,閾值ε=0.001,嶺回歸系數(shù)C=80,然后將訓(xùn)練集輸入RF-FLM進(jìn)行訓(xùn)練,最后對測試集進(jìn)行單步預(yù)測,房地產(chǎn)價(jià)格預(yù)測結(jié)果和預(yù)測絕對誤差如圖3所示。從圖3可知,房地產(chǎn)價(jià)格預(yù)測值與實(shí)際值之間十分接近,RMSE為1.84,MAPE%為1.06,由此可以看出利用RF-ELM模型進(jìn)行房地產(chǎn)價(jià)格預(yù)測可以獲得較高的預(yù)測精度。
圖3 RF-ELM的單步預(yù)測性能
3.4.2 房地產(chǎn)價(jià)格多步預(yù)測性能對比
房地產(chǎn)價(jià)格預(yù)測的目標(biāo)就是對房地產(chǎn)價(jià)格變化趨勢進(jìn)行把握,因此要求有一定提前預(yù)測時(shí)間,采用單步預(yù)測法對房地產(chǎn)價(jià)格投資決策實(shí)際應(yīng)用價(jià)值不大,因此需要將單頻預(yù)測擴(kuò)展到多步預(yù)測。采用RF-ELM、OS-ELM和ELM對房地產(chǎn)價(jià)格進(jìn)行建模與預(yù)測,2步、4步和6步預(yù)測結(jié)果的RMSE和MAPE%如表1所示。
表1 3種房地產(chǎn)價(jià)格預(yù)測模型的預(yù)測誤差對比
對表1中3個(gè)模型在不同預(yù)測步長的性能進(jìn)行分析,可以得到如下結(jié)論:
(1)傳統(tǒng)極限學(xué)習(xí)機(jī)(ELM)在初始訓(xùn)練階段完成后,網(wǎng)絡(luò)輸出權(quán)值不再發(fā)生改變,隨著房地產(chǎn)價(jià)格預(yù)測步長逐漸增大,訓(xùn)練集與當(dāng)前時(shí)刻間房地產(chǎn)價(jià)格預(yù)測點(diǎn)的距離越大,建立預(yù)測模型不能難以準(zhǔn)確刻畫當(dāng)前時(shí)刻的房地產(chǎn)價(jià)格動(dòng)態(tài)變化特性,房地產(chǎn)價(jià)格的預(yù)測精度比較低。
(2)相對于ELM,由于RF-ELM和OS-ELM不斷利用新采集的房地產(chǎn)價(jià)格訓(xùn)練樣本對預(yù)測模型進(jìn)行在線更新,預(yù)測誤差明顯減小,此外,由于新采集的房地產(chǎn)價(jià)格訓(xùn)練樣本與預(yù)測點(diǎn)間的距離最小,可以準(zhǔn)確跟蹤房地產(chǎn)價(jià)格動(dòng)態(tài)變趨勢,獲得的房地產(chǎn)價(jià)格預(yù)測結(jié)果更加可靠。
(3)相對于OS-ELM,RF-ELM的預(yù)測誤差更小,主要由于OS-ELM模型將距離房地產(chǎn)價(jià)格較遠(yuǎn)的房地產(chǎn)價(jià)格訓(xùn)練樣本同等對待,然而,現(xiàn)實(shí)情況卻是房地產(chǎn)與當(dāng)前較近的時(shí)間點(diǎn)的房地產(chǎn)價(jià)格呈十分緊密的聯(lián)系,而OS-ELM模型將所有的訓(xùn)練樣本賦予同樣的權(quán)重,難以準(zhǔn)確反映房地產(chǎn)價(jià)格之間的時(shí)間相關(guān)性。而RF-ELM以遺忘舊訓(xùn)練樣本的方式,對一些距離預(yù)測點(diǎn)較遠(yuǎn),關(guān)聯(lián)性較小的樣本賦予較小的權(quán)值,將無用的樣本數(shù)據(jù)點(diǎn)丟棄,突出了新的房地產(chǎn)價(jià)格訓(xùn)練樣本對預(yù)測點(diǎn)影響,可以較好的捕捉真實(shí)房地產(chǎn)價(jià)格變化特性,從而可以獲得了令人滿意的預(yù)測效果。
3.3.3 其他房地產(chǎn)價(jià)格的預(yù)測
為了進(jìn)一步測試本文模型的普適性,采用2000年1月到2012年8月長沙市房地產(chǎn)價(jià)格、2001年3月到2012年8月武漢市房地產(chǎn)價(jià)格、2002年5月2013年3月深圳市房地產(chǎn)價(jià)格、2003年2月到2012年11月湘潭市房地產(chǎn)價(jià)格進(jìn)行仿真測試,得到相應(yīng)預(yù)測結(jié)果,預(yù)測誤差見表2。
表3 其它城市房地產(chǎn)價(jià)格預(yù)測精度
從表2可知,利用RF-ELM進(jìn)行各地房地產(chǎn)價(jià)預(yù)測,均獲得了較好的預(yù)測精度,長沙市房地產(chǎn)價(jià)格的RMSE、MAPE分別為6.73和4.00,其余三地的房地產(chǎn)價(jià)格預(yù)測值的MAPE均小于4.00,都具有較高的預(yù)測精度,結(jié)果表明,因此,RF-ELM是一種預(yù)測精度高的房地產(chǎn)價(jià)格預(yù)測模型。
為了提高房地產(chǎn)價(jià)格的預(yù)測精度,針對房地產(chǎn)價(jià)格訓(xùn)練樣本選擇問題,提出了一種基于合理遺忘歷史樣本的房地產(chǎn)價(jià)格預(yù)測模型。仿真結(jié)果表明,相對對比模型,RF-ELM提高了房地產(chǎn)價(jià)格的預(yù)測精度,加快了訓(xùn)練速度,可以更好的滿足房地產(chǎn)價(jià)格在線預(yù)測要求。由于房地產(chǎn)價(jià)格是受政治、經(jīng)濟(jì)、供給、需求等多種因子的影響,本研究只房地產(chǎn)價(jià)格歷史時(shí)間序列數(shù)據(jù),沒有考慮到這些因素的影響,綜合考慮多種因子對房地產(chǎn)價(jià)格的影響,有待進(jìn)一步研究。
[1]章晨,鄭循剛,龔沁.基于ARMA模型的我國房地產(chǎn)價(jià)格預(yù)測分析[J].生產(chǎn)力研究2012,(2).
[2]柳冬,王雯珺,汪壽陽.我國房地產(chǎn)價(jià)格影響要素分析與趨勢預(yù)測[J].經(jīng)濟(jì)與金融,201,22(5).
[3]楊勵(lì)雅,邵春福.基于BP神經(jīng)網(wǎng)絡(luò)與馬爾可夫鏈的城市軌道交通周邊房地產(chǎn)價(jià)格的組合預(yù)測方法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2008,38(3).
[4]周亮,周正.基于時(shí)間序列的房地產(chǎn)價(jià)格指數(shù)預(yù)測方法探討[J].哈爾濱商業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2008,(2).
[5]李萬慶,張金水,孟文清.基于小波神經(jīng)網(wǎng)絡(luò)的房地產(chǎn)價(jià)格指數(shù)預(yù)測研究[J].河北工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)[J].2008,25(1).
[6]梁坤,聶會(huì)星,徐樅巍.基于支持向量機(jī)的北京市房地產(chǎn)價(jià)格指數(shù)預(yù)測[J].合肥工業(yè)大學(xué)學(xué)報(bào),2011,34(4).
[7]鐘昌寶.基于灰色-馬爾柯夫模型預(yù)測房地產(chǎn)價(jià)格[J].統(tǒng)計(jì)與決策,2005,(1).
[8]胡曉龍,郜振華,馬光紅.基于Elman神經(jīng)網(wǎng)絡(luò)的房地產(chǎn)價(jià)格預(yù)測[J].統(tǒng)計(jì)與決策,2008,(7).
[9]Callado A,Keu R J,Sadok D,et a1.Better Network Traffic Identification Through The Independent Combination of Techniques[J].Journal of Network and Computer Applications,2012,33(4).
[10]高光勇,蔣國平.采用優(yōu)化極限學(xué)習(xí)機(jī)的多變量混沌時(shí)間序列預(yù)測[J].物理學(xué)報(bào),2012,61(4).
[11]張弦,王宏力.基于貫序正則極端學(xué)習(xí)機(jī)的時(shí)間序列預(yù)測及應(yīng)用[J].航空學(xué)報(bào),2011,32(7).