劉楊柏紅
(哈爾濱商業(yè)大學金融學院,黑龍江 哈爾 濱 150000)
房地產(chǎn)價格的大變革要追溯到1998 年國家頒布的《國務(wù)院關(guān)于進一步深化城鎮(zhèn)住房制度改革加快住房建設(shè)的通知》,該通知取消了原有的住房分配制度轉(zhuǎn)而施行住房商品化社會化,全國房地產(chǎn)市場迅速發(fā)展[1]。2003 年國務(wù)院發(fā)布“18 號文件”首次公開肯定了房地產(chǎn)在國民經(jīng)濟發(fā)展中的支柱地位[2]。2019 年8 月,中國人民銀行發(fā)布公告,提出“住房只住不炒”,進一步施行房貸利率改革,實施貸款市場報價利率[3]。2020 年5 月,十三屆全國人大三次會議提出新定位:“堅持房子是用來住的、不是用來炒的”,與此同時要根據(jù)每個城市的特色和不同人群的需求發(fā)展相應(yīng)的房地產(chǎn)事業(yè),促進各地房地產(chǎn)市場平穩(wěn)健康發(fā)展。由此可見,房地產(chǎn)市場和房地產(chǎn)價格受到了大眾以及國家的廣泛關(guān)注。2020 年11 月,哈爾濱市印發(fā)了《關(guān)于疫情期間促進我市房地產(chǎn)市場平穩(wěn)健康發(fā)展相關(guān)政策的通知》,該通知旨在鼓勵房地產(chǎn)企業(yè)“賣房”。因此,房地產(chǎn)的健康發(fā)展關(guān)系到民生,而價格毫無疑問是房地產(chǎn)發(fā)展是否健康的重要指標。
因此,針對住宅商品房價格成倍增長的現(xiàn)象,選取了以二線城市-哈爾濱市為例利用SPSS 以及MATLAB 工具,進行因子分析,建立多元回歸模型和BP 神經(jīng)網(wǎng)絡(luò),以研究預測哈爾濱市住宅商品房價格和走勢。圖1 為哈爾濱市住宅商品房價格走勢圖。
圖1 哈爾濱市住宅商品房價格走勢圖
對于房地產(chǎn)價格問題很早就有學者通過構(gòu)建有效、多樣的模型對房地產(chǎn)價格進行進行研究、探討和預測。國外研究學者很多是通過利用基本經(jīng)濟學原理建立傳統(tǒng)線性模型對房地產(chǎn)引發(fā)的交易事件進行分析。我國在該領(lǐng)域的研究相對于國外研究來說時間相對晚一些。但是,隨著理論與實踐研究的深入,我國研究房地產(chǎn)價格變化的學者也越來越多。羅博煒、洪智勇利用Python 工具基于多元線性回歸統(tǒng)計模型對美國部分地區(qū)房價進行預測,并對模型進行修正和優(yōu)化;吳承業(yè)、沈逸珺等利用Eviews 軟件,建立ARMA 模型對杭州市房價進行預測,得出房價整體處于較快上升趨勢的結(jié)果;賈建英利用GM(1,1)模型對唐山市房價進行預測;李秀芝、劉成林等利用馬爾科夫鏈對宜賓市商品房銷售價格進行預測,得出宜賓市的房價處于波動狀態(tài),上升勢頭明顯;張雙妮利用逐步回歸模型擬合房價預測模型得出長期來看房價普遍上漲的結(jié)論;楊莎莎基于模型平均對房價進行預測和實證研究。通過學習,本文運用多元線性回歸與BP 神經(jīng)網(wǎng)絡(luò)兩種工具進行預測,獲得準確性更高的房價預測工具。
利用從國家統(tǒng)計局收集到的相關(guān)數(shù)據(jù)進行篩選后,按照年份進行排列。哈爾濱市國內(nèi)生產(chǎn)總值(億元)、哈爾濱市年末總?cè)丝冢ㄈf人)、哈爾濱市房地產(chǎn)開發(fā)投資額(億元)、哈爾濱市房地產(chǎn)開發(fā)住宅投資額(億元)、哈爾濱市住宅商品房銷售面積(萬平方米)、哈爾濱市城鄉(xiāng)居民儲蓄年末余額(億元)作為自變量,分別記為X1、X2、X3、X4、X5、X6;哈爾濱市住宅商品房平均銷售價格(元/平方米)作為因變量記為Y。表1 為哈爾濱市2002-2019 年相關(guān)數(shù)據(jù)。
表1 哈爾濱市2002-2019 年相關(guān)數(shù)據(jù)
因子分析總的來說就是一種降維的思想,就是將收集到的多個滿足真實性和有效性的數(shù)據(jù)變量轉(zhuǎn)換為幾個更具代表性的綜合指標,再將相關(guān)性相對較高的數(shù)據(jù)變量組合在一起,以減少因解釋變量過多導致深入分析過程變得復雜的現(xiàn)象。
運用因子分析的前提是因子之間存在相關(guān)性。因此,在利用SPSS 工具對7 個變量進行因子分析之前要驗證各變量之間的線性關(guān)系。本文利用KMO 和巴特利特檢驗方法進行分析。KMO 是比較變量間簡單和偏相關(guān)系數(shù)的指標,取值在(0,1)之間。經(jīng)過KMO 檢驗得出的結(jié)果大于0.5,說明該組變量可以進行因子分析;巴特利特檢驗是計算各個變量之間相關(guān)性程度的方法。本文數(shù)據(jù)檢驗結(jié)果如下:
表2 總方差解釋
KMO 值=0.736,巴特利特檢驗顯著性 sig=0.000。該結(jié)果說明所選取的數(shù)據(jù)適合做因子分析。
由生成的總方差解釋結(jié)果表可以分析出:第一和第二主成分初始特征值總計分別為5.240,1.395,兩個主成分的初始特征值累計貢獻率總共達到94.782%。該比例說明有效信息損失少,通過獲取第一和第二個公共因子就能最大限度的解釋該組解釋變量的整體情況并提供所需要的信息。由于第一主成分的貢獻率最大,可以根據(jù)第一主成分的數(shù)據(jù)來判斷其他各因素的重要程度:
利用SPSS 對數(shù)據(jù)進行擬合分析,確定各個因素與因變量之間的關(guān)系。建立多元回歸分析模型:
本次多元回歸利用的是逐步回歸模型方法:將每個要進行分析的解釋變量單獨輸入到模型中,每輸入一個解釋變量后都進行一次F 檢驗,對上一步已經(jīng)選定的解釋變量再逐個進行t 檢驗。若原來輸入的解釋變量由于后來解釋變量的引入變得不顯著,則將后者刪除,以此來確保最后得到的解釋變量集合的檢驗結(jié)果是最優(yōu)集合。依據(jù)上述方法得出哈爾濱市房價的多元回歸模型為:
整個回歸過程進行了一步,進入變量為X6,標準化系數(shù)為0.982,得到的德賓-沃森數(shù)值為1.035,查表(n=7,k=1),顯著性水平為0.016(在0.01 左右),因此選擇A-1 德賓-沃森統(tǒng)計量臨界值表中的對應(yīng)數(shù)值,得出=0.435,=1.036。在ANOVA 表中,模型sig 統(tǒng)計值小于0.05,解釋變量系數(shù)顯著。得出單方程模型為:
圖3 BP 神經(jīng)網(wǎng)訓練過程
將2016、2017、2018、2019年城鄉(xiāng)居民儲蓄年末余額(X6)帶入中,可以得出預測值(如表3 所示)。
表3 多元回歸模型預測結(jié)果
通過結(jié)果可以看出,住宅商品房預測值與實際值存在一定誤差并且波動較大,誤差仍在合理的預測區(qū)間內(nèi)。
BP 神經(jīng)網(wǎng)絡(luò)(Back Propagation)是一種按誤差逆?zhèn)鞑ニ惴ㄓ柧毜亩鄬忧梆伨W(wǎng)絡(luò),人工神經(jīng)元的研究起源于腦神經(jīng)元學說,人工神經(jīng)網(wǎng)絡(luò)是有大量的簡單基本元件——神經(jīng)元相互連接而成的自適應(yīng)非線性動態(tài)系統(tǒng)[4]。
BP神經(jīng)網(wǎng)絡(luò)是由輸入層(input)、隱含層、輸出層(output)組成,首先給網(wǎng)絡(luò)的各連接權(quán)值賦予(0,1)區(qū)間內(nèi)的隨機值,也就是我們所說的歸一化處理,將輸入層對應(yīng)的數(shù)據(jù)和圖像模式輸入給網(wǎng)絡(luò),通過計算隱含層中神經(jīng)元權(quán)重的不同,將各神經(jīng)元權(quán)值加權(quán)求和,利用激活函數(shù)進行非線性運算,得到網(wǎng)絡(luò)輸出結(jié)果并與原數(shù)據(jù)進行比較,從而達到預測數(shù)據(jù)的效果。
BP 神經(jīng)網(wǎng)絡(luò)通過對輸入的數(shù)據(jù)進行不斷訓練,訓練結(jié)束后輸入預測值的自變量從而得到與預測值相近或者與原預測數(shù)據(jù)相同的數(shù)據(jù)值并輸出?;贐P 神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,我們利用其作為工具,來完成本文要達到的目的。圖2 為BP 神經(jīng)網(wǎng)絡(luò)訓練過程。
圖2 BP 神經(jīng)網(wǎng)絡(luò)訓練過程
4.2.1 數(shù)據(jù)預處理
在初始建立模型之前,本文使用Mapminmax(X)對每一行數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)統(tǒng)一在[-1,1]的范圍之中,可以在一定程度上避免所輸入的數(shù)據(jù)出現(xiàn)不必要的數(shù)值問題。在神經(jīng)網(wǎng)絡(luò)對于數(shù)據(jù)訓練結(jié)束之后,需要再對輸出數(shù)據(jù)進行Mapminmax(‘reverse’,X,Y)的反歸一化處理,將數(shù)據(jù)恢復成與輸入數(shù)據(jù)相同的形式。
4.2.2 選取神經(jīng)元節(jié)點個數(shù)
通過6 個影響因素對住宅價格進行預測,建立三層BP神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)輸入層節(jié)點數(shù)n=6,輸出神經(jīng)元n=1,利用Hornik 公式可以計算出中間層(隱含層)節(jié)點數(shù)范圍:
計算出的中間層神經(jīng)元節(jié)點數(shù)范圍為[4,13],再該范圍內(nèi)選擇最優(yōu)的節(jié)點數(shù),經(jīng)過實驗,本位選取的最優(yōu)節(jié)點數(shù)為8。
4.2.3 訓練及預測分析
選取2002-2015 年6 個自變量數(shù)據(jù)作為訓練數(shù)據(jù),Sigmoid 函數(shù)作為激活函數(shù),tansig 作為傳遞函數(shù),訓練次數(shù)5000 次,最小誤差10-6。在經(jīng)過了363 次迭代后,誤差小于等于10-6時停止訓練。
訓練數(shù)集通過訓練,在到達10-6后,曲線變得平緩,并最終落在目標誤差線上。訓練后的誤差(mse)值,最大誤差為0.0413,目標誤差為1.00e-06,實際誤差為9.953e-08。隨后以2016—2019 年6 個自變量數(shù)據(jù)為基礎(chǔ),通過E 計算真實值與預測值之間誤差,mse(E)表示均值方差誤差值,對因變量進行預測。
通過表4 中計算的誤差結(jié)果我們可以看出,2016-2019年誤差逐漸升高,波動較規(guī)律,可見預測相近年份的數(shù)據(jù)準確度更高。從一定程度上預測了與真實值相同的房價走勢。
表4 BP 神經(jīng)網(wǎng)絡(luò)預測數(shù)據(jù)誤差
我們可以從圖4 中觀察到,X2(哈爾濱市年末總?cè)丝跀?shù))從2002 年開始一直處于緩慢的下降趨勢;X3(哈爾濱市房地產(chǎn)開發(fā)投資額)與X4(哈爾濱市房地產(chǎn)開發(fā)住宅投資額)走勢較為接近。X3隨著X3的增長而增長,由于包括哈爾濱市在內(nèi)的東北地區(qū)整體經(jīng)濟增長能力不足,導致在2013 年之后X3開始逐步下滑,相應(yīng)的X4也逐步下滑,由于X3的減少,X5(哈爾濱市住宅商品房銷售面積)在2013 年達到最高水平后開始下跌。而房X3和X5的減少會影響到住宅商品房市場的供給與需求的失衡;X6(哈爾濱市城鄉(xiāng)居民儲蓄年末余額)是多元回歸模型中提取出的主要因素,在2019 年X6急速上漲超過了X1(哈爾濱市國內(nèi)生產(chǎn)總值),這體現(xiàn)出哈爾濱市居民傳統(tǒng)的投資理念:一部分居民將手里的錢用于存款儲蓄,另外一部分居民對銀行利率不看好,直接將儲蓄投資于房地產(chǎn)。存款儲蓄多一般情況能反映出現(xiàn)金流量多,貨幣流通周轉(zhuǎn)速度快,貨幣創(chuàng)造能力強。但是伴隨著X1的下降,產(chǎn)出以及投資減少,居民的儲蓄并沒有最大效率的實現(xiàn)貨幣加倍創(chuàng)造的能力,沒有達到預期的經(jīng)濟增長水平。住宅商品房價格在各因素的影響下仍在不斷升高,除文中提到的六個因素外,還受例如政府調(diào)控、國家政策、人均可支配收入、房貸利率等諸多因素的影響,需要進一步進行研究與挖掘。
圖4 住宅商品房影響因素折線圖
多元回歸模型在對住宅商品房價格進行預測時X6(城鄉(xiāng)居民儲蓄年末余額)對價格影響最大,BP 神經(jīng)網(wǎng)絡(luò)則是受到不同權(quán)重影響因素的影響,相比之下,BP 神經(jīng)網(wǎng)絡(luò)模型的誤差值更小,預測更準確。由于影響住宅商品房價格的因素較為復雜和繁瑣,本次研究只抽取六個影響因素的相關(guān)數(shù)據(jù)。因此,對兩種模型的學習和比較為今后進行深入研究提供了基礎(chǔ)。