摘要:本文采用Engle-Granger檢驗來探索南充市房價與以搜索指數(shù)為代表的大數(shù)據(jù)之間的關(guān)系。選取了2014年1月至2018年11月的房價數(shù)據(jù),并利用相關(guān)系數(shù)大于0.5的百度指數(shù)構(gòu)建搜索指數(shù),從而對其進行實證檢驗。結(jié)果發(fā)現(xiàn),南充市房價同搜索指數(shù)之間存在著協(xié)整關(guān)系,且其相關(guān)系數(shù)較大,說明大數(shù)據(jù)對于中小城市房價具有較強的預(yù)測。此外,還比較了不同的搜索指數(shù)構(gòu)造方法,發(fā)現(xiàn)以相關(guān)系數(shù)為權(quán)重所構(gòu)造的搜索指數(shù)表現(xiàn)更佳。
關(guān)鍵詞:大數(shù)據(jù);房價;Engle-Granger檢驗
一、引言
眾所周知,房價是政府宏觀經(jīng)濟調(diào)控的重要手段,房價的穩(wěn)定在一定程度上影響到經(jīng)濟的穩(wěn)增長。因此,國內(nèi)關(guān)于房價的研究文獻較多,(劉莉亞和蘇毅,2005)采用協(xié)整方法測算了上海房價的合理水平,并據(jù)此分析了上海房價失調(diào)的程度及原因;(張亞麗,2011)利用房地產(chǎn)價格決定模型得出當期實際人均可支配收入、預(yù)期收入和預(yù)期房地產(chǎn)收益率是房價持續(xù)上漲的主要因素的結(jié)論;(王文雯等,2014)以省級面板數(shù)據(jù)研究了人口結(jié)構(gòu)、收入分配和經(jīng)濟政策等變量對房價的影響。綜上,關(guān)于房價的研究文獻大多集中在大中城市,而對于三四線城市的關(guān)注較少。然而就在去年,南充作為一座四線小城市突然受到央視財經(jīng)頻道《經(jīng)濟半小時》欄目報道,原因就在于南充的房價不到半年時間從5634元飆升至7285元,漲幅高達29.3%,居于全國的前列。那么,如何來分析和預(yù)測小城市房價的變化呢?
2009年,Nature雜志上刊登了一篇利用谷歌搜索日志來即時預(yù)測流感趨勢的文章,迅速引起了社會對于大數(shù)據(jù)的關(guān)注。近年來,人們不斷挖掘大數(shù)據(jù)背后蘊含的巨大潛力,將其運用于醫(yī)療、交通、商業(yè)推廣等各個領(lǐng)域,甚至形象地將其稱為“數(shù)字黃金”。而在學術(shù)界,大數(shù)據(jù)對于經(jīng)濟的預(yù)測能力也逐漸被放在突出位置。(張誼浩等,2014)發(fā)現(xiàn)網(wǎng)絡(luò)搜索能夠用于預(yù)測股票市場,從而構(gòu)造投資組合獲得超額收益;(劉濤雄和徐曉飛,2015)通過比較政府統(tǒng)計的結(jié)構(gòu)化數(shù)據(jù)和網(wǎng)絡(luò)搜索的非結(jié)構(gòu)化數(shù)據(jù),討論了能否利用互聯(lián)網(wǎng)搜索預(yù)測宏觀經(jīng)濟的問題;(王娜,2016)利用百度搜索指數(shù)和媒體指數(shù)證明大數(shù)據(jù)可以提高碳排放權(quán)預(yù)測的準確性。
由于大數(shù)據(jù)在經(jīng)濟領(lǐng)域具有較好的預(yù)測能力,本文嘗試探索大數(shù)據(jù)和房地產(chǎn)的關(guān)系,希望能夠為中小城市經(jīng)濟預(yù)測提供一種思路。
二、搜索指數(shù)對房價影響的理論分析
從經(jīng)濟學的角度而言,房屋也是一種商品,那么它的價格必然由其供需所決定。從供給來看,房屋的供給在很大程度上取決于土地的供給,而土地作為一種特殊的商品,是缺乏彈性的。因此,短期來看,房價主要受到房屋需求量的影響。而就房屋需求而言,消費者的需求主要包括投資需求和投機需求。其中,投資需求反映了消費者的剛需,受到經(jīng)濟基本面等因素的影響。而投機需求則取決于房屋的預(yù)期收益,如果預(yù)期房價收益率大于社會資本的一般收益率,則投機需求增加;反之,則投機需求下降。
網(wǎng)絡(luò)搜索是一種信息挖掘的手段,在獲取信息的同時也記錄下投資者的動態(tài)。投資者往往不會搜索與其無關(guān)或不感興趣的信息,對于特定關(guān)鍵詞的檢索實際上反映了投資者的關(guān)注和預(yù)期。例如,投資者搜索房貸利率,常常預(yù)示著該投資者在關(guān)注房地產(chǎn)市場,或者表明其有較強的房屋購買意愿。正是基于此,本文認為充分挖掘網(wǎng)絡(luò)搜索的信息,可以了解投資者的需求,從而預(yù)測未來房價的變化。但是,關(guān)于二者的影響機制,目前學術(shù)界還沒有公認的觀點,結(jié)合資產(chǎn)價格決定理論和行為經(jīng)濟學理論,本文提出如下的理論分析。
如圖1所示,網(wǎng)絡(luò)搜索實際上是投資者情緒和投資者關(guān)注的一種反應(yīng)。當投資者情緒高漲時,對于資產(chǎn)的關(guān)注程度必然上漲,從而表現(xiàn)出較高的網(wǎng)絡(luò)搜索量;而當投資者情緒降低時,說明投資者對資產(chǎn)的興趣減弱,而投資者關(guān)注會伴隨降低,從而表現(xiàn)出較少的網(wǎng)絡(luò)搜索量。根據(jù)行為經(jīng)濟學的相關(guān)理論,投資者情緒和投資者關(guān)注是影響投資者偏好和決策的主要因素,而偏好和決策在一定程度上會引起需求的變化,從而造成價格的波動。具體而言,房地產(chǎn)市場上有投資者和投機者兩大購買方。當投資者情緒高漲、關(guān)注上升時,購買者常常做出預(yù)期未來房地產(chǎn)市場會有超額收益率的判斷,從而影響投資者偏好和決策。此時,投資者方表現(xiàn)為購買意愿會更加強烈,等待交易的時機會縮短,愿意付出的成本對價會更多,從而引起投資需求增加;而投機者表現(xiàn)為進入房屋市場的可能性增強,交易數(shù)量增多,交易方向多數(shù)為買人,從而引起投機需求的增加。因此,房屋市場的總體需求上漲。反之,當投資者情緒低迷、關(guān)注下降時,常常意味著預(yù)期未來房地產(chǎn)市場收益率下降的可能性增強,從而影響投資者偏好和決策。此時,投資者的購買意愿降低,等待交易的時機會延長,愿意付出的成本對價會減少,從而導(dǎo)致投資需求的降低;而投機者進入市場的可能性下降,交易數(shù)量減少,交易方向多為賣出,從而導(dǎo)致投資投機需求的減少。因此,房屋的總體需求下降。根據(jù)供求關(guān)系理論,短期房地產(chǎn)市場的供給不易變化,房屋需求的增加會導(dǎo)致房價的上漲,而需求的降低會引起房價的下跌。綜上所述,利用網(wǎng)絡(luò)搜索能夠預(yù)期未來房屋需求的變動,從而預(yù)測未來房價的變化。
三、實證檢驗
(一)數(shù)據(jù)的來源和變量的選取
1.房屋價格指數(shù)P。本文的原始房價數(shù)據(jù)來源于南充房產(chǎn)信息網(wǎng),收集的是南充市市區(qū)(嘉陵、順慶、高坪)住宅商品房成交價的月度均值。將此數(shù)據(jù)和wind數(shù)據(jù)庫中的南充房屋月度基準數(shù)據(jù)進行比較,發(fā)現(xiàn)二者的相關(guān)性高達0.98,因此認為該數(shù)據(jù)準確、可靠。本文選取了2014年1月至2018年11月,共計59個月度數(shù)據(jù),并將2014年1月的房屋價格設(shè)定為100,將數(shù)據(jù)進行同比處理得到房屋價格指數(shù)。
2.搜索指數(shù)的構(gòu)建。借助國內(nèi)外已有參考文獻的經(jīng)驗,本文以百度指數(shù)代表投資者的網(wǎng)絡(luò)搜索數(shù)據(jù)。將搜索區(qū)域限制在南充地區(qū),利用Python軟件爬取了2014年1月至2018年11月期間,與房價有關(guān)的14個關(guān)鍵詞的百度指數(shù)。所選取的關(guān)鍵詞都是與房價直接或間接相關(guān)的常用詞匯,包括房價、買房、買房注意事項、公積金、公積金查詢、存款利率、家裝、房產(chǎn)稅、房貸、房貸利率、房貸計算器、搜房網(wǎng)、裝修。為了同房價保持一致,先將得到的周度百度指數(shù)轉(zhuǎn)化為月度數(shù)據(jù),再按照以下原則對數(shù)據(jù)進行標準化處理。
其中,SS代表處理后第i個關(guān)鍵詞在t時期的百度指數(shù);X代表第i個關(guān)鍵詞在t時期的百度指數(shù);n代表所選期間的月份個數(shù)。
得到標準化的百度指數(shù)后,計算各個關(guān)鍵詞與房價之間的相關(guān)系數(shù),選取大于0.5的關(guān)鍵詞用于構(gòu)造搜索指數(shù),分別是房價SS(β=0.61)、房產(chǎn)稅SS(β=0.51)和房貸計算器SS(β=0.75)。
如表1所示,本文采用了兩種方法構(gòu)造搜索指數(shù),第一種是簡單算術(shù)平均的方法,第二種是以相關(guān)系數(shù)進行加權(quán)平均的方法。將得到的搜索指數(shù)同房價進行相關(guān)分析,發(fā)現(xiàn)前者的相關(guān)系數(shù)為0.74,而后者的相關(guān)系數(shù)為0.76。由于加權(quán)得到的搜索指數(shù)與房價之間的相關(guān)性更高,因此本文選擇SS作為搜索指數(shù)。
(二)模型設(shè)定
在上文中已經(jīng)通過理論分析了網(wǎng)絡(luò)搜索跟房地產(chǎn)價格之間可能存在的關(guān)系,這里將對其進行實證驗證。由于所選擇的變量都是非平穩(wěn)的,不能直接使用經(jīng)典線性回歸模型,所以本文采用Engle-Granger協(xié)整檢驗?zāi)P?。如果模型結(jié)果表明存在著協(xié)整關(guān)系,則說明變量間存在長期均衡關(guān)系,則可以利用其相關(guān)關(guān)系進行預(yù)測。對房地產(chǎn)價格(P)和搜索指數(shù)(SS)進行協(xié)整檢驗,具體過程如下。
P=c+aSS(2)
e=P-P(3)
首先建立變量間的線性回歸方程(見等式2),然后得到被解釋變量真實值和預(yù)測值之間的離差數(shù)列e(見等式3)。此時,對e進行單位根檢驗,若結(jié)果平穩(wěn),則說明變量之間存在協(xié)整關(guān)系;反之,則說明二者之間不存在協(xié)整關(guān)系。
(三)實證的結(jié)果與分析
1.ADF檢驗
對變量房價P和搜索指數(shù)SS進行單位根檢驗,得到表2中的結(jié)果。原時間序列在1%的顯著水平下均不能拒絕原假設(shè),說明原數(shù)列非平穩(wěn)。而它們的一階差分序列d(P)、d(SS)檢驗值均明顯小于1%水平的臨界值(-2.61),說明變量P和SS為一階單整序列。
2.協(xié)整檢驗
由于房價P和搜索指數(shù)SS均為一階單整序列,為了判定其是否存在線性關(guān)系,利用EVIEWS 8軟件對其進行Engle-Granger檢驗,其結(jié)果如上圖所示。
在表3中,tau統(tǒng)計量的數(shù)值為-3.45,根據(jù)其求得的概率為4.79%;z統(tǒng)計量的數(shù)值為-18.91,其對應(yīng)的概率為4.64%。說明兩個統(tǒng)計量在5%的顯著水平下均拒絕原假設(shè),也即是P和SS存在協(xié)整關(guān)系。
既然房價P和搜索指數(shù)SS存在著協(xié)整關(guān)系,則說明二者具有長期均衡關(guān)系,那么可以利用搜索指數(shù)來建立房價模型。為了說明二者之間的關(guān)系,采用如下回歸模型。
其中,調(diào)整后的R=0.57,S.E=13.18,F(xiàn)=70,DW=0.59。
根據(jù)模型(4)的結(jié)果,說明搜索指數(shù)對房價存在著正向的影響,且影響程度較高,系數(shù)達到0.76。意味著搜索指數(shù)每變動1個單位,房價將隨之變動0.76個單位。又由于相關(guān)系數(shù)大于零,說明搜索指數(shù)上漲時房價將會上漲,搜索指數(shù)下降時房價隨之下降。因此,可以利用搜索指數(shù)的變化來預(yù)測未來房價的變化。
四、結(jié)論和啟示
通過前面的分析,本文主要得到以下結(jié)論。
1.大數(shù)據(jù)對于中小城市房價具有較強的預(yù)測能力。對房屋價格指數(shù)和搜索指數(shù)進行Engle-Granger檢驗,發(fā)現(xiàn)二者之間存在著協(xié)整關(guān)系,且其相關(guān)系數(shù)高達0.76,說明搜索指數(shù)對南充房價市場具有較強的預(yù)測能力。在一定程度上,這也說明了大數(shù)據(jù)對于區(qū)域經(jīng)濟預(yù)測和決策的重要作用。通過查看已有文獻,發(fā)現(xiàn)關(guān)于區(qū)域經(jīng)濟的研究多數(shù)集中在大中城市,原因就在于中小城市的經(jīng)濟統(tǒng)計數(shù)據(jù)較難獲取,這就阻礙了對于中小城市經(jīng)濟預(yù)測的可能性,同時影響了經(jīng)濟決策的制定和執(zhí)行。隨著大數(shù)據(jù)的出現(xiàn),改變了中小城市數(shù)據(jù)難以獲取的現(xiàn)狀,能為預(yù)測和決策提供必要的數(shù)據(jù)支撐。因此,積極探索大數(shù)據(jù)對于中小城市區(qū)域經(jīng)濟的影響具有重要價值。本文僅僅以南充房地產(chǎn)市場作為大數(shù)據(jù)運用的一個方面,希望能夠借此充分挖掘大數(shù)據(jù)的潛力。
2.構(gòu)建搜索指數(shù),以相關(guān)系數(shù)為權(quán)重表現(xiàn)更佳。大數(shù)據(jù)的特點在于數(shù)量多、非結(jié)構(gòu)化、信息冗雜,由于百度搜索引擎是國人常用的瀏覽器,而百度指數(shù)向大眾提供免費查詢個別關(guān)鍵詞網(wǎng)絡(luò)搜索量的功能。因此,本文選取百度指數(shù)來構(gòu)建搜索指數(shù)。但是,與房價有關(guān)的關(guān)鍵詞很多,本文篩選相關(guān)系數(shù)大于0.5的關(guān)鍵詞進行指數(shù)構(gòu)建,這樣在一定程度上對大數(shù)據(jù)的信息進行過濾。然后,在構(gòu)建指數(shù)的過程中,分別比較了算術(shù)平均數(shù)和以相關(guān)系數(shù)為權(quán)重的加權(quán)平均數(shù)的構(gòu)造方法,結(jié)果發(fā)現(xiàn)以加權(quán)平均數(shù)來構(gòu)造權(quán)重的方法得到的搜索指數(shù)跟房價的相關(guān)性更大。因此,本文建議在利用大數(shù)據(jù)構(gòu)建搜索指數(shù)時注重相關(guān)系數(shù)所帶來的權(quán)重影響。
參考文獻:
[1]王娜.基于大數(shù)據(jù)的碳價預(yù)[T].統(tǒng)計研究,2016,33(11):56-62.
[2]秦磊,謝邦昌.谷歌流感趨勢的成功與失誤[J].統(tǒng)計研究,2016,33(2):107-110.
[3]劉濤雄,徐曉飛.互聯(lián)網(wǎng)搜索行為能幫助我們預(yù)測宏觀經(jīng)濟嗎?[J].經(jīng)濟研究,2015,50(12):68-83.
作者簡介:
弋微微,南充職業(yè)技術(shù)學院,四川南充。
①基金:2018年南充市社會科學研究“十三五”規(guī)劃項目,項目編號:NC2018C040。