張娟
[提要] 為科學(xué)分析網(wǎng)絡(luò)搜索數(shù)據(jù)與房地產(chǎn)價(jià)格之間的變動(dòng)關(guān)系,本文以百度搜索指數(shù)為基礎(chǔ),選取與房地產(chǎn)價(jià)格相關(guān)度較高的7個(gè)關(guān)鍵詞構(gòu)建全新的綜合網(wǎng)絡(luò)搜索指數(shù),并運(yùn)用自回歸分布滯后模型對(duì)房地產(chǎn)價(jià)格指數(shù)進(jìn)行擬合與預(yù)測(cè),得到房地產(chǎn)價(jià)格指數(shù)預(yù)測(cè)模型。最后把該模型用于河北省石家莊市、唐山市和秦皇島市房地產(chǎn)市場(chǎng)的驗(yàn)證和預(yù)測(cè),結(jié)果表明:本文構(gòu)建的綜合網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)之間的ADL模型能夠及時(shí)、客觀、準(zhǔn)確地預(yù)測(cè)房地產(chǎn)價(jià)格變動(dòng)趨勢(shì),具有明顯的可操作性。
關(guān)鍵詞:網(wǎng)絡(luò)搜索;數(shù)據(jù)分析;房地產(chǎn)價(jià)格;ADL模型
基金項(xiàng)目:河北省統(tǒng)計(jì)科學(xué)研究計(jì)劃項(xiàng)目:“基于網(wǎng)絡(luò)搜索數(shù)據(jù)的河北省房地產(chǎn)價(jià)格預(yù)測(cè)研究”(2014HY27);河北省科技廳軟科學(xué)研究計(jì)劃項(xiàng)目:“基于互聯(lián)網(wǎng)征信數(shù)據(jù)的中小微企業(yè)信用評(píng)估體系研究”(154576271)
中圖分類號(hào):C812 文獻(xiàn)標(biāo)識(shí)碼:A
收錄日期:2017年7月19日
近年來,伴隨著各地限購(gòu)、限貸或其他抑制房?jī)r(jià)政策的出臺(tái),房地產(chǎn)市場(chǎng)的價(jià)格走勢(shì)已經(jīng)成為各類購(gòu)房者、房地產(chǎn)商以及房產(chǎn)信息網(wǎng)站共同關(guān)注的關(guān)鍵問題。國(guó)家統(tǒng)計(jì)局每月中旬發(fā)布的房地產(chǎn)價(jià)格指數(shù)明顯具有時(shí)效性的欠缺,難以作為房地產(chǎn)價(jià)格走勢(shì)的即時(shí)性參考,而本文提出的網(wǎng)絡(luò)搜索關(guān)鍵詞綜合指數(shù)法則可以有效地預(yù)測(cè)未來房地產(chǎn)價(jià)格的走勢(shì)。
一、網(wǎng)絡(luò)搜索數(shù)據(jù)測(cè)度
在互聯(lián)網(wǎng)信息化時(shí)代人們使用各種搜索引擎獲取各類信息,搜索引擎的搜索數(shù)據(jù)逐漸在社會(huì)科學(xué)研究中得到應(yīng)用。利用網(wǎng)絡(luò)算法技術(shù)搜索與輸入性關(guān)鍵詞和索引相匹配的網(wǎng)頁(yè)和數(shù)據(jù)已經(jīng)成為經(jīng)濟(jì)預(yù)測(cè)的重要手段之一,可以這樣說,分析網(wǎng)絡(luò)搜索數(shù)據(jù)不僅能夠找到經(jīng)濟(jì)主體預(yù)期行為的基本規(guī)律和變化趨勢(shì),而且還會(huì)發(fā)現(xiàn)比經(jīng)濟(jì)主體實(shí)際行為更具時(shí)效性的資料和數(shù)據(jù)。在國(guó)內(nèi)三大主流搜索引擎百度、Google和搜狗的篩選中,Google存在著對(duì)中文支持不足的缺點(diǎn)、搜狗具有數(shù)據(jù)庫(kù)信息不對(duì)稱的特征,唯有百度搜索引擎最具說服力和代表性,為此本文選用百度搜索引擎作為數(shù)據(jù)分析的基礎(chǔ)。為了對(duì)百度搜索欄中出現(xiàn)的關(guān)鍵詞進(jìn)行熱度分析,本文借用了百度網(wǎng)站經(jīng)常使用的百度搜索指數(shù)來構(gòu)建全新的網(wǎng)絡(luò)搜索指數(shù)。百度搜索指數(shù)是指百度官方計(jì)算的各個(gè)關(guān)鍵詞在百度網(wǎng)頁(yè)中出現(xiàn)頻率的加權(quán)和、網(wǎng)絡(luò)搜索數(shù)據(jù)的測(cè)度以百度關(guān)鍵詞的指數(shù)數(shù)據(jù)為基礎(chǔ)。盡管目前的網(wǎng)絡(luò)搜索技術(shù)已經(jīng)非常成熟,但國(guó)內(nèi)外真正利用百度搜索數(shù)據(jù)來預(yù)測(cè)房?jī)r(jià)走勢(shì)的研究成果相對(duì)較少,零星的研究仍處于起步階段。為此,本文首先構(gòu)建了綜合網(wǎng)絡(luò)搜索指數(shù)并借此研究該指數(shù)與房地產(chǎn)價(jià)格的相關(guān)性。
(一)關(guān)鍵詞的選定。首先,篩選與房地產(chǎn)價(jià)格有關(guān)的關(guān)鍵詞,關(guān)鍵詞指數(shù)數(shù)據(jù)選取百度中整體趨勢(shì)的搜索指數(shù)。初始關(guān)鍵詞依據(jù)人們關(guān)注房地產(chǎn)價(jià)格時(shí)考慮的主要因素,具體包含房地產(chǎn)市場(chǎng)的總體狀況、房地產(chǎn)的相關(guān)政策、房地產(chǎn)市場(chǎng)的交易信息等,據(jù)此得到相關(guān)聯(lián)的關(guān)鍵詞75個(gè)。由于百度搜索引擎會(huì)推薦一些與我們搜索內(nèi)容有關(guān)的其他關(guān)鍵詞,因此綜合起來所有的關(guān)鍵詞達(dá)到了90個(gè);其次,依據(jù)百度指數(shù)中的需求圖譜及相關(guān)詞分類的相關(guān)度,將相關(guān)度低的或類似的關(guān)鍵詞刪掉,剩余的關(guān)鍵詞再進(jìn)行進(jìn)一步的關(guān)聯(lián)度對(duì)比,最終保留相關(guān)度較高的7個(gè)關(guān)鍵詞:房?jī)r(jià)(k1)、房源(k2)、房產(chǎn)網(wǎng)(k3)、新樓盤(k4)、房貸利率(k5)、公積金(k6)、裝修(k7)。
(二)綜合網(wǎng)絡(luò)搜索指數(shù)的構(gòu)建。為科學(xué)的分析河北省的情況,選取最具代表性的三個(gè)城市:石家莊市、唐山市和秦皇島市。以三個(gè)城市為例,依據(jù)2011年1月1日至2016年12月31日的關(guān)鍵詞周平均指數(shù),利用移動(dòng)平均法計(jì)算得到2011年1月至2016年12月的月平均指數(shù),為將所選關(guān)鍵詞的百度搜索指數(shù)合成一個(gè)綜合網(wǎng)絡(luò)搜索指數(shù)WI,構(gòu)建合成指數(shù)計(jì)算公式:WI=■Iiwi。其中,Ii為第i個(gè)關(guān)鍵詞的百度搜索指數(shù),wi為第i個(gè)指數(shù)的權(quán)重,權(quán)重的確定利用主成分分析進(jìn)行。由此根據(jù)所選三個(gè)城市7個(gè)關(guān)鍵詞的百度搜索指數(shù)數(shù)據(jù),利用SAS軟件進(jìn)行主成分分析,得到第一主成分的特征向量如表1所示。將各系數(shù)進(jìn)行歸一化處理后作為各個(gè)關(guān)鍵詞指數(shù)的權(quán)重。根據(jù)表1得到的權(quán)重分別計(jì)算得到石家莊市、唐山市、秦皇島市的綜合網(wǎng)絡(luò)搜索指數(shù),記為WIS、WIT、WIQ,如圖1所示。(表1、圖1)
二、網(wǎng)絡(luò)搜索指數(shù)與房地產(chǎn)價(jià)格之間的相關(guān)性
購(gòu)房者借助網(wǎng)絡(luò)搜索技術(shù)找到所需相關(guān)信息,實(shí)現(xiàn)了購(gòu)買房產(chǎn)時(shí)的較高參與度。這說明網(wǎng)絡(luò)搜索數(shù)據(jù)能夠顯示出房地產(chǎn)參與主體的預(yù)期,也展示了房地產(chǎn)業(yè)各參與主體的購(gòu)買習(xí)慣和行為走向,進(jìn)而對(duì)房地產(chǎn)的價(jià)格產(chǎn)生影響。
(一)理論分析。供求因素是影響房地產(chǎn)價(jià)格的重要因素,互聯(lián)網(wǎng)的搜索引擎為房地產(chǎn)參與主體提供了便利的信息供應(yīng)。通常情況下,消費(fèi)者在購(gòu)房的時(shí)候會(huì)抱有謹(jǐn)慎的態(tài)度,并且由于房地產(chǎn)的位置固定性、價(jià)值量大、流動(dòng)性差等特點(diǎn),使房地產(chǎn)市場(chǎng)的供求信息處于一種不對(duì)稱狀態(tài)。消費(fèi)者在購(gòu)房需求產(chǎn)生之后通常都會(huì)花費(fèi)大量時(shí)間搜集相關(guān)信息,消費(fèi)者對(duì)這些信息的關(guān)注程度展示了消費(fèi)者對(duì)房地產(chǎn)市場(chǎng)供需狀況的反應(yīng),進(jìn)而影響到預(yù)期的購(gòu)買行為。就房地產(chǎn)市場(chǎng)的參與各方而言,面對(duì)宏觀經(jīng)濟(jì)政策的變化都存在一個(gè)心理預(yù)期的形成過程。政策變動(dòng)時(shí),其投資行為或購(gòu)買行為會(huì)考慮新政策下的預(yù)期收益和成本變動(dòng)等問題。也就是說,房地產(chǎn)價(jià)格的變化并不會(huì)隨著宏觀經(jīng)濟(jì)政策的變化立即產(chǎn)生,而是存在明顯的時(shí)滯性。這說明購(gòu)房者及房地產(chǎn)商的行為都可以在互聯(lián)網(wǎng)上和實(shí)際市場(chǎng)中反映出來,互聯(lián)網(wǎng)絡(luò)搜索關(guān)鍵詞的變化成為各參與主體預(yù)期行為的表現(xiàn),而各參與方的實(shí)際行為則反映在房地產(chǎn)價(jià)格的滯后變化上。
(二)網(wǎng)絡(luò)搜索指數(shù)與房地產(chǎn)價(jià)格互相關(guān)分析。房地產(chǎn)價(jià)格選取新建商品住宅價(jià)格環(huán)比指數(shù)(FI)作為研究變量,三個(gè)城市的新建商品住宅價(jià)格指數(shù)分別記為FIS、FIT、FIQ,選取國(guó)家統(tǒng)計(jì)局公布的2011年1月到2016年12月數(shù)據(jù),如圖2所示。(圖2)
由圖1和圖2可以看出,網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)之間存在較明顯的共同變化趨勢(shì),為進(jìn)一步研究二者之間的關(guān)系,采用時(shí)間序列互相關(guān)函數(shù)進(jìn)一步分析。
1、平穩(wěn)性檢驗(yàn)。首先對(duì)各變量進(jìn)行平穩(wěn)性檢驗(yàn),檢驗(yàn)結(jié)果如表2所示。可以看出:FIS、FIT、FIQ、WIS、WIT、WIQ的ADF統(tǒng)計(jì)量在10%的顯著水平下都是平穩(wěn)的。(表2)
2、互相關(guān)函數(shù)分析。互相關(guān)函數(shù)能夠測(cè)度兩變量之間的相關(guān)強(qiáng)度和方向,利用Eviews8.0作互相關(guān)函數(shù)圖,分別對(duì)石家莊市、唐山市、秦皇島市的網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)進(jìn)行互相關(guān)分析。(表3、表4、表5)
表3顯示石家莊市的網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)存在明顯滯后的正相關(guān)關(guān)系。FIS與WIS(-i)之間的關(guān)系中可以看出,滯后的WIS與FIS相關(guān)性較顯著,相關(guān)關(guān)系一直持續(xù)到滯后第9期,滯后第10期開始逐漸減弱,尤其是WIS(-6)、WIS(-7)、WIS(-8)與FIS的正相關(guān)性較強(qiáng),說明人們進(jìn)行網(wǎng)絡(luò)搜索的變化與半年以后的房?jī)r(jià)相關(guān)聯(lián);在FIS與WIS(+i)之間的關(guān)系中,顯示出FIS與未來的WIS也存在一定的相關(guān)性,尤其是未來4期的負(fù)相關(guān)關(guān)系明顯,說明房?jī)r(jià)變化與未來網(wǎng)絡(luò)搜索量的反向變動(dòng)關(guān)系明顯,人們對(duì)石家莊市房?jī)r(jià)的反應(yīng)較敏感。
表4顯示唐山市的網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)的正相關(guān)關(guān)系滯后作用期更長(zhǎng)一些,WIT與FIT的相關(guān)關(guān)系稍弱于石家莊市。FIT與WIT(-i)之間的關(guān)系中,從滯后第6期,WIT與FIT的相關(guān)性才開始增強(qiáng),WIT(-9)與FIT的相關(guān)性最顯著,一直持續(xù)到滯后11期,然后逐漸減弱;在FIT與WIT(+i)的關(guān)系中,F(xiàn)IT與未來WIT的負(fù)相關(guān)性顯現(xiàn)的較緩慢,未來的8期之后負(fù)相關(guān)關(guān)系才逐漸增強(qiáng),說明唐山市房?jī)r(jià)發(fā)生變化后,網(wǎng)絡(luò)搜索的反應(yīng)較慢,人們對(duì)唐山市房?jī)r(jià)的反應(yīng)不夠敏感。
表5顯示秦皇島市的網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)之間的滯后相關(guān)也較明顯,與唐山市相似,但正相關(guān)關(guān)系更強(qiáng)一點(diǎn)。FIQ與WIQ(-i)之間的關(guān)系中,WIQ與FIQ的滯后相關(guān)關(guān)系不斷增強(qiáng),WIQ(-9)與FIQ的相關(guān)關(guān)系最強(qiáng),滯后相關(guān)持續(xù)到滯后11期,第12期開始逐漸減弱;在FIQ與WIQ(+i)之間的關(guān)系中,F(xiàn)IT與未來WIT的負(fù)相關(guān)性顯現(xiàn)的也較緩慢,負(fù)相關(guān)程度顯現(xiàn)的比唐山市的稍強(qiáng)一些,說明人們對(duì)秦皇島市房?jī)r(jià)的反應(yīng)比唐山市敏感一些。
三、基于ADL模型的預(yù)測(cè)分析
(一)模型的構(gòu)建與估計(jì)。通過互相關(guān)函數(shù)的分析可以看出,網(wǎng)絡(luò)搜索指數(shù)(WI)與新建商品住宅價(jià)格指數(shù)(FI)存在明顯的滯后關(guān)系,而且滯后期較長(zhǎng),因此構(gòu)建能夠反映滯后影響關(guān)系的自回歸分布滯后模型ADL(1,n)模型:
FIt=c+?琢FIt-1+?茁0WIt+?茁1WIt-1+?茁2WIt-2+…+ut
模型中,下標(biāo)t表示第t月,u為隨機(jī)擾動(dòng)項(xiàng)。由于FI與WI互相關(guān)函數(shù)分析的滯后期較長(zhǎng),因此模型的構(gòu)建中加入了FIt-1,并且對(duì)WI的滯后期沒有加以限制,但WI的滯后期長(zhǎng)度需要在模型的估計(jì)中進(jìn)行驗(yàn)證。根據(jù)AIC、SC信息準(zhǔn)則,從滯后11階開始驗(yàn)證模型,以此得到最顯著的滯后階數(shù)。運(yùn)用Eviews8.0對(duì)三個(gè)城市分別進(jìn)行模型的驗(yàn)證與估計(jì),估計(jì)方法采用阿爾蒙多項(xiàng)式法,最終驗(yàn)證的模型及結(jié)果如表6所示。(表6)
模型估計(jì)結(jié)果表明,網(wǎng)絡(luò)搜索指數(shù)對(duì)房地產(chǎn)價(jià)格確實(shí)存在滯后影響,石家莊市的滯后影響在第4~8個(gè)月比較顯著,唐山市的為第7~11個(gè)月,秦皇島的為第6~9個(gè)月,說明對(duì)河北省房?jī)r(jià)感興趣的購(gòu)房者通常會(huì)提前半年左右甚至提前更長(zhǎng)時(shí)間搜索相關(guān)信息,換言之,根據(jù)當(dāng)前用戶的網(wǎng)絡(luò)搜索數(shù)據(jù)可以預(yù)測(cè)半年以后的房地產(chǎn)價(jià)格。
(二)基于ADL模型的預(yù)測(cè)。根據(jù)2017年1月和2月的百度搜索數(shù)據(jù)計(jì)算得到網(wǎng)絡(luò)搜索指數(shù)的WI,利用表6的驗(yàn)證模型分別對(duì)石家莊市、唐山市和秦皇島市的新建商品住宅價(jià)格指數(shù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如表7所示。三個(gè)模型進(jìn)行預(yù)測(cè)的平均相對(duì)預(yù)測(cè)誤差MAPE分別是0.21%、0.21%、0.29%。(表7)
預(yù)測(cè)結(jié)果顯示,2017年1月和2月河北省石家莊市、唐山市和秦皇島市的新建商品住宅價(jià)格指數(shù)均大于1,說明房?jī)r(jià)均有所上漲,與實(shí)際國(guó)家統(tǒng)計(jì)局公布的實(shí)際數(shù)據(jù)相比,三個(gè)模型的預(yù)測(cè)誤差很小,預(yù)測(cè)結(jié)果與實(shí)際相符,模型的預(yù)測(cè)效果很好。
四、結(jié)論
通過理論分析網(wǎng)絡(luò)搜索數(shù)據(jù)與房地產(chǎn)價(jià)格之間的關(guān)系,利用互相關(guān)函數(shù)分析進(jìn)一步證實(shí)網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)之間的滯后相關(guān),據(jù)此建立的自回歸分布滯后模型更具體展現(xiàn)了二者之間的滯后影響關(guān)系。石家莊市、唐山市、秦皇島市的數(shù)據(jù)經(jīng)過模型的驗(yàn)證都充分說明房地產(chǎn)參與主體的網(wǎng)絡(luò)搜索行為與房地產(chǎn)價(jià)格之間存在的滯后關(guān)系。綜合來看,滯后影響在滯后第4~11個(gè)月之間較顯著。這一結(jié)果表明購(gòu)房者一般會(huì)提前半年至一年的時(shí)間搜索相關(guān)信息,而當(dāng)前搜索行為的數(shù)據(jù)為以后房地產(chǎn)價(jià)格的預(yù)測(cè)提供了信息基礎(chǔ)。本文構(gòu)建的綜合網(wǎng)絡(luò)搜索指數(shù)與新建商品住宅價(jià)格指數(shù)之間的ADL模型,能夠比較及時(shí)、客觀、準(zhǔn)確地預(yù)測(cè)房地產(chǎn)價(jià)格的變動(dòng),相對(duì)于其他方法來說,消除了主觀因素的影響,預(yù)測(cè)的時(shí)效性更強(qiáng),體現(xiàn)出網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)房地產(chǎn)價(jià)格具有較好的預(yù)測(cè)效果。
主要參考文獻(xiàn):
[1]孟彩云,王聰.房地產(chǎn)價(jià)格、泰勒規(guī)則與宏觀經(jīng)濟(jì)調(diào)控——基于2000~2010年我國(guó)宏觀經(jīng)濟(jì)數(shù)據(jù)的檢驗(yàn)[J].當(dāng)代財(cái)經(jīng),2012.2.
[2]董紀(jì)昌,李秀婷.基于網(wǎng)絡(luò)關(guān)鍵詞搜索的房地產(chǎn)價(jià)格影響因素研究[J].新疆財(cái)經(jīng)大學(xué)學(xué)報(bào),2013.3.
[3]劉枬,劉小娟.房地產(chǎn)大數(shù)據(jù)的研究現(xiàn)狀和趨勢(shì)分析[J].建筑經(jīng)濟(jì),2015.6.