劉娜娜+李雨潔+唐宇+邱益聰
摘要:通過(guò)分析人們?cè)诨ヂ?lián)網(wǎng)搜索過(guò)程中留下的搜索數(shù)據(jù),我們可以獲取許多有用的信息,本文基于人們利用互聯(lián)網(wǎng)搜索詞進(jìn)行房?jī)r(jià)預(yù)測(cè)。從確定種子關(guān)鍵詞開(kāi)始,接下來(lái)進(jìn)行種子關(guān)鍵詞擴(kuò)充,進(jìn)而確定核心關(guān)鍵詞,然后利用多元線性回歸進(jìn)行房?jī)r(jià)預(yù)測(cè)模型建立,并對(duì)比擬合值與實(shí)際值。
關(guān)鍵詞:大數(shù)據(jù);種子關(guān)鍵詞;多元線性回歸
一、背景
隨著互聯(lián)網(wǎng)的飛速發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)悄然地進(jìn)入人們的生活當(dāng)中,大數(shù)據(jù)開(kāi)啟了巨大的時(shí)代轉(zhuǎn)型,就宏觀經(jīng)濟(jì)分析而言,大數(shù)據(jù)時(shí)代帶來(lái)的轉(zhuǎn)變是重大且具有變革意義的。[1]另一方面,房地產(chǎn)市場(chǎng)在大多數(shù)國(guó)家屬于支柱性產(chǎn)業(yè),房地產(chǎn)市場(chǎng)的興衰或成敗決定著國(guó)家經(jīng)濟(jì)形勢(shì)的好壞。[2]隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,也給房地產(chǎn)行業(yè)帶來(lái)了一定沖擊和變革,房地產(chǎn)行業(yè)越來(lái)越多與互聯(lián)網(wǎng)相加,據(jù)統(tǒng)計(jì),在美國(guó)房地產(chǎn)商中,有72%的人利用互聯(lián)網(wǎng)銷(xiāo)售房屋,房地產(chǎn)經(jīng)紀(jì)人中有90%的人經(jīng)常利用網(wǎng)絡(luò)與購(gòu)房者進(jìn)行交流,互聯(lián)網(wǎng)已成為美國(guó)房地產(chǎn)營(yíng)銷(xiāo)的主要媒體。[3]通過(guò)分析消費(fèi)者利用互聯(lián)網(wǎng)的搜索痕跡,我們可以得到需求方的相關(guān)信息,從而為供給策略提供依據(jù)。在房地產(chǎn)行業(yè)中,我們就可以利用互聯(lián)網(wǎng)搜索引擎中廣大消費(fèi)者的與房地產(chǎn)相關(guān)的搜索詞匯進(jìn)行商品房的預(yù)測(cè)。
二、關(guān)鍵詞選取
(一)種子關(guān)鍵詞的選取
種子關(guān)鍵詞是在研究開(kāi)始時(shí)所確定的初始關(guān)鍵詞,這些關(guān)鍵詞必然與所要研究的問(wèn)題密切相關(guān)。其選取基于以下兩個(gè)標(biāo)準(zhǔn):一是要有一定的理論基礎(chǔ)作支撐,且該理論基礎(chǔ)必須貫穿于種子關(guān)鍵詞選取的始終;二是選取的種子關(guān)鍵詞必須與所要研究的問(wèn)題有密切的關(guān)系。[4]
據(jù)此,我們采用范圍取詞法,即根據(jù)所研究的經(jīng)濟(jì)行為的影響因素,確定種子關(guān)鍵詞的選取范圍,然后在范圍內(nèi)選擇合適的關(guān)鍵詞作為種子關(guān)鍵詞。
房地產(chǎn)的價(jià)格受宏觀和微觀兩方面因素共同作用,宏觀經(jīng)濟(jì)政策及外部環(huán)境的變化影響著供求關(guān)系,而供求關(guān)系決定了商品房的價(jià)格?;诤暧^層面,選擇“房貸利率”作為關(guān)鍵詞;基于微觀層面,其中又涉及到兩個(gè)主體,供應(yīng)方和需求方,針對(duì)房地產(chǎn)開(kāi)發(fā)商,選擇“成都樓盤(pán)”、“成都房地產(chǎn)”作為關(guān)鍵詞,針對(duì)購(gòu)房群體,選擇“成都搜房網(wǎng)”、“成都房?jī)r(jià)”、“成都租房”、“成都二手房”作為關(guān)鍵詞。
(二)種子關(guān)鍵詞的拓展
通常,在進(jìn)行相關(guān)搜索時(shí),人們不僅僅會(huì)搜索一次,例如當(dāng)搜索城市樓盤(pán)時(shí),如果對(duì)搜索結(jié)果不滿意,可能還有根據(jù)百度搜索推薦進(jìn)行再次搜索,通過(guò)這樣多次搜索的過(guò)程,來(lái)獲取滿意的結(jié)果。因此,對(duì)于種子關(guān)鍵詞的拓展,主要采用百度搜索推薦的方法,匯總7個(gè)初始種子關(guān)鍵詞的相關(guān)方面,形成關(guān)鍵詞集合,如下表1。
(三)核心關(guān)鍵詞確定
在確定了一組與所要研究的問(wèn)題密切相關(guān)的關(guān)鍵詞后,在后續(xù)的研究過(guò)程中一些相關(guān)關(guān)鍵詞將被視為核心關(guān)鍵詞,圍繞這一核心會(huì)派生出更多有價(jià)值的關(guān)鍵詞,推動(dòng)后續(xù)研究的進(jìn)行。[4]
我們通過(guò)2014-2015年的種子關(guān)鍵詞搜索量月度數(shù)據(jù)與成都市商品房月度價(jià)格指數(shù)進(jìn)行相關(guān)性分析,以此確定核心關(guān)鍵詞如下表2。
通過(guò)上表我們可以發(fā)現(xiàn),選擇出的核心關(guān)鍵詞的搜索量與商品房?jī)r(jià)格之間利用多元回歸的擬合結(jié)果與實(shí)際值之間誤差很小,其平均相對(duì)誤差值為0.88%。利用該模型,我們?cè)谥?015年12月份幾個(gè)核心關(guān)鍵詞的搜索量之后,預(yù)估商品房?jī)r(jià)格指數(shù),如下表6:
四、結(jié)論
“互聯(lián)網(wǎng)+”時(shí)代,我們可以利用互聯(lián)網(wǎng)上的“大數(shù)據(jù)”進(jìn)行房?jī)r(jià)的預(yù)測(cè),本文采用的方法較為簡(jiǎn)單,預(yù)測(cè)結(jié)果與實(shí)際值之間存在一定差異,同時(shí)如何使用恰當(dāng)?shù)姆椒?,使得估?jì)值與實(shí)際值之間的誤差更小,值得我們不斷探索和研究。近幾年政府在房地產(chǎn)行業(yè)也頒布了相關(guān)法律政策,我們也可以利用此種方法預(yù)測(cè)國(guó)家政策對(duì)于商品房?jī)r(jià)的作用。互聯(lián)網(wǎng)大數(shù)據(jù),將會(huì)給我們的生產(chǎn)生活帶來(lái)意想不到的改變。(作者單位:四川大學(xué)商學(xué)院)
參考文獻(xiàn):
[1]BreimanL,Randomforests[J].MachineLearing,2001(45).
[2]梁云芳,高鐵梅,賀書(shū)平.房地產(chǎn)市場(chǎng)與國(guó)民經(jīng)濟(jì)協(xié)調(diào)發(fā)展的實(shí)證分析[J].中國(guó)社會(huì)科學(xué),2006,(3):74-84.
[3]楊樹(shù)新,董紀(jì)昌,李秀婷.基于網(wǎng)絡(luò)關(guān)鍵詞搜索的房地產(chǎn)價(jià)格影響因素研究[J].新疆財(cái)經(jīng)大學(xué)學(xué)報(bào).2013(3):7.
[4]楊洋.基于灰色關(guān)聯(lián)聚類(lèi)的房屋銷(xiāo)售額預(yù)測(cè)關(guān)鍵詞優(yōu)化研究[D].吉林:吉林大學(xué),2015:14
[5]王惠文,孟潔.多元線性回歸的預(yù)測(cè)建模方法[J],北京航空航天大學(xué)學(xué)報(bào).2007,33(4):500.
[6]周復(fù)恭,黃運(yùn)成.應(yīng)用線性回歸分析[M].北京:中國(guó)人民大學(xué)出版社,1989:88-115.
[7]于秀林,任雪松.多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2011:8-30.
[8]葉峰,多元線性回歸在經(jīng)濟(jì)技術(shù)產(chǎn)量預(yù)測(cè)中的應(yīng)用[J],中外能源,(2):45.