張漢中+張倩+王斌+周小平+黃繼風(fēng)
[摘 要]近些年,上海市商品住宅的價(jià)格增長迅速,成為拉動(dòng)內(nèi)需、帶動(dòng)經(jīng)濟(jì)增長的支柱性產(chǎn)業(yè)。但是,若任其發(fā)展,將在一定程度上影響房地產(chǎn)市場健康發(fā)展的持續(xù)穩(wěn)定,影響宏觀經(jīng)濟(jì)和社會(huì)穩(wěn)定。雖然政府相關(guān)部門出臺(tái)了一系列調(diào)控措施,如房產(chǎn)稅、戶口限制等,但“購房熱”“買房難”依然是持續(xù)影響百姓生活的重大問題。也正因?yàn)槎鄶?shù)新房價(jià)格昂貴,大多數(shù)人會(huì)選擇購買二手房,那么,二手房的房價(jià)走勢是一個(gè)很值得研究的問題。文章主要通過對(duì)數(shù)量指標(biāo)進(jìn)行數(shù)據(jù)整理與清洗,并運(yùn)用動(dòng)態(tài)聚類法完成多元線性回歸模型的構(gòu)建。通過構(gòu)造合理準(zhǔn)確的多元線性回歸模型來預(yù)測出較為客觀的上海市二手房房價(jià)走勢。
[關(guān)鍵詞]商品住宅價(jià)格;線性回歸模型;房價(jià)預(yù)測;二手房
[DOI]10.13939/j.cnki.zgsc.2018.02.042
1 引 言
在我國文化觀念的影響下,房地產(chǎn)業(yè)是每位我國國民幾乎都會(huì)進(jìn)行消費(fèi)的重要產(chǎn)業(yè),是推動(dòng)國民經(jīng)濟(jì)增長的關(guān)鍵組成部分,[1]但由于房價(jià)泡沫等一系列因素導(dǎo)致房價(jià)陷入持續(xù)性飆升的“怪圈”。這種奇怪現(xiàn)象說明了對(duì)房地產(chǎn)業(yè)的研究和房屋價(jià)格走勢預(yù)測刻不容緩。[2]由圖1可知,上海的商品住房價(jià)格走勢一直呈現(xiàn)上升態(tài)勢。隨著更多的流動(dòng)人口進(jìn)入上海,住房的需求會(huì)越來越大。然而,在房價(jià)居高不下致使大多數(shù)人買不起房的情況下,房價(jià)依舊持續(xù)走高,不但加重了居民購房的負(fù)擔(dān),還可能造成諸多經(jīng)濟(jì)、社會(huì)問題,[3]所以,住房問題日漸成為我國的政治問題,引起中央與地方政府的高度關(guān)注。雖然國家出臺(tái)了一系列宏觀調(diào)控政策,但是效果并不是特別明顯。[4]上海作為國家經(jīng)濟(jì)發(fā)展的重要城市,對(duì)上海市商品房價(jià)格走勢的預(yù)測,有著一定的現(xiàn)實(shí)意義。
2012年,張小富、侯綱發(fā)表題為“基于多元線性回歸模型的西安住宅價(jià)格泡沫研究”的文章,其中通過構(gòu)建多元線性回歸方程分析多種因素對(duì)房價(jià)的影響。2013年,盧小濤對(duì)上海房地產(chǎn)業(yè)與區(qū)域經(jīng)濟(jì)相關(guān)性研究,發(fā)現(xiàn)房地產(chǎn)業(yè)發(fā)展對(duì)其區(qū)域經(jīng)濟(jì)的帶動(dòng)作用更為顯著。2015年,Lisi G和Iacobini M通過對(duì)意大利房產(chǎn)數(shù)據(jù)進(jìn)行分析,構(gòu)建數(shù)學(xué)模型進(jìn)而對(duì)房地產(chǎn)進(jìn)行較為合理的估價(jià),此模型對(duì)世界各地房地產(chǎn)普遍適用。本文中,筆者將通過對(duì)變量進(jìn)行處理,構(gòu)造多元回歸線性模型,運(yùn)用更為準(zhǔn)確的方式分析上海市二手房價(jià)格的變動(dòng)因素及發(fā)展趨勢。[5]見圖1。
2 數(shù)據(jù)的獲取與分析
2.1 數(shù)據(jù)的獲取
本文主要以鏈家網(wǎng)為例通過python編寫代碼獲取相應(yīng)的已成交二手房信息。[6]其中所需的有效信息為上海各個(gè)區(qū)域下每套二手房的所在區(qū)域、小區(qū)名稱、戶型、面積、成交日期、售價(jià)、樓層(分區(qū))、朝向、單價(jià)及建造日期。(注:獲取的成交數(shù)據(jù)建造日期存在部分,通過與未成交數(shù)據(jù)匹配可以盡量彌補(bǔ)所缺少的建造日期),獲取數(shù)據(jù)整理成如圖2所示的格式(共24036套)。
2.2 數(shù)據(jù)的整理與分析
2.2.1 上海各地區(qū)二手房的均價(jià)
各區(qū)近期房價(jià)如圖3所示,上海二手房價(jià)格最高的三個(gè)地區(qū)為:靜安、黃浦和徐匯,均價(jià)都在7萬元以上,房價(jià)較低的三個(gè)區(qū)為:金山、崇明和奉賢,均價(jià)都在2萬元左右。
2.2.2 二手房的戶型和檔次的分布
從圖4中不難看出,戶型分布數(shù)據(jù)的長尾向右延伸,屬于嚴(yán)重的正偏態(tài)分布。所以,考慮將600套以下的戶型統(tǒng)統(tǒng)歸為一類,以此減輕長尾現(xiàn)象。如圖5所示。
2.2.3 二手房的面積和成交價(jià)格的正態(tài)性檢驗(yàn)
核密度估計(jì)是對(duì)直方圖的一個(gè)自然拓展。
QQ圖是由標(biāo)準(zhǔn)正態(tài)分布的分位數(shù)為縱坐標(biāo),樣本值為橫坐標(biāo)的散點(diǎn)圖,利用QQ圖可以判斷數(shù)據(jù)是否近似符合正態(tài)分布,只需看QQ圖上的點(diǎn)是否近似地在一條直線附近,該直線的斜率為標(biāo)準(zhǔn)差,截距為均值。
PP圖是根據(jù)變量的累積比例與指定分布的累積比例之間的關(guān)系所繪制的圖形。利用PP圖可以判斷數(shù)據(jù)是否符合正態(tài)分布。當(dāng)數(shù)據(jù)符合正態(tài)分布時(shí),PP圖中各點(diǎn)近似呈一條直線。[7]
顯然,獲取到的數(shù)據(jù)的面積和成交價(jià)格均不滿足正態(tài)分布,那么就無法直接對(duì)數(shù)據(jù)進(jìn)行方差分析或構(gòu)建線性回歸模型。通過上述方法檢驗(yàn)發(fā)現(xiàn),二手房的面積和成交價(jià)格均不符合正態(tài)分布。詳見圖6和圖7。
3 多元線性模型的構(gòu)建
3.1 相關(guān)分析
動(dòng)態(tài)聚類法又稱逐步聚類法,其基本思路為,起初進(jìn)行粗略分類,然后依據(jù)最優(yōu)原則將原本不合理的分類進(jìn)行調(diào)整,進(jìn)而形成最終聚類。此方法較為簡便,占用計(jì)算機(jī)內(nèi)存較少,所以更適用于大樣本的聚類分析。其中最常用的為kmeans函數(shù)。由于獲取到的數(shù)據(jù)屬于大樣本范疇,本文將采用此算法進(jìn)行聚類。[8]
第一,用房子的單價(jià)(danjia)和面積(mianji)這兩個(gè)變量對(duì)樓盤進(jìn)行聚類分析,用K均值聚類,分成四類,進(jìn)行顯組間比較,結(jié)果差異顯著,有統(tǒng)計(jì)學(xué)意義。[9]聚類數(shù)量分布表——每個(gè)聚類中的個(gè)案數(shù)量見表1,方差分析表—ANOVA見表2。
第二,根據(jù)每個(gè)類別的單價(jià),面積的平均值,以及各個(gè)類別在區(qū)域、朝向、戶型的分布情況。[10]四個(gè)樓盤的類別是以下幾類。
第一類:大戶型,樓盤的面積最大,價(jià)格最高,數(shù)量最少。相對(duì)的戶型是5室以上。以靜安為代表,一般朝西。
第二類:徘徊型。價(jià)格第二高,面積適中,數(shù)量一般,相對(duì)的戶型是4室或3室2廳的,集中在黃浦、長寧、徐匯一帶。主要以朝東南、朝西南為主。
第三類:大眾型,價(jià)格最低,數(shù)量比較多,主要是2室1廳、3室1廳。集中在崇明、金山、奉賢一帶。朝向是南北為主。
第四類:地段型,價(jià)格適中,面積小,數(shù)量最多,主要是沒有廳的戶型,集中在閘北、楊浦、普陀一帶。朝向以東南、朝南為主。
第三,四種樓盤分類如圖8所示。
第四,以單價(jià)(danjia)為因變量,區(qū)域(are)、戶型(tye)、學(xué)區(qū)(xuequ)、面積(mianji)、看房量(kanfan),朝向(P)、容積(rongji)、綠化(lvhua)為自變量做方差分析如下:從表3中可知朝向的P值大于0.05,沒有統(tǒng)計(jì)學(xué)意義,因此可以考慮把朝向剔除。endprint
第五,剔除朝向后的方差分析如下:區(qū)域、戶型、學(xué)區(qū)、面積、看房量、朝向、容積、綠化率均有統(tǒng)計(jì)學(xué)意義。在單變量方差分析中,SSA 代表A因素產(chǎn)生的組間變異, SSE是組內(nèi)變異。公式分母是組內(nèi)變異SSE 和A因素的組間變異的和,偏eta方的公式為n2p=SSASSA+SSE。偏eta方能說明某個(gè)因素與誤差的關(guān)系,[11]因此從偏Eta平方可以看出區(qū)域、學(xué)區(qū)房對(duì)單價(jià)的影響比較大。見表4。
3.2 數(shù)學(xué)模型的構(gòu)建
基于上述分析,我們可以給出上海住宅的多元線性回歸模型。
因變量單價(jià):
Danjia=46852.6+26422.9are1+15252are2-25304are3+8328tye1+1881.5tye2+2059.74tye3-6863.77xuequ+17.3mianji+214.22kanfan+5351.3rongji+25624.34lvhua.(1)
式(1)中,Danjia表示前三類房屋單價(jià),are1表示第1類樓盤的區(qū)域,are2表示第2類樓盤的區(qū)域,are3表示第3類樓盤的區(qū)域,tye1表示第1類樓盤的戶型,tye2表示第2類樓盤的戶型,tye3表示第3類樓盤的戶型,xuequ表示學(xué)區(qū),mianji表示面積,kanfan表示看房量,rongji表示容積率,lvhua表示綠化率。
當(dāng)是第4類的樓盤、學(xué)區(qū)房時(shí)。相對(duì)應(yīng)的樓盤單價(jià)方程為:
Danjia=46852.6+17.3mianji+214.22kanfan+5351.3rongji+25624.34lvhua(2)
式(2)中,Danjia表示第4類房屋單價(jià),mianji表示面積,kanfan表示看房量,rongji表示容積率,lvhua表示綠化率。
表5可以得出各種類型的房價(jià)預(yù)測,學(xué)區(qū)房比非學(xué)區(qū)房的房價(jià)要貴。以第4類樓盤為參照水平。
通過LSD法比較各個(gè)戶型樓盤單價(jià)的高低情況,[12]得出tye1>tye2>tye4.tye1>tye3>tye4。tye2和tye3 P值大于0.05,沒有顯著性差異。見表6。
通過LSD法比較各個(gè)區(qū)域樓盤單價(jià)的高低情況,得出are1>are2>are4>are3。見表7。
從殘差圖圖9來看,整體的波動(dòng)不大,因此模型的擬合效果比較好[13]。
4 結(jié) 論
本文通過構(gòu)建線性回歸方程建立起上海二手房價(jià)格的評(píng)估模型,并對(duì)具體數(shù)據(jù)進(jìn)行房產(chǎn)價(jià)格的評(píng)估,分析得到,樓盤的單價(jià)減去預(yù)測值,如果為正則樓盤有升值空間,如果為負(fù)則樓盤為泡沫存在。從以圖10可以看到,存在泡沫的主要是第三類大眾型和第四類地段型樓盤。圖10為結(jié)論圖。
參考文獻(xiàn):
[1] 許艷榮.房地產(chǎn)業(yè)對(duì)相關(guān)產(chǎn)業(yè)的帶動(dòng)效應(yīng)研究[J].中國經(jīng)貿(mào), 2013(18):22.
[2] 劉其華.試論影響我國房地產(chǎn)價(jià)格持續(xù)上漲的主要因素及其原因——以上海為例[J].經(jīng)濟(jì)師, 2011(4):236-238.
[3] 張?jiān)?基于主成分回歸分析的上海房價(jià)影響因素研究[J].江蘇商論, 2013(27):125-126.
[4] 任晨瑩.上海樓市主線政策大回顧[J].上海房地, 2017(4):19-23.
[5] Lisi G, Iacobini M.Estimating the Housing Price with a Search-and-matching Model[J].Journal of European Real Estate Research, 2015, 8(2):196-216.
[6] 王藎梓, 賴雯潔.基于房產(chǎn)交易網(wǎng)站的數(shù)據(jù)獲取與在線工具開發(fā)[J].計(jì)算機(jī)技術(shù)與發(fā)展, 2017, 27(5):154-159.
[7] 張小富, 侯綱.基于多元線性回歸模型的西安住宅價(jià)格泡沫研究[J].價(jià)格月刊, 2012(11):41-44.
[8] 丁飛.上海與重慶房地產(chǎn)價(jià)格決定因素對(duì)比分析[J].知識(shí)經(jīng)濟(jì), 2011(13):96.
[9] Berna Keskin.HedonicAnalysis of Price in the Istanbul Housing Market[J].International Journal of Strategic Property Management, 2008, 12(2):125-138.
[10] 丁軍.北京、上海、深圳房地產(chǎn)價(jià)格的影響因素比較研究[J].中國房地產(chǎn), 2016(36):28-35.
[11]劉紀(jì)輝.基于多元線性回歸分析房地產(chǎn)價(jià)格的影響因素[J].湖北工業(yè)大學(xué)學(xué)報(bào), 2008, 23(4):87-90.
[12] Tsai I C, Peng C W.Linear and Nonlinear Dynamic Relationships between Housing Prices and Trading Volumes[J].North American Journal of Economics & Finance, 2016(38):172-184.
[13] Francke M K.Repeat Sales Index for Thin Markets[J].Journal of Real Estate Finance & Economics, 2010, 41(1):24-52.endprint