王鈳茗
【摘要】主成分分析是研究住宅屬性與價格關(guān)系的有效手段。本文將主成分分析模型用于杭州市二手房市場研究,分析2930個杭州市二手房的詳細情況,進行多重回歸分析,并用SPSS軟件模擬特征價格模型。
【關(guān)鍵詞】住宅屬性 二手房
一、引言
特征價格法是目前國際上研究影響住宅價格微觀決定因素的最主流方法。自1974年Rosen提出完整的技術(shù)框架后,經(jīng)歷30余年的發(fā)展,業(yè)己十分成熟,在我國及很多發(fā)達國家的政府部門和產(chǎn)業(yè)界得到越來越廣泛的應(yīng)用。
二、研究區(qū)概況
杭州市房地產(chǎn)市場是我國最為發(fā)達的房地產(chǎn)市場之一,自2016年G20之后,杭州市的國際知名度大增,二手房交易流動速度遠高于我國房產(chǎn)交易平均水平。在二手房交易中,賣方和買方的信息對稱和知情權(quán)是目前制約二手房市場發(fā)展的主要原因之一。對賣方而言,由于復(fù)雜多變的政策、“一房一價”模式以及個人偏好問題,導(dǎo)致售出過程受阻;而對買方而言,從浩瀚如煙的房產(chǎn)數(shù)據(jù)里搜尋出心儀的房產(chǎn),更是難事一樁。因此,快速準確地為業(yè)主的房產(chǎn)估值或為購房者提供置業(yè)建議成為房產(chǎn)經(jīng)濟行業(yè)非常有意義的研究問題。
三、樣本量的確定
本文從實際樣本量的可獲取量出發(fā),參考各個城區(qū)人口數(shù)量間的比例關(guān)系,其中西湖區(qū)編號為1,人口數(shù)量80.85萬人,樣本數(shù)量510;上城區(qū)編號為2,人口數(shù)量35.30萬人,樣本數(shù)量412;下城區(qū)編號為3,人口數(shù)量53.50萬人,樣本數(shù)量330;江干區(qū)編號為4,人口數(shù)量71.09萬人,樣本數(shù)量456;拱墅區(qū)編號為5,人口數(shù)量57.10萬人,樣本數(shù)量640;濱江區(qū)編號為6,人口數(shù)量33.08萬人,樣本數(shù)量582。
四、特征價格模型的構(gòu)建
(一)數(shù)據(jù)來源
變量數(shù)據(jù)的獲取主要依靠網(wǎng)絡(luò)。內(nèi)容包括:裝修程度、建筑類型、朝向、附近生活便利情況、附近教育配套、附近醫(yī)療情況、附近交通情況、面積、戶型、樓層、建造年代等。以及區(qū)位特征和鄰里特征;對于特征不詳盡的住房,以實地調(diào)查的方式補充資料。
(二)樣本變量的選擇和量化
分等級賦值變量:有些特征變量需要通過主觀識別進行評價,為了便于賦值,所以進行了等級的賦值的方法,這類變量主要有:裝修程度、建筑類型、朝向三個變量。賦值越高,對住宅價格的附加值就越高。裝修中毛坯、簡裝、精裝分別賦值為3、6、9;樓層低中高分別對應(yīng)樓層2、7、10;給朝向排序綜合指標變量。由于過多變量的共線性問題不容忽視,故需對過多變量進行概括與濃縮,形成一個綜合指標,包括15min步行范圍內(nèi)公交站數(shù);5公里內(nèi)醫(yī)院數(shù);1公里內(nèi)學校數(shù);15min步行范圍內(nèi)超市數(shù)。還對定量數(shù)據(jù)進行量化,包括:幾室?guī)讖d、面積、建造年代、電梯有無。
(三)杭州二手房房產(chǎn)估值模型的建立
建立多元線性回歸模型,再用逐步回歸法對影響房價不大的因素移去,再利用線性最小二乘法對其他主要因素進行擬合。
1.多元線性回歸模型的建立與求解:
由y=β0+β1x1+…+βkxk確定模型為:
Y=Xβ+ε
E(ε)=0,COV(ε,ε)=σ2In
為k元線性回歸模型,k=12,簡記為(Y,Xβ,σ2In)
Y=-185.5261+3.0877*x3+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1o+10.6264*x11+1.3616*x12
其中β0,βD,…,β12是13個帶估計參數(shù)。y為房價,單位萬元;x1為室數(shù),單位室;x2為廳數(shù),單位廳;x3為面積;x4為朝向;x5為裝修;x6為電梯有無;x7為建造年代;x8為樓層高低;x9為周邊交通;x10為周邊醫(yī)療;x11為周邊教育;x12為周邊超市。
用最小二乘法求β0,…,βk的估計量做離差平方和:
選擇β0,…,βk使得Q達到最小。解得估計值:
此為經(jīng)驗回歸平面方程,βi為經(jīng)驗回歸系數(shù)。
進行逐步回歸分析,從一個自變量開始,視自變量y作用的顯著程度,從大到小地依次逐個引入回歸方程。當引入的自變量由于后面變量的引入而變得不顯著時,要將其剔除掉。對于每一步都要進行y值檢驗,以確保每次引入新的顯著性變量前回歸方程中只包含對y作用顯著的變量。這個過程反復(fù)進行,直至既無不顯著的變量從回歸方程中剔除,又無顯著變量可引入回歸方程時為止。最終得到回歸平面方程為:
y=-185.5261+3.0877x3*+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1*+10.6264*x11+1.3616*x12
2.線性模型和回歸系數(shù)的檢驗:
利用R檢驗法,解得R2=0.79802;修正后:,模型具有比較強的解釋能力。
與顯著性相關(guān)的P值=0<0.05,表示回歸方程顯著性強,說明住宅價格和各特征變量之間的線性關(guān)系能夠成立。
五、研究結(jié)果分果
根據(jù)本文得出的杭州市二手房特征價格模型,在其他變量不變的情況下,住房所處的地區(qū)分別為西湖區(qū)、上城區(qū)、下城區(qū)、江干區(qū)、拱墅區(qū)和濱江區(qū),其中西湖區(qū)房價最高,江干區(qū)房價最低;同時,住房附近公交站點數(shù)增加,會使住房價格上升,住房價格增加可用公式△y=0.7181*x9表示,其中△y為住房價格增量,y為住房原價,x9為公交站點數(shù)。影響特征中的電梯有無,周邊學校個數(shù),裝修程度,周邊醫(yī)院個數(shù),房屋朝向,房屋面積,周邊超市個數(shù),周邊公交站個數(shù)這8個特征對二手房價格影響依次減少。其他影響特征不變的情況下,建筑面積越大的住房,住宅總價越高。