石振武, 王 喆
(東北林業(yè)大學(xué) 土木工程學(xué)院, 黑龍江 哈爾濱 150040)
隨著城市化進(jìn)程的加快,房地產(chǎn)價(jià)格的空間協(xié)調(diào)發(fā)展問(wèn)題,是房地產(chǎn)業(yè)乃至城市發(fā)展的關(guān)鍵問(wèn)題。十九大提出房地產(chǎn)業(yè)要實(shí)現(xiàn)穩(wěn)定發(fā)展,房?jī)r(jià)的穩(wěn)定是主要因素,因此對(duì)房?jī)r(jià)的預(yù)測(cè)和分析具有重要意義。
當(dāng)前研究房?jī)r(jià)的方法多是利用獲得的數(shù)據(jù)結(jié)合地理位置,地理位置間的鄰近關(guān)系會(huì)使得數(shù)據(jù)具有空間特性[1],為了將數(shù)據(jù)的空間特性納入回歸模型中予以分析,英國(guó)地理學(xué)家Brunsdon引入了地理加權(quán)回歸(Geographically Weighted Regression,GWR),探討英國(guó)房?jī)r(jià)與樓地板面積的關(guān)系,研究結(jié)果證實(shí)地理加權(quán)回歸模型較最小二乘線(xiàn)性回歸(Ordinary Least Squares,OLS)更優(yōu)[2],該方法備受?chē)?guó)內(nèi)外學(xué)者的親睞。目前國(guó)內(nèi)有許多學(xué)科的學(xué)者已將GWR模型引入到自身的學(xué)科之中加以研究。湯慶園等[3]研究發(fā)現(xiàn)地理加權(quán)回歸分解成局部參數(shù)估計(jì)優(yōu)于OLS提供的全局參數(shù)估計(jì),它可以深刻地揭示出房?jī)r(jià)和空間影響因子之間的復(fù)雜關(guān)系,而且可視化工具可以用地圖的形式更詳細(xì)地呈現(xiàn)出城市房?jī)r(jià)的整體景觀(guān)。分位數(shù)回歸可以解釋變量的分位數(shù)來(lái)得到被解釋變量的條件分布的相應(yīng)的分位數(shù)方程,主要研究非正態(tài)變量。王新剛等[4]以湖北省黃石市為例,運(yùn)用最小二乘線(xiàn)性回歸(OLS)發(fā)現(xiàn),GWR和局部線(xiàn)性地理加權(quán)回歸(Local Linear Geographically Weighted Regression, LLGWR)能更合理和準(zhǔn)確地解釋住房?jī)r(jià)格的空間變異,且LLGWR優(yōu)于GWR。某些研究者將OLS結(jié)合GWR提出了混合性地理加權(quán)模型,同濟(jì)大學(xué)覃文忠在混合加權(quán)地理回歸模型中,利用OLS結(jié)合GWR分析了上海房?jī)r(jià),證明了混合加權(quán)的優(yōu)越性[5]。還有些作者采用分位數(shù)方法分析房?jī)r(jià),程亞鵬[6]以保定市為例采用分位數(shù)分解方法分析房?jī)r(jià)變動(dòng)的原因,研究發(fā)現(xiàn)商品住宅價(jià)格的空間差異主要是由住宅屬性特征的跨度性較大引起的。許啟發(fā)等[7]以Cupola函數(shù)刻畫(huà)資產(chǎn)間非線(xiàn)性關(guān)聯(lián)關(guān)系,建立Cupola-分位數(shù)回歸方法。
上述研究有的考慮了分位數(shù)因素的跨度性,有的考慮了局部空間平滑性,都沒(méi)有將兩者結(jié)合起來(lái)。本文借鑒國(guó)內(nèi)外文獻(xiàn)[8~11]提出一種基于分位數(shù)的混合地理加權(quán)模型,以哈爾濱市二手商品住宅小區(qū)(以下簡(jiǎn)稱(chēng)為“商品住宅”)為研究對(duì)象。哈爾濱市作為黑龍江省的省會(huì)城市,城區(qū)改造與開(kāi)發(fā)并存。目前,全國(guó)二線(xiàn)城市房地產(chǎn)市場(chǎng)交易活躍,政府為禁止捂盤(pán)惜售出臺(tái)了一系列政策。哈爾濱市區(qū)域分異特征顯著,作為代表城市研究。為進(jìn)一步明確哈爾濱市商品住宅價(jià)格影響機(jī)理,以期深刻理解都市冰城商品住宅市場(chǎng)空間異質(zhì)性的驅(qū)動(dòng)機(jī)理,從方法和實(shí)踐上充實(shí)房地產(chǎn)經(jīng)濟(jì)學(xué)的研究案例,同時(shí)可為類(lèi)似地區(qū)房地產(chǎn)管理工作提供有益借鑒。
商品住宅是空間位置中極具固定性的產(chǎn)品,區(qū)位因素在空間中分布極不均衡,導(dǎo)致其對(duì)商品住宅價(jià)格的影響具有跨度飛躍性,同時(shí)群體中逐個(gè)個(gè)體的差異性構(gòu)成了商品住宅的空間異質(zhì)性?;谝延形墨I(xiàn),應(yīng)用R語(yǔ)言結(jié)合ArcGis技術(shù)采用基于分位數(shù)的混合地理加權(quán)回歸模型進(jìn)行分析。本文以哈爾濱市三環(huán)內(nèi)主城區(qū)為研究區(qū)域,該區(qū)域涵蓋了哈爾濱市6個(gè)中心區(qū),松北區(qū)、道里區(qū)、道外區(qū)、南崗區(qū)、香坊區(qū)、群力新區(qū),這片區(qū)域是居民活動(dòng)最為中心分布的區(qū)域,也是哈爾濱市集中成片的城市區(qū)域。數(shù)據(jù)來(lái)源于目前我國(guó)最大的房產(chǎn)交易網(wǎng)站安居客的最新消息,數(shù)據(jù)信息包含小區(qū)名稱(chēng)、地址、價(jià)格(元/m2)、竣工日期、經(jīng)緯度坐標(biāo)。以住宅小區(qū)在售的二手房平均售價(jià)為基準(zhǔn)數(shù)據(jù),剔除奇異數(shù)據(jù)得到1345個(gè)數(shù)據(jù)。ArcGiS分析底圖采用百度地圖,所收集的要素點(diǎn)采用POI(Point of Interest)中的進(jìn)戶(hù)年份、地鐵站、高等學(xué)校、公園、購(gòu)物中心、河流、快速路、三甲醫(yī)院、中學(xué),在ArcGis-map平臺(tái)上對(duì)所收集的數(shù)據(jù)建立空間數(shù)據(jù)庫(kù),建立相應(yīng)點(diǎn)圖層。圖1,2為建立的數(shù)據(jù)源分布點(diǎn)、POI分布點(diǎn)以及中位數(shù)位置信息。根據(jù)圖1可以看出,數(shù)據(jù)源屬于研究面域上的離散點(diǎn)分布,此模式聚焦在空間對(duì)象的位置分布信息,圖2將位置關(guān)系、特征以及樣本點(diǎn)和要素點(diǎn)的空間分布充分顯示。
圖1 哈爾濱市商品住宅
圖2 要素點(diǎn)分布
通過(guò)ArcGis軟件得到的直方圖(圖3)和QQ-Plot圖(圖4)可知,商品住宅價(jià)格并不滿(mǎn)足正態(tài)分布,有顯著的異方差性,直接采用OLS或GWR都不能完全處理這種現(xiàn)象,因此對(duì)于這種異方差性的處理,選擇分位數(shù)回歸分析,分位數(shù)中核心體現(xiàn)數(shù)據(jù)聚合度的是中位數(shù),所以本文采用中位數(shù)回歸分析方法。
圖3 商品住宅價(jià)格直方圖
圖4 QQ-plot圖
設(shè)隨機(jī)變量的分布函數(shù)為:
F(y)=Prob(Y≤y)
(1)
Y的τ分位數(shù)的定義為:
Q(τ)=inf{y:F(y)≥τ},0<τ<1
(2)
樣本分位數(shù)回歸是使加權(quán)誤差絕對(duì)值之和最小,即
式(3)可等價(jià)為:
(4)
設(shè)u=Yi-ξ,一般地,τ分位數(shù)回歸的損失函數(shù)為:
ρτ(u)=u(τ-I(u<0))
(5)
式中:I(Z)為示性函數(shù),Z是指示關(guān)系式,代表u<0,u=0以及u>0。k個(gè)自變量可以得到參數(shù)估計(jì)值模型為:
(6)
通過(guò)式(6)得到其參數(shù)估計(jì)值,表示的參數(shù)意義為:當(dāng)其他協(xié)變量保持不變時(shí),這一估計(jì)差異來(lái)自一個(gè)連續(xù)型協(xié)變量的單位增量,或者虛擬變量值從0到1的變化。
分位數(shù)回歸方程為:
(7)
QGWR模型是同時(shí)考慮全局系數(shù)和局域系數(shù)的回歸模型,全局系數(shù)即為常系數(shù)記為A,局域系數(shù)即為變系數(shù)記為B;對(duì)應(yīng)的獨(dú)立變量分兩組分別記為Xa和Xb。由此MGWR模型為:
Y=XaA+XbB+θ
(8)
式中:Y是因變量矩陣;Xa是全局變量矩陣;A是全局系數(shù)矩陣;Xb是局域變量矩陣;B是局域系數(shù)矩陣;θ是殘差。
本文提出一種基于分位數(shù)的混合地理加權(quán)回歸模型(QGWR),將混合模型中的全局變量回歸項(xiàng)引入分位數(shù)回歸項(xiàng),模型如下:
(9)
對(duì)于此模型的運(yùn)算具體分為四步:(1)利用R語(yǔ)言對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理;(2)對(duì)數(shù)據(jù)進(jìn)行多元分位數(shù)回歸判斷不同參數(shù)的分位數(shù)結(jié)果;(3)對(duì)數(shù)據(jù)進(jìn)行GWR回歸;(4)通過(guò)結(jié)果分析篩選及剔除部分?jǐn)?shù)據(jù)代入形成最終的分位數(shù)混合地理加權(quán)回歸模型。
首先運(yùn)用OLS方法進(jìn)行全局模型估計(jì)。模型擬合度R2=0.61,F(xiàn)檢驗(yàn)值為7.979693,其Prob(>F)為0.00<0.05,表明通過(guò)顯著性水平為0.05的F檢驗(yàn),各回歸系數(shù)與住房?jī)r(jià)格的線(xiàn)性關(guān)系顯著。因樣本數(shù)據(jù)空間分布的多重共線(xiàn)性,故構(gòu)造異質(zhì)數(shù)據(jù)去除變量的相關(guān)冗余性,以避免某些鄰近樣本點(diǎn)的多重共線(xiàn)造成的估計(jì)偏差。利用R語(yǔ)言對(duì)模型進(jìn)行分位數(shù)回歸得到圖5,從圖中可以看出各個(gè)變量與價(jià)格都不滿(mǎn)足正態(tài)分布,存在偏差,本文通過(guò)對(duì)分位數(shù)的分析對(duì)數(shù)據(jù)進(jìn)行二次處理,剔除影響因素小的變量,加大影響因素大的變量的權(quán)重,得到新的數(shù)據(jù)表,利用數(shù)據(jù)表得到分位數(shù)回歸系數(shù),帶入本文所提出的回歸模型式(9)中,得到的數(shù)據(jù)與傳統(tǒng)GWR模型結(jié)果的對(duì)比如表1所示。AICc作為模型的顯著性標(biāo)識(shí),從GWR模型中的23085.759532增加到25508.637895,遠(yuǎn)大于3,表明本文所提出的模型擬合度十分顯著;擬合度R2由0.901015提高到0.926709,模型擬合性能強(qiáng)。
通過(guò)表2的估計(jì)系數(shù)對(duì)比可以看出基于分位數(shù)混合模型的關(guān)系強(qiáng)度和類(lèi)型都發(fā)生改變,總體上看相關(guān)強(qiáng)度除了中學(xué)減少外都變大,說(shuō)明本模型更能體現(xiàn)自變量和因變量之間的關(guān)系。產(chǎn)生這樣的原因是混合加權(quán)地理回歸模型的全局參數(shù)采用OLS中影響大的因素,本質(zhì)上認(rèn)為這些因素滿(mǎn)足正態(tài)分布,但其實(shí)通過(guò)分析所有的因素,發(fā)現(xiàn)都有上尾和下尾的影響,分位數(shù)是考慮每個(gè)因素在不同分位時(shí)影響效應(yīng)不同,通過(guò)對(duì)分位數(shù)回歸的計(jì)算,找出對(duì)模型影響最大時(shí)相應(yīng)因素的分位數(shù)回歸系數(shù)替代全局系數(shù),這樣更接近實(shí)際情況。
圖5 分位數(shù)回歸結(jié)果
表1 哈爾濱市住宅價(jià)格GWR和混合GWR模型結(jié)果對(duì)比
表2 GWR模型與基于分位數(shù)的混合GWR模型的估計(jì)系數(shù)
空間自相關(guān)的Moran’s I統(tǒng)計(jì)可表示為:
(10)
(11)
式中:E(I)=-1/(n-1)為其理論期望;V(I)=E(I2)-E(I)2是Moran指數(shù)的理論方差。
利用式(10)計(jì)算空間全局Moran’s I指數(shù),進(jìn)行最近距離分析,住宅價(jià)格空間數(shù)據(jù)需進(jìn)行對(duì)數(shù)轉(zhuǎn)換,以保證數(shù)據(jù)服從正態(tài)分布。以空間的1345個(gè)數(shù)據(jù)為基本數(shù)據(jù)源經(jīng)對(duì)數(shù)轉(zhuǎn)換后服從正態(tài)分布,大多數(shù)點(diǎn)都落在第一和第三象限。ArcGis空間自相關(guān)模塊可以得到Moran’s I值和Z Score值。Moran’s I指數(shù)的值域?yàn)閇-1,1],-1表示完全負(fù)相關(guān),1表示完全正相關(guān),取值為0表示不相關(guān)。如果Z Score值在[-1.96,1.96]區(qū)間外,那么返回的統(tǒng)計(jì)結(jié)果為可信;如果Z Score值大于1.96,表示樣本點(diǎn)分布聚集;如果Z Score值小于-1.96,表示分布離散。計(jì)算結(jié)果見(jiàn)表3,I=0.604574>0,Z Score值得分23.388987,遠(yuǎn)大于99%置信區(qū)間雙側(cè)檢驗(yàn)臨界值1.96。表明哈爾濱市商品住宅價(jià)格在空間上呈現(xiàn)積聚狀態(tài),并存在一定的差異。由表4所示,得出商品住宅的最近鄰指數(shù)NN比率為0.603727<1,NNZ檢驗(yàn)值為-27.844016,在1%的顯著性水平下通過(guò)檢驗(yàn)。二者均表明哈爾濱市商品住宅價(jià)格在整體上存在空間正相關(guān)性,表現(xiàn)為樣本點(diǎn)之間的聚集性較強(qiáng),即樣本點(diǎn)的距離越小,價(jià)格的差異越小。具體而言,分布在城市各區(qū)核心位置的商品住宅數(shù),香坊區(qū)占總數(shù)的18.65%,南崗區(qū)占總數(shù)的25.78%,群力新區(qū)占總數(shù)的14.39%,道里區(qū)占總數(shù)的20.98%,道外區(qū)占總數(shù)的9.55%,其余分布在江北區(qū)域以及外圍開(kāi)發(fā)區(qū)。商品房具有明顯的局部性和偏態(tài),商品房高價(jià)格明顯出現(xiàn)在新區(qū)和大型的商業(yè)區(qū)如群里與哈西,相近的城鄉(xiāng)路房地產(chǎn)價(jià)格有明顯的降低,松花江沿線(xiàn)江南地區(qū)價(jià)格遠(yuǎn)高于江北,并整體呈現(xiàn)集中程度由城市中心向外圍開(kāi)發(fā)區(qū)遞減的趨勢(shì)。
表3 Moran’s I指數(shù)
表4 最近鄰指數(shù)
樣本數(shù)據(jù)特征表明,基于分位數(shù)的混合地理加權(quán)回歸分析適合于90%哈爾濱市住房?jī)r(jià)格分析。圖6是利用ArcGis統(tǒng)計(jì)分析模塊中的趨勢(shì)分析功能,生成哈爾濱市商品住宅價(jià)格的空間變化趨勢(shì)圖。哈爾濱住宅的空間格局是在南北兩個(gè)方向上存在明顯的中心俱樂(lè)部結(jié)構(gòu),哈爾濱市以中央大街、秋林、哈西萬(wàn)達(dá)為中心的單元結(jié)構(gòu)發(fā)展到多元結(jié)構(gòu),松花江以南方向較以北地區(qū)房?jī)r(jià)明顯升高,從側(cè)面反應(yīng)哈爾濱市的建設(shè)是由中心向四周輻射,局部地區(qū)形成了次中心,以哈西、群力新區(qū)崛起最為迅速。本節(jié)利用基于分位數(shù)混合地理加權(quán)模型得到上述九個(gè)自變量的系數(shù),利用ArcGis軟件將表2中的系數(shù)在地圖中以影響因素形式用圖6顯示,圖6表明哈爾濱市商品房?jī)r(jià)格空間變化趨勢(shì)明顯呈現(xiàn)局部性和偏態(tài)。
圖6 哈爾濱市商品住宅價(jià)格趨勢(shì)
采用近鄰分析形成回歸模型輸入變量,其中進(jìn)戶(hù)年份直接作為變量輸入,近鄰采用住宅價(jià)格與地鐵距離為500 m,采用與其余POI要素點(diǎn)距離為1 km?;貧w結(jié)果表明:哈爾濱市商品住宅價(jià)格可以由住房的本身屬性、環(huán)境因素和區(qū)位屬性來(lái)建模。
通過(guò)分位數(shù)回歸模型的估計(jì)系數(shù)在哈市主城區(qū)影響分布圖(圖7),影響顯著的點(diǎn)顏色排列順序?yàn)椋悍凵?紅色>藍(lán)色,得到如下分析結(jié)果:
圖7 空間因素對(duì)住宅價(jià)格影響顯著的點(diǎn)分布
(1)商品住宅價(jià)格與進(jìn)戶(hù)年份成負(fù)相關(guān),相關(guān)強(qiáng)度小,表明城市商品房?jī)r(jià)與房齡的關(guān)系不是太大,這與實(shí)際情況一致。
(2)與主城區(qū)地鐵成負(fù)相關(guān),相關(guān)強(qiáng)度大,但由于哈爾濱市地鐵站數(shù)量較少,對(duì)整體影響顯著性不強(qiáng);從圖7a可以看出,哈爾濱地鐵的建設(shè)及開(kāi)通,地鐵1號(hào)線(xiàn)和地鐵3號(hào)線(xiàn)已開(kāi)通運(yùn)營(yíng)。交通便利度常被看作是影響住宅價(jià)格的重要因素,哈爾濱市早晚高峰期交通阻塞現(xiàn)象嚴(yán)重,由于哈爾濱市天氣的特殊性,遇雪期時(shí)這種現(xiàn)象更加惡劣。因此居民往往選乘地鐵,致哈爾濱市地鐵沿線(xiàn)尤其是大直街和哈西地區(qū)的商品住宅價(jià)格普遍高于其他區(qū)位。
(3)與高等學(xué)校呈正相關(guān),相關(guān)強(qiáng)度較低,這是由于哈爾濱高等學(xué)校附近的住宅建成年份較為久遠(yuǎn),但在一定程度上在校教師對(duì)其購(gòu)買(mǎi)力更高;從圖7b可以看出,對(duì)高等學(xué)校附近的商品住宅價(jià)格有影響的地區(qū),主要集中在江北大學(xué)城、學(xué)府路附近,此處均為高校密集區(qū)。
(4)與公園呈負(fù)相關(guān),相關(guān)強(qiáng)度強(qiáng),這是由于選定的公園點(diǎn)較多,從圖7c可以看出,由于哈爾濱市的城市建設(shè)規(guī)劃,公園集中在道里區(qū)、香坊區(qū)、群力新區(qū)、江北區(qū),對(duì)這幾處周邊商品住宅價(jià)格的影響較為顯著;而且大多進(jìn)入商業(yè)區(qū)附近,對(duì)數(shù)據(jù)產(chǎn)生影響。
(5)與購(gòu)物中心呈負(fù)相關(guān),相關(guān)強(qiáng)度大;從圖7d可以看出,商業(yè)購(gòu)物點(diǎn)分布于各主城區(qū)中心,輻射范圍較大,對(duì)整個(gè)主城區(qū)商品住宅價(jià)格均產(chǎn)生一定影響,距離商業(yè)購(gòu)物中心近的住宅價(jià)格影響更大。
(6)與河流呈負(fù)相關(guān),相關(guān)強(qiáng)度較小,這是由于哈爾濱市河流附近住宅樣本數(shù)較少所引起;從圖7e可以看出,哈爾濱市的江景房?jī)H對(duì)河流沿線(xiàn)的群力新區(qū)有顯著影響。
(7)與快速路呈正相關(guān),相關(guān)強(qiáng)度較強(qiáng),由于快速路建成在城市邊緣,與實(shí)際相符;由圖7f可以看出,快速路具有獨(dú)特性,距離快速路入口的商品住宅價(jià)格有較大影響。
(8)與三甲醫(yī)院呈負(fù)相關(guān),相關(guān)系數(shù)較??;雖然分布系數(shù)有影響,從圖7g可以看到,由于哈爾濱醫(yī)科大學(xué)附屬第一醫(yī)院周?chē)h(huán)繞遠(yuǎn)大購(gòu)物、秋林等商業(yè)購(gòu)物中心,因此其周邊的商品住宅價(jià)格并不僅受醫(yī)院這一單變量因素影響,其余三甲醫(yī)院對(duì)周邊的商品住宅價(jià)格影響較小。
(9)與中學(xué)呈正相關(guān),相關(guān)系數(shù)較小,這是由于選取了所有的POI點(diǎn),哈爾濱中學(xué)學(xué)區(qū)房的特殊性造成此數(shù)據(jù)不符合消費(fèi)者觀(guān)念,但與哈爾濱現(xiàn)狀相符;從圖7h可以看出,由于哈爾濱中學(xué)均分布在市中心,在分布圖上可以看出此變量對(duì)住宅價(jià)格有影響,同時(shí)住宅價(jià)格還受其周邊購(gòu)物中心、火車(chē)站的影響。
本文以哈爾濱市主城區(qū)小區(qū)商品房為研究對(duì)象,提出了基于分位數(shù)的混合地理加權(quán)回歸模型,由此得出以下結(jié)論:
(1)基于分位數(shù)的混合GWR模型的擬合結(jié)果表明哈爾濱市三環(huán)內(nèi)主城區(qū)的商品房?jī)r(jià)格并非平穩(wěn),而與地理因素有關(guān),商品住宅在空間上具有顯著的空間異質(zhì)性。模型更好地處理了非正態(tài)數(shù)據(jù)所帶來(lái)的影響,從結(jié)果對(duì)比上來(lái)看要比傳統(tǒng)GWR的性能優(yōu)越。選取的商品住宅價(jià)格影響因素的9個(gè)變量存在顯著的空間局部性和偏態(tài)性,導(dǎo)致價(jià)格出現(xiàn)偏差。研究區(qū)域化變量的空間屬性時(shí)引入進(jìn)戶(hù)時(shí)間屬性進(jìn)行回歸分析,模型具有很強(qiáng)的時(shí)空分析能力,結(jié)果表明時(shí)間因素的影響較小。
(2)模型對(duì)哈爾濱市商品住宅價(jià)格進(jìn)行了空間計(jì)量分析,運(yùn)行結(jié)果顯示:哈爾濱市商品住宅價(jià)格呈明顯的中心包圍結(jié)構(gòu),并隨距市中心距離的增加,商品住宅價(jià)格逐級(jí)呈圈層式遞減;在哈爾濱市三環(huán)主城區(qū)以?xún)?nèi)對(duì)房?jī)r(jià)的眾多影響因素中,以公園、購(gòu)物中心、地鐵影響力較大,表現(xiàn)出消費(fèi)者對(duì)居住環(huán)境的舒適度、便利度以及生活質(zhì)量上要求較多。
(3)商品房?jī)r(jià)格與整個(gè)城市的收入、國(guó)際國(guó)內(nèi)金融環(huán)境、國(guó)家和地方政策及人們主觀(guān)愿望都息息相關(guān),如果回歸更精確就應(yīng)該考慮上述因素,學(xué)者可以在今后的研究中引入,值得深思。