荊晶
摘要:自1994年以來(lái),房地產(chǎn)業(yè)得到了極大的發(fā)展,但是有關(guān)我國(guó)房產(chǎn)稅稅基評(píng)估的問(wèn)題一直處于爭(zhēng)議,我國(guó)也實(shí)行了滬渝兩地的試點(diǎn)工作。圍繞房產(chǎn)稅評(píng)估的討論也由此展開(kāi),文章系統(tǒng)地總結(jié)了房產(chǎn)稅評(píng)估的模型,并針對(duì)地提出了幾點(diǎn)看法,最后,對(duì)房產(chǎn)稅評(píng)估的模型提出了拙見(jiàn)。
關(guān)鍵詞:房產(chǎn)稅;稅基;評(píng)估模型
中圖分類(lèi)號(hào):F810.422 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1005-913X(2019)03-0080-03
對(duì)房產(chǎn)稅稅基進(jìn)行評(píng)估有許多評(píng)估模型,因傳統(tǒng)方法存在弊端,目前的評(píng)估模型主要是特征價(jià)格模型的應(yīng)用及在此基礎(chǔ)上的優(yōu)化和改進(jìn):特征價(jià)格模型, 用來(lái)描述產(chǎn)品的特征與其價(jià)格的關(guān)系;參數(shù)模型, 即對(duì)回歸函數(shù)常帶有基本假設(shè)并提供大量附加信息。非參數(shù)模型,即針對(duì)一般在實(shí)際應(yīng)用資料中,可以隨便做出樣本總體是符合某分布的假設(shè)。半?yún)?shù)模型,即將回歸函數(shù)分解成參數(shù)和非參數(shù)結(jié)構(gòu),直觀上看是參數(shù)模型和非參數(shù)模型的疊加;地理信息系統(tǒng)(GIS),即與計(jì)算機(jī)技術(shù)結(jié)合,以電子地圖的形式直觀地呈現(xiàn)出城市的狀況;人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)。當(dāng)然,還有不依賴(lài)特征價(jià)格模型的模型,如:隨機(jī)森林模型、回歸決策樹(shù)模型,具體而言。
一、特征價(jià)格模型
自Ridker(1976)[1]指出空氣污染會(huì)影響房屋價(jià)值,第一個(gè)把特征價(jià)格理論應(yīng)用到住宅市場(chǎng)分析以來(lái),大量Hedonic模型應(yīng)用于歐美學(xué)術(shù)界住宅價(jià)格分析的研究。住宅的特征價(jià)格模型可以表達(dá)為:
P=f(Z)=f(L,S,N)
其中:P 為住宅的市場(chǎng)價(jià)格;Z 為住宅特征向量,包括 L、S、N 三個(gè)部分;L 為住宅的區(qū)位(Location)特征向量;S 為住宅的建筑結(jié)構(gòu)(Structure)特征向量;N為住宅的鄰里環(huán)境(Neighborhood)特征向量。
線性函數(shù)、對(duì)數(shù)函數(shù)、半對(duì)數(shù)函數(shù)和逆半對(duì)數(shù)線性函數(shù)的函數(shù)形式,我們稱(chēng)之為基本函數(shù)形式。
(1)線性形式:
(2)對(duì)數(shù)形式:
(3)半對(duì)數(shù)形式:
(4)逆半對(duì)數(shù)形式:
其中:P為住宅的價(jià)格,β0為常數(shù)項(xiàng),βi為住宅的特征價(jià)格,Qi為住宅特征向量,ε為誤差項(xiàng)。
此外,還有一種經(jīng)常使用的靈活的函數(shù)形式是Box-Cox變換,而下式是對(duì)P和Qi兩個(gè)變量進(jìn)行Box-Cox變換:
其中λ為估計(jì)參數(shù)。
特征價(jià)格法根據(jù)房地產(chǎn)各個(gè)特征的隱含價(jià)格進(jìn)行價(jià)格評(píng)估,避免評(píng)估者主觀原因造成的評(píng)估偏差。為了克服市場(chǎng)比較法等傳統(tǒng)方法的問(wèn)題 ,取得了良好的評(píng)估效果,但也存在一定的問(wèn)題,如錯(cuò)誤設(shè)定的問(wèn)題是不可避免的;由于研究人員的錯(cuò)誤,可能導(dǎo)致模型函數(shù)形式的錯(cuò)誤設(shè)定而得到錯(cuò)誤的結(jié)果;多重共線性可能導(dǎo)致難以置信的回歸結(jié)果,甚至錯(cuò)誤的參數(shù)符號(hào);特征價(jià)格模型通常無(wú)法解釋空間自相關(guān)問(wèn)題,但它不會(huì)導(dǎo)致回歸系數(shù)改變地理信息系統(tǒng)。而B(niǎo)ox-Cox變換具有自適應(yīng)性,可用于不同的經(jīng)濟(jì)過(guò)程,采用不同的變換,但是樣本數(shù)據(jù)的質(zhì)量與屬性極度地影響λ的估計(jì)值 。
二、參數(shù)模型、非參數(shù)模型、半?yún)?shù)模型
在計(jì)量經(jīng)濟(jì)學(xué)模型的參數(shù)回歸分析中,最小二乘法是我們對(duì)線性回歸模型參數(shù)估計(jì)方法,它使用回歸函數(shù),即選擇合適的參數(shù)來(lái)確定樣本,以便所有樣本值的殘差平方和(Residual Sum of Square,RSS)最小,即
其中, 為殘差平方和, 為樣本的真實(shí)值, 為樣本的估計(jì)值。
非參數(shù)回歸模型對(duì)函數(shù)形式?jīng)]有約束,對(duì)解釋變量和因變量的分布幾乎沒(méi)有限制,它試圖從數(shù)據(jù)本身獲得解決問(wèn)題所需的信息,因此,比參數(shù)回歸模型具有更大的適應(yīng)性。設(shè)Y 為因變量,是隨機(jī)變量; X 為解釋變量,它可以是確定的,也可以是隨機(jī)的。對(duì)于一組樣本觀察,建立非參數(shù)回歸模型:
Yi=m(Xi)+ui(i=1,2,......n)
其中,m⊙是未知的函數(shù),ui是隨機(jī)誤差項(xiàng)。
半?yún)?shù)回歸基于參數(shù)回歸和非參數(shù)回歸,并提出用于解決實(shí)際數(shù)據(jù)中遇到的問(wèn)題而提出的。半?yún)?shù)模型分為線性、非線性,線性半?yún)?shù)模型的一般向量形式為:
Y=Xβ+S+ε
其中Y表示為n維觀測(cè)向量,X為n*p維列滿秩設(shè)計(jì)矩陣,β為 p 維參數(shù)向量,ε為n維偶然誤差向量,S 表示描述系統(tǒng)誤差的n維非參數(shù)向量。
非線性半?yún)?shù)模型形式如下:
Y =f(X,β)+S+ε
其中 f 是已知二次可微的函數(shù),其他的量與線性的半?yún)?shù)回歸模型相同。
參數(shù)回歸模型可以分析每個(gè)解釋變量對(duì)因變量的影響,但由于參數(shù)回歸模型會(huì)提前做出許多假設(shè),此外,解釋變量和因變量的分布存在限制,導(dǎo)致結(jié)果存在偏差。非參數(shù)回歸模型比參數(shù)回歸模型接近更實(shí)際情況,具有廣泛的應(yīng)用和較好的穩(wěn)定性,然而,非參數(shù)回歸并未充分利用樣本所攜帶的關(guān)于總體的信息,致使效率會(huì)降低,而且存在不能深入分析解釋變量、可能會(huì)受到限制。半?yún)?shù)回歸模型結(jié)合了參數(shù)回歸與非參數(shù)回歸的優(yōu)點(diǎn),結(jié)果更接近實(shí)際情況,此外,它可以處理參數(shù)和非參數(shù)之間的許多模型,并且可以掌握因變量的總體趨勢(shì),適合于預(yù)測(cè)。
三、地理信息系統(tǒng)
GIS是地理信息系統(tǒng),其英文全稱(chēng)是Geographic Information Systems,是非參數(shù)模型與計(jì)算機(jī)技術(shù)的結(jié)合,用于房地產(chǎn)稅基評(píng)估。GIS系統(tǒng)具備綜合維護(hù)和管理多種數(shù)據(jù)的能力,如:集成電子地圖、遙感圖片、照片等數(shù)據(jù),適合管理房地產(chǎn)周邊地區(qū)的各種情況,有利于準(zhǔn)確估計(jì)房地產(chǎn)的真實(shí)價(jià)值、實(shí)時(shí)監(jiān)控房地產(chǎn)對(duì)象的變更、管理各種類(lèi)型的區(qū)域以及與這些區(qū)域相關(guān)的評(píng)稅因素的參數(shù)值、精準(zhǔn)計(jì)算與地理位置相關(guān)的評(píng)稅因素、可以生成可視化視圖,實(shí)現(xiàn)空間信息和屬性信息的綜合管理,評(píng)估者可以根據(jù)GIS的輸出結(jié)果,經(jīng)過(guò)適當(dāng)調(diào)整可以形成評(píng)估報(bào)告。
四、人工神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)通過(guò)樣本學(xué)習(xí)并根據(jù)樣本映射影響因子之間的相關(guān)性。評(píng)估過(guò)程就是利用描述某一區(qū)域房地產(chǎn)評(píng)估對(duì)象特征的信息,即影響房地產(chǎn)價(jià)格的因素,作為神經(jīng)網(wǎng)格的輸入向量,以及交易價(jià)格為選擇足夠數(shù)量的培訓(xùn)樣本,并使用網(wǎng)絡(luò)內(nèi)分布的連接權(quán)重,通過(guò)對(duì)影響因素和房地產(chǎn)價(jià)格的培訓(xùn)來(lái)表達(dá)學(xué)到的價(jià)格評(píng)估知識(shí)。對(duì)它們不斷的進(jìn)行修正,直到滿足設(shè)定的誤差精度。最后,通過(guò)自適應(yīng)學(xué)習(xí)從網(wǎng)絡(luò)的正確內(nèi)部表示獲得一組權(quán)值和閾值。訓(xùn)練完畢后,即可用訓(xùn)練好的模型對(duì)該地區(qū)的其它房屋價(jià)格進(jìn)行評(píng)估,也是非參數(shù)統(tǒng)計(jì)與計(jì)算機(jī)技術(shù)的結(jié)合,其操作規(guī)則如下:
Ykj=f W Y
其中,Y 是k-1層第i個(gè)神經(jīng)元的輸出,也是第k個(gè)神經(jīng)元的輸入;W 是k-1層第i個(gè)元素與第k層第j個(gè)元素的連接權(quán)值;Y 是k層第j個(gè)神經(jīng)元的輸出,也是第k+1層神經(jīng)元的輸出;f通常是Sigmoid函數(shù),f(x)= 。
BP神經(jīng)網(wǎng)絡(luò)在計(jì)算中具有并行性的特點(diǎn),網(wǎng)絡(luò)的計(jì)算速度得到了很大的提高。神經(jīng)網(wǎng)絡(luò)比其他數(shù)理模型更具有適應(yīng)性,更接近人腦的運(yùn)行規(guī)律;神經(jīng)網(wǎng)絡(luò)將知識(shí)存儲(chǔ)在連接權(quán)重中,并且可以實(shí)現(xiàn)各種非線性映射;神經(jīng)網(wǎng)絡(luò)具有很大的容錯(cuò)性,整體輸出的規(guī)律受到之前錯(cuò)誤數(shù)據(jù)的不會(huì)影響很大。然而,在實(shí)際使用中需要解決的另一個(gè)問(wèn)題是數(shù)據(jù)的可獲得性,即如何在將來(lái)獲得快速評(píng)估,以及如何收集和存儲(chǔ)所收集的數(shù)據(jù)。
五、隨機(jī)森林模型
隨機(jī)森林是 2001加州大學(xué)伯克利分校統(tǒng)計(jì)系教授Breiman L[2]提出的統(tǒng)計(jì)學(xué)習(xí)理論,從而將非參數(shù)統(tǒng)計(jì)引入機(jī)器學(xué)習(xí)領(lǐng)域,所以出現(xiàn)了隨機(jī)森林模型,隨機(jī)森林模型的建立可以分為以下幾步:
首先,應(yīng)用 Bootstrap 抽樣方法從總體樣本中抽取 K 輪形成原始訓(xùn)練集 S形成訓(xùn)練集序列。
其次,CART 算法用于為每個(gè)新生成的訓(xùn)練集建立相應(yīng)的決策樹(shù)以獲得分類(lèi)器。
最后,將多個(gè)決策樹(shù)的預(yù)測(cè)結(jié)果的平均值作為隨機(jī)森林的最終回歸和猜測(cè)結(jié)果,由于最終的結(jié)果由很多樹(shù)的組合決定,因此將之稱(chēng)為Forests。
隨機(jī)回歸森林具有如下定理:
當(dāng)k→∞,
EX,Y[Y-avkh(X,θk)]2→EX,Y[Y-Eθ(X,θk)]2
假設(shè)對(duì)所有的θ,EY=EXh(X,θ),則
PE*(forest)≤ρPE*(tree)
其中,ρ是殘差Y-h(X,θ)和Y-h(X,θ')的加權(quán)相關(guān)系數(shù),且θ和θ'相互獨(dú)立。
隨機(jī)森林作為新型的機(jī)器學(xué)習(xí)統(tǒng)計(jì)模型,其需求樣本數(shù)據(jù)少、分類(lèi)速度快,具有很高的預(yù)測(cè)準(zhǔn)確率、對(duì)異常值和噪聲具有較好的容忍度,該算法具有需要調(diào)整的參數(shù)較少、不必?fù)?dān)心過(guò)度擬合、分類(lèi)速度快、能高效處理大樣本數(shù)據(jù)、能估計(jì)特征因素的重要性以及有較強(qiáng)的抗噪音能力等特點(diǎn)。與傳統(tǒng)的線性回歸方法不同,隨機(jī)森林的使用可以充分證明數(shù)據(jù)挖掘的優(yōu)勢(shì),而且該方法不用函數(shù)形式預(yù)先假定,避免了假設(shè)誤差。
六、回歸決策樹(shù)模型
回歸樹(shù)是一種特殊的回歸,實(shí)際上是非參數(shù)非線性回歸。該方法由Breiman(1884)提出,其在葉節(jié)點(diǎn)處具有常熟值,并且使用方差作為雜質(zhì)的量度。CART回歸樹(shù)分割選擇的測(cè)度方法如下:
其中c1,c2分別用下式估計(jì):
avg{yi|xi∈R1(j,s)},avg{yi|xi∈R2(j,s)}
目的是使平方和 i(yi-U(xi))2最小,j 為分裂變量,s 為分裂點(diǎn)。
CART預(yù)測(cè)模型為:
U(x)= cmI(x∈Ri)
其中,Ri為區(qū)域,I 為節(jié)點(diǎn)處的信息,cm為區(qū)域?qū)?yīng)為勢(shì)最大的類(lèi),M為所有的區(qū)域數(shù)量,x為待預(yù)測(cè)點(diǎn)。
回歸決策樹(shù)不需要任何先驗(yàn)假設(shè),因此,模型設(shè)定沒(méi)有問(wèn)題;回歸結(jié)果簡(jiǎn)單明了、易解釋?zhuān)辉跇?gòu)建樹(shù)的過(guò)程中,分類(lèi)和回歸樹(shù)不根據(jù)純度選擇最優(yōu)的分割變量,從而消除了選擇變量的麻煩。然而,回歸結(jié)果只限于幾個(gè)值,并且結(jié)果的經(jīng)濟(jì)影響尚未完全測(cè)量。
各類(lèi)房產(chǎn)稅稅基的評(píng)估模型都有一定優(yōu)缺點(diǎn),并不是相互排斥的。特征價(jià)格模型在國(guó)內(nèi)的研究雖然不成熟,但是具有廣闊的發(fā)展空間,對(duì)房產(chǎn)稅稅基的評(píng)估,可以基于特征價(jià)格模型,引入其他模型或技術(shù),以特征價(jià)格模型為主,其他模型為輔,相互結(jié)合的房產(chǎn)稅稅基評(píng)估體系。隨著社會(huì)的進(jìn)步,科學(xué)技術(shù)的不斷發(fā)展,可以結(jié)合人工智能、區(qū)塊鏈等高科技對(duì)房產(chǎn)稅進(jìn)行批量評(píng)估,但必須指出的是使用前注意模型的適用性。
參考文獻(xiàn):
[1] Ridker R G, Henning J A. The Determinants of Residential Property Values with Special Reference to Air Pollution[J].The Review of Economics and Statistics,1967(2).
[2] Breiman L. Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)[J]. Statistical Science, 2001(3).
[責(zé)任編輯:王 旸]