史東輝
Shi Donghui
安徽建筑工業(yè)學(xué)院電子與信息工程學(xué)院 安徽 合肥 230088
School of Electronics and Information Engineering,Anhui University of Architecture,Hefei 230088,China
房產(chǎn)價(jià)格評(píng)估非常重要,尤其對(duì)于稅務(wù)部門(mén)[1][2],正確的評(píng)估能夠客觀(guān)反映房產(chǎn)的價(jià)值。但房產(chǎn)的價(jià)格由許多因素決定,對(duì)房產(chǎn)進(jìn)行評(píng)估有一定復(fù)雜性。房屋評(píng)估一般從三個(gè)方面來(lái)進(jìn)行,建筑特征、區(qū)位特征、近鄰特征。房產(chǎn)的建筑屬性值可以通過(guò)房產(chǎn)交易數(shù)據(jù)庫(kù)獲得,區(qū)位特征和近鄰特征,特別是近鄰特征很難從交易數(shù)據(jù)庫(kù)中獲取相應(yīng)信息, 房產(chǎn)近鄰的準(zhǔn)確定義是非常困難的[2]。一般是先對(duì)房屋近鄰特征變量進(jìn)行實(shí)地考察,根據(jù)評(píng)估人員經(jīng)驗(yàn)來(lái)確定,由于涉及近鄰特征信息眾多,人為因素多,工作量大等原因,難以應(yīng)用近鄰特征準(zhǔn)確地對(duì)房屋評(píng)估。傳統(tǒng)的計(jì)算機(jī)房產(chǎn)價(jià)格評(píng)估方法多采用多元回歸分析等,準(zhǔn)確性有待進(jìn)一步提高[2]。近年來(lái),許多研究者開(kāi)始將非傳統(tǒng)方法應(yīng)用于房產(chǎn)評(píng)估,并獲得了一些成果,最主要的非傳統(tǒng)方法是基于神經(jīng)網(wǎng)絡(luò)的方法[3][4][5],自適應(yīng)神經(jīng)模糊推理系統(tǒng)[6][7](Adaptive Neuro-Fuzzy Inference System,ANFIS)等。本文將進(jìn)一步研究ANFIS在房產(chǎn)評(píng)估的應(yīng)用,研究地理位置,時(shí)間與房產(chǎn)價(jià)格的關(guān)系,通過(guò)定義房產(chǎn)近鄰,即房產(chǎn)的k近鄰,計(jì)算k近鄰的房產(chǎn)平均價(jià)格,改進(jìn)自適應(yīng)神經(jīng)模糊推理系統(tǒng)。
Hasiloglu,Yilmaz等(2004),應(yīng)用自適應(yīng)神經(jīng)模糊推理系統(tǒng)預(yù)測(cè)不穩(wěn)定傳熱,發(fā)現(xiàn) ANFIS比多元回歸方法具有更好的效果[8]。Byme(1995),Bagnoli,Smith和Halbert(1998)最早將ANFIS應(yīng)用于房產(chǎn)評(píng)估,研究表明ANFIS模型可以自動(dòng)產(chǎn)生模糊規(guī)則和隸屬函數(shù), 獲得房產(chǎn)各種屬性與價(jià)格之間的復(fù)雜非線(xiàn)性關(guān)系[9][10]。
Guan,Zurada(2008)使用ANFIS用于房產(chǎn)評(píng)估[1],采用美國(guó)中部區(qū)域1982到1992年房產(chǎn)銷(xiāo)售數(shù)據(jù),共363條記錄,19個(gè)輸入變量,作為實(shí)驗(yàn)研究對(duì)象。實(shí)驗(yàn)將輸入數(shù)據(jù)隨機(jī)分成訓(xùn)練集(40%,共142條記錄),驗(yàn)證集(30%,共107條記錄),和測(cè)試集(30%,共106條記錄),實(shí)驗(yàn)仿真運(yùn)行50次獲得統(tǒng)計(jì)平均值。在ANFIS模型中,選擇減法聚類(lèi),快速建立不同類(lèi)別,用于ANFIS 初始模型的建立;使用混合學(xué)習(xí)算法將最小二乘法和梯度下降法相結(jié)合的學(xué)習(xí)算法進(jìn)行前向傳遞和反向傳遞。選擇原始數(shù)據(jù)集19個(gè)變量中相關(guān)的14變量作為所有變量數(shù)據(jù)集,使用R2方法、主成分法對(duì)數(shù)據(jù)集降維處理,獲得另外兩組對(duì)照數(shù)據(jù)集。用R2方法降維后獲得11個(gè)輸入變量;用主成分方法降維后獲得4個(gè)主成分輸入變量。與傳統(tǒng)方法相比,使用所有變量作為輸入變量時(shí),平均錯(cuò)誤率比傳統(tǒng)方法稍差,對(duì)輸入變量降維后,獲得較少的輸入變量,平均錯(cuò)誤率好于傳統(tǒng)方法,說(shuō)明 ANFIS方法能對(duì)房產(chǎn)價(jià)格進(jìn)行評(píng)估有一定的效果,值得更近一步研究。盡管ANFIS 對(duì)房產(chǎn)價(jià)格有一定的作用,但由于實(shí)驗(yàn)數(shù)據(jù)量較小,不能充分反映數(shù)據(jù)特性,另外數(shù)據(jù)集中沒(méi)有地理位置信息,研究范圍有很大的局限性,另外沒(méi)有合理定義某一房產(chǎn)近鄰,并采用近鄰均價(jià)對(duì)房產(chǎn)價(jià)值進(jìn)行預(yù)測(cè),沒(méi)有充分應(yīng)用歷史數(shù)據(jù)對(duì)房產(chǎn)進(jìn)行的有效預(yù)測(cè)。
在后面的研究中,通過(guò)加入地理位置,研究地理位置對(duì)模型預(yù)測(cè)準(zhǔn)確性的影響,以及房齡對(duì)房產(chǎn)價(jià)格評(píng)估的影響,并以此為基礎(chǔ),提出基于k近鄰自適應(yīng)神經(jīng)模糊網(wǎng)路推理方法,進(jìn)一步改進(jìn)ANFIS模型的預(yù)測(cè)準(zhǔn)確性。
研究采用的自適應(yīng)神經(jīng)模糊推理系統(tǒng)基于Sugeno計(jì)算模型的模糊推理系統(tǒng)[11][12],將神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)功能和模糊推理系統(tǒng)的模糊語(yǔ)言表達(dá)能力結(jié)合起來(lái),通過(guò)系統(tǒng)自身的訓(xùn)練和學(xué)習(xí)過(guò)程,不斷自動(dòng)調(diào)整變量隸屬函數(shù)參數(shù),獲得模糊推理系統(tǒng)輸入、輸出關(guān)系的最佳組合。圖1為用于房產(chǎn)評(píng)估的ANFIS結(jié)構(gòu):
圖1 房產(chǎn)評(píng)估ANFIS 結(jié)構(gòu)圖
第1層:將輸入變量模糊化,輸出為模糊集隸屬度。Xi是輸入,Aij是第 i個(gè)節(jié)點(diǎn)的隸屬函數(shù)。這些參數(shù)是自適應(yīng)的,函數(shù)的數(shù)值由0到1.隨著參數(shù)的改變,隨著函數(shù)數(shù)值改變,輸入變量x的隸屬程度改變。這一層,有m*n個(gè)節(jié)點(diǎn),m輸入變量的數(shù)量,n是隸屬函數(shù)的數(shù)量。Oij為隸屬度:
房產(chǎn)估價(jià)模型μij選擇為高斯型隸屬函數(shù):
σ,c確定隸屬函數(shù)圖形。
第2層:實(shí)現(xiàn)條件部分的模糊集運(yùn)算,計(jì)算每個(gè)規(guī)則的適用度:
Xi為輸入變量。
第3層:將各條規(guī)則的適用度歸一化。Wi是第i個(gè)規(guī)則適用度。通過(guò)規(guī)則適用度比所有規(guī)則適用度之和計(jì)算歸一化規(guī)則適用度:
第4層:自適應(yīng)層,每個(gè)節(jié)點(diǎn)都是線(xiàn)性函數(shù),函數(shù)的系數(shù)通過(guò)最小二乘法和反向傳播算法相結(jié)合的方法調(diào)節(jié):
其中 fk是第k個(gè)模糊規(guī)則的輸出。:
第5層:輸出層,計(jì)算模糊推理系統(tǒng)的總輸出,這一層得到前面層的輸出之和:
前件參數(shù)和后件參數(shù)根據(jù)算法自動(dòng)調(diào)節(jié),獲得輸入輸出的最佳組后。
在房產(chǎn)評(píng)估中,通過(guò)某一房產(chǎn)周?chē)慨a(chǎn)的平均價(jià)格預(yù)測(cè)該房產(chǎn)的實(shí)際價(jià)格,不同的房產(chǎn)近鄰的定義具有不同平均價(jià)格,但精確定義房產(chǎn)的近鄰是非常困難的事,一般根據(jù)房產(chǎn)評(píng)估人員的經(jīng)驗(yàn),或根據(jù)行政區(qū)域劃分來(lái)判定。研究表明使用單純的區(qū)域劃定獲得的平均價(jià)格對(duì)房產(chǎn)價(jià)格的評(píng)估準(zhǔn)確性的提高作用不大[2]。以下通過(guò)定義不同k近鄰數(shù)據(jù),解決房產(chǎn)近鄰的準(zhǔn)確定義問(wèn)題。
定義1:已知多維數(shù)據(jù)為a1,……,aN,對(duì)應(yīng)的域分別D1,……, DN,D為數(shù)據(jù)對(duì)象集,對(duì)每個(gè)數(shù)據(jù)對(duì)象t, t ∈D,t1屬性值為t2屬性值為,兩數(shù)據(jù)對(duì)象距離定義為:
定義2:已知D為數(shù)據(jù)對(duì)象集,數(shù)據(jù)對(duì)象t, t的k近鄰數(shù)據(jù)為t0,滿(mǎn)足k-nearest(D,t0),即t0,t1∈D, Distance(t,t0)<=Distance(t,t1); t1為k近鄰以外數(shù)據(jù)對(duì)象。如k為1時(shí),t0為最近鄰數(shù)據(jù)。
定義3:計(jì)算最近鄰時(shí),多維數(shù)據(jù)a1,……,aN所有屬性參與計(jì)算,同定義1, 稱(chēng)為全變量k近鄰;選擇部分屬性參與計(jì)算,稱(chēng)為部分變量k近鄰;
定義4:參與計(jì)算距離的數(shù)據(jù)對(duì)象t僅為數(shù)據(jù)對(duì)象中房產(chǎn)地理位置,對(duì)應(yīng)屬性x、y,t0∈D,其中t0, 滿(mǎn)足k-nearest(D,t0),計(jì)算k近鄰時(shí)僅考慮不同數(shù)據(jù)對(duì)象中地理位置的距離,稱(chēng)為房產(chǎn)的空間k近鄰;
定義5:已知房齡a0,參與計(jì)算距離的數(shù)據(jù)對(duì)象t僅為數(shù)據(jù)對(duì)象中房產(chǎn)地理位置,對(duì)應(yīng)屬性x、y,t∈D1, 具有t的數(shù)據(jù)對(duì)象對(duì)應(yīng)房齡a kd樹(shù)是多維空間有效組織點(diǎn)集合而產(chǎn)生的一種空間分割數(shù)據(jù)結(jié)構(gòu)。把多維空間分割成若干個(gè)不相交的子區(qū)域,空間中任何一個(gè)點(diǎn)屬于某一子區(qū)域,建立kd樹(shù)。 算法1 kd樹(shù)搜素算法描述: (1)首先通過(guò)二叉樹(shù)搜索比較查詢(xún)節(jié)點(diǎn)和分裂結(jié)點(diǎn)的分裂維的值。 (2)查找與待查點(diǎn)同一子空間的葉子結(jié)點(diǎn)。 (3)然后回溯搜索路徑,并判斷搜索路徑上的結(jié)點(diǎn)的其他子結(jié)點(diǎn)空間是否可能有最近點(diǎn),如果有,到此結(jié)點(diǎn)空間繼續(xù)搜索。 (4)重復(fù),直到搜索路徑為空。 對(duì)房產(chǎn)的k近鄰定義后,通過(guò)基于k近鄰ANFIS算法,計(jì)算k近鄰房產(chǎn)平均價(jià)格,將k近鄰平均價(jià)格作為輸入變量,產(chǎn)生ANFIS模型結(jié)構(gòu),求得最優(yōu)的模糊推理的系統(tǒng)模型。以下算法2為基于k近鄰ANFIS改進(jìn)算法的描述。 算法2 基于k近鄰ANFIS改進(jìn)算法描述: (1) 選擇對(duì)房?jī)r(jià)影響較大相關(guān)屬性用于計(jì)算距離; (2) 查找數(shù)據(jù)集D中每個(gè)數(shù)據(jù)對(duì)象t的k近鄰為t0,使得t0滿(mǎn)足Distance(t,t0)<=Distance(t,t1);根據(jù)k近鄰的不同定義,可能是全變量k近鄰,部分變量k近鄰,空間k近鄰,和時(shí)空k近鄰; (3) 查找k近鄰對(duì)象t0所對(duì)應(yīng)的房?jī)r(jià)y(t0),并計(jì)算均價(jià); (5) 重復(fù)以上步驟,直到找到最優(yōu)模型。 實(shí)驗(yàn)使用Matlab Fuzzy Logic Toolbox,選取美國(guó)中部區(qū)域2003到2007年房產(chǎn)銷(xiāo)售數(shù)據(jù),共13892條記錄,16個(gè)輸入屬性,其中包括兩個(gè)地理位置屬性x,y,一個(gè)房產(chǎn)價(jià)格屬性作為輸出屬性。 考慮到通貨膨脹,房產(chǎn)價(jià)格用以下公式調(diào)整: 148,548$為數(shù)據(jù)集中最后一年即2007年均價(jià)。 在ANFIS模型中,選擇減法聚類(lèi),使用混合學(xué)習(xí)算法將最小二乘法和反向傳播相結(jié)合的學(xué)習(xí)算法進(jìn)行前向傳遞和反向傳遞。 房產(chǎn)評(píng)估誤差結(jié)果的測(cè)量采用以下幾種測(cè)量方法: 均方根誤差(RMSE)是使用較多的一種方法,說(shuō)明樣本的離散程度,運(yùn)算結(jié)果與預(yù)測(cè)結(jié)果具有同樣單位,但其缺點(diǎn)是夸大了離群數(shù)據(jù)的作用,均方根誤差計(jì)算公式: 平均絕對(duì)誤差(MAE),結(jié)果與預(yù)測(cè)結(jié)果有同樣單位,計(jì)算公式如下: 平均絕對(duì)百分比誤差(MAPE),是絕對(duì)百分比誤差的平均值,用于比較預(yù)測(cè)的準(zhǔn)確性。平均絕對(duì)百分比誤差計(jì)算公式: 以上公式中N為測(cè)試集數(shù)據(jù)對(duì)象個(gè)數(shù)。 數(shù)據(jù)集沒(méi)加入房產(chǎn)的地理位置信息數(shù)據(jù)集,簡(jiǎn)稱(chēng)所有變量(不含位置),共13892條記錄,14個(gè)輸入屬性,一個(gè)房?jī)r(jià)輸出變量;包含所有變量數(shù)據(jù)集,即加入房產(chǎn)地理位置信息,包括經(jīng)度、維度,共16個(gè)輸入變量,一個(gè)房?jī)r(jià)輸出變量。將兩個(gè)數(shù)據(jù)集分別用同樣的方法將輸入數(shù)據(jù)隨機(jī)分成訓(xùn)練集(40%),驗(yàn)證集(30%,),和測(cè)試集(30%),實(shí)驗(yàn)仿真運(yùn)行50次獲得統(tǒng)計(jì)平均值。 計(jì)算得到RMSE,MAE及MAPE。在表1中,所有變量(不含位置)模型的平均MAPE為21.64%,所有變量(含位置)的平均MAPE為20.26%,有所改進(jìn)。MAPE誤差在小于等于的5%范圍內(nèi),所有變量(含位置)的模型百分比為24.4%;大于所有變量(不含位置)的22.8%,說(shuō)明模型準(zhǔn)確性改善。從表2可以看出,所有變量(包含位置)的測(cè)試集的模型RMSE、MAE的數(shù)值分別為34423、24837,而所有變量(不包含位置)測(cè)試集模型的RMSE、MAE數(shù)值為36345,26610,有明顯的改進(jìn),驗(yàn)證數(shù)據(jù)集有相同的結(jié)果。該實(shí)驗(yàn)表明,加入地理位置信息后,模型預(yù)測(cè)準(zhǔn)確率提高,說(shuō)明房產(chǎn)的價(jià)格與地理位置有較密切的關(guān)系,在房產(chǎn)價(jià)格評(píng)估中應(yīng)充分考慮地理位置信息。 表1 所有變量(不含位置)和(含位置)測(cè)試集的MAPE 表2 所有變量(不含位置)和所有變量(含位置)模型測(cè)試集的RMSE和MAE 使用SAS軟件計(jì)算房齡(房產(chǎn)的銷(xiāo)售日期減房產(chǎn)的建立日期)的分布情況,發(fā)現(xiàn)房齡的分布是不均勻的,房齡的中值是33年,50 %房產(chǎn)房齡小于33年;90%的房產(chǎn)房齡小于67年;最大房齡為115年,只有10%的房產(chǎn)在67到115之間。因此將原始數(shù)據(jù)按房齡分成為房齡為0數(shù)據(jù)集;房齡為小于等于33數(shù)據(jù)集;房齡大于33并且小于67數(shù)據(jù)集;房齡大于67數(shù)據(jù)集。比較不同房齡模型的準(zhǔn)確性。 表3中房齡小于0的數(shù)據(jù)集的對(duì)應(yīng)模型平均MAPE為11.92,房齡小于等于33數(shù)據(jù)集的對(duì)應(yīng)模型平均MAPE為11.74,房齡小于等于66,大于33數(shù)據(jù)集的對(duì)應(yīng)模型平均MAPE為23.48,房齡>66數(shù)據(jù)集模型為35.5, 房齡小于0的數(shù)據(jù)集MAPE小于等于5%范圍內(nèi),模型輸出百分比為34.5%,房齡小于等于33數(shù)據(jù)集,平均MAPE也有較好效果為11.74%,遠(yuǎn)大于其他數(shù)據(jù)對(duì)應(yīng)模型準(zhǔn)確率。但由于房齡小于或等于0的數(shù)據(jù)集所包含的數(shù)據(jù)對(duì)象較少,表4中顯示,RMSE,MAE分別為43495,26353大于其他數(shù)據(jù)集。表3中顯示,房齡大于66數(shù)據(jù)集的平均MAPE數(shù)據(jù)為35.5%,在MAPE的5%范圍,輸出模型百分比只占12.8%,具有最小預(yù)測(cè)準(zhǔn)確性,同時(shí)表4中模型輸出RMSE和MAE誤差值分別為43685,32476,同樣說(shuō)明房齡大于66時(shí),有較大的預(yù)測(cè)誤差。該實(shí)驗(yàn)表明房產(chǎn)的價(jià)格與房齡有密切關(guān)系,ANFIS模型對(duì)房齡較大的房產(chǎn)預(yù)測(cè)準(zhǔn)確性下降。 表3 不同房齡模型測(cè)試集的MAPE 表4 不同房齡模型測(cè)試集的RMSE和MAE 由于房產(chǎn)與地理位置,時(shí)間等因素有較大關(guān)系,單純通過(guò)將地理位置的經(jīng)緯度加入模型不能完全表示地理位置對(duì)房產(chǎn)價(jià)格的影響。通過(guò)定義全變量k近鄰,空間k近鄰,時(shí)空k近鄰,使用前述算法2,計(jì)算房產(chǎn)均價(jià),將不同定義的k近鄰均價(jià)加入ANFIS模型的輸入變量。 表5,表6為k取值為10時(shí),各種k近鄰模型應(yīng)用于測(cè)試集的誤差對(duì)比結(jié)果。表5中全變量k近鄰測(cè)試集MAPE為19.84%,大于所有變量(不含位置)的MAPE值21.64%,及所有變量(含位置)的測(cè)試集MAPE的值20.26%。表6中全變量k近鄰測(cè)試集的RMSE值34428,MAE值24739,大于所有變量(不含位置)的RMSE的值36345,MAE的值26610。說(shuō)明全變量k近鄰房產(chǎn)均價(jià)對(duì)預(yù)測(cè)模型有一定改進(jìn)。 通過(guò)測(cè)試集對(duì)模型進(jìn)行測(cè)試,表5中可以看出全變量k近鄰平均MAPE為19.84%,空間k近鄰測(cè)試集上的平均MAPE為17.08%,時(shí)空k近鄰為9.86%;MAPE的5%范圍內(nèi),全變量k近鄰模型輸出百分比為22.4%,空間k近鄰為28.4%,時(shí)空k近鄰為42.4%。時(shí)空k近鄰,空間k 近鄰預(yù)測(cè)準(zhǔn)確性有極大提高。表6中,由于時(shí)空k近鄰選取記錄較少,因此其預(yù)測(cè)誤差RMSE值31770,,MAE值20788,稍大于空間k近鄰,RMSE的值30114,MAE的值21330。 表7和表8為k取值為20時(shí),各種k近鄰模型應(yīng)用于測(cè)試集的誤差對(duì)比結(jié)果。表7中可以看出全變量k近鄰平均MAPE為20.32%,空間k近鄰測(cè)試集上的平均MAPE為17.24%,時(shí)空k近鄰為9.56%,時(shí)空k近鄰,空間k 近鄰預(yù)測(cè)準(zhǔn)確性有很大提高,表7與表5有相似的結(jié)果。表8中全變量k近鄰測(cè)試集的RMSE及MAE值分別為34818,25082,空間k近鄰分別為30180,21579,時(shí)空k近鄰分別為34926,20622,均大于所有變量(不含位置)的RMSE的值36345,MAE的值26610,與表6有相似的結(jié)論,說(shuō)明k近鄰房產(chǎn)均價(jià)對(duì)預(yù)測(cè)模型有一定改進(jìn)。表8中的全變量k近鄰、空間k近鄰、時(shí)空k近鄰的RMSE,MAE值,除時(shí)空k近鄰的MAE值為20622有所減少外,普遍有所增加。另外表8中時(shí)空k近鄰的RMSE的最大值增大,標(biāo)準(zhǔn)誤增大,說(shuō)明k近鄰的k值選取過(guò)大可能會(huì)引起誤差增大,某些房產(chǎn)的近鄰價(jià)格會(huì)影響房產(chǎn)的評(píng)估,降低房產(chǎn)預(yù)測(cè)的準(zhǔn)確性。 表5 不同k近鄰模型測(cè)試集的MAPE(k=10) 表6 不同k近鄰模型測(cè)試集的RMSE和MAE(k=10) 表7 不同k近鄰模型測(cè)試集的MAPE(k=20) (10,15] 16.30 16.40 15.60(15,20] 11.20 10.90 7.30(20,25] 7.40 6.60 2.90>25 20.10 15.70 3.10 表8 不同k近鄰模型測(cè)試集的RMSE和MAE(k=20) 本文首先將地理位置加入原始數(shù)據(jù)集,研究全變量(不含位置信息)與全變量(含位置信息)分別作為輸入數(shù)據(jù)集,獲取不同模型,對(duì)測(cè)試集上的預(yù)測(cè)誤差值進(jìn)行了對(duì)比分析。實(shí)驗(yàn)表明加入地理位置信息后,預(yù)測(cè)準(zhǔn)確性有一定提高,說(shuō)明地理位置與房?jī)r(jià)存在一定聯(lián)系。又將原始數(shù)據(jù)集分成房齡小于等于0,小于等于33,大于33并且小于67,大于67等不同房齡數(shù)據(jù)集。實(shí)驗(yàn)表明使用不同房齡數(shù)據(jù)集建立ANFIS模型,房齡越小預(yù)測(cè)準(zhǔn)確性越高,房齡較大的房產(chǎn)預(yù)測(cè)準(zhǔn)確性較差,說(shuō)明房齡與房?jī)r(jià)有密切關(guān)系。 結(jié)合日常房產(chǎn)評(píng)估經(jīng)驗(yàn),提出基于k近鄰的ANFIS改進(jìn)方法。定義不同意義的k近鄰,描述了查找k近鄰,計(jì)算k近鄰均價(jià)算法,并應(yīng)用于ANFIS模型,從而將地理位置信息,時(shí)間信息與歷史房?jī)r(jià)相結(jié)合。實(shí)驗(yàn)表明,時(shí)空k近鄰,空間k近鄰方法的預(yù)測(cè)準(zhǔn)確性有大幅提高,k取10時(shí),時(shí)空k近鄰平均MAPE為9.86%;在MAPE的5%范圍內(nèi),時(shí)空k近鄰為42.4%,說(shuō)明使用k近鄰改進(jìn)自適應(yīng)神經(jīng)模糊推理系統(tǒng)的方法,能明顯改進(jìn)房?jī)r(jià)預(yù)測(cè)準(zhǔn)確性,這一方法也可應(yīng)用于其他大宗財(cái)產(chǎn)評(píng)估。k近鄰的k值選取20與k值選取10時(shí),有相似的結(jié)論,但k為20時(shí),全變量k近鄰、空間k近鄰、時(shí)空k近鄰的RMSE,MAE值,普遍稍有增加,說(shuō)明k近鄰的k值選取過(guò)大,可能會(huì)引起誤差增大。 由于不同房產(chǎn)屬性與價(jià)格的非線(xiàn)性關(guān)系,房產(chǎn)評(píng)估是一個(gè)較復(fù)雜的過(guò)程,自適應(yīng)神經(jīng)模糊推理系統(tǒng)對(duì)房產(chǎn)評(píng)估是非常有效手段,特別是通過(guò)應(yīng)用k近鄰方法進(jìn)行改進(jìn),對(duì)輸入數(shù)據(jù)集進(jìn)行優(yōu)化,能明顯改進(jìn)ANFIS的預(yù)測(cè)效果。該方法的提出,有效地提高了ANFIS自適應(yīng)神經(jīng)模糊推理系統(tǒng)的預(yù)測(cè)準(zhǔn)確性。 隨著計(jì)算機(jī)信息系統(tǒng)的廣泛應(yīng)用,存儲(chǔ)技術(shù)的發(fā)展,電子商務(wù)的興起,可以獲得大量的歷史數(shù)據(jù),使用歷史數(shù)據(jù)評(píng)估大宗財(cái)產(chǎn)的價(jià)值,越來(lái)越多地引起重視,我們將應(yīng)用人工智能方法進(jìn)一步改進(jìn)神經(jīng)模糊推理系統(tǒng),并將它應(yīng)用于其它大宗財(cái)產(chǎn)評(píng)估領(lǐng)域。 [1]Jian Guan, Jozef Zurada, Alan S.Levitan.An Adaptive Neuro-Fuzzy Inference System Based Approach to Real Estate Property Assessment.[J].The Journal of Real Estate Research, 2008,30(4):349-387. [2]Jozef Zurada, Alan S.Levitan, Jian Guan.A Comparison of Appraisal Context.[J].The Journal of Real Estate Research, 2011,33(3):395-421. [3]Mitchell, T.Machine Learning [M].New York :McGraw-Hill, 1997. [4]Worzala, E, Lenk, M., and Silva, A.An exploration of neural networks and its application to real estate valuation.[J].The Journal of Real Estate Research, 1995,10(2):185-201. [5]Nguyen, N., and A.Cripps.Predicting housing value:a comparison of multiple regression analysis and artificial neural networks.[J].The Journal of Real Estate Research,2011, 22(3):313-336. [6]Ponnambalam, K., Karray, F., Mousavi, S.Optimization Approaches for Reservoir Systems Operation Suing Computational Intelligence tools.[J].SAMS, 2002,42(9):1347-1360. [7]Stepnowski, A., Mosynski, M., Dung, T.V.Adaptive Neuro-Fuzzy and Fuzzy Decision Tree Classifiers As Applied Seafloor Characterization.[J].Acoustical Physics,2003,49(2):193-202. [8]Hasiloglu, A., M.Yilmaz, O.Comakli, and I.Ekmekci.Adaptive Neuro-Fuzzy Modeling of Transient Heat Transfer in Circular Duct Air Flow.International Journal of Thermal Science, 2004, 43:1075-90. [9]Byme, P.Fuzzy Analysis:A Vague Way of Dealing with Uncertainty in Real Estate Analysis.Journal of Property Valuation & Investment, 1995, 13(3):22-41. [10]Bagnoli, C., B.Smith, and C.Halbert.The Theory of Fuzzy Logic and its Application to Real Estate Valuation.Journal of Real Estate Research, 1998, 16(2), 169-200. [11]Sugeno, M.and Kang, G.T., Structure identification of fuzzy model.[J].Fuzzy Sets and Systems, 1988,28(1):15–33. [12]Takagi, T.and Sugeno, M., Fuzzy identification of systems and its applications to modeling and control.[J].IEEE Transactions on Systems, Man, and Cybernetics 1985,15(1):116–132. [13]Ian H.Witten & Eibe Frank.Data Mining Practical Machine Learning Tools And Techniques [M].San Francisco:Elsevier, 2005.3.3 kd-樹(shù)最近鄰搜索算法[13]
3.4 基于k近鄰ANFIS算法
4.實(shí)驗(yàn)結(jié)果分析
4.1 實(shí)驗(yàn)數(shù)據(jù)描述與實(shí)驗(yàn)方法
4.2 將房產(chǎn)的經(jīng)、緯度加入ANFIS模型
4.3 房齡對(duì)模型的影響
4.4 將不同定義k 近鄰房產(chǎn)加入ANFIS模型
5.結(jié)束語(yǔ)