国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于深度置信網(wǎng)的房屋價格預(yù)測模型研究

2018-10-29 08:03:26
天津科技 2018年10期
關(guān)鍵詞:置信房價房屋

呂 昊

(天津市南開城市建設(shè)投資有限公司 天津300110)

0 引 言

隨著經(jīng)濟(jì)的持續(xù)發(fā)展,房地產(chǎn)行業(yè)已經(jīng)成為支柱產(chǎn)業(yè),房屋價格不僅直接影響著居民的生活水平,也間接影響著國家經(jīng)濟(jì)的持續(xù)、健康、平穩(wěn)發(fā)展,房屋價格已經(jīng)成為關(guān)系民生的熱點問題[1]。

房屋價格受到很多因素的制約和影響,在當(dāng)前房屋價格預(yù)測模型中,主要提取的因素集中在綜合國民經(jīng)濟(jì)發(fā)展水平、消費水平、人均生產(chǎn)總值、人均居住面積、人均可支配性收入等方面[1],所選取的指標(biāo)涵蓋了從人均水平到整體經(jīng)濟(jì)水平的描述,但是所選指標(biāo)依然不夠,對房屋的位置、屬性、格局等自身屬性考慮不足。因此,在房屋價格預(yù)測模型中,選取的特征因素應(yīng)當(dāng)具有全面性、多樣性[2]。

近年來,國內(nèi)外學(xué)者已經(jīng)應(yīng)用多種學(xué)習(xí)模型對房屋銷售價格進(jìn)行預(yù)測。申瑞娜等[3]收集了影響房價的8個因素,結(jié)合主成分分析和支持向量機(jī)對房屋價格進(jìn)行預(yù)測;周學(xué)君等[4]采用了影響房價的6個主要因素輸入到人工神經(jīng)網(wǎng)絡(luò)中進(jìn)行房價預(yù)測;劉瓊芳[5]建立灰度 GM(1,1)預(yù)測模型,預(yù)測福州市的房價走勢,具有較高的精確度;王瑾等[6]通過多元逐步回歸方法建立房價預(yù)測模型對北京市房屋價格進(jìn)行統(tǒng)計分析;陳世鵬等[7]根據(jù)襄陽房貸數(shù)據(jù)建立隨機(jī)森林模型對測試樣本進(jìn)行房價預(yù)測,取得了較好的效果;韋光蘭等[8]以馬爾可夫鏈為預(yù)測模型,采用數(shù)理統(tǒng)計的計算方法,預(yù)測了昆明近期房價走勢,分析房價的動態(tài)變化過程。從以上研究成果來看,在進(jìn)行房屋價格預(yù)測時,由于所選取的特征維數(shù)有限,并不能全面反映影響房屋價格的制約因素,并且所選用的預(yù)測模型較為簡單,能夠分析處理的特征維數(shù)較少,并不能全面挖掘特征因素與房價之間的影響關(guān)系。

以受限玻爾茲曼機(jī)為基礎(chǔ)構(gòu)造的深度置信網(wǎng)是深度學(xué)習(xí)的典型算法之一,通過多層特征的學(xué)習(xí)與訓(xùn)練,能夠有效挖掘輸入特征的關(guān)鍵信息,在一定程度上,克服了人工神經(jīng)網(wǎng)絡(luò)容易局部最優(yōu)和訓(xùn)練時間長的問題,已經(jīng)在信號處理、圖像分析等領(lǐng)域取得了較為成功的應(yīng)用。本文以深度置信網(wǎng)模型為基礎(chǔ),以Kaggle平臺的房屋價格作為數(shù)據(jù)庫,建立影響房屋價格的多維因素與房屋價格之間的深度學(xué)習(xí)預(yù)測模型。

1 深度置信網(wǎng)及房屋價格預(yù)測模型

1.1 深度置信網(wǎng)簡介

深度置信網(wǎng)(Deep Belief Network,DBN)的基本構(gòu)成元件是受限玻爾茲曼機(jī)(Restricted Boltzmann Machines,RBM) 。上一層的 RBM 的特征訓(xùn)練輸出作為下一層 RBM 的特征訓(xùn)練輸入,依此進(jìn)行多層RBM 的疊加訓(xùn)練 DBN結(jié)構(gòu),能夠更加深入全面地進(jìn)行特征分析,避免人工神經(jīng)網(wǎng)絡(luò)容易局部最優(yōu)的缺點,是深度學(xué)習(xí)的典型結(jié)構(gòu)之一[9-10]。

圖 1顯示了 DBN的網(wǎng)絡(luò)結(jié)構(gòu)模型??梢钥闯?,其中主要包括特征輸入層、隱藏層和特征輸出層。將收集的影響房屋價格的特征因素經(jīng)過預(yù)處理之后輸入到特征輸入層;隱藏層是由多個 RBM 疊加形成的深度特征處理結(jié)構(gòu),每一個隱藏層的特征計算作為下一個隱藏層的輸入迭代計算;最后的特征輸出層是一層人工神經(jīng)網(wǎng)絡(luò),將特征計算結(jié)果映射到房屋價格,完成房屋價格的預(yù)測。

圖1 深度置信網(wǎng)絡(luò)結(jié)構(gòu)模型Fig.1 Structure of deep belief network

1.2 基于深度置信網(wǎng)的房屋價格預(yù)測模型

基于深度置信網(wǎng)的房屋價格預(yù)測模型在訓(xùn)練過程中,首先無監(jiān)督地訓(xùn)練其中的每一層 RBM,將影響房屋價格的特征因素經(jīng)過預(yù)處理之后作為特征輸入映射到不同的特征空間中進(jìn)行訓(xùn)練;然后將經(jīng)過多層 RBM 訓(xùn)練之后得到的輸出特征作為輸入因素,輸入到最后一層的人工神經(jīng)網(wǎng)絡(luò),并在其中進(jìn)行監(jiān)督預(yù)測,得到房屋價格的預(yù)測結(jié)果,計算預(yù)測結(jié)果與實際結(jié)果的差異并反向傳播,不斷調(diào)整 DBN網(wǎng)絡(luò),直至差異在允許范圍之內(nèi)或連續(xù)訓(xùn)練達(dá)到一定次數(shù)時,完成訓(xùn)練過程,輸出最終的房屋價格預(yù)測結(jié)果[11-12]。

1.3 預(yù)測模型的評價標(biāo)準(zhǔn)

在本文中得到的房屋價格為預(yù)測的連續(xù)值,因此采用平均誤差(RMSE)和決定系數(shù)(R-squared)對房屋價格預(yù)測模型的準(zhǔn)確度和可靠性進(jìn)行評價[13-14]。平均誤差能夠衡量預(yù)測結(jié)果與真實結(jié)果之間的偏差,平均誤差越小表示預(yù)測結(jié)果與真實結(jié)果越接近,反之則差異越大;決定系數(shù)能夠評價房屋價格預(yù)測模型的擬合優(yōu)度值,決定系數(shù)越接近 1,代表預(yù)測結(jié)果與真實結(jié)果之間的擬合程度越好。通過 RMSE和R-squared兩個評價標(biāo)準(zhǔn)能夠衡量房屋價格預(yù)測模型的優(yōu)劣。兩個評價標(biāo)準(zhǔn)的公式定義分別為:

式中:ypred代表本文模型得到的房屋預(yù)測價格;yact為該房屋的真實價格;n為樣本的個數(shù);為yact的平均值。

2 實驗結(jié)果

2.1 房屋價格數(shù)據(jù)庫

Kaggle建立于 2010年,是一個進(jìn)行數(shù)據(jù)挖掘與預(yù)測競賽的在線平臺。本文所使用的數(shù)據(jù)庫是其中的House Prices:Advanced Regression Techniques(https:// www.kaggle.com/c/house-prices-advanced-regression-techniques)。

Kaggle House Prices中列出了愛荷華州埃姆斯(Ames)房屋市場已經(jīng)成交的1461座房屋的79個特征(其中包括 41個分類變量,38個連續(xù)數(shù)值變量) ,主要涉及地段、面積、層數(shù)、地下室、與街道之間的距離、房屋的外墻材料等項數(shù)據(jù),根據(jù)這些數(shù)據(jù)特征來預(yù)測房屋的銷售價格。

對 Kaggle中的房屋價格數(shù)據(jù)進(jìn)行預(yù)處理操作,刪除其中某一特征缺失較多的選項,同時刪除個別離散較大的特征,最終得到用于房屋價格預(yù)測模型輸入的較重要特征。

2.2 實驗設(shè)置

本文所使用的數(shù)據(jù)庫中共包含 1461套已經(jīng)成交的房價特征與其出售價格。按照訓(xùn)練集∶測試集=3∶1的比例分割數(shù)據(jù)庫,得到隨機(jī)的訓(xùn)練集樣本數(shù)為1096個,測試集樣本數(shù)為365個,采取10折交叉驗證的方式進(jìn)行模型的訓(xùn)練,得到最終的房屋價格預(yù)測結(jié)果。

本文所使用的DBN模型中包含3個隱藏層,隱藏層中的節(jié)點數(shù)分別為 300、150、100,學(xué)習(xí)率為0.01,動量為 0.4。

2.3 實驗結(jié)果與分析

偏最小二乘回歸(PLSR) 、支持向量機(jī)(PCA+SVM) 、神經(jīng)網(wǎng)絡(luò)(PCA+ANN)是機(jī)器學(xué)習(xí)領(lǐng)域中經(jīng)典和常用的預(yù)測模型,本文使用這3種模型作為對比實驗,以R-square和RMSE作為評價指標(biāo),驗證基于深度置信網(wǎng)的房屋價格預(yù)測模型的準(zhǔn)確性。

表 1中列出了本文方法與 3種對比實驗方法的預(yù)測結(jié)果,從中可以看出,本文方法的 R-square達(dá)到了0.6872,高于3種對比模型,說明本文方法預(yù)測的結(jié)果與真實結(jié)果的擬合程度最好。同理,本文方法的RMSE達(dá)到了 23511,小于 3種對比方法,說明本文方法預(yù)測得到的結(jié)果與真實結(jié)果之間的偏差最小。綜上所述,本文基于深度置信網(wǎng)模型進(jìn)行房屋價格預(yù)測的結(jié)果要優(yōu)于3種常用的預(yù)測模型。

3 總 結(jié)

房屋價格受到多種因素的影響,是社會關(guān)注的熱點問題之一,對房屋價格進(jìn)行預(yù)測,能夠有效輔助房地產(chǎn)業(yè)研究。本文使用基于深度置信網(wǎng)的預(yù)測模型,在 Kaggle房屋價格數(shù)據(jù)庫上進(jìn)行實驗驗證,結(jié)果表明,該方法的預(yù)測結(jié)果要優(yōu)于對比實驗中3種經(jīng)典預(yù)測模型的預(yù)測結(jié)果,能夠更有效地進(jìn)行房屋價格的預(yù)測。

猜你喜歡
置信房價房屋
急診住院醫(yī)師置信職業(yè)行為指標(biāo)構(gòu)建及應(yīng)用初探
基于置信職業(yè)行為的兒科住院醫(yī)師形成性評價體系的構(gòu)建探索
基于模糊深度置信網(wǎng)絡(luò)的陶瓷梭式窯PID優(yōu)化控制
UMAMMA歷史房屋改造
兩大手段!深圳土地“擴(kuò)權(quán)”定了,房價還會再漲?
房屋
文苑(2020年10期)2020-11-22 03:28:43
防范未然 “穩(wěn)房價”更要“穩(wěn)房租”
轉(zhuǎn)租房屋,出現(xiàn)問題由誰負(fù)責(zé)?
金橋(2018年2期)2018-12-06 09:30:40
去庫存的根本途徑還在于降房價
公民與法治(2016年8期)2016-05-17 04:11:34
2016房價“漲”聲響起
府谷县| 万全县| 福安市| 洛隆县| 金塔县| 内江市| 海安县| 根河市| 荥阳市| 威信县| 靖宇县| 营山县| 莎车县| 霍山县| 双柏县| 衡南县| 贵州省| 府谷县| 大同县| 丰县| 伊川县| 汶上县| 龙口市| 上蔡县| 平阳县| 桦甸市| 广平县| 佳木斯市| 濮阳县| 大余县| 达拉特旗| 邯郸市| 芦山县| 滨海县| 饶阳县| 信宜市| 永吉县| 安顺市| 根河市| 汉沽区| 枣强县|