摘要:本文從知識粒度的角度提出了相似度的概念,并利用相似度作為屬性重要度的度量。先求出屬性集的核,并以此為起點,根據(jù)屬性的重要性,逐步把屬性添加到核屬性集,從而得到約簡屬性集。
關(guān)鍵詞:知識粒度;相似度;屬性約簡
中圖分類號:F299.23 文獻識別碼:A 文章編號:1001-828X(2016)003-000-01
引言
粗糙集理論[1]是Pawlak教授于1982提出的一種以等價關(guān)系為基礎(chǔ),并具有很強定性分析能力的數(shù)學工具。
近年來,房地產(chǎn)市場的發(fā)展非常迅速,房價也成為人們關(guān)注的焦點。許多學者也對房價進行了大量的研究,取得了豐碩的成果。
麗江在云南的西北部,是著名的旅游城市。近幾年,隨著旅游熱度的持續(xù)升溫,旅游人數(shù)的快速增長,居民收入增長迅速等原因麗江的房價增長得很快。由于影響麗江市房價的因素多樣并且復雜,而且因素之間也相互影響。所以,考慮所有因素是不現(xiàn)實的。本文從需求、供應(yīng)和宏觀層面出發(fā),選取了人均可支配收入,常住人口,房地產(chǎn)開發(fā)投資額,GDP,貸款余額五個指標。其中,人均可支配收入選取了城鎮(zhèn)人均可支配收入;實際房價=商品房銷售額/銷售面積。
通過麗江市統(tǒng)計局網(wǎng)站獲得的數(shù)據(jù),利用粗糙集的理論分析影響房價的5個因素的重要程度,為相關(guān)部門的一些決策提供一定的參考。
一、相關(guān)概念
二、基于粗糙集的麗江房價研究
本文從需求、供應(yīng)和宏觀層面出發(fā),選取了人均可支配收入,常住人口,房地產(chǎn)開發(fā)投資額,GDP,貸款余額五個指標,原始數(shù)據(jù)如表一,數(shù)據(jù)來源是麗江市統(tǒng)計局網(wǎng)站的統(tǒng)計公報。
計算各項指標的增長率,并對各項指標進行等距離散化,可得表二,其中為條件屬性,為決策屬性(即房價)。
所以,在五個指標中人均可支配收入,常住人口和貸款余額比較重要。
三、結(jié)論
影響房價的因素非常多,并且非常復雜,利用粗糙集理論可以較為快速地計算出條件屬性的一個約簡。找到了影響房價的主要因素,為科學研究房價提供了方便。另外,粗糙集也可以跟神經(jīng)網(wǎng)絡(luò),灰色理論,遺傳算法等結(jié)合。
參考文獻:
[1]Pawlak Z.Rough sets-Theoretical Aspects of reasoning about data[M]. Kluwer Academic Publishers, Boston,1991.
[2]李敏,王洋.基于灰色系統(tǒng)理論對成都市房價預測分析[J].云南民族大學學報(自然科學版),2013,22(6):441-443.
[3]申瑞娜,曹昶,樊重俊.基于主成分分析的支持向量機模型對上海房價的預測研究[J].數(shù)學的實踐與認識,2013,43(23):11-16.
[4]韋光蘭,鄧曉盈,張瓊.基于馬爾可夫鏈預測模型的昆明市房價預測分析[J].中國市場,2013,21:86-87.
[5]王雅楠,孟曉景.基于動量BP算法的神經(jīng)網(wǎng)絡(luò)房價預測研究[J].軟件導刊,2015,14(2):59-61.
[6]張文修,吳偉志,梁吉業(yè),李德玉.粗糙集理論與方法[M].北京:科學出版社,2001.
作者簡介:汪際和(1986-),男,江西都昌人,講師,主要研究方向:粗糙集、概念格及關(guān)聯(lián)規(guī)則。
基金項目:云南大學旅游文化學院科學研究基金項目:2013XY15。