岑 希
摘要:房地產(chǎn)行業(yè)是復(fù)雜的非線性系統(tǒng),數(shù)據(jù)挖掘技術(shù)的應(yīng)用對政府的決策、企業(yè)的運(yùn)營和個人的投資選擇都有重要的影響。本文從房地產(chǎn)行業(yè)的價(jià)值鏈出發(fā),旨在從房地產(chǎn)行業(yè)貸款風(fēng)險(xiǎn)分析、公司經(jīng)營等級劃分和客戶關(guān)系管理三個方面著手,綜述數(shù)據(jù)挖掘技術(shù)這一新的研究領(lǐng)域在房地產(chǎn)行業(yè)中的應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)挖掘;房地產(chǎn)行業(yè);多元統(tǒng)計(jì)分析
房地產(chǎn)行業(yè)是一個數(shù)據(jù)量大、關(guān)聯(lián)性強(qiáng)、影響因素多的復(fù)雜非線性系統(tǒng)。數(shù)據(jù)挖掘技術(shù)在房地產(chǎn)行業(yè)的應(yīng)用是一個年輕且充滿希望的研究領(lǐng)域,人們對它的研究正日益廣泛和深入。解決好這些問題,對于政府部門合理分析產(chǎn)業(yè)發(fā)展,制定產(chǎn)業(yè)政策及開發(fā)企業(yè)和個人正確判斷房地產(chǎn)市場形勢、做出投資或購房決策具有重要意義。
總體來說,數(shù)據(jù)挖掘(Data Mining,本文下面均簡稱DM技術(shù))在房地產(chǎn)行業(yè)的應(yīng)用主要使用了三種技術(shù):
(1)分類技術(shù)
(2)聚類技術(shù)
(3)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)技術(shù)
本文主要從商業(yè)貸款風(fēng)險(xiǎn)評估技術(shù)、房地產(chǎn)公司經(jīng)營等級劃分和客戶關(guān)系管理這三點(diǎn)綜述數(shù)據(jù)挖掘技術(shù)在房地產(chǎn)行業(yè)的應(yīng)用。
1房地產(chǎn)商業(yè)貸款風(fēng)險(xiǎn)分析——基于神經(jīng)網(wǎng)絡(luò)技術(shù)
隨著房地產(chǎn)市場的逐步走熱, 投身于房地產(chǎn)項(xiàng)目開發(fā)的企業(yè)日益增多, 在貸款企業(yè)情況的多數(shù)不確定因素面前, 銀行的商業(yè)貸款風(fēng)險(xiǎn)也隨之提高.信息不對稱情況下, 銀行在貸款的過程中不得不承擔(dān)由于締約方違約或經(jīng)營的失敗而使得銀行不能回收貸款利息與本金的風(fēng)險(xiǎn)。 因此, 銀行機(jī)構(gòu)為了對貸款風(fēng)險(xiǎn)的有效管理與控制, 必須尋求有效的貸款風(fēng)險(xiǎn)預(yù)測量化的方法和技術(shù).
針對此問題, 可以構(gòu)建一種基于神經(jīng)網(wǎng)絡(luò)的客戶模糊分類數(shù)據(jù)挖掘方法, 旨在對客戶的貸款風(fēng)險(xiǎn)進(jìn)行分類, 為銀行貸款風(fēng)險(xiǎn)分析部門準(zhǔn)確分析目標(biāo)客戶提供一種有效的方法. 該方法對客戶進(jìn)行了合理區(qū)分, 試圖為充分做好客戶關(guān)系管理, 增強(qiáng)企業(yè)競爭優(yōu)勢, 提高企業(yè)的核心競爭力提供有效的解決方案. 該方法的思想是運(yùn)用模糊神經(jīng)網(wǎng)絡(luò)分析探索影響因素之間共同作用產(chǎn)生的交互效應(yīng), 用過去的事實(shí)進(jìn)行綜合評價(jià), 訓(xùn)練網(wǎng)絡(luò), 來確定權(quán)重的大小。這樣將會使結(jié)果更加準(zhǔn)確可信。
1.1貸款風(fēng)險(xiǎn)評估中指標(biāo)體系的建立。
數(shù)據(jù)挖掘針對不同行業(yè)的具體運(yùn)作具有不同的分類方法, 輸入量也具有各自的特點(diǎn), 對于建設(shè)企業(yè)的貸款風(fēng)險(xiǎn)系數(shù)等級的確定, 建立需要影響風(fēng)險(xiǎn)系數(shù)的指標(biāo)體系, 依據(jù)以下8個方面的分析方法。即:(1)行業(yè)發(fā)展趨勢;(2)國家政治與監(jiān)管環(huán)境;(3)管理層素質(zhì)及承擔(dān)風(fēng)險(xiǎn)態(tài)度;(4)公司經(jīng)營及競爭地位;(5)財(cái)務(wù)狀況及流動資金來源;(6)公司結(jié)構(gòu)框架;(7)母公司擔(dān)保及支持協(xié)議;(8)突發(fā)事件風(fēng)險(xiǎn)。指標(biāo)性質(zhì)分為定性指標(biāo)和定量指標(biāo)。
1.2客戶貸款風(fēng)險(xiǎn)模糊神經(jīng)網(wǎng)絡(luò)分類器體系的建立。
模糊邏輯與神經(jīng)網(wǎng)絡(luò)從概念到方法都不相同,但是它們都是為了表示預(yù)處理不確定性知識而引入的方法,而且都是一種模型的估計(jì)器。因此, 在不確定知識處理中, 模糊邏輯與神經(jīng)網(wǎng)絡(luò)可以結(jié)合。模糊邏輯要求把使用的知識以模糊命題、模糊規(guī)則的形式表示在知識庫中, 模糊命題和模糊規(guī)則是模糊概念的一種邏輯表示形式. 模糊知識只能通過領(lǐng)域?qū)<姨峁┗蚱渌緩将@取, 模糊邏輯系統(tǒng)本身不具備學(xué)習(xí)能力。 模糊神經(jīng)網(wǎng)絡(luò)以學(xué)習(xí)實(shí)例的形式隱含所需要的知識, 學(xué)習(xí)實(shí)例是以確定的輸入輸出模式表示的數(shù)值集合。神經(jīng)網(wǎng)絡(luò)具備學(xué)習(xí)能力, 經(jīng)過學(xué)習(xí)后獲得的知識的表示形式是網(wǎng)絡(luò)的互連結(jié)構(gòu)及其相應(yīng)的鄰接權(quán)矩陣。
模糊邏輯的推理是以模糊匹配和模糊集的運(yùn)算方法為基礎(chǔ), 得出的推理結(jié)論是模糊概念之間的模糊邏輯關(guān)系。神經(jīng)網(wǎng)絡(luò)的推理是以網(wǎng)絡(luò)的非線性數(shù)值運(yùn)算為基礎(chǔ),得出的推理結(jié)論也是數(shù)值的,需要通過對輸入輸出模式的解釋才能得出相應(yīng)的邏輯結(jié)論。
由于本文只做綜述性匯總和概括,原理及應(yīng)用的具體問題請參閱相關(guān)文獻(xiàn)。
具體過程可以用Matlab 軟件程序編輯實(shí)現(xiàn)BP神經(jīng)網(wǎng)絡(luò), 網(wǎng)絡(luò)的輸入層的神經(jīng)元對應(yīng)問題產(chǎn)生影響的測試變量,輸出層分別對應(yīng)各種風(fēng)險(xiǎn)等級,其中還包括隱層設(shè)置、學(xué)習(xí)率、最小誤差的設(shè)定等。
對建筑行業(yè)企業(yè)貸款風(fēng)險(xiǎn)等級的確定,可以引入一個基于模糊數(shù)學(xué)與神經(jīng)網(wǎng)絡(luò)的解決體系構(gòu)架. 通過利用模糊邏輯模仿人腦模糊思維、模糊推力的能力, 與神經(jīng)網(wǎng)絡(luò)模仿人腦結(jié)構(gòu)映射輸入特征與輸出結(jié)論的非線性關(guān)系的優(yōu)點(diǎn)相結(jié)合, 取長補(bǔ)短, 最終準(zhǔn)確地預(yù)測客戶的貸款風(fēng)險(xiǎn)等級, 將能夠?yàn)槠髽I(yè)帶來兩方面的好處:
(1)有效地識別有價(jià)值客戶,提高獲利機(jī)會,并且有針對性的向顧客提供滿意服務(wù),維持良好的合作關(guān)系,從而延長客戶生命周期。(2)減少銀行不良貸款比率,規(guī)避貸款風(fēng)險(xiǎn),以備擴(kuò)大利潤空間。
2房地產(chǎn)業(yè)上市公司的統(tǒng)計(jì)數(shù)據(jù)挖掘分析——聚類分析和因子分析
對上市公司而言,對外披露的財(cái)務(wù)指標(biāo)中往往隱含很多能具體反映出公司在某年度財(cái)務(wù)狀況的信息,但如果僅僅是籠統(tǒng)的、盲目的去查看這些繁雜的財(cái)務(wù)指標(biāo),一般很難從中發(fā)現(xiàn)更多對投資者做出投資決策有幫助的信息。故這種分析將以多元統(tǒng)計(jì)分析的方法對這些財(cái)務(wù)指標(biāo)進(jìn)行數(shù)據(jù)挖掘工作。首先選取若干個能夠反映公司財(cái)務(wù)狀況主要參考指標(biāo)進(jìn)行因子分析,縮減變數(shù)并提取出對這一系列指標(biāo)做出主要貢獻(xiàn)的因素(即主成分),然后再對各上市公司進(jìn)行聚類分析,劃分營運(yùn)等級,找出各類公司存在的財(cái)務(wù)狀況的相似性。
這種利用多元統(tǒng)計(jì)分析的方法分析房地產(chǎn)業(yè)上市公司的好處是:投資者可以根據(jù)劃分出來的上市公司的等級情況,透視企業(yè)的財(cái)務(wù)狀況,做出合理的投資決策;而各上市公司也可以根據(jù)自己的營運(yùn)等級,找出問題所在,彌補(bǔ)自身不足,修正自己公司的經(jīng)營模式。
2.1因子分析
可以借助若干家房地產(chǎn)板塊上市公司的年度財(cái)務(wù)報(bào)表,從中選取若干個具有重要參考價(jià)值的指標(biāo),首先利用SPSS 統(tǒng)計(jì)軟件分析包進(jìn)行因子分析,尋找這些財(cái)務(wù)指標(biāo)背后是否有公共因子的存在,并籍以縮減變數(shù)進(jìn)行分析??梢蕴岢鋈缦乱恍┲笜?biāo)做參考:流動比率、總資產(chǎn)周轉(zhuǎn)率、應(yīng)收帳款增長率、速動比率、主營業(yè)務(wù)收入增長率、應(yīng)收帳款周轉(zhuǎn)率等。
在因子分析過程中,將上市公司的若干個財(cái)務(wù)指標(biāo)通過提取其公因子,得到幾個能較好反映原指標(biāo)所包含信息的因子,根據(jù)財(cái)務(wù)管理的專業(yè)知識,可以對這幾個公因子加以歸納分析。如:代表房地產(chǎn)企業(yè)盈利能力的“盈利能力因子”,還有“償債能力因子”、“周轉(zhuǎn)運(yùn)營能力因子”以及“未來發(fā)展能力因子”等等,相應(yīng)的指標(biāo)可以分別為每股收益、流動比率、總資產(chǎn)周轉(zhuǎn)率、每股收益增長率等。
由于這種利用多元統(tǒng)計(jì)的方法對各種指標(biāo)進(jìn)行抽象地提煉和劃分,能夠較客觀地反應(yīng)各房地產(chǎn)企業(yè)的財(cái)務(wù)能力。還可以通過因子分析得出因子得分矩陣,將各指標(biāo)量化匯總,得出各公司的總得分,是能夠較充分反映公司營運(yùn)能力的指標(biāo)。
2.2聚類分析
根據(jù)選取的所有財(cái)務(wù)指標(biāo),對若干家公司進(jìn)行聚類分析,得到聚類分析的龍骨圖。將具有相似財(cái)務(wù)狀況的房地產(chǎn)公司聚成一類,通過與其他類公司的比較和分析,得出自己競爭的優(yōu)勢和劣勢,以及該企業(yè)在整個同行業(yè)中所出的地位,這對企業(yè)未來發(fā)展有較大的指導(dǎo)作用。
基于多元統(tǒng)計(jì)分析的視角,可以從大量繁雜的數(shù)據(jù)信息中,挖掘到很多實(shí)際的、有價(jià)值的東西,從而更有利于管理者和投資者決策活動,這也就是數(shù)據(jù)挖掘技術(shù)的含義所在??傊?若企業(yè)能夠及早發(fā)現(xiàn)自己的經(jīng)營績效上已出現(xiàn)危機(jī),就必須找出原因加以改善,以提高自己的市場競爭力,投資者也可以對公司歷來的業(yè)績情況進(jìn)行分類,判斷該公司是否值得投資,以降低投資風(fēng)險(xiǎn)。
3DM技術(shù)在房地產(chǎn)客戶關(guān)系管理系統(tǒng)中的應(yīng)用
3.1DM技術(shù)在房地產(chǎn)客戶關(guān)系管理系統(tǒng)中的應(yīng)用。
隨著市場競爭的進(jìn)一步加劇, 房地產(chǎn)企業(yè)對客戶關(guān)系管理的關(guān)注比以往更高, 能否對客戶數(shù)據(jù)進(jìn)行合理、有效地利用, 決定著一個企業(yè)的成敗。面對海量數(shù)據(jù),DM技術(shù)越來越成熟地應(yīng)用于房地產(chǎn)CRM系統(tǒng)中,為企業(yè)制定營銷策略、開展?fàn)I銷活動提供決策支持。
房地產(chǎn)行業(yè)的客戶信息有許多特點(diǎn),如客戶群廣泛、客戶特征描述結(jié)構(gòu)復(fù)雜, 又如, 客戶需求層次不一,易受外界因素影響等, 因此,有必要針對這種復(fù)雜、多變和多層次性的客戶信息進(jìn)行分析挖掘, 以識別客戶購買行為, 發(fā)現(xiàn)客戶購買模式和趨勢, 從而進(jìn)一步提高企業(yè)的服務(wù)質(zhì)量, 降低企業(yè)營銷成本。下面是DM技術(shù)在房地產(chǎn)行業(yè)不同營銷階段上的應(yīng)用:
3.2將DM技術(shù)應(yīng)用于房地產(chǎn)CRM系統(tǒng)的具體步驟
3.2.1明確商業(yè)目標(biāo)。
描述出需要解決的問題, 并且確定所要解決的問題屬于哪種應(yīng)用類型, 是屬于關(guān)聯(lián)分析、時序模式、分類、聚類、偏差分析和預(yù)測, 還是綜合應(yīng)用。
3.2.2數(shù)據(jù)準(zhǔn)備。
數(shù)據(jù)挖掘是由可以獲取的數(shù)據(jù)驅(qū)動的, 其成功很大程度上取決于所收集數(shù)據(jù)的數(shù)量和質(zhì)量。建立可靠數(shù)據(jù)資源的第一步就是確定系統(tǒng)將要使用數(shù)據(jù)的數(shù)據(jù)字典。它們應(yīng)包括如下工作:確定數(shù)據(jù)庫每一列預(yù)期存放的內(nèi)容;數(shù)據(jù)來源的描述;對缺失數(shù)據(jù)的處理等。
3.2.3利用數(shù)據(jù)挖掘技術(shù)建立模型。
利用數(shù)據(jù)挖掘的一些算法對數(shù)據(jù)進(jìn)行分析, 建立模型, 并選擇好相應(yīng)的實(shí)現(xiàn)工具。假如明確了主要任務(wù)是分類,可以采用的算法有遺傳算法、決策樹和人工神經(jīng)網(wǎng)絡(luò)等。選擇了模型的類型及實(shí)現(xiàn)的工具后, 有時還需對數(shù)據(jù)進(jìn)行預(yù)處理。
3.2.4反復(fù)驗(yàn)證。
從較小的系統(tǒng)(如較小的客戶群體) 開始,但要完成全過程(即從數(shù)據(jù)收集和處理, 到數(shù)據(jù)挖掘, 最后到產(chǎn)生促銷數(shù)據(jù)結(jié)構(gòu), 如郵件發(fā)送列表) 。通過驗(yàn)證, 可以糾正系統(tǒng)中的錯誤, 并有利于用戶對系統(tǒng)功能的進(jìn)一步理解。
3.2.5實(shí)施與維護(hù)。
在應(yīng)用模型之后, 還要不斷監(jiān)控模型的效果。因此隨著模型使用時間的增加, 要不斷的對模型做重新測試, 有時甚至需要重新建立新的模型。
4結(jié)束語
房地產(chǎn)商之間激烈的競爭導(dǎo)致了面向市場營銷和顧客服務(wù)的數(shù)據(jù)倉庫的建設(shè)以及數(shù)據(jù)挖掘技術(shù)的應(yīng)用, 本文對數(shù)據(jù)挖掘技術(shù)在房地產(chǎn)CRM系統(tǒng)中應(yīng)用的具體方式與方法進(jìn)行了探討。隨著數(shù)據(jù)挖掘技術(shù)的進(jìn)一步發(fā)展, 必將使得房地產(chǎn)CRM系統(tǒng)更加成熟完善。