国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于C4.5算法分類器的電力客戶信用評級模型研究*

2016-01-27 02:08:04丁浩
通化師范學院學報 2015年12期
關(guān)鍵詞:評級信用指標體系

?

基于C4.5算法分類器的電力客戶信用評級模型研究*

丁浩

(安徽工商職業(yè)學院,安徽 合肥231131)

摘要:電力客戶巨額欠費是電力公司面臨的一個難題,該文采用C4.5算法分類器對電力系統(tǒng)客戶進行信用評級.從電力系統(tǒng)大規(guī)模的繳費數(shù)據(jù)中提取訓練樣本,利用C4.5算法進行學習得到分類規(guī)則,然后將這些規(guī)則應(yīng)用于用電客戶的信譽評級,從而更好地管理客戶繳費行為,為電力系統(tǒng)的管理運營提供數(shù)據(jù)支持.實驗結(jié)果表明,對于不同的指標體系和不同的分類樣本,都可以獲得較好的分類效果.

關(guān)鍵詞:C4.5算法;決策樹;電力客戶;信用評級

電力產(chǎn)品作為一種商品,具有其獨有的特殊性:其生產(chǎn)、輸送到最終消費都在瞬間完成,不可儲存.這就決定了電力產(chǎn)品的銷售主要是以“先使用后付費”的方式進行,電費的安全及時回收是供電企業(yè)保證正常經(jīng)營的前提,同時電費也是電力基礎(chǔ)設(shè)施建設(shè)維護的主要資金來源.供電企業(yè)為確保其自身的正常經(jīng)營和持續(xù)發(fā)展,當然更傾向于將電力商品銷售給需要用電又講信用的客戶,希望用電者都能按時繳納電費.但現(xiàn)實中卻并不是這樣,由于“信用缺失”,有些客戶用電后故意拖延繳費、逃避繳費,這必然導致供電企業(yè)電費回收工作非常艱難,給電力企業(yè)帶來很大的經(jīng)營風險.近年來,電力公司為解決拖欠電費問題付出了很大的努力,但實際效果卻并不樂觀.

為了徹底扭轉(zhuǎn)這種局面,有效降低電力企業(yè)的經(jīng)營風險,實現(xiàn)可持續(xù)發(fā)展,我們必須采取科學的管理方法和高科技的手段來解決電力企業(yè)目前存在的上述問題.因而,如何對用電客戶的信用等級進行評估并對其信用風險進行有效管控,就成為供電企業(yè)降低經(jīng)營風險、提高經(jīng)營管理水平所必須解決的問題.如果能掌握電力客戶的信用狀況,對有欠費跡象或出現(xiàn)問題的電力客戶事先及時采取措施,就能大大減少電力公司的經(jīng)營風險及經(jīng)濟損失.

1C4.5算法簡介

從本質(zhì)上看,對電力系統(tǒng)客戶進行信用評級就是一個分類問題.隨著市場競爭的日趨激烈及計算機技術(shù)的飛速發(fā)展,越來越多的分類方法被應(yīng)用到信用評級領(lǐng)域.數(shù)據(jù)挖掘中常用的分類方法有決策樹分類法、神經(jīng)網(wǎng)絡(luò)分類法和貝葉斯分類法等.決策樹(Decision Tree,DC)分類法又稱概率分析決策法,是一種以數(shù)據(jù)集為基礎(chǔ),從一組無次序、無規(guī)則的樣本數(shù)據(jù)中推理出分類規(guī)則的歸納學習算法.該算法能夠完整地顯示出決策問題在不同階段上的詳細的決策過程,邏輯清晰,層次分明,形象直觀,用圖形表示出來很像一棵樹[1].例如,圖1就是一個簡單的決策樹模型.該示意圖描述了一個客戶是否會按時繳納電費的分類模型,利用它可以對一個電力客戶是否可能欠費進行分類預(yù)測.

圖1 決策樹模型

C4.5算法是一種非常經(jīng)典的分類算法,屬于決策樹算法的一種,是由Quinlan提出.C4.5算法是在ID3算法的基礎(chǔ)上做出了重大改進之后而形成的一種很好的分類算法.相對于ID3算法,C4.5算法在改進之后有如下優(yōu)點:[2]

(1)提高了算法的準確率.C4.5算法的最大改進就是采用信息增率代替信息增益來選擇屬性,從而可以避免那些樣本數(shù)量多但卻對分類貢獻少的屬性作為根節(jié)點.

(2)提高了算法的效率.該算法對決策樹進行前剪枝,發(fā)現(xiàn)異常數(shù)據(jù)可以及時處理,不用等到樹建好后再去對其剪枝.

(3)大大拓展了應(yīng)用的范圍.C4.5算法能夠?qū)B續(xù)數(shù)據(jù)進行離散化,從而不僅可以處理離散型數(shù)據(jù),而且可以處理連續(xù)型數(shù)據(jù).此外,對有缺失的數(shù)據(jù),C4.5算法依然能夠進行有效的處理.因而C4.5算法被廣泛應(yīng)用于各個領(lǐng)域.

2電力客戶信用評級模型的設(shè)計

從當前供電企業(yè)實際的業(yè)務(wù)背景出發(fā),圍繞電力客戶信用評價的功能目標,深入探討電力客戶信用評價的組成和影響客戶信用狀況的因素.在此基礎(chǔ)上,選取評價指標、確定指標權(quán)重,從而設(shè)計出電力客戶信用評價的指標體系,并制定信用等級評估標準.

傳統(tǒng)的信用評估方法主要包括5C評估法和綜合評估法.在使用綜合評估法對電力客戶進行信用評級時,在一些環(huán)節(jié)上會遇到要素難以量化的問題,對此我們不能僅依靠評級人員“藝術(shù)地去把握”.為了淡化主觀因素,我們主要從指標的選取和指標權(quán)重設(shè)置這兩個關(guān)鍵環(huán)節(jié)來考慮對綜合評估法加以改進和完善.

指標選取就是研究確定用哪些指標來對電力客戶的信用進行評估,指標權(quán)重是指在整個信用評估的指標體系中,各項評估指標所占有的比重.目前,在大多數(shù)國內(nèi)的信用評估中,指標的選取及指標權(quán)重的設(shè)置還都是采用Delphi法,也稱為專家咨詢法,本質(zhì)上就是一種主觀、定性的方法,因而主觀因素在所難免.我們可以運用數(shù)據(jù)挖掘技術(shù)、數(shù)理統(tǒng)計方法等來進行相關(guān)的處理,比如進行指標間的相關(guān)性分析、制衡性分析,對定性指標進行定量考察,對不同計量單位指標進行同度量處理等,從而使得指標選取和指標權(quán)重設(shè)置更加科學合理.確保這種價值判斷的客觀性,淡化可能帶有的主觀色彩,達到對客戶的信用水平進行客觀公正地測量的目的.[3]

建立電力客戶信用評級指標體系應(yīng)該包括以下三個方面的內(nèi)容:確定各級指標;確定各個指標的權(quán)重;確定計分方法和評分標準.

結(jié)合信用管理行業(yè)特點并針對電力行業(yè)的現(xiàn)狀,我們建立如下指標體系:把環(huán)境、道德和能力三個方面作為一級評價指標,并進一步選取以下12個二級指標,即繳費的及時性、有無卡表、繳費的性質(zhì)、經(jīng)濟狀況、補繳情況、社會信用、前一季度評價、有無違規(guī)用電、預(yù)交情況、用電量的波動、有無陳欠及有無用電.

確定了指標體系以后,接下來以定性分析與定量計算相結(jié)合的方式,采用一種層次權(quán)重決策分析方法(簡稱層次分析法,AHP)來設(shè)定指標權(quán)重.[3]

由于計算出的指標權(quán)重均小于1,不符合打分時一般使用百分制(滿分為100分)的習慣,為便于打分,可通過乘以100將權(quán)重比例轉(zhuǎn)換為權(quán)數(shù).對于定性指標要量化處理,可以依據(jù)指標分析結(jié)果的不同情況相應(yīng)地設(shè)置得分.得出每一個客戶指標分值后再相加,就可得到客戶信用評估的總分.然后按總分高低劃分客戶信用等級,采用國際通用的“四等十級制”(見表1).等級越高,表明該客戶信用越好,反之等級越低,信用越差.

表1客戶信用等級評定標準

通常,B級以下都會被看成“垃圾等級”.為了簡化模型,本系統(tǒng)實際采用了六級分類標準,即AAA,AA,A,B,C,D.

3基于C4.5算法分類器的電力客戶信用評級建模過程

根據(jù)需求可知,所創(chuàng)建的模型最后要能夠預(yù)測客戶的信用等級,因此,這個模型本質(zhì)上就是一個分類器,利用它可以把數(shù)據(jù)庫當中的數(shù)據(jù)項映射到給定類別當中.可以將系統(tǒng)大致分成以下幾個部分:建模數(shù)據(jù)集的選取、模型創(chuàng)建、模型驗證、模型預(yù)測、模型評價,由此設(shè)計系統(tǒng)邏輯模型如圖2所示.[4]

圖2 系統(tǒng)邏輯模型

(1)建模數(shù)據(jù)集的選取.選擇具有代表性的數(shù)據(jù)集進行建模,對于生成模型的準確率至關(guān)重要.在預(yù)分類數(shù)據(jù)中,各種因果聯(lián)系是已知的這部分事先已知的例子會教給模型有關(guān)數(shù)據(jù)的信息,因此,這部分數(shù)據(jù)也稱為模型集.通過從客戶信息中,按照電力客戶信用風險評定指標體系,生成符合要求的數(shù)據(jù)集,從生成數(shù)據(jù)集中選取一部分作為建模數(shù)據(jù)集.

(2)訓練集和測試集的選取.到目前為止,數(shù)據(jù)挖掘中關(guān)于訓練和測試集的選取還是一個有待進一步研究的問題.當前比較通用的是n次交叉驗證法(見圖3),即將數(shù)據(jù)集分為n個子集D1,D2,…,Dn,每個子集的數(shù)據(jù)量大致相當,對數(shù)據(jù)集的訓練和測試都重復(fù)n次,在第k次重復(fù)時,子集Sk作為測試集,余下的n-1個子集作訓練集.如此重復(fù)n次,最終的預(yù)測準確度是n次的平均值.目前,公認的是10次交叉驗證.[5]

圖3 n次交叉驗證示意圖

(3)預(yù)測模型的生成.電力客戶信用評級建模,就是通過利用電力企業(yè)已經(jīng)掌握的現(xiàn)有客戶數(shù)據(jù)進行訓練和測試,最終達到可以對新的數(shù)據(jù)進行預(yù)測的目標.經(jīng)過不斷的循環(huán)測試,最終生成較為滿意的預(yù)測模型(見圖4).

圖4 生成的預(yù)測模型

(4)模型的評價.利用C4.5算法生成預(yù)測模型會受到多方面因素的影響,比如訓練數(shù)據(jù)的多少,訓練屬性的波動等.下文用三個模型加以比較說明.

表2基于C4.5算法模型A的評價指標和結(jié)果(打√的為指標)

表3 基于C4.5算法模型B的評價指標和結(jié)果(打√的為指標)

表2顯示的是使用所有的指標體系對電力客戶進行等級評定,所得到的模型A在不同數(shù)據(jù)樣本下模型的準確率.表3顯示的是使用部分的指標體系對電力客戶進行等級評定,所得到的模型B在不同數(shù)據(jù)樣本下模型的準確率(見圖5).

圖5 不同指標體系下基于C4.5算法分類器的信用評級模型

表2和表3的實驗結(jié)果表明:模型A和模型B兩者都具有較高的準確率,能夠很好地應(yīng)用于對電力客戶進行信用評價.模型A和模型B的比較分析可以看出,經(jīng)濟狀況、用電量波動和有無用電這些指標對電力客戶信用評價影響較小,并不能反映電力客戶信用,反而對信用評價的準確率有干擾.

表4基于C4.5算法樣本數(shù)相同情況下的評價指標和結(jié)果

(打√的為指標)

表4的實驗結(jié)果表明,評價指標的選擇對于預(yù)測的準確度有很大影響,而其中前三個月的評價、繳費及時性和有無卡表對預(yù)測的準確率影響較大.

這充分說明我們所選擇的指標體系乃至整個系統(tǒng)的設(shè)計都是非常科學的.

4總結(jié)與展望

總之,采用科學的方法和技術(shù)對電力客戶進行

信用等級評估,可以安全及時地回收客戶的電費和其它應(yīng)收賬款,是供電企業(yè)內(nèi)部挖潛、提高效益的有效手段,是供電企業(yè)立足市場,提高效益的前提,也是供電企業(yè)健康發(fā)展的基礎(chǔ).通過對電力客戶信用等級的評定,可以對一些客戶進行欠費的預(yù)測,為防范和處理用電客戶惡意拖欠或拒交電費的工作提供科學依據(jù)和決策指導.電力系統(tǒng)必須實施客戶信用風險管理,信用評級必須運用于實踐,并逐步完善評價內(nèi)容和程序,以提高科學性和效率,形成常態(tài)機制,建立起適合中國電力市場特點的電力系統(tǒng)信用評價體系.

參考文獻:

[1](加)Jiawei Han MichelineKamber.數(shù)據(jù)挖掘概念與技術(shù)(第二版)[M].范明,孟小峰,等譯.北京:機械工業(yè)出版社,2001.

[2]Chye K H,Chin T W,Peng G C.Creditscoring using data mining techniques[J].Singapore M anagementReview,2004,26(2):26-47.

[3]孫瑞麗.基于因子分析與聚類分析的我國傳媒類上市公司信用評級模型[J].科技視界,2014(06).

[4]Pawan L.Interval set clustering of web users with rough K-Means.Journal ofIntelligent Information System,2004,23(1):15-16.

[5]Jae H.M,Yang-chan L.Bankruptcy prediction using support vector machinewith optimal choice of kernel function parameters.Expert Systems withApplications,2006,28(2):603-614.

(責任編輯:王前)

Study on Credit Evaluation Models for Power Clients Based on C4.5 Classification Algorithm

DING Hao

(AnhuiBusinessVocationalCollege,Hefei,Anhui231131,China)

Abstract:In this paper, C4.5 classification algorithm is used for evaluating the credits of power clients so as to resolving the problem of huge arrearages from clients. Firstly, the specimen extracted from massive bill data of power system to acquire the principles of classification is studied. Then, the rule is applied to evaluate the credits of power clients for further managing their paying behaviors and providing the data support for the management of power system. The experimental result indicates that preferable effect of classification can be obtained in various index systems and different specimens.

Keywords:C4.5 algorithm;Decision tree;Power client; Credit Evaluation

中圖分類號:TP274

文獻標志碼:A

文章編號:1008-7974(2015)06-0007-04

作者簡介:丁浩,男,安徽泗縣人,講師.

基金項目:國家自然科學基金面上項目“基于靈敏性分析和隱因素發(fā)現(xiàn)的復(fù)雜系統(tǒng)脆弱性演化機制研究”(61175051)

收稿日期:*2015-07-25

DOI:10.13877/j.cnki.cn22-1284.2015.12.003

猜你喜歡
評級信用指標體系
為食品安全加把“信用鎖”
信用收縮是否結(jié)束
中國外匯(2019年9期)2019-07-13 05:46:30
層次分析法在生態(tài)系統(tǒng)健康評價指標體系中的應(yīng)用
供給側(cè)改革指標體系初探
信用中國網(wǎng)
分析師最新給予買入評級的公司
信用消費有多爽?
百度遭投行下調(diào)評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
測土配方施肥指標體系建立中‘3414
土地評價指標體系研究
滨海县| 游戏| 柘荣县| 巴东县| 福安市| 花莲市| 巴南区| 乌拉特中旗| 思茅市| 穆棱市| 尼玛县| 仙居县| 隆昌县| 类乌齐县| 大庆市| 舟山市| 始兴县| 德昌县| 灌阳县| 宜宾县| 汕尾市| 闽侯县| 铅山县| 女性| 恩平市| 新宁县| 林甸县| 油尖旺区| 德庆县| 四子王旗| 牟定县| 安达市| 宁乡县| 清涧县| 汾西县| 新野县| 罗甸县| 咸阳市| 兴仁县| 哈巴河县| 汾西县|