付 沙 周航軍 楊 波 肖葉枝
(湖南財政經濟學院,湖南長沙410205)
基于信息熵多屬性決策的統(tǒng)計信息綜合評價研究
付 沙 周航軍 楊 波 肖葉枝
(湖南財政經濟學院,湖南長沙410205)
〔摘 要〕針對當前權重確定方法單一、傳統(tǒng)熵權計算方式不足等問題,構建一種基于信息熵多屬性決策的綜合評價模型。該模型運用改進層次分析法確定全體決策者對各指標的主觀權重,以信息熵理論確定各指標的客觀權重,并結合主觀與客觀權重作為最終評價的綜合權重。在此基礎上依據多屬性決策模型提出多屬性決策評價方法,該方法將主、客觀分析相結合,既考慮權重的現實性,又以數據作為評價基礎,能有效解決選擇評價中的不確定多屬性決策問題。論文通過對湖南統(tǒng)計年鑒中數據的分析,驗證了所提方法的可行性與有效性。
〔關鍵詞〕信息熵;多屬性決策;統(tǒng)計信息;綜合權重
多屬性決策(Multiple Attribute Decision Making,MADM)是現代決策科學的一個重要組成部分,主要用于解決多個屬性情況下的有限方案決策問題,其實質是利用已有決策信息,通過一定方式對有限個備選方案進行排序擇優(yōu)。其理論和方法已廣泛應用到社會生活、工程設計、系統(tǒng)工程以及管理科學等領域?,F實生活中,由于人類思維的模糊性以及客觀事物的復雜性與不確定性,人們在決策過程中對評價事物往往難以給出確切的數值,而是以模糊數等形式的不確定信息來評定[1]。此類決策問題目前在國內外專家學者中有著較高的關注度,如文獻[2]利用信息熵理論對多屬性決策指標進行規(guī)范化處理的方法,得到了待決策方案的優(yōu)化屬性值,從而達到更為精確地判斷決策方法優(yōu)劣的效果。文獻[3]通過將信息熵引入到不確定多屬性評價決策模型中,建立了我國商業(yè)銀行操作風險的多屬性評價方法。文獻[4]針對多屬性決策過程中同時存在多種特征的定性與定量不確定信息,且屬性權重未知的情況,提出基于不確定信息熵和證據推理的不確定多屬性決策方法。文獻[5]運用信息熵和結構元理論,探討了權重完全未知情況下的模糊多屬性決策方法,構建了模糊多屬性決策模型,并將該方法運用到干部考核、評估等問題中。
湖南幅員遼闊,物產富饒,俗有“湖廣熟,天下足”之謂,是著名的“漁米之鄉(xiāng)”。全省轄13個市、1個自治州、122個縣(市、區(qū)),在這片三湘大地上,生活著漢、土家、苗、侗、回等56個民族7 090萬湖湘兒女。全省實有耕地總資源378.9萬公頃,至2010年底,全省有林地面積1.51億畝,森林覆蓋率為57.01%。主要農副產品產量如糧食、棉花、油料、苧麻、烤煙及豬肉等均位居全國前列。湖南礦產豐富,礦種齊全,是馳名中外的“有色金屬之鄉(xiāng)”和“非金屬礦之鄉(xiāng)”?;谏鲜雒枋?,以湖南統(tǒng)計信息網發(fā)布的2008-2012年《湖南統(tǒng)計年鑒》中“湖南的一天”數據為例,根據信息熵多屬性決策的綜合評價模型對其進行分析與評價。
熵的概念最早由Clausius于1865年提出,之后信息論之父C.E.Shannon在1948年將熵的概念引入信息領域,利用“信息熵”作為衡量信息紊亂程度的測度[6]。熵的概念從宏觀上反映了系統(tǒng)在微觀狀態(tài)下的不確定性程度。
信息熵(Shannon熵)在隨機事件發(fā)生之前,它是對于結果不確定性的量度;在隨機事件發(fā)生之后,它是從該事件中所獲信息的量度(信息量)。信息熵是系統(tǒng)無序程度的度量,其某項指標的指標值變異程度越大,信息熵越小,該指標所提供的信息量越大,其權重也應越大。信息熵的運用可減少確定指標權重的主觀性與隨意性。在信息論中,信息熵用于表示系統(tǒng)的不確定性。它是多屬性系統(tǒng)的一個狀態(tài)函數,熵值越大,表明系統(tǒng)越不確定,越無序;熵值越小,則該系統(tǒng)越高效有序,且經濟效益越高。
假設系統(tǒng)可能處于n種不同狀態(tài):{S1,S2,…,Sn},Pi表示系統(tǒng)處于狀態(tài)Si下的概率,其中i=1,2,…,n,0≤Pi,則系統(tǒng)X的熵為:
熵具有極值性,當系統(tǒng)狀態(tài)為等概率,即Pi=1/n時,熵取最大值Hmax=lnm,利用Hmax對式(4)進行歸一化處理得到衡量各指標的相對重要性熵值為:
當pij(j=1,2,…,m)取等值時,熵ei為最大值1,即ei滿足0≤ei≤1。
2.1問題描述
對于某一多屬性決策問題,假設方案集為A={A1,A2,…,Am},屬性集為C={C1,C2,…,Cn},屬性的權重向量為w={w1,w2,…,wn},且。本文依據各方案屬性值的表達,分析探討如何構建基于信息熵多屬性決策的綜合評價模型。
2.2算法步驟
針對文中探討的基于信息熵多屬性決策的綜合評價模型構建,其具體步驟如下:
Step 1依據給定各方案在各指標下的評價值,構造m個方案n個評價指標的判斷矩陣A=(xij)m×n,xij表示第i個方案的第j個指標值。
Step 2判斷矩陣的規(guī)范化處理。為消除指標間由于量綱不同而影響決策結果,可對指標值的判斷矩陣進行規(guī)范化處理,由此得到規(guī)范化決策矩陣Y=(yij)m×n。
在多屬性決策問題中常見屬性類型為效益型與成本型,效益型指標的值越大越好;而成本型指標的值則越小越好。
效益型指標:
成本型指標:
其中,i=1,2,…,m;j=1,2,…,n。
Step 3依據熵的定義確定第j個指標的信息熵值。
Step 4計算第j項指標的熵權[8]。
Step 5計算每個屬性的客觀權重比重與綜合權重。
設每個屬性的客觀權重所占比重為qj,則主觀權重所占比重為pj,且qj+pj=1,j=1,2,…,n。
運用模糊層次分析法確定全體決策者對各屬性的權重z,計算屬性的綜合權重wj。
Step 6從方案集A中定義相對的理想方案與負理想方案:
將方案i與理想方案的距離記為
方案i與負理想方案的距離為
其中,i=1,2,…,m。
最后,依據Ui的大小進行排序,即可獲得最優(yōu)方案。
《湖南統(tǒng)計年鑒》系統(tǒng)收錄了全省及各市、州、縣連續(xù)若干年經濟與社會發(fā)展方面的大量統(tǒng)計數據,以及重要歷史年份的全省主要統(tǒng)計數據,是一部全面反映湖南省經濟和社會發(fā)展情況的資料性年刊。為了更直觀地闡述基于信息熵多屬性決策的綜合評價模型作用機理,本文以湖南省政府統(tǒng)計門戶網站“湖南統(tǒng)計信息網”發(fā)布的2008-2012年《湖南統(tǒng)計年鑒》中“湖南的一天”子欄目為例[9],其統(tǒng)計信息評價如表1所示。
表1 湖南省統(tǒng)計信息評價指標
表1?。ɡm(xù))
(1)依據式(3)~(4)將表1的指標數據進行規(guī)范化處理,利用式(5)~(6)計算熵值Hj和熵權ej。
Hj=(0.76271,0.79490,0.71345,0.79467,0.80970,0.72782,0.67340,0.67941,0.67058,0.64919,0.75950,0.84205,0.82370,0.76668,0.77474,0.67759,0.69317,0.71475,0.61359,0.83747,0.67491,0.68729,0.79573,0.76275,0.82028,0.72323,0.79530,0.17744,0.79338,0.78766,0.82901,0.80689,0.84317,0.71037)
ej=(0.02871,0.02790,0.02995,0.02790,0.02753,0.02959,0.03096,0.03081,0.03103,0.03157,0.02879,0.02671,0.02717,0.02861,0.02841,0.03086,0.03046,0.02992,0.03247,0.02683,0.03092,0.03061,0.02788,0.02871,0.02726,0.02971,0.02789,0.04347,0.02794,0.02808,0.02704,0.02760,0.02668,0.03003)
(2)根據式(7)可得qj:
qj=(0.44193,0.45913,0.38293,0.53114,0.54025,0.48909,0.43260,0.32925,0.44510,0.42627,0.50594,0.60010,0.57692,0.47660,0.44806,0.41736,0.40144,0.40914,0.39237,0.67918,0.37917,0.37792,0.49119,0.48161,0.50894,0.53858,0.57441,0.21444,0.53297,0.52690,0.55366,0.49133,0.66328,0.46238)
(3)運用文獻[10]提出的模糊層次分析法確定各屬性權重z,然后依據式(8)計算屬性的綜合權重wj。
wj=(0.02999,0.02958,0.03060,0.02795,0.02774,0.02929,0.02985,0.02893,0.02935,0.03010,0.02840,0.02723,0.02752,0.02829,0.02708,0.02919,0.02899,0.02879,0.02975,0.02720,0.03097,0.03085,0.02947,0.02782,0.02811,0.02938,0.02836,0.03132,0.03030,0.03041,0.02970,0.02984,0.02881,0.03109)
(4)從方案集中定義相對的理想方案f和負理想方案v。
f=(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,0,0,1,0,1,0)
v=(0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,0,1,0,1)
(5)運用式(9)~(10)得到:
S+=(0.72798,0.61109,0.39578,0.23426,0.14572)
S-=(0.17399,0.17148,0.27381,0.43897,0.78846)
(6)根據式(11)可得:
Ui=(0.19290,0.21912,0.40893,0.65204,0.84402)
由此,“湖南的一天”統(tǒng)計信息評價得分的結果如圖1所示。
圖1 “湖南的一天”統(tǒng)計信息評價得分情況
經湖南省統(tǒng)計局核算,曾以“魚米之鄉(xiāng)”著稱的湖南,農業(yè)生產已先后被工業(yè)及服務業(yè)趕超。2011年湖南省經濟發(fā)展保持平穩(wěn)較快增長,工業(yè)領域增長顯著:全省規(guī)模工業(yè)實現增加值8 122.76億元,增長20.1%。主要工業(yè)產品中,74.1%的產品產量增幅較大,產銷率達98.71%,同比提高0.11個百分點。根據圖表統(tǒng)計信息整理及分析,得出:原油加工量增長28.6%,鋼材增長7.5%,原煤增長6.5%,水泥增長6.3%。2011年原煤較2007年增長68.3%,水泥較2007年增長66.5%,原油加工量較2007年增長24.6%。
與之相比,經濟總量位列第三的第一產業(yè)中,糧食總產量增長3.2%,豬牛羊肉減少1.5%,水產品增長0.57%,油料增長10.3%,增幅表現平穩(wěn)。在消費方面,2011年城鄉(xiāng)居民消費總額、平均每人消費額分別增長11.3、12.3,較2007年分別增長68.1、78.2。值得關注的二級指標有:2011年郵電業(yè)務總量較2007年減少30.7%,苧麻較2007年減少68.8%。
從2008-2012年,我省GDP由11 156.64億元增長到22 154.23億元,連續(xù)5年列全國前十,增長近2倍。一系列的數據印證了湖南在多方面實力逐步提升:(1)工業(yè)生產平穩(wěn)增長;(2)農業(yè)基礎地位得到鞏固;(3)基礎設施不斷完善;(4)居民消費保持旺勢;(5)外引內聯成效明顯。從多項數據分析亦可看出,湖南人民同心協力、開拓進取,全省經濟建設不斷發(fā)展,社會事業(yè)突飛猛進,綜合實力顯著增強,人民生活水平穩(wěn)步提高。
本文首先運用改進層次分析法確定全體決策者對各指標的主觀權重,然后應用信息熵理論確定指標的客觀權重,再通過建立綜合權重模型將決策者的主觀權重與樣本自身產生的熵權相結合,采取一定的方式混合加權計算綜合權重。在此基礎上結合多屬性決策模型提出多屬性決策評價方法,將主、客觀分析相結合,既減少決策問題的主觀性,又能量化整個評價過程,有效解決了選擇評價中的不確定多屬性決策問題,具有良好的應用推廣與實際決策價值,可廣泛應用于供應鏈選擇、項目評估、投資決策以及經濟效益綜合評價等相關決策問題中。
參考文獻
[1]張市芳,劉三陽,翟任何.動態(tài)直覺模糊多屬性決策的VIKOR擴展方法[J].計算機科學,2012,39(2):240-243.
[2]余勝春.基于信息熵的多屬性參數系統(tǒng)決策方法[J].數學雜志,2012,32(6):1111-1114.
[3]張晨,朱衛(wèi)東,楊善林.基于信息熵的商業(yè)銀行操作風險多屬性評價方法研究[J].預測,2007,26(5):55-58,63.
[4]尹德進,王宏力.基于信息熵與證據推理的不確定多屬性決策方法[J].計算機應用,2011,31(5):1308-1310,1412.
[5]劉海濤,郭嗣琮.基于結構元理論及信息熵的模糊多屬性決策方法[J].數學的實踐與認識,2009,39(17):1-5.
[6]梁吉業(yè),錢宇華.信息系統(tǒng)中的信息粒與熵理論[J].中國科學E輯:信息科學,2008,38(12):2048-2065.
[7]張近東,任杰.熵理論中熵及熵權計算式的不足與修正[J].統(tǒng)計與信息論壇,2011,26(1):3-5.
[8]何滿輝,逯林.基于信息熵多屬性決策的物流供應商選擇評價[J].工程設計學報,2013,20(1):6-10.
[9]湖南統(tǒng)計信息網.湖南統(tǒng)計年鑒[EB/OL].http:∥www.hntj. gov.cn/sjfb/tjnj/,2013-07-17.
[10]付沙,廖明華,肖葉枝.模糊層次分析法在信息安全領域中的研究探索[J].情報學報,2012,31(10):1105-1109.
(本文責任編輯:孫國雷)
The Statistics Comprehensive Evaluation Research Based on Entropy Multi-attribute Decision Making
Fu Sha Zhou Hangjun Yang Bo Xiao Yezhi
(Hunan University of Finance and Economics,Changsha 410205,China)
〔Abstract〕The paper construct a multi-attribute decision making comprehensive evaluation model based on information entropy,for the single method of weight determining and less calculation methods of traditional entropy weight and other issues.The model uses improved AHP to determine the subjective weighting of each index of all decision-makers,to determine the objective weight of each index based on the information entropy theory,and combined with subjective and objective weight as the comprehensive weight of final evaluation.Then proposed multi-attribute decision evaluation method based on multi-attribute decision model,this method combined the subjective and objective analysis,consider the reality of weight and uses data as the evaluation,it can effectively solve the uncertain multi-attribute decision making problems in selection and evaluation process.The paper verified the feasibility and effectiveness of the proposed method by the analysis of the data in Hunan Statistical Yearbook.
〔Key words〕entropy;multi-attribute decision making;statistics;comprehensive weight
作者簡介:付 沙(1980-),男,副教授,碩士,研究方向:決策分析、信息系統(tǒng)安全。
基金項目:湖南省社科基金項目(項目編號:No.14YBA065);湖南省教育廳科學研究項目(項目編號:No.14C0184)。
收稿日期:2015-06-29
〔中圖分類號〕G254.92
〔文獻標識碼〕A
〔文章編號〕1008-0821(2015)08-0126-05
DOI:10.3969/j.issn.1008-0821.2015.08.024