石金貴 李毅 羅妮君
【摘 要】隨著大數(shù)據(jù)挖掘技術(shù)不斷發(fā)展,面臨的數(shù)據(jù)量越來越復(fù)雜,統(tǒng)計(jì)學(xué)顯得更加重要,它是開發(fā)現(xiàn)代工程技術(shù)、信息技術(shù)、軟件開發(fā)、衛(wèi)星通信技術(shù)等的重要工具。本文采用純數(shù)據(jù),應(yīng)用統(tǒng)計(jì)變異系數(shù)數(shù)據(jù)構(gòu)造判斷矩陣, 及 值具有高度一致滿意性,求得最大特征向量作為指標(biāo)權(quán)重,再對(duì)原始數(shù)據(jù)作奇異值分解,并將奇異值作為另一權(quán)重向量。組合這兩種權(quán)重作為疊加權(quán)重,結(jié)合 綜合模型進(jìn)行排名,實(shí)驗(yàn)取得較好的結(jié)果。
【關(guān)鍵詞】統(tǒng)計(jì)學(xué)變異系數(shù)據(jù);矩陣奇異值分解; 綜合模型
評(píng)價(jià)方法在社會(huì)生活的各行各業(yè)中廣泛存在,如藥物成份對(duì)總體藥性效果,各色素對(duì)顏色的影響,生態(tài)環(huán)境質(zhì)量優(yōu)劣,項(xiàng)目經(jīng)濟(jì)效益評(píng)價(jià),NBA球類競賽分析與評(píng)價(jià)等體系。常常涉及多個(gè)影響因素指標(biāo)值,這類問題的解決是將多個(gè)指標(biāo)通過一定的方法處理匯總,得到一個(gè)綜合指標(biāo)值,從這個(gè)指標(biāo)值反映被評(píng)價(jià)問題的整體情況。隨著計(jì)算機(jī)技術(shù)和大數(shù)據(jù)挖掘技術(shù)不斷日新月異的發(fā)展,面對(duì)多個(gè)復(fù)雜的影響指標(biāo),使得評(píng)價(jià)體系系統(tǒng)日趨復(fù)雜,迫切要求進(jìn)行多學(xué)科綜合評(píng)價(jià),例如用統(tǒng)計(jì)學(xué)與大數(shù)據(jù)挖掘技術(shù)、計(jì)算機(jī)編程技術(shù)、代數(shù)學(xué)中的矩陣計(jì)算等相結(jié)合進(jìn)行分析和評(píng)價(jià)。這樣就更能使非定性的、模糊不清的、難以量化的問題得到系統(tǒng)性強(qiáng)的清晰結(jié)果。
本文對(duì)文獻(xiàn)[1]中NBA賽程排序進(jìn)行評(píng)價(jià),利用新的方法,用變異系數(shù)構(gòu)造互反判斷矩陣,求出互反判斷矩陣的最大特征值的特征向量作為加權(quán)系數(shù)。將原始數(shù)據(jù) 個(gè)數(shù)據(jù)作為 數(shù)據(jù)矩陣,通過奇異值分解得到 個(gè)奇異值,每個(gè)奇異值作為另一個(gè)加權(quán)分量。將兩個(gè)加權(quán)系數(shù)進(jìn)行加權(quán)得到疊加加權(quán)系數(shù)。通過建立 綜合模型,進(jìn)行指標(biāo)值排序,與文獻(xiàn)[ 1 ]的模型結(jié)果進(jìn)行對(duì)比分析。
1.評(píng)價(jià)賽程的因素分析
建立恰當(dāng)?shù)脑u(píng)價(jià)指標(biāo)體系,是整個(gè)評(píng)價(jià)方法工作的最基本的關(guān)鍵一步,要建立有效合理賽程評(píng)價(jià)體系,要求問題的影響因子構(gòu)成的指標(biāo)必須完整有效,它的選取直接影響綜合評(píng)價(jià)的準(zhǔn)確性、合理性。
本文利用文獻(xiàn)[1]中的的6個(gè)指標(biāo)進(jìn)行分析,各個(gè)指標(biāo)之間的相互影響具有許多不確定的模糊性,層次分析法提供了處理這類問題的一種有效的方法[2],它是將復(fù)雜問題的各個(gè)影響指標(biāo)按照支配關(guān)系主次分層,形成一定的隸屬關(guān)系,并用一定的方法確定各個(gè)影響指標(biāo)的權(quán)重,通過建立 綜合評(píng)價(jià)模型,在 軟件中進(jìn)行統(tǒng)計(jì)試驗(yàn)。表略
記上述表1中的30個(gè)球隊(duì)的6個(gè)影響指標(biāo)構(gòu)成原始數(shù)據(jù)單位化矩陣為 。
2.用數(shù)理統(tǒng)計(jì)學(xué)數(shù)據(jù)構(gòu)造兩兩成對(duì)比較互反判斷矩陣
問題的影響因子指標(biāo)的重要程度是一個(gè)相對(duì)比較,具有一定的模糊性,現(xiàn)實(shí)數(shù)據(jù)不能完全刻畫它們的相對(duì)重要規(guī)律,所以建立合理的互反判斷比較矩陣至關(guān)重要,互反判斷比較矩陣是決策者針對(duì)方案給出的關(guān)于兩兩影響指標(biāo)比較的一種偏好信息形式,在比較時(shí)帶有強(qiáng)烈的主觀性、經(jīng)驗(yàn)性,常常導(dǎo)致不同的專家確定的值不相同。
本文用矩陣 的每列的變異系數(shù),作相互比值構(gòu)造判斷矩陣。由于變異系數(shù)能反映待評(píng)價(jià)對(duì)象之間的差異性[3],變異系數(shù)之間的差異就能刻畫其相對(duì)差異性程度,變異系數(shù)公式為
(1)
(其中 表示第 指標(biāo)的標(biāo)準(zhǔn)差, 表示第 指標(biāo)的平均值, ),由表1的數(shù)據(jù),經(jīng)計(jì)算得矩陣 每列的變異系數(shù)構(gòu)成的向量為
利用變異系數(shù)構(gòu)造的互反判斷矩陣公式以及對(duì)應(yīng)的判斷矩陣分別為
(2)
通過矩陣H的特征值分解,求出判斷矩陣的最大特征值 ,對(duì)應(yīng)的特征向量并歸一化作為權(quán)重向量,即
一致性檢驗(yàn)。用一致性檢驗(yàn)確定原始判斷矩陣內(nèi)在邏輯關(guān)系是否合理。一致性檢驗(yàn)影響因子指標(biāo)值為
由于判斷矩陣的最大特征值 依賴于 , 最大特征值 比維數(shù) 大的越多,判斷矩陣的不一致性越嚴(yán)重,用判斷矩陣最大特征值對(duì)應(yīng)的特征向量作為被比較因素對(duì)上層某指標(biāo)的權(quán)向量,其不一致程度就越大,產(chǎn)生的判斷誤差越大。反之,最大特征值 比維數(shù) 大的越小,產(chǎn)生的誤差越小,用的權(quán)向量就越準(zhǔn)確。由計(jì)算可知, ,說明判斷矩陣具有完全一致性,比文獻(xiàn)[1]中的 較好。
同時(shí),隨機(jī)一致性比值為
當(dāng)維數(shù) 時(shí), ,將數(shù)據(jù)代入得 ,文獻(xiàn)[1]的 ,結(jié)果表明,此時(shí)的互反判斷矩陣具有高度的滿意一致性。
3.利用奇異值構(gòu)造權(quán)重系數(shù)
奇異值分解法的幾何意義是任意兩個(gè)垂直方向的單位向量,在矩陣作用下進(jìn)行拉伸,拉伸后形成的兩個(gè)單位向量任然保持垂直,拉伸的長度就為奇異值的大小,奇異值的大小就為每個(gè)元素的疊加之和的大小,因此,可以作為客觀權(quán)重向量。
根據(jù)文獻(xiàn)[4]矩陣奇異值分解的基本概念,對(duì)于給定的任意實(shí)數(shù)矩陣 ,存在正交矩陣 和正交矩陣 ,使得矩陣 可以分解為 (其中 ),由表1的數(shù)據(jù),經(jīng)計(jì)算得矩陣 的奇異值分解得到
將每個(gè)對(duì)角元看作 的每列影響指標(biāo)的權(quán)重大小,即對(duì)角元記作權(quán)向量并單位化得
4.一級(jí)指標(biāo)向量和兩個(gè)二級(jí)指標(biāo)向量構(gòu)成交錯(cuò)疊加權(quán)重
本文采用由變異系數(shù)構(gòu)造判斷矩陣的最大特征值對(duì)應(yīng)的特征向量和原始數(shù)據(jù)單位化矩陣 的奇異值構(gòu)成的分量權(quán)重,再綜合標(biāo)準(zhǔn)差構(gòu)成的一級(jí)指標(biāo)權(quán)重進(jìn)行交錯(cuò)組合,最終形成疊加權(quán)重。
取一級(jí)指標(biāo)球隊(duì)因素和媒體因素兩個(gè)影響因子的權(quán)重為 ,并取 ,則疊加權(quán)重計(jì)算式為
(3)
將 的值代入(3)式,代入計(jì)算得綜合疊加權(quán)重為
(4)
5.TOPSIS綜合模型:對(duì)30個(gè)球隊(duì)進(jìn)行效應(yīng)型指標(biāo)排名
第一步,利用綜合權(quán)重系數(shù)加權(quán)規(guī)一化矩陣 ,即
(5)
第二步,確定效益型指標(biāo)的正負(fù)理想值,即
(6)
第三步,正負(fù)理想距離為
(7)
第四步,績效指標(biāo)值的確定,公式為
(8)
將(4)代入(5)~(8)式,可以得績效指標(biāo)值,并進(jìn)行排序,對(duì)變異系數(shù)法與文獻(xiàn)[1]的最大離差法的負(fù)理想值進(jìn)行對(duì)比,表略
從表2的對(duì)比結(jié)果,有18個(gè)排序順序完全相同, 對(duì)其余12個(gè)排序不同的隊(duì)進(jìn)行比較,交錯(cuò)順序間隔為1的有6個(gè)隊(duì),交錯(cuò)間隔為2的2個(gè)隊(duì),交錯(cuò)間隔為3的2個(gè)隊(duì),交錯(cuò)間隔為5的1個(gè)隊(duì),交錯(cuò)間隔為6的1個(gè)隊(duì)。因此,兩種方法排序效果相當(dāng)。
6.結(jié)束語
本文綜合了文獻(xiàn)[1]與[2]、[3]、[4]的研究方法,提出了用數(shù)理統(tǒng)計(jì)學(xué)方法構(gòu)造互反判斷矩陣的方法,求此矩陣的最大特征值的特征向量作為主觀權(quán)重。通過求 值,得出本文的方法比文獻(xiàn)[1]構(gòu)造的主觀權(quán)重向量較好,通過奇異值分解,用奇異值作為權(quán)重分量,并且和主觀權(quán)重向量組合,最終獲得疊加權(quán)重,并且建立TOPSIS綜合模型進(jìn)行績效排名,結(jié)果表明,使用本文的方法也較好。
參考文獻(xiàn):
[1]王積建.全國大學(xué)生數(shù)學(xué)建模競賽試題研究[M].國防工業(yè)出版社,2015.5
[2]王冬琳,王妍.綜合評(píng)價(jià)方法在NBA賽程分析中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2009.8
[3]安樹庭,彭焱秋,戴宛平.對(duì)使用主成分進(jìn)行績效指標(biāo)值排名的討論[J].數(shù)學(xué)建模及其應(yīng)用.2017.3
[4]姜艷萍,樊治平.基于判斷矩陣的決策理論與方法[M].科學(xué)出版社.2008.12
[5]James W.Demmel著.王國榮譯.應(yīng)用數(shù)值線性代數(shù)[M].人民郵電出版社.2007.6
[6]卓金武.MATLAB在數(shù)學(xué)建模中的應(yīng)用(第二版)[M].北京航空航天大學(xué)出版社.2014.9
作者簡介:
李 毅(1969-)女,副教授,主要研究課程論。
羅妮君(1963-)女,副教授,主要研究高等數(shù)學(xué)教育。
通訊作者:
石金貴(1985-)男,碩士,講師,主要研究數(shù)值代數(shù)、數(shù)學(xué)建模應(yīng)用、數(shù)理統(tǒng)計(jì)學(xué)、大數(shù)據(jù)挖掘處理。