張永超,張建村
(中國航天空氣動力技術(shù)研究院,北京 100074)
Fisher判別分析方法的基本思想是投影,即將高維數(shù)據(jù)點投影到低維空間上,這樣,數(shù)據(jù)點就變得比較密集,從而可以克服由于維數(shù)較高而引起的“維數(shù)禍根”,根據(jù)類間距離最大、類內(nèi)距離最小的原則確定判別函數(shù),再依據(jù)建立的判別函數(shù)判定待判樣品的類別。
設(shè)有m個總體G1,G2…Gm相應(yīng)的均值向量和協(xié)方差矩陣分別為 μ(1),μ(2),…,μ(m);ν(1),ν(2),…,ν(m)從總體 Gi中抽取容量為ni樣本為
則得到
為X(i)a在軸上的投影,其中:a=1,2,…,ni;i=1,2,…,m向量u=(u1,u2…,up)T表示P維空間中的1個方向,Y=uTX,為u與X的內(nèi)積,即X在u軸上的投影,記
其中:Si就是Gi中ni個本樣 的樣本離差陳,組間差為
令,為了使φ達(dá)到最大值,且使解維一,通常附加條件使uTWu=1,于是問題就轉(zhuǎn)化為在條件uTWu=1下求使uTBu達(dá)到最大值u。為此,用拉格朗日乘數(shù)法,令
對(7)式進行求偏導(dǎo),并使其為0,即
經(jīng)進一步整理得到:
表明應(yīng)是的最大特真值,u就是最大特征值所對應(yīng)的特征向量,從而可求出判別函數(shù)。
參照許強、Guan、邵云飛和、陳偉和張永超等人關(guān)于高技術(shù)相關(guān)產(chǎn)業(yè)的指標(biāo)體系設(shè)計,并同時遵循指標(biāo)設(shè)計的數(shù)據(jù)可獲取和可操作性原則,本文確定如表1的高技術(shù)產(chǎn)業(yè)技術(shù)創(chuàng)新能力評價指標(biāo)。本研究在綜合考慮數(shù)據(jù)的非保密性、時效性及權(quán)威性,根據(jù)指標(biāo)體系中的所要獲取數(shù)據(jù)均來源于《中國統(tǒng)計年鑒》(2012年)《中國科技統(tǒng)計年鑒》2012年)《中國高技術(shù)產(chǎn)業(yè)統(tǒng)計年鑒》(2012年),并選取了全國30個省級區(qū)域在2011年的數(shù)據(jù)。此外,為統(tǒng)計上的方便,對各省進行區(qū)進行編號,如北京為1、遼寧為7等。
根據(jù)表1中指標(biāo)和數(shù)據(jù),本文運用SPSS19.0軟件對我國高技術(shù)產(chǎn)業(yè)各省的創(chuàng)新水平進行判別分析。從而輸出如下表所示。
上述表2反映了判別函數(shù)的特征值、解釋方差的比例和典型相關(guān)系數(shù)。第一判別函數(shù)解釋了62.6的方差,第二判別函數(shù)解釋了37.4方差,兩個判別函數(shù)解釋了全部方差。表3是對兩個判別函數(shù)的顯著性檢驗,由Wilks的Lambda檢驗,認(rèn)為兩個函數(shù)在0.05水平上顯著
上表4是標(biāo)標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù),從而得到標(biāo)準(zhǔn)化的判別式函數(shù)如下:
Y1=-1.204X1+1.069X2+2.459X3+4.868X4+.788X5-5.751X6
Y2=-5.067X1+10.579X2+-.066X3-3.281X4+1.132X5-2.117X6
表1 指標(biāo)及統(tǒng)計數(shù)據(jù)
表2 特征值
表 3 Wilks’Lambda
表4 標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)
此外還得到最終的Fisher的線性判別式函數(shù),如上表所示,于是根據(jù)分類函數(shù)系數(shù)可求出相慶的分類函數(shù):
表5 分類函數(shù)系數(shù)
F1=-14.211+5.379E-5X2-5.119E-5X3-.004X4+12.765X5+7.322E-7X6
F2=-17.403-.001X1+7.339E-5X2+4.004E-5X3+40.3015-2.373E-6X6
F3=-2.973+2.136E-5X2+1.219E-5X3+13.733X5-8.015E-7X6
從而我們得到最終的分類結(jié)果如下表6所示
表6 判別結(jié)果
圖1 聚類圖
從上表可以看出,通過判別函數(shù)的預(yù)測,31個樣本的分類是正確的,其中第1組6個樣本的觀測全部判對,第二組的和第三的樣本全部預(yù)測正確,可以看出本文所構(gòu)造的判別函數(shù)很好地預(yù)測了我國高技術(shù)產(chǎn)業(yè)創(chuàng)新能力分類情況。此外,從分類結(jié)果圖1可以直觀地看到三組分類可以很清晰地分開。同時根據(jù)各省的區(qū)域代碼所對應(yīng)的省區(qū)發(fā)現(xiàn),第一組基上為我國經(jīng)濟發(fā)展水平較高的東部地區(qū),第二組為中部次發(fā)達(dá)地區(qū),第三組為西部發(fā)展中地區(qū),這也我國經(jīng)濟整體的區(qū)域發(fā)展水平是相符的。
通過對我國31個省區(qū)的高技術(shù)產(chǎn)業(yè)創(chuàng)新能力進行判別分析,得到的各省在高技術(shù)產(chǎn)業(yè)創(chuàng)新能力發(fā)展水評分類情況與本地區(qū)的經(jīng)濟發(fā)展水平是比較相符合的,說明判別分析方法可以作為我國產(chǎn)業(yè)創(chuàng)新能力判斷的一種手段。研究結(jié)果對于政府部門及相關(guān)企業(yè)制定各自發(fā)展戰(zhàn)略具有一定的指導(dǎo)意義。
[1]陳 偉,楊早立,周 文,朗益夫.基于突變級數(shù)的知識密集型制造業(yè)技術(shù)創(chuàng)新能力動態(tài)綜合評價——變化速度特征的視角[J].運籌與管理,2015(1):191-201.
[2]陳 偉,楊早立,張永超.網(wǎng)絡(luò)結(jié)構(gòu)與企業(yè)核心能力關(guān)系實證研究:基于知識共享與知識整合中介效應(yīng)視角[J].管理評論,2014(6):74-82.
[3]何曉群.多元統(tǒng)計分析[M].北京:中國人民大學(xué)出版社,2012.
[4]許 強.知識密集型產(chǎn)業(yè)評價和發(fā)展研究[D].上海:復(fù)旦大學(xué),2007:45-47.
[5]Guan,J.C.,Chen,K..Measuring the innovation production process:a cross-region empirical study of China’s high-tech innovations [J].Technovation,2010(30):348-358.
[6]邵云飛,唐小我.中國區(qū)域技術(shù)創(chuàng)新能力的主成份實證研究[J].管理工程學(xué)報,2005(3):71-76.
[7]陳 偉,張永超,馬一博,田世海.高技術(shù)虛擬企業(yè)合作伙伴選擇組合評價研究[J].科技與經(jīng)濟,2011(3):1-5.
[8]張永超.知識密集型制造業(yè)知識產(chǎn)權(quán)管理系統(tǒng)研究[D].哈爾濱:哈爾濱工程大學(xué),2013.