潘玉榮, 賈朝勇
(蚌埠學(xué)院數(shù)理系,安徽 蚌埠 233000)
我國(guó)普通高等院校肩負(fù)著人才培養(yǎng)、科學(xué)研究、社會(huì)服務(wù)三大任務(wù),科學(xué)研究常常圍繞人才培養(yǎng)、教學(xué)的相關(guān)問(wèn)題展開(kāi),可以促進(jìn)教學(xué)的深入和提高,教學(xué)又為高校的教師和學(xué)生參與科學(xué)研究活動(dòng)提供了可能,而搞好科學(xué)研究可以使高校更好的為社會(huì)服務(wù).科學(xué)研究成果是衡量高校總體實(shí)力的一個(gè)重要指標(biāo),科研的狀況也直接影響高校的排名,因此,找出影響高等院校的科研狀況的關(guān)鍵因素,正確合理評(píng)價(jià)各地區(qū)高等院校的科學(xué)研究的整體狀況是很必要的.描述科研狀況變量很多,比如投入科研活動(dòng)的人年數(shù)、投入高級(jí)職稱(chēng)人年數(shù)、投入科研事業(yè)費(fèi)、課題總數(shù)、專(zhuān)著數(shù)、論文數(shù)、獲獎(jiǎng)數(shù)等,但并非收集的變量越多對(duì)問(wèn)題分析越有利,因變量間信息的高度重疊和高度相關(guān)反而會(huì)給統(tǒng)計(jì)方法的應(yīng)用帶來(lái)許多障礙,甚至使分析結(jié)果不準(zhǔn)確.針對(duì)此問(wèn)題,選用1999年我國(guó)31個(gè)省市自治區(qū)部分高校有關(guān)人文社會(huì)科研究方面的數(shù)據(jù)為樣本資料,借助SPSS軟件,運(yùn)用多元分析方法中的因子分析方法[1~2],從眾多變量中提取影響高??蒲袪顩r的主要因子,并借鑒國(guó)內(nèi)一些學(xué)者的研究成果[3~6],對(duì)各地區(qū)高校科研狀況進(jìn)行科學(xué)合理地評(píng)價(jià).最后通過(guò)因子變量的聚類(lèi)分析對(duì)評(píng)價(jià)結(jié)果進(jìn)行驗(yàn)證.
因子分析主要利用數(shù)學(xué)上的變量降維思想,將實(shí)際問(wèn)題中的多個(gè)指標(biāo)設(shè)法重新組合成一組新的少數(shù)幾個(gè)綜合指標(biāo)來(lái)代替原來(lái)指標(biāo)的一種多元統(tǒng)計(jì)方法.通常把轉(zhuǎn)化生成的綜合指標(biāo)稱(chēng)為因子,其中每個(gè)因子都是原始變量的線(xiàn)性組合,且各個(gè)因子之間互不相關(guān),還要盡可能多的反映原來(lái)指標(biāo)的信息.因子分析的基本步驟為:(1)因子分析前提條件的驗(yàn)證,因子分析前提條件要求原始變量之間應(yīng)存在較強(qiáng)的相關(guān)關(guān)系,這樣才能進(jìn)行因子的提取;(2)因子的提取,因子提取個(gè)數(shù)確定是很重要,因子要反應(yīng)原有變量的絕大部分信息;(3)使因子具有命名可解釋性,提取的因子被確定后,還需根據(jù)因子的旋轉(zhuǎn)獲得命名可解釋性;(4)計(jì)算各樣本的因子得分,根據(jù)因子得分系數(shù)矩陣計(jì)算樣本數(shù)據(jù)的因子得分,從而獲得因子變量.其中,因子的提取是很關(guān)鍵的步驟,常用的提取方法是主成分分析法.
本文選用的數(shù)據(jù)是1999年我國(guó)31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),數(shù)據(jù)主要來(lái)源于薛薇《SPSS統(tǒng)計(jì)分析方法及應(yīng)用》,數(shù)據(jù)中7個(gè)指標(biāo)變量是對(duì)高??蒲袪顩r較全面的描述,其中X1—省市名稱(chēng),X2—投入人年數(shù),X3—投入高級(jí)職稱(chēng)人年數(shù),X4—投入科研事業(yè)費(fèi)(百元),X5—課題總數(shù),X6—專(zhuān)著數(shù),X7—論文數(shù),X8—獲獎(jiǎng)數(shù).
根據(jù)SPSS軟件對(duì)上述的7個(gè)指標(biāo)變量的相關(guān)性進(jìn)行分析,從變量的相關(guān)系數(shù)矩陣(見(jiàn)表1)發(fā)現(xiàn)相關(guān)系數(shù)大部分多大于0.6,說(shuō)明各變量呈較強(qiáng)的線(xiàn)性關(guān)系,能夠從中提取公共因子.另外從表2中,發(fā)現(xiàn)KMO統(tǒng)計(jì)量值是0.846,也說(shuō)明這些變量相關(guān)性很強(qiáng),適合作因子分析,Bartlett's球度檢驗(yàn)的實(shí)測(cè)概率為0小于顯著水平0.05,應(yīng)拒絕原假設(shè),進(jìn)一步說(shuō)明這7個(gè)指標(biāo)變量相關(guān)性強(qiáng),適合作因子分析.
表1 變量的相關(guān)系數(shù)矩陣表
表2 Bartlett's球度檢驗(yàn)和KMO檢驗(yàn)
由于描述各地區(qū)高等院校社會(huì)科研狀況的7個(gè)指標(biāo)變量相關(guān)性較強(qiáng),適合作因子分析,現(xiàn)應(yīng)用主成分分析法來(lái)進(jìn)行因子的提取和因子個(gè)數(shù)的確定,從表3的因子方差累計(jì)貢獻(xiàn)率發(fā)現(xiàn)第一個(gè)因子的特征根為5.994,解釋原有7個(gè)變量總方差的85.631%,而當(dāng)提取兩個(gè)因子時(shí),對(duì)原變量的方差解釋能力達(dá)到94.889%,遠(yuǎn)遠(yuǎn)大于85%的要求,故取前面兩個(gè)因子基本包含了全部測(cè)評(píng)指標(biāo)所具有絕大部分的信息,因子分析效果較理想.
表3 因子解釋原有變量總方差的情況
表4 旋轉(zhuǎn)后的因子載荷矩陣
投入人年數(shù) 0.840 0.512課題總數(shù) 0.826 0.490論文數(shù) 0.743 0.616獲獎(jiǎng)數(shù)0.258 0.949
為了給這兩個(gè)因子命名,這里采用方差最大法對(duì)因子載荷矩陣實(shí)施正交旋轉(zhuǎn)以使因子具有命名解釋性.現(xiàn)指定按第一因子載荷降序的順序輸出旋轉(zhuǎn)后的因子載荷以及旋轉(zhuǎn)后的因子載荷圖即表4,從表中可以得知科研人力投入(投入科研事業(yè)費(fèi))、經(jīng)費(fèi)投入(投入高級(jí)職稱(chēng)的人年數(shù)、投入人年數(shù))等變量在第一個(gè)因子上有較高的載荷,說(shuō)明第一個(gè)因子主要解釋這幾個(gè)變量,可解釋為科研投入因子;而發(fā)表論文數(shù)、獲獎(jiǎng)數(shù)等變量在第二個(gè)因子有較高的載荷,說(shuō)明第二個(gè)因子主要解釋這幾個(gè)變量,可解釋為科研產(chǎn)出因子,即原有7個(gè)相關(guān)變量綜合成科研投入、科研產(chǎn)出兩個(gè)因子.
這里采用回歸法估計(jì)因子得分系數(shù),并輸出因子得分系數(shù)矩陣見(jiàn)表5.
表5 因子得分系數(shù)矩陣
根據(jù)表5可寫(xiě)出以下因子得分函數(shù):
F1=0.143投入人年數(shù) +0.18投入高級(jí)職稱(chēng)的人年數(shù)+0.382投入科研事業(yè)費(fèi) +0.149課題總數(shù)+0.357專(zhuān)著數(shù) +0.026論文數(shù) -0.442獲獎(jiǎng)數(shù)(1)F2=0.08投入人年數(shù) +0.022投入高級(jí)職稱(chēng)的人年數(shù)-0.332投入科研事業(yè)費(fèi) +0.063課題總數(shù)-0.283專(zhuān)著數(shù) +0.261論文數(shù) +0.946獲獎(jiǎng)數(shù)(2)
通過(guò)上述公式(1)和公式(2)可以得到每個(gè)地區(qū)的因子得分,從而獲得兩個(gè)因子變量,由于這兩個(gè)因子變量是線(xiàn)性無(wú)關(guān),因此,可以利用它們對(duì)各地區(qū)的高等院校的科研狀況作統(tǒng)計(jì)分析.
下面利用兩個(gè)因子變量對(duì)各地區(qū)1999年高等院??蒲袪顩r進(jìn)行多元統(tǒng)計(jì)分析,并對(duì)各地區(qū)高等院??蒲袪顩r進(jìn)行評(píng)價(jià).
首先,畫(huà)出兩因子變量的散點(diǎn)圖對(duì)各地區(qū)高等院校科研狀況進(jìn)行對(duì)比分析.以第一因子變量科研投入因子為橫坐標(biāo),以第二因子變量科研產(chǎn)出因子為縱坐標(biāo)作出散點(diǎn)圖如圖1.觀察圖1可看到北京的第一因子很高,表明科研投入很大,遠(yuǎn)遠(yuǎn)高于其他地區(qū).廣東、湖北兩個(gè)因子都高于其它地區(qū),說(shuō)明這兩個(gè)地區(qū)的高??蒲型度牒彤a(chǎn)出都較高.江蘇、山東、湖南、浙江和遼寧的第一因子與其他地區(qū)相差不大,但第二因子卻較大,說(shuō)明這些地區(qū)的高校科研產(chǎn)出較高.其他地區(qū)的科研投入和科研產(chǎn)出都相差不大.
圖1 各地區(qū)兩因子得分變量的散點(diǎn)圖
其次,對(duì)各地區(qū)的1999年高等院校科研狀況進(jìn)行綜合評(píng)價(jià).這里采用加權(quán)總分的方法,其中權(quán)重就取兩個(gè)因子的方差貢獻(xiàn)率為權(quán)數(shù),計(jì)算公式為F=0.856F1+0.9258F2,綜合得分較高的省市有北京、江蘇、山東、湖北、廣東、湖南、上海、遼寧、浙江等,這些地區(qū)大多是我國(guó)的中東地區(qū),高校相對(duì)較聚集.而綜合得分較低為西藏、青海、寧夏、貴州等,多為西南部邊遠(yuǎn)地區(qū),這些地方的高校數(shù)量較少.這個(gè)結(jié)果與散點(diǎn)圖分析的情況有很相似的地方.
最后,利用中心聚類(lèi)對(duì)各地區(qū)的高等院??蒲袪顩r進(jìn)行聚類(lèi)分析,即利用兩因子變量對(duì)31地區(qū)進(jìn)行快速聚類(lèi),分成3類(lèi)的結(jié)果如表6所示.北京獨(dú)自成一類(lèi),遼寧、江蘇、浙江、山東和湖南成一類(lèi),余下的地區(qū)成一類(lèi),這個(gè)結(jié)果與散點(diǎn)圖分析、綜合評(píng)價(jià)分析的情況基本類(lèi)似.
表6 聚類(lèi)結(jié)果
綜上,從上述評(píng)價(jià)分析發(fā)現(xiàn),各地區(qū)高校的科研狀況總的來(lái)說(shuō)具有不均衡性,究其原因相當(dāng)復(fù)雜,中東地區(qū)因?yàn)榈乩砦恢煤徒?jīng)濟(jì)原因高校數(shù)量較多,投入科研的人力、物力、財(cái)力較多、以至科研投入和科研產(chǎn)出的總量相對(duì)高些,而西南部地區(qū)相對(duì)低些.
本文針對(duì)資料數(shù)據(jù)對(duì)各地區(qū)高校社科研狀況進(jìn)行綜合評(píng)價(jià)分析.此分析思路即當(dāng)要研究的問(wèn)題涉及得變量很多,而且變量間的相關(guān)性較強(qiáng)時(shí),可以采用因子分析法進(jìn)行因子提取,利用因子變量進(jìn)行事物的評(píng)價(jià)分析,有利于得到預(yù)期的分析效果.另外,就本案例而言,通過(guò)研究發(fā)現(xiàn),因地理位置、經(jīng)濟(jì)狀況等原因,我國(guó)各地區(qū)高等院校社科研狀況總體而言具有不均衡性,所以要改善這種狀況,建議國(guó)家增加對(duì)西南部邊遠(yuǎn)地區(qū)教育及科研的人力、財(cái)力投入.
[1]薛薇.SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].第二版.北京:電子工業(yè)出版社,2006:303 -349.
[2]張文彤.SPSS11統(tǒng)計(jì)分析教程—高級(jí)篇[M].北京:北京希望電子出版社,2002:166-210.
[3]閻慈琳.關(guān)于主成分分析做綜合評(píng)價(jià)的若干問(wèn)題[J].數(shù)理統(tǒng)計(jì)與管理,1998(2):22-24.
[4]宋之杰,高曉紅.一種多指標(biāo)綜合評(píng)價(jià)中確定指標(biāo)權(quán)重的方法[J].燕山大學(xué)學(xué)報(bào),2002,1(26):20 -22.
[5]齊維毅,黃鳳娟.因子分析在對(duì)學(xué)生考試成績(jī)進(jìn)行綜合評(píng)價(jià)中的應(yīng)用[J].沈陽(yáng)體育學(xué)院學(xué)報(bào).2000,1:55 -59.
[6]胡振華,袁靜.因子分析在企業(yè)綜合經(jīng)濟(jì)效益評(píng)價(jià)中的應(yīng)用[J].中南工業(yè)大學(xué)學(xué)報(bào),2001,37:214 -217.