国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于雙成分雙標(biāo)圖方法的學(xué)科學(xué)位點(diǎn)分布差異分析

2017-05-25 00:37張曉琴丁皓
關(guān)鍵詞:標(biāo)圖學(xué)位向量

張曉琴,丁皓

(山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)

基于雙成分雙標(biāo)圖方法的學(xué)科學(xué)位點(diǎn)分布差異分析

張曉琴,丁皓

(山西大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,山西 太原 030006)

針對(duì)研究生學(xué)位點(diǎn)建設(shè)分布不均衡日益凸顯的問題,應(yīng)用一種有效可視化分析方法——雙標(biāo)圖,分析學(xué)位點(diǎn)分布差異情況。在此基礎(chǔ)上,考慮到學(xué)位點(diǎn)分布數(shù)據(jù)集的特殊性,應(yīng)用雙成分雙標(biāo)圖分析方法對(duì)各學(xué)科間的分布差異進(jìn)行分析,并驗(yàn)證了其有效性和合理性。

研究生學(xué)位點(diǎn);分布差異;雙標(biāo)圖;雙成分;可視化

0 引言

自1980年2月我國(guó)開始建立學(xué)位制度,36年來,中國(guó)學(xué)位點(diǎn)建設(shè)與研究生教育快速發(fā)展,取得了長(zhǎng)足的進(jìn)步。而高等教育學(xué)位點(diǎn)分布以及學(xué)科建設(shè)成為學(xué)術(shù)界的熱點(diǎn)話題,受到廣大學(xué)者的關(guān)注。

在對(duì)中國(guó)學(xué)位與研究生教育的發(fā)展提出了很多建設(shè)性思路的同時(shí),許多研究也揭示了其發(fā)展中的一些欠完善之處。駱?biāo)你慬1]從學(xué)位等級(jí)、學(xué)位類型、學(xué)位點(diǎn)分布以及學(xué)位數(shù)量比例四個(gè)方面分析了我國(guó)前八批學(xué)位點(diǎn)結(jié)構(gòu)失衡的現(xiàn)象,但未指出學(xué)位點(diǎn)分布具體差異情況。于曉敏[2]等通過對(duì)2005-2011年間全國(guó)31個(gè)省市博士點(diǎn)數(shù)量的建模,發(fā)現(xiàn)博士點(diǎn)的發(fā)展存在明顯的差異性。此外,羅云[3]和車如山[4]等分別指出了全國(guó)教育學(xué)學(xué)位點(diǎn)分布的不均衡性。李燕領(lǐng)[5]等對(duì)截至2009年全國(guó)體育學(xué)研究生學(xué)位點(diǎn)的比較也指出體育學(xué)4個(gè)二級(jí)學(xué)科發(fā)展不平衡以及研究生培養(yǎng)單位地域分布不均衡的問題。我國(guó)在對(duì)學(xué)位授權(quán)審核工作中,強(qiáng)調(diào)要發(fā)展學(xué)位授權(quán)體系,優(yōu)化結(jié)構(gòu),不斷探索和改革,完善中國(guó)特色的學(xué)位授權(quán)體制[6]。

武漢大學(xué)中國(guó)科學(xué)評(píng)價(jià)研究中心每年都會(huì)對(duì)中國(guó)研究生教育及學(xué)科專業(yè)進(jìn)行評(píng)價(jià)和分析,根據(jù)2015年的評(píng)價(jià)分析報(bào)告結(jié)果,我國(guó)現(xiàn)階段的研究生教育資源配置依然存在很大的不平衡,區(qū)域間存在較大的教育差異[7]。而針對(duì)高等教育學(xué)位點(diǎn)分布以及學(xué)科建設(shè)的問題,采用傳統(tǒng)的數(shù)據(jù)分析方法來研究各學(xué)科學(xué)位點(diǎn)在各地區(qū)分布差異,需要處理大量的數(shù)據(jù)而且往往僅可以分析其中一部分的信息。

雙標(biāo)圖是一種可視化數(shù)據(jù)處理方法,可以將兩向數(shù)據(jù)集轉(zhuǎn)化在平面圖形中,進(jìn)而進(jìn)行直觀分析。雙標(biāo)圖在統(tǒng)計(jì)學(xué)的研究領(lǐng)域中是一種重要的分析工具。目前,雙標(biāo)圖分析方法已經(jīng)在對(duì)小麥、大豆等農(nóng)作物的多點(diǎn)試驗(yàn)育種問題上廣泛應(yīng)用。除此之外,雙標(biāo)圖方法還被應(yīng)用于生物學(xué)、環(huán)境學(xué)與經(jīng)濟(jì)學(xué)等領(lǐng)域當(dāng)中。

本文將引入雙標(biāo)圖分析方法,對(duì)學(xué)位點(diǎn)與地區(qū)構(gòu)成的數(shù)據(jù)集進(jìn)行可視化圖形描述,從而可以在圖形中直觀分析各學(xué)科學(xué)位點(diǎn)分布存在的問題。

1 雙標(biāo)圖分析方法

雙標(biāo)圖[8]最早是由Gabriel在1971年提出,該方法將數(shù)據(jù)矩陣轉(zhuǎn)化為可視化圖形,數(shù)據(jù)集中的每一個(gè)數(shù)據(jù)屬性都可以在圖形中找到對(duì)應(yīng),在圖形中更加簡(jiǎn)單有效地解釋數(shù)據(jù)的屬性以及其內(nèi)在聯(lián)系。1996年Gower和Hand在Gabriel提出的雙標(biāo)圖基礎(chǔ)上加入新的見解[9],將數(shù)據(jù)分析方法與雙標(biāo)圖方法結(jié)合,從而提出多種類型的雙標(biāo)圖。Aitchison對(duì)雙標(biāo)圖進(jìn)行大量研究分析,將其應(yīng)用于有條件限制的成分?jǐn)?shù)據(jù)上,在2005年對(duì)成分?jǐn)?shù)據(jù)雙標(biāo)圖的理論進(jìn)行具體闡述,并提出了雙成分雙標(biāo)圖[10]的思想。在國(guó)內(nèi),嚴(yán)威凱[11]最早引入雙標(biāo)圖,并在用雙標(biāo)圖分析農(nóng)作物品種多點(diǎn)試驗(yàn)中,就如何選擇適當(dāng)?shù)碾p標(biāo)圖、如何正確使用雙標(biāo)圖的不同功能以及如何判斷分析雙標(biāo)圖的顯示結(jié)果等問題進(jìn)行了系統(tǒng)的闡述。最新的雙標(biāo)圖方法被應(yīng)用在杧果特殊基因的選擇[12]及產(chǎn)油量與種子產(chǎn)量之間的關(guān)系分析[13]。雙標(biāo)圖發(fā)展至今,已經(jīng)成為一種被廣大學(xué)者所接受的有效可視化數(shù)據(jù)處理方法。

本節(jié)將對(duì)雙標(biāo)圖的理論知識(shí)和雙成分雙標(biāo)圖分析法作簡(jiǎn)單介紹。

1.1 雙標(biāo)圖的理論基礎(chǔ)

假設(shè)含有n個(gè)觀測(cè)樣本,p個(gè)指標(biāo)變量的原始數(shù)據(jù)陣可用矩陣Xn×p表示,雙標(biāo)圖方法就是找到一個(gè)r維子空間,使得n個(gè)觀測(cè)值與p個(gè)指標(biāo)變量映射到r維空間時(shí)近似殘差平方和最小,使得原始數(shù)據(jù)集Xn×p可以由降維后的Zn×p與特征向量來近似代替。具體分析如下:

首先對(duì)原始數(shù)據(jù)矩陣Xn×p進(jìn)行中心化處理,得到消除量綱后的數(shù)據(jù)矩陣Zn×p,且

.

矩陣Zn×p的秩為r,對(duì)矩陣Zn×p進(jìn)行奇異值分解:

Z=USVT.

其中,U是n×r的左奇異值矩陣,V是p×r的右奇異值矩陣,S=diag(s1,s2,…,sr)。奇異值矩陣S中,其對(duì)角元素為奇異值且滿足:s1≥s2≥…≥sr。

令Z=FGT,其中F=USα,G=VS1-α,α∈[0,1].F是n×r的矩陣,其內(nèi)存儲(chǔ)的行信息,用n個(gè)點(diǎn)表示;G是p×r的矩陣,其內(nèi)存儲(chǔ)的列信息,用p個(gè)向量表示,原點(diǎn)O是p個(gè)向量的中心。這樣得到由原點(diǎn)、樣本點(diǎn)及向量構(gòu)成的雙標(biāo)圖(如圖1所示),該圖中包含了單個(gè)數(shù)據(jù)集的所有信息:

Fig.1 Interpretation of elements in a two-dimensional biplot圖1 二維平面中雙標(biāo)圖基本構(gòu)成元素

1) 雙標(biāo)圖中的點(diǎn),近似表示了矩陣Z中的行(樣本)信息。

2) 雙標(biāo)圖中的向量,近似表示矩陣Z中列(屬性)信息。

3) 點(diǎn)之間的距離,反映它們對(duì)應(yīng)的樣本之間的差異大小,兩點(diǎn)相距較遠(yuǎn),對(duì)應(yīng)樣本差異大;兩點(diǎn)相距較近,對(duì)應(yīng)樣本差異小,存在相似性。

4) 兩個(gè)向量間的夾角余弦值cosθ,反映對(duì)應(yīng)的兩個(gè)列(屬性)間的相關(guān)性。夾角余弦值為正時(shí),兩個(gè)向量正相關(guān),表明在原始數(shù)據(jù)中兩個(gè)屬性互相促進(jìn);夾角余弦值為負(fù)時(shí),向量負(fù)相關(guān),對(duì)應(yīng)的兩個(gè)屬性互相抵制。余弦值的絕對(duì)值大小反映兩向量間的相關(guān)性大小,值越大表明兩個(gè)向量對(duì)應(yīng)的屬性之間相關(guān)性越高。當(dāng)兩個(gè)向量近似垂直時(shí),兩個(gè)屬性之間相關(guān)性很弱,幾乎互不影響。

根據(jù)以上原理,分析圖上點(diǎn)、向量以及它們之間的相互關(guān)系,可以直觀分析數(shù)據(jù)集中包含的樣本、列屬性信息,進(jìn)而對(duì)樣本間的相互關(guān)系、樣本與列屬性的關(guān)系以及列屬性間的相互關(guān)系進(jìn)行研究。

在構(gòu)建雙標(biāo)圖的過程當(dāng)中,要選取適當(dāng)?shù)谋壤?將每個(gè)奇異值分配到相應(yīng)的行奇異值向量和列奇異值向量之間。根據(jù)n×p取值的不同,可以得到不同種類的雙標(biāo)圖,α通常取0、0.5、1,進(jìn)而得到三類不同研究目標(biāo)的雙標(biāo)圖:

α=0時(shí),將奇異值全部分配到列奇異值上,稱為協(xié)變量雙標(biāo)圖,主要用于分析列屬性信息以及列屬性間的關(guān)系;

α=1時(shí),將奇異值全部分配到行奇異值上,稱為結(jié)構(gòu)性雙標(biāo)圖,主要用于分析樣本間信息;

α=1.5時(shí),將奇異值均衡的分配到行、列奇異值上,稱為對(duì)稱雙標(biāo)圖,該雙標(biāo)圖反映行樣本以及列屬性間的關(guān)系,用于綜合研究分析當(dāng)中。

1.2 雙成分雙標(biāo)圖

雙成分雙標(biāo)圖是在含有兩個(gè)條件限制的數(shù)據(jù)集下構(gòu)建的雙標(biāo)圖。對(duì)同一組分析樣本在兩個(gè)成分下,分別有數(shù)據(jù)矩陣X1、X2,其中X1是n×p的矩陣,含有p列,表示第一成分下的數(shù)據(jù)矩陣;X2是n×p的矩陣,含有q列,表示第二成分下的數(shù)據(jù)矩陣。建立雙成分雙標(biāo)圖時(shí),同單成分下構(gòu)建雙標(biāo)圖相同,首先對(duì)X1、X2進(jìn)行中心化處理,得到消除量綱后的數(shù)據(jù)矩陣Z1、Z2。

其中,U是n×r矩陣,S是r×r的矩陣,V是(p+q)×r矩陣,V1、V2分別包含有對(duì)應(yīng)數(shù)據(jù)集的列屬性。

由F*=USα包含行信息,將矩陣F*中每行數(shù)據(jù)作為坐標(biāo)值繪制點(diǎn),繪制樣本點(diǎn)。在圖形中表現(xiàn)為n個(gè)點(diǎn),與原始數(shù)據(jù)集的n行觀測(cè)樣本一一對(duì)應(yīng)。理論上雙標(biāo)圖可以是r維圖形,實(shí)際分析中一般只在二維中直觀分析。即r=2,取

.

繪制二維平面上的樣本點(diǎn)。

在平面中與原點(diǎn)構(gòu)成向量。

通過上述方法步驟,繪制出兩個(gè)成分下的雙成分雙標(biāo)圖,圖中同樣包含原點(diǎn)、樣本點(diǎn)及不同成分下的向量。為圖中添加一些輔助線,例如向量間連線、點(diǎn)在向量上的投影等,而更利于在圖形上進(jìn)行分析研究。

2 用雙成分雙標(biāo)圖分析法處理學(xué)科分布差異

在學(xué)科學(xué)位點(diǎn)分布差異的研究中,由學(xué)科-區(qū)域構(gòu)成了一個(gè)兩向數(shù)據(jù)表。選取2011年學(xué)位授權(quán)門類的分布情況數(shù)據(jù),應(yīng)用雙標(biāo)圖分析法研究學(xué)科學(xué)位點(diǎn)在不同區(qū)域的分布差異。

表1是全國(guó)12個(gè)學(xué)科分別在兩個(gè)不同劃分條件下的學(xué)位授權(quán)點(diǎn)分布數(shù)據(jù),取X1為各學(xué)科在一區(qū)、二區(qū)劃下的學(xué)位授權(quán)點(diǎn)分布數(shù)據(jù),X2為個(gè)學(xué)科在東部、中部、西部劃分下的學(xué)位授權(quán)點(diǎn)分布數(shù)據(jù)。

對(duì)X1、X2中心化,得到中心化矩陣Z1、Z2以及Z*,其結(jié)果見表2。

表1 2011年學(xué)科學(xué)位授權(quán)點(diǎn)的區(qū)域分布情況(個(gè))

表2 各學(xué)科在一區(qū)、二區(qū)及東部、中部、西部下的數(shù)據(jù)中心化結(jié)果

為了綜合研究各學(xué)科在不同區(qū)域的分布情況以及不同區(qū)域之間的相互影響關(guān)系,選取α=0.5,根據(jù)2.2節(jié)雙成分雙標(biāo)圖的構(gòu)建方法,得到各學(xué)科在不同區(qū)域劃分下的雙成分雙標(biāo)圖,其圖示結(jié)果為圖2。

Fig.2 Bicomponents biplot of the degrees’distribution圖2 2011年各學(xué)科區(qū)域分布的雙成分雙標(biāo)圖

一、樣本點(diǎn)2和5分別對(duì)應(yīng)于經(jīng)濟(jì)學(xué)和文學(xué),分布相近,存在的差異較小。分布差異最大的為樣本點(diǎn)9與11,對(duì)應(yīng)到農(nóng)學(xué)與管理學(xué)在實(shí)際各分布中存在差異較大。同樣與管理學(xué)相比較,法學(xué)(樣本點(diǎn)3)在各區(qū)域的分布差異相比較小。

3 結(jié)論

通過以上分析結(jié)果可以驗(yàn)證,在實(shí)際分析一區(qū)、二區(qū)以及東部、中部、西部劃分下,雙成分雙標(biāo)圖分析方法是可行的。應(yīng)用雙標(biāo)圖方法分析教育學(xué)位點(diǎn)分布差異,最大的優(yōu)點(diǎn)是將傳統(tǒng)數(shù)據(jù)可視化,簡(jiǎn)單直觀的在圖形中反映不同學(xué)科之間分布的差異大小,以及各學(xué)科在不同劃分區(qū)域中的分布大小關(guān)系。本文重點(diǎn)在方法的引述,僅分析了一年的學(xué)科分布情況,可以進(jìn)一步研究不同年份下的分布數(shù)據(jù),進(jìn)而分析我國(guó)教育體系的發(fā)展情況。

[1] 駱?biāo)你?我國(guó)學(xué)位結(jié)構(gòu)失衡淺析[J].現(xiàn)代大學(xué)教育,2005,1:83-86.DOI:10.3969/j.issn.1671-1610.2005. 01.019.

[2] 于曉敏,吳旸,樊文強(qiáng),等.博士學(xué)位點(diǎn)區(qū)域發(fā)展差異與趨勢(shì)研究——基于2005年至2011年追蹤數(shù)據(jù)的實(shí)證分析[J].國(guó)家行政學(xué)院學(xué)報(bào),2013,6: 73-77.DOI:10.3969/j.issn.1672-4038.2013.06.015.

[3] 羅云,裴懷濤.論我國(guó)高等教育學(xué)學(xué)位點(diǎn)布局的不均衡性[J].中國(guó)高教研究,2007,11: 48-50.DOI:10.3969/j.issn.1004-3667.2007.11.013.

[4] 車如山,劉文霞.論我國(guó)高等教育學(xué)學(xué)位點(diǎn)布局的不均衡性[J].國(guó)家教育行政學(xué)院學(xué)報(bào),2009,3: 44-46.DOI:10.3969/j.issn.1672-4038.2009.03.009.

[5] 李燕領(lǐng),王家宏,陶玉流.1979~2009年中國(guó)體育學(xué)研究生學(xué)位點(diǎn)的發(fā)展[J].體育學(xué)刊,2010,17(10): 59-63.DOI:10.3969/j.issn.1006-7116.2010.10.013.

[6] 宋曉平,梅紅.我國(guó)學(xué)位授權(quán)審核的歷程與動(dòng)因分析[J].高等教育研究,2009(8):72-78.

[7] 邱均平,柴雯,馬力.2015年中國(guó)研究生教育及學(xué)科專業(yè)評(píng)價(jià)報(bào)告的產(chǎn)生與分析[J].評(píng)價(jià)與管理,2015(2):21-34.

[8]GabrielKR.TheBiplotGraphicalDisplayofMatriceswithApplicationtoPrincipalComponentAnalysis[J].Biometrika,1971,58:453-467.DOI:10.1093/biomet/58.3.453.

[9]GowerJC,HandDJ.Biplot[M].USA,London:Chapman&Hall,1996.

[10]AitchisonJ,NgKW.ConditionalCompositionalBiplots:TheoryandApplication[J].Recercat Principal,2005: 6-8.

[11] 嚴(yán)威凱.雙標(biāo)圖分析在農(nóng)作物品種多點(diǎn)試驗(yàn)中的應(yīng)用[J].作物學(xué)報(bào),2010,36(11):1805-1819.DOI:10.3724/SP.J.1006.2010.01805.

[12]MaiaMCC,AraújoLBD,DiasCTDS,et al.SelectionofMangoRosaGenotypesinaBreedingPopulationusingtheMultivariate-biplotMethod[J].Ciencia Rural,2016,46(10):1689-1694.DOI:10.1590/0103-8478cr20130722.

[13]GhaniG,Raziuddin,KhalilIA,et al.BiplotAnalysisofSeedYieldandOilContentCombiningAbilityinRapeseed(BrassicanapusL.)[J].Australian Journal of Crop Science,2016,10(9):1238-1243.DOI:10.21475/ajcs.2016.10.09.p7214.

Analysis of Differences in Graduate Degree Distribution Based on Bicomponents Biplot Method

ZHANG Xiaoqin,DING Hao

(School of Mathematical Sciences, Shanxi University,Taiyuan 030006,China)

For the imbalance problem of the graduate degree distribution, a visible analysis method, biplot method, is applied to analyze the difference of graduate degree distribution. On this basis, considering the particularity of the graduate degree data set, the bicomponents biplot analysis method is used to analyze the distribution differences among various subjects, and its validity and rationality are verified.

the graduate degree; imbalance distribution; biplot; bicomponents; visibility

10.13451/j.cnki.shanxi.univ(nat.sci.).2017.02.006

2016-07-28;

2016-11-29

國(guó)家自然科學(xué)基金(61573229);山西省國(guó)際科技合作項(xiàng)目(2015081020);山西省自然科學(xué)基金(2015011044)

張曉琴(1975-),女,山西長(zhǎng)治人,副教授.主要研究方向:數(shù)據(jù)挖掘,統(tǒng)計(jì)機(jī)器學(xué)習(xí),E-mail:zhangxiaoqin@sxu.edu.cn

O213.9

A

0253-2395(2017)02-0229-05

猜你喜歡
標(biāo)圖學(xué)位向量
向量的分解
重磅!廣東省“三舊”改造標(biāo)圖入庫(kù)標(biāo)準(zhǔn)正式發(fā)布!
教育部就學(xué)位法草案公開征求意見
聚焦“向量與三角”創(chuàng)新題
從技能生成規(guī)律入手優(yōu)化作戰(zhàn)標(biāo)圖技能訓(xùn)練方法
『博士后』是一種學(xué)位嗎?
英國(guó)大學(xué)本科一等學(xué)位含金量遭質(zhì)疑
向量垂直在解析幾何中的應(yīng)用
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
國(guó)內(nèi)ERP研究現(xiàn)狀——基于學(xué)位論文的統(tǒng)計(jì)分析