【摘 要】隨著科技的發(fā)展,越來越多的人渴望得到更高的學(xué)位,同時也對高校招生人數(shù)的確定是否具有科學(xué)性產(chǎn)生了一定的疑惑,本文通過收集整理數(shù)據(jù),選取對研究生招生人數(shù)造成影響的因素,利用R進(jìn)行多元回歸分析,求出回歸方程,進(jìn)行統(tǒng)計檢驗(包括回歸方程的顯著性檢驗,回歸系數(shù)的顯著性檢驗)以及殘差的檢驗,然后進(jìn)行估計和預(yù)測。最終得到最優(yōu)的回歸方程。以此對高校招生計劃的制定給予參考。
【關(guān)鍵詞】R軟件;研究生招生人數(shù);回歸分析;優(yōu)化
【中圖分類號】G642? 【文獻(xiàn)標(biāo)識碼】A? 【文章編號】1671-8437(2019)22-0008-02
1? ?引言
隨著科學(xué)發(fā)展觀的推動,為滿足全國人民對高等教育的渴望,我國高等教育實現(xiàn)了跨越式發(fā)展。越來越多的畢業(yè)生甚至是已經(jīng)從業(yè)的人選擇繼續(xù)深造來增加自己在就業(yè)市場中的被選擇機會。近幾年研究生的報考人數(shù)更是急劇增長,相應(yīng)地很多高校亦是響應(yīng)國家需要而實行擴招,但是高校教育資源有限,所以合理科學(xué)的預(yù)測招生人數(shù),不僅可以為高校招生計劃的制定給予一定的參考,還可以逐步實現(xiàn)按市場經(jīng)濟規(guī)律合理配置和優(yōu)化教育資源。
2? ?模型的設(shè)定及檢驗
2.1? 數(shù)據(jù)來源及指標(biāo)設(shè)計
所有的數(shù)據(jù)均來自中國統(tǒng)計年鑒1997-2017年的數(shù)據(jù),選取高校研究生招生人數(shù)(Y)為因變量,然后在社會現(xiàn)狀和許多學(xué)者的討論選取GDP()、高校數(shù)量
()、高校教師數(shù)量()、國家財政性教育經(jīng)費
()、農(nóng)村居民家庭人均純收入()、城鎮(zhèn)居民家庭人均可支配收入()六個指標(biāo)能夠影響招生人數(shù)的確定。我們不排除其他有價值變量存在的可能性。
2.2? 估計模型及分析
利用函數(shù)m( )對Y、、、、、
、做回歸分析,得到全回歸方程:,由于自變量和因變量都是有單位的,不能由偏回歸系數(shù)的大小直接說明對因變量線性影響的大小,故需要先將變量標(biāo)準(zhǔn)化后計算標(biāo)準(zhǔn)化偏回歸系數(shù)以解釋因變量對自變量的
影響[1-2]。通過R軟件得到模型的多重測定系數(shù)R2=0.987值很接近1,多重測定系數(shù)的結(jié)果表明約有98.7%的招生人數(shù)變化可以用模型解釋,所以其模型擬合度較好[3]。
由F檢驗結(jié)果可得,模型的F值為157,P<0.0001,故模型有意義。由t檢驗結(jié)果可見(見表1),回歸系數(shù)只有x4的P值=0.09<0.1,其它變量均不顯著,且國家財政性教育經(jīng)費和農(nóng)村居民家庭人均純收入所對應(yīng)的偏回歸系數(shù)都為負(fù),這與理論現(xiàn)實是不相符的[4]。出現(xiàn)這種結(jié)果的原因可能是這些解釋變量之間存在高度的共線性。由R軟件中函數(shù)vif( )得到各個變量的都遠(yuǎn)遠(yuǎn)超過10,說明各變量間存在多重共線性。
2.3? 模型的優(yōu)化
R軟件中用函數(shù)step()對模型進(jìn)行逐步回歸選擇AIC最小的最佳模型,得到的回歸方程為:。
2.4? 殘差檢驗
用R軟件中t.test()函數(shù)對模型的殘差值進(jìn)行零均值檢驗,P=1,由此可知均值為0,用qqplot()繪圖檢驗殘差正態(tài)性,由圖可知,所有的點基本都分布在直線周圍并且均落在置信區(qū)間內(nèi),故殘差服從正態(tài)分布。用函數(shù)durbinWatsonTest()做Durbin-Watson檢驗。DW=1.245,P值=0.006顯著,說明誤差項之間存在自相關(guān)性。對此,我們采用迭代法對殘差的自相關(guān)進(jìn)行處理,消除自相關(guān)。通過R根據(jù)迭代原理編程得到新的模型,回歸方程為:。
再次做DW檢驗,DW=1.768,P值=0.166不顯著說明無自相關(guān)性。統(tǒng)計檢驗結(jié)果(表2)顯示,留存自變量對因變量影響顯著且多重測定系數(shù)達(dá)到0.968。然后用函數(shù)ncvTest()再對新模型進(jìn)行殘差的方差齊性檢驗,P值=0.2512不顯著,說明不存在異方差。最后將為,為,為,為,為,為,將原始數(shù)據(jù)變量回代如以上方程中,得到無自相關(guān)性的最方程:。
3? ?結(jié)束語
經(jīng)檢驗,建立的模型具有一定的可靠性和實用性,為最優(yōu)擬合模型。由模型表明:全國研究生招生人數(shù)與GDP、國家財政內(nèi)教育經(jīng)費以及城鎮(zhèn)和農(nóng)村家庭的平均收入有著密切關(guān)系。招生人數(shù)對GDP依存度為負(fù),這反映了隨著對高學(xué)歷人才的需求,使得招生人數(shù)占GDP比重出現(xiàn)逐年下滑的趨勢;剩余變量對招生人數(shù)的影響都需要經(jīng)過一個滯后期才能顯現(xiàn)出來。
【參考文獻(xiàn)】
[1]王斌會.多元統(tǒng)計分析及R語言建模[M].暨南大學(xué)出版社,2010.
[2]Myers R ,麥爾斯, Myers.經(jīng)典和現(xiàn)代回歸分析及其應(yīng)用[M].北京:高等教育出版社,2005.
[3]何曉群.實用回歸分析[M].北京:高等教育出版社,2008.
[4]彭懷祖.高校招生人數(shù)影響因素分析及應(yīng)用[J].教育與經(jīng)濟, 2008(2).
【作者簡介】
楊天貞(1993~),女,回族,河南商丘人,研究方向:教育統(tǒng)計。