吳新林,陳詩雨
(1.湖北第二師范學院 數學與統計學院,武漢 430205;2.湖北第二師范學院 大數據建模與智能計算研究所,武漢 430205)
教育經費的增加與中國國內生產總值增加有關,經濟發(fā)展水平是教育發(fā)展水平的直接和最終決定因素,是現代教育的根本性的社會動力。增加教育經費可以為教育提供物質條件和基礎,這意味著將會有更多資源流向教育,可以建設更完善的教育設施,招聘更優(yōu)秀的教師,從而提高教育產出。通過預測教育經費可幫助人們做出合理決策,及時調整教育資源中的分配結構。在研究預測的過程中需要用到數理統計的相關方法,如,李海娟分析了數理統計在經濟學中應用的意義以及具體的應用策略[1],為本研究提供了參考。
本文著眼于利用一元線性回歸模型預測教育經費,研究國內生產總值與教育經費的關系,引入一元線性回歸模型,為今后的預測提供解決思路和方法步驟。對一元線性回歸模型進行預測的研究主要分為兩部分,一部分為研究預測過程中模型的相關概念與基本理論、模型的建立與方法步驟,其中,茆詩松等給出了回歸系數的最小二乘估計,通過求偏導數并命其為0 可以得到參數的最小二乘估計算式[2];李文亮等以濟源市1991-2000年國內生產總值與固定資產投資關系為例將一元線性回歸模型在投資方面的預測中具體進行了應用,并展示了一元線性相關關系判定中的相關圖和相關系數這兩種方法[3];何福云等將一元線性回歸模型在預測工程項目的造價中進行應用[4];杜克余等將一元線性回歸在分析農業(yè)建設規(guī)模中進行運用。[5]唐亞寧等[6]對一元線性回歸方程的三種顯著性檢驗的等價性進行分析;另一部分為利用軟件對一元線性回歸模型進行求解和預測;張海燕等將Excel軟件應用到一元線性回歸問題的求解中。[7]隨著研究的深入,郭志軍等應用Excel軟件對一元線性回歸模型進行分析,得出數據間的關系,建立回歸方程[8];楊雄等以成本預測為案例,應用Excel 對案例進行回歸方程求解,并對Excel 運行結果中的各參數進行解釋。[9]綜合以上分析可以看出,各學者將一元線性回歸模型應用于不同研究領域,本文一方面結合2012-2021年期間國內生產總值與全國教育經費的樣本數據對一元線性回歸模型進行了參數估計,并對結果進行了顯著性檢驗,另一方面,將建立的模型應用于教育經濟預測問題中,借助Excel軟件對模型進行了求解。
一元線性回歸模型使用的條件是兩個經濟變量之間需要存在線性相關關系,下面將介紹兩種判斷經濟變量之間是否存在線性相關關系的方法。
方法1:散點圖法
調查并收集具有相關關系的兩個現象的相關資料及數據,形成一組組成對的數據并在直角坐標系中呈現。觀察這些點的分布情況,如果這些點大致分布在一條直線上下,就說明這兩個變量之間有線性關系,如果這些點散落分布,不在一條直線附近,說明這兩個變量之間不是線性相關。
方法2:相關系數
通過計算相關系數也可以來確定相關關系,計算公式為:[2]
在確定了兩個變量之間有線性相關關系后,就可以進行線性回歸分析。設一元線性回歸模型為y?=a?+b?x,稱y關于x的回歸方程[2],所呈現的圖形稱為回歸直線。給定x=x0后,稱y?0=a?+b?x0為預測值。
一般采用最小二乘法估計模型中的a?,b?,令存在a?,b?使得Q(a,b)最小,將Q(a,b) 分別對a,b進行求偏導并命其為0。解得:
這就是參數的最小二乘估計,其中:[2]
下面需要判斷本文所使用的回歸方程是否有意義,本文采用F檢驗法對回歸方程進行檢驗。
在F檢驗中[2]:稱y?i=a?+b?xi為xi處的回歸值,又稱yi-y?i為xi處的殘差。數據總的波動用總偏差平方和表示:。yi的波動用回歸平方和表示:。y的觀測值與回歸值之間的差距用殘差平方和表示:
F 作為檢驗問題的檢驗統計量[2]:,對于整個給定的顯著性水平α,其拒絕域為F≥F1-α(1,n-2) ,整個檢驗也可列成一張方差分析表,如表1所示,檢驗也可用p值進行。
表1 方差分析表
選取2012-2021年中國國內生產總值和全國教育經費數據(如表2所示),建立一元線性回歸模型。中國統計年鑒數據顯示,2022年國內生產總值為121.0萬億元,下面利用一元線性回歸模型和2022年國內生產總值預測2022年全國教育經費。(注:截至2023年5月,2022年度全國教育經費數據尚未官方公布。)
表2 2012-2021年GDP和全國教育經費
(1)一元線性相關關系的判定
方法1:繪制散點圖
由表2中2012-2021年中國國內生產總值和全國教育經費數據繪制散點圖,如圖1所示:
圖1 GDP和全國教育經費散點圖
方法2:計算相關系數
由相關圖(見圖1)和相關系數(0.998)可以判斷中國國內生產總值與全國教育經費之間存在高度的線性相關關系。
(2)建立一元線性回歸模型
從散點圖我們發(fā)現10個點基本在一條直線附近,這說明兩個變量之間存在線性相關關系,我們設關于中國國內生產總值與全國教育經費之間的一元線性回歸模型為:y?=a?+b?x,其中,a?、b?為待求的回歸系數。
(3)最小二乘估計求回歸系數
(4)回歸方程的顯著性檢驗
這里我們考慮關于回歸方程的顯著性檢驗,相關指標計算結果如下:
將數據移入方差分析表,繼續(xù)進行計算。計算出國內生產總值和全國教育經費的方差分析表,如表3所示。因為p值很小,故在顯著性水平0.01下回歸方程是顯著的。
表3 GDP和全國教育經費回歸方程的方差分析表
(5)預測
建立好模型后就可以進行預測,將每年的國內生產總值代入回歸預測模型中可以得到全國教育經費的預測值。由中國統計年鑒得知,2022年的國內生產總值為121.0萬億元,則2022年全國教育經費的預測值為:y?=0.15+0.05×121=6.2(萬億元)。
Excel 軟件是微軟公司出品的Office 系列軟件中的其中一款,它是一個功能強大的可以進行數據管理與分析的軟件,Excel向我們提供了80多個統計函數。本文首先應用Excel軟件的SLOPE函數和INTERCEPT函數求出回歸方程的斜率和截距,然后應用FORECAST函數進行預測。其具體求解步驟與方法如下:
(1)SLOPE函數:選擇“y的范圍(因變量)”和“x的范圍(自變量)”,計算的回歸直線y=a+bx的斜率b。
語法:SLOPE(Known-y's,Known-x's)
(2)INTERCEPT 函數:通過“y的范圍(因變量)”和“x的范圍(自變量)”,計算回歸直線y=a+bx的截距a。
語法:INTERCEPT(Known-y's,Known-x's)
(3)FORECAST函數:通過指定的x值來預測y值。
語法:FORECAST(x,Known-y's,Known-x's)
其中:
X……預測中使用的值;
Known-y's……指定已知的y值;
Known-x's……指定已知的x值。
求解步驟如下:
(1)將2012-2021年中國國內生產總值和全國教育經費的數據輸入到Excel中。
(2)在單元格F2中插入SLOPE函數,選出因變量數值區(qū)域及自變量數值區(qū)域,計算出斜率b=0.05,過程及結果如圖2所示。
圖2 SLOPE函數
(3)在單元格F3中插入INTERCEPT函數,選出因變量數值區(qū)域及自變量數值區(qū)域,計算出截距a=0.24,過程及結果如圖3所示。
圖3 INTERCEPT函數
(4)由斜率b和截距a的值可得,一元線性回歸方程為y?=0.24+0.05x。
(5)在單元格C12中插入FORECAST函數,在B12中輸入2022年國內生產總值為121.0萬億元,選擇其為預測中使用的X值,再選出因變量數值區(qū)域及自變量數值區(qū)域,得到預測值為6.12,過程及結果如圖4所示。
圖4 FORECAST函數
經濟預測是當代社會活動中的一個熱點研究問題,具有廣泛的應用價值。本文研究回歸分析法中的一元線性回歸模型,結合國內生產總值與教育經費的相關數據,通過分析國內生產總值與教育經費的相關性建立回歸模型并應用Excel 軟件對模型進行求解與預測。根據預測結果對教育資源進行合理分配與決策。通過對相關理論的研究及具體實例的計算,給出了求解一元線性回歸模型及其預測的詳細步驟,實用性較強。結合本文的研究思路,可以進一步將一元線性回歸模型應用于投資經濟、航空經濟、物流經濟等不同經濟領域,通過預測幫助人們展望未來經濟發(fā)展前景,做出決策并進行科學管理。