黃博宇
(西安工程大學 服裝與藝術設計學院, 陜西 西安 710048)
隨著大學不斷的擴招,大學生的數(shù)量急劇增加,這給大學畢業(yè)生就業(yè)帶來了一定的困難[1-2]。而大學畢業(yè)就業(yè)率對于社會穩(wěn)定、大學的發(fā)展都起著舉足輕重的作用。因此,大學畢業(yè)生就業(yè)預測研究成為當前的熱點問題[2]。
近十多年來,國內(nèi)一些學者和專家以及一些研究機構對大學畢業(yè)生就業(yè)問題進行了一系列的分析,提出了許多有效的大學畢業(yè)生就業(yè)預測模型[4-6],如線性回歸模型、灰色理論的GM(1,1)模型、神經(jīng)網(wǎng)絡、支持向量機等,其中線性回歸模型、灰色理論的GM(1,1)模型只能描述大學畢業(yè)生就業(yè)的線性變化特點,使得大學畢業(yè)生就業(yè)預測誤差相當大,無法滿足大學的發(fā)展要求。神經(jīng)網(wǎng)絡雖然有比較好的非線性建模能力,但是其要求大學畢業(yè)生就業(yè)的歷史數(shù)據(jù)多,使得大學畢業(yè)生就業(yè)成本高,而且大學畢業(yè)生就業(yè)歷史樣本實際很少,而且神經(jīng)網(wǎng)絡本身的結構比較復雜,使得大學畢業(yè)生就業(yè)預測結果不穩(wěn)定[7-9]。支持向量機的大學畢業(yè)生就業(yè)預測效果要優(yōu)于其他方法,是一種大數(shù)據(jù)分析技術,但是其參數(shù)影響大學畢業(yè)生就業(yè)預測結果,如何確定最優(yōu)參數(shù)是關鍵[10]。
針對當前大學畢業(yè)生就業(yè)預測精度低、效率低等缺陷,為了獲取更優(yōu)的大學畢業(yè)生就業(yè)預測結果,提出基于數(shù)據(jù)挖掘的大學畢業(yè)生就業(yè)預測模型,在MATLAB 2019的平臺下對大學畢業(yè)生就業(yè)預測模型的性能進行了仿真對比測試,驗證了本文模型的優(yōu)越性。
數(shù)據(jù)挖掘的大學畢業(yè)生就業(yè)預測模型工作原理為:首先對一個大學畢業(yè)生就業(yè)的歷史數(shù)據(jù)進行收集,然后采用ACO算法確定SVM的相關參數(shù)最優(yōu)值,最后SVM根據(jù)參數(shù)的最優(yōu)值建立大學畢業(yè)生就業(yè)預測模型,并對將來一段時間的大學畢業(yè)生就業(yè)進行估計,如圖1所示。
圖1 大學畢業(yè)生就業(yè)預測模型工作原理
f(x)=ωTφ(x)+b
(1)
對式(1)進行轉換,得到一個帶約束的優(yōu)化形式,如式(2)。
(2)
式中,C為懲罰參數(shù);n表示歷史數(shù)據(jù)的數(shù)量;ξ表示松弛因子。
引入拉格朗日乘子αi建立式(2)的對偶形式,從而建立拉格朗日方程,具體如式(3)。
(3)
將式(3)轉成對偶形式,即有式(4)。
(4)
這樣得到支持向量的回歸估計函數(shù)為式(5)。
(5)
采用核函數(shù)k(xi,x)代替(φ(xi),φ(x)),式(5)變?yōu)槭?6)。
(6)
k(xi,x)定義如式(7)。
當?shù)装遄钔饩壚瓚_到235 MPa時底板的剪力滯系數(shù)分布圖如圖13所示。此時,塑性階段的剪力滯系數(shù)是通過數(shù)值計算的結果除以屈服應力235 MPa得到。從ANSYS中提取固端正應力結果后,此時底板最外側幾個點的正應力已經(jīng)超過屈服應力235 MPa,其他大部分點均未達到屈服應力,說明在這種均布荷載作用下各點的剪力滯系數(shù)與彈性階段剪力滯系數(shù)分布都差不多,同時截面的應力分布還處于彈性階段的狀態(tài),模型的塑性變形不明顯,主要是彈性階段的變形。
(7)
式中,σ為核寬度。
參數(shù)σ和C對SVM的大學畢業(yè)就業(yè)分析時,它們影響大學畢業(yè)就業(yè)分析效果,采用蟻群算法對參數(shù)σ和C進行優(yōu)化。
螞蟻初始位置為Xi(xi1,xi2,…,xid),第i只螞蟻的初始信息素計算式為式(8)。
Δτ(i)=exp(-f′(xi))
(8)
當f(xi)無限大時,信息素濃度會向零靠近,所以f(xi)進行相應的修正,具體如式(9)。
(9)
式中,avg為f(xi)的均值。
當一只螞蟻在完成一次搜索后,根據(jù)移動規(guī)則進行下一次搜索,具體為:選擇p個螞蟻,計算它們的信息素濃度,將信息素濃度最大個體作為目標如式(10)。
(10)
式中,Xbest為上次搜索過程中的最優(yōu)解。
由于信息素濃度越大,吸引程度越大,所以第i只螞蟻向目標螞蟻位置移動。當整個蟻群完成一次搜索后,對信息素進行更新操作,具體如式(11)。
τ(i)=(1-ρ)τ(i)+Δτ(i)
(11)
式中,ρ為信息素的揮發(fā)因子。
Step1:選擇多個大學作為畢業(yè)就業(yè)狀況預測對象,并對其大學畢業(yè)就業(yè)歷史數(shù)據(jù)進行采集。
Step2:大學畢業(yè)生就業(yè)與多種因素相關,如大學本身的層次、大學專業(yè)、大學所處的地理位置等,使各個大學畢業(yè)就業(yè)歷史數(shù)據(jù)的值差異比較大,如果直接輸入到SVM進行學習,使得SVM的訓練效率低,因此對其進行歸一化操作,具體為式(12)。
(12)
式中,yi,j表示第i個大學第j年的就業(yè)歷史數(shù)據(jù)值;max和min分別表示整個大學畢業(yè)就業(yè)數(shù)據(jù)的最大值和最小值。
Step3:選擇一部分大學畢業(yè)就業(yè)歷史數(shù)據(jù),將它們組合在一起形成大學畢業(yè)就業(yè)分析的訓練樣本,用于確定SVM的參數(shù)值。
Step4:將校畢業(yè)就業(yè)分析的訓練樣本輸入到SVM,采用ACO算法確定SVM的參數(shù)最優(yōu)值。
Step5:根據(jù)參數(shù)最優(yōu)值,SVM重新對校畢業(yè)就業(yè)分析的訓練樣本學習,建立大學畢業(yè)就業(yè)分析模型,并可以對將來幾年的大學畢業(yè)就業(yè)狀態(tài)進行預測和分析。
數(shù)據(jù)挖掘的大學畢業(yè)生就業(yè)預測模型(ACO-SVM)的性能,對其進行仿真測試,首先設置仿真測試環(huán)境,包括硬件環(huán)境和軟件,在相同測試環(huán)境下,選擇蟻群算法優(yōu)化BP神經(jīng)網(wǎng)絡(ACO-BPNN)、傳統(tǒng)支持向量機(SVM)、深度學習算法中的卷積神經(jīng)網(wǎng)絡(CNN)進行對比測試,以驗證本文模型的優(yōu)越性。采用大學畢業(yè)生就業(yè)預測精度以及建模時間作為性能評估標準。
為了使大學畢業(yè)生就業(yè)預測結果具有較強的說服力,選擇全國4類大學作為測試數(shù)據(jù),收集它們畢業(yè)就業(yè)數(shù)據(jù),4類大學分別為985、211大學、一本大學、二本學院和大專,它們歷史數(shù)據(jù)具體如表1所示。
表1 畢業(yè)就業(yè)狀況預測的實驗數(shù)據(jù)
沒有列出影響因素,訓練樣本數(shù)量和測試樣本數(shù)的比例為5∶1。
采用4種大學畢業(yè)生就業(yè)預測模型對表1的實驗數(shù)據(jù)進行建模與分析,得到4類大學的畢業(yè)就業(yè)狀況預測精度如圖2所示。
圖2 大學畢業(yè)生就業(yè)預測精度對比
對圖2的大學畢業(yè)生就業(yè)預測精度分析,可得以下結論。
(1) ACO-BPNN的大學畢業(yè)生就業(yè)預測精度最低,說明ACO-BPNN無法準確描述大學畢業(yè)生就業(yè)變化特點,導致分析誤差最大。
(2) SVM的大學畢業(yè)生就業(yè)預測精度要高于ACO-BPNN,主要是因為SVM的泛化能力要強于BP神經(jīng)網(wǎng)絡,沒有BP神經(jīng)網(wǎng)絡建模的限制條件,減少了大學畢業(yè)生就業(yè)預測誤差。
(3) CNN的就業(yè)預測精度要優(yōu)于SVM以及ACO-BPNN,因為其屬于當前流行的深度學習算法,具有較好的擬合和建模能力,但是其預測效果也要差于ACO-SVM,這是因為CNN同樣也存在參數(shù)優(yōu)化問題,這是下一階段要解決的問題。
(4) ACO-SVM的大學畢業(yè)生就業(yè)預測精度要大幅度高于對比模型,這表明ACO-SVM較好的克服了當前模型存在大學畢業(yè)生就業(yè)預測誤差大,很好地描述了大學畢業(yè)生就業(yè)變化特點,驗證了ACO-SVM的優(yōu)越性。
ACO-SVM的大學畢業(yè)生就業(yè)預測模型與對比模型的訓練時間和測試時間如表2所示。
由表2可以看出,SVM的大學畢業(yè)生就業(yè)預測總時間最長,大學畢業(yè)生就業(yè)預測效率最低,其次為ACO-BPNN,這是因為BP神經(jīng)網(wǎng)絡的收斂速度慢,建模效率較低,大學畢業(yè)生就業(yè)預測效率最高者為ACO-SVM,加快了大學畢業(yè)生就業(yè)預測速度。
表2 預測模型的訓練和測試時間對比
為了獲取更優(yōu)的大學畢業(yè)生就業(yè)預測結果,提出基于數(shù)據(jù)挖掘的大學畢業(yè)生就業(yè)預測模型。對比測試結果表明,數(shù)據(jù)挖掘大學畢業(yè)生就業(yè)預測精度達到了90%以上,減少了大學畢業(yè)生就業(yè)預測誤差,大學畢業(yè)生就業(yè)預測時間短,獲得理想的大學畢業(yè)生就業(yè)預測結果。