(河北建筑工程學院能源與環(huán)境工程學院 河北 張家口 075000)
Applicationoflinearnormalizationinregressionanalysisofinfluencingfactorsofwagedistribution
【Abstract】The distribution of income is closely linked with the enterprise human resources strategy management factors,and the enterprise wage distribution influenced by various factors,usually can use the principal component analysis and linear fitting method to find salary allocation of main factors,in order to find a better allocation of practicability and operability,before in the application of this method needs to be normalized processing to various influence factors,otherwise will lead to the result is no comparison,affect the results of data analysis.
【Keywords】Wage distribution;Linear fitting;Principal component analysis;Linear normalization.
工資總額分配是與企業(yè)人力資源戰(zhàn)略緊密聯(lián)系的管理要素。企業(yè)在各個省市分公司應該綜合考慮地區(qū)差異、收入與成本規(guī)模以及收益等因素,科學配置工資總額,以提高管理水平、提升競爭能力、促進企業(yè)經(jīng)營發(fā)展。目前已知工資總額分配可能與地區(qū)差異、收入與成本規(guī)模以及收益有關(guān),但為了能夠制定實用性和操作性更好的分配方案,需要對影響因素進行優(yōu)選,減少影響因素,提高模型的可操作性。在此,先利用主成分分析簡化模型影響因素,在利用最小二乘法得到最終比較簡單的組合算法成為合理的模型建立方案。數(shù)據(jù)來源于2019年河北省研究生數(shù)學建模競賽第四題。
首先需要對題目中所列舉的對工資分配有影響的因素進行主成分分析,以確定對工資分配影響較大的因素,先利用SPSS軟件對分配的工資總額及所提供的影響因素等數(shù)據(jù)進行主成分分析,分析結(jié)果如表1所示。在篩選出的三個主成分的成分矩陣中選出所占比重>0.9的影響因子(第三主成分影響因子的選取標準為所占比重>0.85),初步確定每個成分中起主導作用的影響因子[1][2]。
表1 旋轉(zhuǎn)成份矩陣
通過表1,可知該國有企業(yè)26個省各分公司所分配的工資總額主要的影響因素為篩選的三個主成分,三個主成分的主要影響因子如下:
主成分Ⅰ:GDP和業(yè)務總收入;
主成分Ⅱ:城鄉(xiāng)居民可支配收入、商品房平均銷售價格和其他國有企業(yè)員工平均工資;
主成分Ⅲ:成本費用率和人事成本費用率
通過上一節(jié)中求出該國有企業(yè)26個省各分公司所分配的工資總額受到三個主要因素所影響,接下來需要將三個主成分與工資分配總額之間建立數(shù)學模型,這里使用最小二乘法[3]以及線性擬合將三個主成分和工資分配總額聯(lián)系起來。
影響26個各省市分公司工資分配總額的三個主成分及其各自的影響因子需要確定合適的計算規(guī)則,計算規(guī)則為將確定的每一個主要成分中的影響因子與2018年工資分配總額進行擬合,對于擬合程度不高的,判斷標準為根據(jù)R2進行判斷,當R2<0.9時擬合程度較低,加上系數(shù)1并取對數(shù)(ln函數(shù));擬合程度較高的取平均值。再將數(shù)據(jù)導入MATLAB進行線性擬合[4],以得到最優(yōu)解及擬合曲線。最后對線性相關(guān)的結(jié)果進行分析。
當使用原始數(shù)據(jù)直接代入時,得出結(jié)果為:
f=10000y+237260000z-393420000
式中:y——第二主成分
z——第三主成分
通過觀察擬合的結(jié)果,可發(fā)現(xiàn)該式中只包含了兩個主成分為沒有包含第一主成分,之后將模型計算結(jié)果與2018年實際分配結(jié)果進行比較,結(jié)果如圖1,橫軸代表26個省市,縱軸代表分配金額。
圖1 原始數(shù)據(jù)代入后生成模型與實際分配方案的比較
圖1中發(fā)現(xiàn)模型計算結(jié)果和2018年實際分配結(jié)果誤差過大只有在少數(shù)幾個省份誤差較小,大多數(shù)省份的誤差過大,這使得模型準確度不高。
分析以上造成誤差較大的原因在于模型代入的數(shù)值為原始數(shù)據(jù),而原始數(shù)據(jù)中不同類別的數(shù)據(jù)之間的差距都在不同的數(shù)量級中,這將會導致數(shù)據(jù)淹沒,即模型只會會反應數(shù)量級較高的數(shù)據(jù)的變化趨勢而數(shù)量級較小的將不會顯示出來,使得指標與指標之間失去可比性。
根據(jù)上節(jié)中,由于不同類別數(shù)據(jù)之間數(shù)量級相差較大,所以需要將數(shù)據(jù)轉(zhuǎn)化到同一數(shù)量級下再進行線性擬合計算,這時需要將數(shù)據(jù)進行歸一化處理,數(shù)據(jù)歸一化目的就是為了把不同來源的數(shù)據(jù)統(tǒng)一到同一數(shù)量級(一個參考坐標系)下,因為不同評價指標具有不同的量綱和量綱單位,這樣的情況會影響到數(shù)據(jù)分析的結(jié)果,為了消除指標之間的量綱影響,那么就需要對數(shù)據(jù)進行歸一化處理,解決數(shù)據(jù)指標之間的可比性問題,使得各指標處于同一數(shù)量級,適合進行綜合對比評價。
本次采用線性歸一化對原始數(shù)據(jù)進行處理,是對原始數(shù)據(jù)的線性變換,使得結(jié)果值映射到[0,1]之間。轉(zhuǎn)換函數(shù)如下:
然后將轉(zhuǎn)換后的數(shù)據(jù)按上一節(jié)提及的計算規(guī)則計算每個主成分,并導入Matlab中進行線性擬合[5][6],其結(jié)果為:
歸一化后的擬合結(jié)果中體現(xiàn)出三個主成分對工資分配總額的影響,然后將擬合得出的模型計算結(jié)果與2018年實際分配方案進行對比,如圖2所示,模型計算結(jié)果與2018年制定的分配方案誤差分析表,見表2。
圖2 線性相關(guān)模型擬合結(jié)果與2018年初制定的工作分配方案的對比
序號省公司2018年實際(萬元)模型計算結(jié)果(萬元)相差(%)1廣東384414363094.4675.55%2江蘇348110350896.1775-0.80%3浙江279441303421.7535-8.58%4山東243007247558.716-1.87%5四川218626185981.164514.93%6北京180483184735.6935-2.36%7湖北177829173453.19152.46%8河北156861165723.945-5.65%9黑龍江155617154734.4950.57%10福建155049151657.4492.19%11湖南152664147664.61553.27%12遼寧124977122718.5641.81%13山西116547107369.96557.87%14廣西108714100996.08457.10%15陜西10627598834.8267.00%16重慶10517598761.5636.10%17江西9378297552.7235-4.02%18吉林8928595428.0965-6.88%19內(nèi)蒙古8369792937.1545-11.04%20云南8192189750.214-9.56%21貴州6821480848.7595-18.52%22天津6380668980.1535-8.11%23甘肅5579051543.55957.61%24海南3079037623.5895-22.19%25寧夏2151821615.624-0.45%26青海1809926744.034-47.77%
如圖2所示的歸一化結(jié)果,在圖像上查找擬合較離散的點,曲線代表模型計算結(jié)果,散點代表2018年實際分配方案,橫坐標代表26個省,縱坐標代表分配的金額。若散點高于曲線,說明2018年初定的工資總額分配偏高;反之,若曲線高于散點,則說明2018年初定的工資總額分配偏低;散點與曲線重合或相差較小,則代表2018年初定的工資總額分配較合理,且表3上的誤差分析也表明,模型計算結(jié)果與2018年制定的工資分配方案相差較小,上述與題目中每年工資分配總額都是在上一年工資分配總額基礎上結(jié)合上一年企業(yè)營業(yè)狀態(tài)進行微調(diào)的條件相符。
(1)對影響企業(yè)的工資分配總額的因素進行線性擬合,能得到實用性和操作性較好的方案,以此制定更加合理的工資分配方案。
(2)當需要處理的數(shù)據(jù)之間數(shù)量級差距較大時,在對數(shù)據(jù)進行擬合等其他運算時,需要將數(shù)據(jù)先進行歸一化處理,否則會造成數(shù)據(jù)淹沒,影響計算精度。