朱辰超,劉雅雅
(上海理工大學 管理學院,上海 200093)
中國老齡化問題日益突出,家庭養(yǎng)老的形式難以滿足老年人的養(yǎng)老需求。李林潼經(jīng)過調查研究,發(fā)現(xiàn)解決現(xiàn)狀的重要方法是采用機構養(yǎng)老的形式,但機構養(yǎng)老在現(xiàn)階段的實施中存在床位供需失衡的問題。關于養(yǎng)老床位需求的研究,余瑩等人運用系統(tǒng)聚類方法分析上海市各個區(qū)的養(yǎng)老區(qū)域劃分。徐佩等人用時間序列模型對上海市的機構養(yǎng)老床位供給量進行預測。除了針對某一個具體省份分析外,曹稀哲等人用多元回歸的方法來預測未來六年中國整體的機構床位需求量。王子鑫等人分析了城市和鄉(xiāng)村老年人的養(yǎng)老床位需求。大部分關于養(yǎng)老機構床位的研究都只是分析整體的需求量、或者城鄉(xiāng)的需求量,很少細化到各個省份來探討分析。雖然高巍等人基于31 個省份的數(shù)據(jù),運用多目標規(guī)劃來分析養(yǎng)老服務運營模式,但是最終并沒有提出各個省份具體的養(yǎng)老服務運營策略。近年來,很多學者采用聚類分析與判別分析結合的方法研究區(qū)域化和老年人能力等級的分類問題。但是判別分析有很多種方法,選擇不同方法,得到的判別函數(shù)也不同,有誤判的現(xiàn)象發(fā)生。
綜上所述,現(xiàn)階段對于機構養(yǎng)老床位的需求分析并沒有細化到各個省份,只是停留在城鄉(xiāng)的階段。基于此,本文主要采用BP 神經(jīng)網(wǎng)絡和灰色預測模型,地區(qū)化分析31 個省份養(yǎng)老機構床位的需求量,力圖實現(xiàn)省份間的合理分配,解決機構養(yǎng)老床位供需失衡的問題。同時將判別分析與BP 神經(jīng)網(wǎng)絡的精確度進行對比分析,以期減少誤判現(xiàn)象,實現(xiàn)地區(qū)的準確分類。選用65 歲及以上人口數(shù)、城鎮(zhèn)單位就業(yè)人員數(shù)、城鎮(zhèn)居民消費水平、城鎮(zhèn)人口數(shù)、基本養(yǎng)老保險基金支出、老年人口撫養(yǎng)比這6 個指標,考慮到養(yǎng)老床位需求受到歷史數(shù)據(jù)的影響,故收集歷年中國31 個省份的指標數(shù)據(jù),運用K 均值聚類的方法將歷年省份分為3 類,分別為養(yǎng)老床位需求高、中、低的地區(qū),并將分類結果用于BP 神經(jīng)網(wǎng)絡的訓練。再采用灰色預測模型和差分整合移動平均自回歸模型來預測2022 年各指標值,對2022 年中國各省養(yǎng)老床位的需求進行分類。最后,基于2022 年的分類結果,通過熵權法對各類中各省的養(yǎng)老床位需求程度打分,根據(jù)分數(shù)的高低提出一種地區(qū)化分配養(yǎng)老床位的方案,為養(yǎng)老床位供需失衡問題提供解決方案支持。同時,用判別分析對2022 年31 個省份進行分類,將判別分析的結果與BP 神經(jīng)網(wǎng)絡的結果進行對比,實現(xiàn)誤判最小化。
BP 神經(jīng)網(wǎng)絡(Back Propagation Neural Network)采用誤差的反向傳播和信號的正向傳播來確定權值,誤差按照負梯度的方向不斷傳播,直至誤差達到一個極小值時停止,或者在模型的學習次數(shù)達到初始設定的最大學習次數(shù)時停止,得到最終的完整網(wǎng)絡。在BP 神經(jīng)網(wǎng)絡中,最常見的是3 層反饋網(wǎng)絡,分別為輸入層、隱含層、輸出層。在BP 神經(jīng)網(wǎng)絡中,隱含層神經(jīng)細胞的數(shù)量由式(1)來求得:
其中,N是輸入層中神經(jīng)元的數(shù)量;N是輸出層神經(jīng)元的數(shù)量;是調節(jié)常數(shù),其范圍在[1,10] 之間。
隱含層神經(jīng)元的數(shù)量需要根據(jù)過去的數(shù)據(jù)逐步訓練BP 神經(jīng)網(wǎng)絡,直至得到預測誤差最小的網(wǎng)絡,從而確定隱含層神經(jīng)元數(shù)量。
在計算過程中,本文擬采用函數(shù)作為隱含層的激活函數(shù),線性傳遞函數(shù)作為輸出層的激活函數(shù)。設輸入層的輸入為分類后的2008~2017 年各省的65 歲及以上人口數(shù)、城鎮(zhèn)單位就業(yè)人員數(shù)、城鎮(zhèn)居民消費水平、城鎮(zhèn)人口數(shù)、基本養(yǎng)老保險基金支出、老年人口撫養(yǎng)比,該層使用函數(shù),對此可表示為:
其中,t為隱含層第個神經(jīng)元的輸出;W為隱含層神經(jīng)元與輸入層神經(jīng)元i 的權值; α為隱含層神經(jīng)元的閾值;()為隱含層神經(jīng)元的激活函數(shù)。
將高、中、低三個需求類別作為輸出層神經(jīng)元的3 個輸出值,神經(jīng)元運用激活函數(shù)將激活后的輸入值輸出,函數(shù)的數(shù)學形式可表示為:
其中,W為隱含層神經(jīng)元到輸出層神經(jīng)元的權值;α為輸出層神經(jīng)元的閾值;()為輸出層神經(jīng)元的激活函數(shù)。
判別分析要求每類中至少有一個樣本,且解釋變量必須是可測量的,才能計算每類的均值和方差,用于判別函數(shù)的具體表達式與計算。判別分析的計算步驟如下:
(1)計算各組類別中各判別變量的均值和協(xié)方差陣。
(2)計算協(xié)方差陣的估計值的逆矩陣。
(3)運用逆矩陣和均值確定判別函數(shù)的具體表達式。
(4)運用判別函數(shù)對已有樣本進行回判,計算精確度。
(5)運用判別函數(shù)對待判別樣本進行分類。
本文從國家統(tǒng)計局中收集2008~2017 年中國31 個省份的6 個指標值作為樣本數(shù)據(jù)。首先,運用數(shù)據(jù)分析軟件SPSS(Statistical Product and Service Solutions)對數(shù)據(jù)進行歸一化處理,去除量綱對于聚類結果的影響;其次,采用K 均值聚類的方法將樣本分為3 類,分別為:床位需求最多、床位需求適中和床位需求最少,最終的聚類結果見表1 和表2,最終聚類中心表示各類別中各指標數(shù)據(jù)的均值。
表1 最終聚類中心Tab.1 Final clustering center
表2 各類中的樣本數(shù)Tab.2 Number of samples in each category
由表1 的數(shù)值可知,第一類對應的是床位需求適中的地區(qū),第二類對應的是床位需求最少的地區(qū),第三類對應的是床位需求最多的地區(qū)。因每年養(yǎng)老床位的需求都受到過去情況的影響,具有連續(xù)性,不是獨立于歷史存在的離散值,故本文以歷史樣本數(shù)據(jù)的分類結果為后續(xù)模型預測的基礎樣本,結果見表2,所有收集的樣本均實現(xiàn)分類,并不存在一個樣本屬于多個類別的情況。
依據(jù)K 均值聚類方法的分類結果,將每個類別的70%樣本作為訓練集,30%樣本作為測試集。由于輸入變量為6 個,輸出變量為3 個,根據(jù)公式(1),隱含層個數(shù)確定在[4,13]內(nèi)。在該區(qū)間內(nèi)選取不同的隱含層個數(shù),訓練BP 神經(jīng)網(wǎng)絡,對比各個隱含層個數(shù)下BP 神經(jīng)網(wǎng)絡的預測精度,選擇精度最高的網(wǎng)絡對應的隱含層個數(shù),最終確定為10。養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡結構如圖1 所示,分類誤差直方圖如圖2 所示。
圖1 養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡結構Fig.1 The BP neural network structure of pension service beds demand
圖2 分類誤差直方圖Fig.2 Histogram of classification error
在神經(jīng)網(wǎng)絡訓練的過程中,需要重視過擬合問題。當訓練集的精確度極高,而測試集的精確度低時,就會產(chǎn)生過擬合現(xiàn)象。由圖2 可以看出,訓練集和測試集的誤差均在0.025 附近,即訓練集和測試集的預測精確度基本均接近于100%,本文的養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡并不存在過擬合現(xiàn)象。
判別分析是對已知樣本數(shù)據(jù)進行計算得到判別函數(shù),選擇不同方法得到的判別函數(shù)也不相同,常用的判別方法有最大似然法、距離判別法、Fisher 判別法、Bayes 判別法。本文將K 均值聚類方法的分類結果作為基礎樣本,以Fisher 判別法為例,通過判別函數(shù)對基礎樣本進行回判,從而求得判別分析的精確度。與養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡的精確度相比,判別分析的精確度較低,故本文選用BP 神經(jīng)網(wǎng)絡的方法來實現(xiàn)養(yǎng)老床位需求的分類。
本文采用灰色預測模型和差分整合移動平均自回歸模型,根據(jù)2008~2017 年31 個省份的6 個指標值,預測2022 年的指標值?;疑A測模型是運用少量數(shù)據(jù)進行短期預測,在計算殘差的方差和指標數(shù)據(jù)的方差后,將兩者的比值稱為后驗差比值,進行后驗差比檢驗。當后驗差比值大于0.65 時,則表明灰色預測模型的預測結果對于該指標數(shù)據(jù)而言不合格,需要選用其他方法進行預測。差分整合移動平均自回歸模型是對平穩(wěn)的時間序列數(shù)據(jù)進行中短期預測,當數(shù)據(jù)不平穩(wěn)時,需要對數(shù)據(jù)進行差分,使其變成平穩(wěn)序列。在本文的指標預測的過程中,對每個指標都先運用灰色預測模型進行預測和檢驗,當檢驗結果顯示不合格、即精確度過低時,將采用差分整合移動平均自回歸模型進行預測,最終的預測結果見表3。
表3 2022 年6 個指標31 個省份的預測值Tab.3 Predicted values of six indicators in 31 provinces of China in 2022
根據(jù)差分整合移動平均自回歸模型和灰色預測模型預測得到的2022 年各個省份的指標值,運用訓練好的養(yǎng)老床位需求BP 神經(jīng)網(wǎng)絡,得到最終2022年31 個省份的類別情況,見表4。
由表4 可知,在面對中國整體的機構養(yǎng)老床位需求量增加的情況下,關于床位的增加量應按照第三類、第一類、第二類的先后順序進行分配。優(yōu)先增加第三類地區(qū)的養(yǎng)老床位,其次增加第一類地區(qū)的養(yǎng)老床位,最后增加第二類地區(qū)的養(yǎng)老床位。
表4 2022 年31 個省份預測類別Tab.4 China′s 31 provinces forecast categories in 2022
本文根據(jù)2022 年中國31 個省份對應的6 個指標預測值,采用熵權法計算各個指標的權重,最終得出各類中每個地區(qū)的評分,評分越高則相應地區(qū)對于床位的需求越急切。
由于運用SPSS 軟件對該組數(shù)據(jù)進行標準化時發(fā)現(xiàn)有負值,故重新采用另一種標準化方法,保證標準化結果在[0,1]之間,列出公式見如下:
其中,r表示2022 年31 個省份對應的各指標預測值。
熵權法是根據(jù)指標的離散程度來分配權重,具有較強的客觀性。熵權法需先對標準化矩陣v計算其對應的概率矩陣;其次,根據(jù)概率矩陣求各指標的信息熵和信息效用值;最后,將信息效用值歸一化,得到各個指標的熵權。熵權與標準化矩陣的元素進行加權求和,即為各個樣本的評分結果。評分結果是各個地區(qū)養(yǎng)老床位需求程度的評分,評分越高表示該地區(qū)對養(yǎng)老床位的需求程度越高,見表5。
表5 2022 年31 個省份每類的評分(每類中評分按降序)Tab.5 The score of each category of China′s 31 provinces in 2022(descending order)
本文主要采用BP 神經(jīng)網(wǎng)絡和灰色預測模型來預測分析2022 年31 個省份的養(yǎng)老床位需求增加量的情況,并且針對床位供需失衡的問題提出相應的解決方法:
(1)對2022 年的養(yǎng)老床位需求增加量,應按照第三類(需求最多)、第一類(需求適中)、第二類(需求最少)地區(qū)的順序來增加養(yǎng)老床位的供給,先在整體上解決養(yǎng)老床位供需失衡的問題。
(2)在各組類別中,各地區(qū)按照熵權法的評分結果,先分配評分高的地區(qū),再分配評分低的地區(qū),即各類中按照各個地區(qū)對于養(yǎng)老床位需求程度的高低進行分配。
(3)在2022 年,在第三類地區(qū)中,按照廣東、江蘇、山東、浙江、河北、遼寧、四川、湖北、安徽、河南的順序依次增加養(yǎng)老床位供給量;對于第一類地區(qū),按照上海、黑龍江、吉林、內(nèi)蒙古、北京、湖南、陜西、江西、山西、重慶、廣西、天津、甘肅、新疆、福建、貴州、云南、海南、寧夏的順序依次增加床位供給量;針對第二類地區(qū),則是按照青海、西藏的順序增加床位供給量。
本文針對中國養(yǎng)老床位供需失衡的問題,通過分類、預測、評分這3 個步驟提出一種地區(qū)化分配養(yǎng)老床位的方案。首先,運用K 均值聚類方法將2008~2017 年31 個省份分為3 類作為樣本數(shù)據(jù),分別為養(yǎng)老床位需求最少、適中、最多。運用BP 神經(jīng)網(wǎng)絡對樣本數(shù)據(jù)進行訓練,同時運用判別分析對樣本數(shù)據(jù)進行回判,比較2 個方法的精確度,確定BP神經(jīng)網(wǎng)絡更適用于養(yǎng)老床位需求的分類預測。通過灰色預測模型和差分整合移動平均自回歸模型求出2022 年各個指標的預測值,輸入BP 神經(jīng)網(wǎng)絡進行分類預測。運用熵權法對各類地區(qū)按養(yǎng)老床位的需求程度進行評分,提出具體的養(yǎng)老床位地區(qū)化分配方案。政府在分配養(yǎng)老床位時,需要先對養(yǎng)老床位需求最多的類別進行分配,在每組類別中,需要對養(yǎng)老床位需求最緊迫的地區(qū)進行分類;在養(yǎng)老床位供給量有限的情況下,優(yōu)先解決養(yǎng)老床位需求最多的地區(qū),力圖實現(xiàn)養(yǎng)老床位在各省間的合理分配。