李圣瑜
摘 要:基于河北省農(nóng)村老年人養(yǎng)老滿意度進(jìn)行問卷調(diào)查和實(shí)地調(diào)研,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)分析河北省農(nóng)村養(yǎng)老滿意度的影響因素及它們的影響程度,為進(jìn)一步提高河北省農(nóng)村老年人養(yǎng)老滿意度提供參考。在關(guān)聯(lián)規(guī)則挖掘中發(fā)現(xiàn),參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低。
關(guān)鍵詞:養(yǎng)老滿意度;GRI算法;關(guān)聯(lián)規(guī)則
中圖分類號(hào):F840 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2014)10-0049-03
引言
1999年以來,中國正式步入老齡化國家的行列,人口老齡化問題是中國經(jīng)濟(jì)社會(huì)發(fā)展面臨的重大現(xiàn)實(shí)問題之一。人口基數(shù)大、發(fā)展迅速、“未富先老”等是中國老齡化的特點(diǎn)。養(yǎng)老問題是關(guān)系國計(jì)民生的大事,關(guān)系到人民的切身利益,特別是在中國經(jīng)濟(jì)發(fā)展相對落后的農(nóng)村,社會(huì)養(yǎng)老保障制度不完善、農(nóng)民收入水平低下,大量勞動(dòng)力外流,使得在對老年人生活照料、精神慰藉和疾病護(hù)理等方面得不到保障,因此,探討農(nóng)村老年人養(yǎng)老滿意度的影響因素,進(jìn)而提高農(nóng)村老年人的養(yǎng)老滿意度尤其重要。本文在研究大量資料、參考論文相關(guān)實(shí)踐成果的基礎(chǔ)上,以“中國老齡事業(yè)發(fā)展‘十二五規(guī)劃”為指導(dǎo),在調(diào)查研究的基礎(chǔ)上,對調(diào)查數(shù)據(jù)進(jìn)行預(yù)處理和統(tǒng)計(jì)分析,通過關(guān)聯(lián)規(guī)則技術(shù)分析河北省農(nóng)村老年人養(yǎng)老滿意度的影響因素。
一、關(guān)聯(lián)規(guī)則的基本思想
關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),尋找事物之間的聯(lián)系規(guī)律和結(jié)構(gòu)特征,挖掘它們之間的關(guān)聯(lián)關(guān)系。數(shù)據(jù)挖掘中,關(guān)聯(lián)分析的主要技術(shù)是關(guān)聯(lián)規(guī)則,最早由Agrawal、Imielinski和Swami提出。關(guān)聯(lián)規(guī)則挖掘是為了尋找同一事件中不同項(xiàng)之間的相關(guān)性。簡單關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要工具之一,屬于無監(jiān)督學(xué)習(xí)方法,能夠揭示數(shù)據(jù)中隱含的關(guān)聯(lián)特征。
Clementine提供了Apriori、Carma和GRI等經(jīng)典算法。本文用的是GRI算法,算法是由Smyth和Goodman于1992年提出的,是在ITRule算法的基礎(chǔ)上拓展形成的,可用于簡單的關(guān)聯(lián)分析。GRI算法的主要特點(diǎn)是:不但能夠處理分類型變量,而且前項(xiàng)還可以為數(shù)值型變量;數(shù)據(jù)只能按事實(shí)表方式存儲(chǔ);采用深度優(yōu)先搜索策略實(shí)現(xiàn)算法。
二、養(yǎng)老滿意度中關(guān)聯(lián)規(guī)則的應(yīng)用
(一)數(shù)據(jù)準(zhǔn)備
從調(diào)查數(shù)據(jù)的頻數(shù)分析中,我們發(fā)現(xiàn)部分變量的在取某值的頻數(shù)很低,甚至有的變量取值的頻數(shù)為0,為了后續(xù)更好的分析,利用Clementine對變量進(jìn)行篩選。軟件操作實(shí)現(xiàn)過程。其中設(shè)定的條件為:變量中缺失值所占比例大于70%;分類變量中類別值所占比例大于90%;分類變量的類別個(gè)數(shù)占總樣本的比例大于95%的應(yīng)視為不重要變量。指定總體滿意度為輸出變量,其他變量為輸入變量。1-概率p值越高,說明輸入變量與輸出變量的相關(guān)性越強(qiáng),輸入變量越重要。
(二)變量前后項(xiàng)設(shè)定
在建立關(guān)聯(lián)規(guī)則模型之前,首先設(shè)定模型的變量前后項(xiàng),職業(yè)、經(jīng)濟(jì)來源、居住狀況、娛樂活動(dòng)、社會(huì)活動(dòng)、村集體補(bǔ)貼和農(nóng)村合作醫(yī)療等變量均為有限個(gè)值,且各值之間無序,因此定義成標(biāo)稱類型;年齡、月平均收入、文化水平、低保制度和總體滿意度各變量值之間具有一個(gè)隱含的序,因此定義成連續(xù)型數(shù)值類型;同時(shí)指定總體滿意度為關(guān)聯(lián)規(guī)則的后件,其余為關(guān)聯(lián)規(guī)則的前件。
(三)基于GRI算法的關(guān)聯(lián)規(guī)則建模
根據(jù)上述的數(shù)據(jù)預(yù)處理的方法對調(diào)查數(shù)據(jù)進(jìn)行整理,預(yù)處理后的數(shù)據(jù)和篩選出來的變量建立GRI模型實(shí)現(xiàn)挖掘過程。
1.設(shè)定閥值
規(guī)則的支持度和置信度大于用戶設(shè)置的最小支持度和置信度的閾值時(shí)才是一條有效規(guī)則。所以在關(guān)聯(lián)規(guī)則挖掘中需要合理、自行設(shè)置最小支持度和置信度的閾值。因?yàn)檫@些閥值的大小直接決定關(guān)聯(lián)規(guī)則挖掘結(jié)果中規(guī)則的數(shù)量。如果支持度閥值太小,會(huì)生成大量的規(guī)則,并且會(huì)失去代表性,挖掘出的規(guī)則毫無意義。而如果支持度閥值設(shè)置太大,則可能無法找到閥值要求的規(guī)則。但是在軟件操作過程中并沒有明確的依據(jù)確定如何設(shè)置模型的最小支持度閾值和置信度閾值,所以本文在實(shí)際操作中,采用設(shè)置不同最小支持度閾值的方式進(jìn)行反復(fù)挖掘,即進(jìn)行若干次探索性的挖掘。我們在反復(fù)挖掘中最終選擇分析在最小支持度閾值為7%,最小置信度閾值為55%的情況下進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
2.關(guān)聯(lián)規(guī)則結(jié)果分析
因?yàn)橹挥性谔嵘却笥?的時(shí)候才有意義,所以本文從提升度大于1的關(guān)聯(lián)規(guī)則中按照最小支持度進(jìn)行排序,支持度大于7%的條件下,選取部分置信度大于55%的排名靠前且有代表性的規(guī)則,規(guī)則進(jìn)行論述,選出的規(guī)則。
后項(xiàng){總體滿意度=1}的關(guān)聯(lián)規(guī)則。規(guī)則1說明職業(yè)是務(wù)農(nóng)且參見農(nóng)村合作醫(yī)療的老年人,養(yǎng)老滿意度較高,其概率為55.6%;規(guī)則2說明和子女同住,且參加農(nóng)村合作醫(yī)療的農(nóng)村老年人,養(yǎng)老滿意度較高;規(guī)則3說明70歲以上務(wù)農(nóng)的農(nóng)村老年人,養(yǎng)老滿意度較高,概率為59.05%;綜合來看,職業(yè)為務(wù)農(nóng),參加農(nóng)村合作醫(yī)療,居住狀況為和子女同住的農(nóng)村老年人,養(yǎng)老滿意度普遍偏高。
后項(xiàng){總體滿意度=2}的關(guān)聯(lián)規(guī)則。規(guī)則6說明和子女同住,職業(yè)為非務(wù)農(nóng),沒有娛樂活動(dòng)的老年人對養(yǎng)老狀況不滿意,其概率為55.19%;規(guī)則7說明年齡在70歲以上,職業(yè)為非務(wù)農(nóng),所在地沒有社會(huì)活動(dòng)的農(nóng)村老年人對養(yǎng)老狀態(tài)不滿意,其概率為57.35%;綜合來看,職業(yè)為非務(wù)農(nóng),未參加農(nóng)村合作醫(yī)療,沒有村集體補(bǔ)貼,居住狀況為獨(dú)居或和配偶居住農(nóng)村老年人養(yǎng)老滿意度較低。從結(jié)果中我們還可以看出,是否參與社會(huì)活動(dòng)和娛樂活動(dòng),也與老年人養(yǎng)老滿意度的高低有很大關(guān)聯(lián)。
從基于GRI算法的關(guān)聯(lián)規(guī)則結(jié)果中可以看出,職業(yè)、年齡、收入水平、居住狀況、農(nóng)村合作醫(yī)療、集體補(bǔ)貼、娛樂活動(dòng)、社會(huì)活動(dòng)、經(jīng)濟(jì)來源等9個(gè)因素均對農(nóng)村老年人的養(yǎng)老滿意度有影響。一般來說,參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低,參加農(nóng)合的老年人養(yǎng)老滿意度較高。雖然目前農(nóng)村居民參保農(nóng)村合作醫(yī)療制度和農(nóng)村醫(yī)療保險(xiǎn)制度的比重在不斷提升,但是還不能覆蓋全部農(nóng)村居民,應(yīng)進(jìn)一步加大農(nóng)村合作醫(yī)療制度的宣傳,尤其是在農(nóng)村老年人中的宣傳,加強(qiáng)和完善農(nóng)村醫(yī)療保障制度的建設(shè),逐步提高農(nóng)村老年人的養(yǎng)老滿意度。
參考文獻(xiàn):
[1] 李放.農(nóng)村老年人養(yǎng)老狀況及其滿意度的實(shí)證研究[J].開發(fā)研究,2010,(1):58-61.
[2] 彭旋子.基于農(nóng)村居民意愿的養(yǎng)老模式選擇研究[D].杭州:浙江農(nóng)業(yè)大學(xué),2010:1-28.
[3] 張巍.黑龍江農(nóng)村社區(qū)養(yǎng)老模式研究[D].西安:陜西師范大學(xué),2012:1-8.
[4] 肖云,劉培森.新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)滿意度影響因素分析[J].經(jīng)濟(jì)體制改革,2011,(5):66-70.
[5] 崔萍.大連農(nóng)村養(yǎng)老模式研究[D].大連:大連理工大學(xué),2010:4-36.
[6] 歐陽彬.基于因子分析的新農(nóng)合農(nóng)戶滿意度研究[J].農(nóng)業(yè)經(jīng)濟(jì),2012,(11):143-146.
[責(zé)任編輯 陳麗敏]endprint
摘 要:基于河北省農(nóng)村老年人養(yǎng)老滿意度進(jìn)行問卷調(diào)查和實(shí)地調(diào)研,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)分析河北省農(nóng)村養(yǎng)老滿意度的影響因素及它們的影響程度,為進(jìn)一步提高河北省農(nóng)村老年人養(yǎng)老滿意度提供參考。在關(guān)聯(lián)規(guī)則挖掘中發(fā)現(xiàn),參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低。
關(guān)鍵詞:養(yǎng)老滿意度;GRI算法;關(guān)聯(lián)規(guī)則
中圖分類號(hào):F840 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2014)10-0049-03
引言
1999年以來,中國正式步入老齡化國家的行列,人口老齡化問題是中國經(jīng)濟(jì)社會(huì)發(fā)展面臨的重大現(xiàn)實(shí)問題之一。人口基數(shù)大、發(fā)展迅速、“未富先老”等是中國老齡化的特點(diǎn)。養(yǎng)老問題是關(guān)系國計(jì)民生的大事,關(guān)系到人民的切身利益,特別是在中國經(jīng)濟(jì)發(fā)展相對落后的農(nóng)村,社會(huì)養(yǎng)老保障制度不完善、農(nóng)民收入水平低下,大量勞動(dòng)力外流,使得在對老年人生活照料、精神慰藉和疾病護(hù)理等方面得不到保障,因此,探討農(nóng)村老年人養(yǎng)老滿意度的影響因素,進(jìn)而提高農(nóng)村老年人的養(yǎng)老滿意度尤其重要。本文在研究大量資料、參考論文相關(guān)實(shí)踐成果的基礎(chǔ)上,以“中國老齡事業(yè)發(fā)展‘十二五規(guī)劃”為指導(dǎo),在調(diào)查研究的基礎(chǔ)上,對調(diào)查數(shù)據(jù)進(jìn)行預(yù)處理和統(tǒng)計(jì)分析,通過關(guān)聯(lián)規(guī)則技術(shù)分析河北省農(nóng)村老年人養(yǎng)老滿意度的影響因素。
一、關(guān)聯(lián)規(guī)則的基本思想
關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),尋找事物之間的聯(lián)系規(guī)律和結(jié)構(gòu)特征,挖掘它們之間的關(guān)聯(lián)關(guān)系。數(shù)據(jù)挖掘中,關(guān)聯(lián)分析的主要技術(shù)是關(guān)聯(lián)規(guī)則,最早由Agrawal、Imielinski和Swami提出。關(guān)聯(lián)規(guī)則挖掘是為了尋找同一事件中不同項(xiàng)之間的相關(guān)性。簡單關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要工具之一,屬于無監(jiān)督學(xué)習(xí)方法,能夠揭示數(shù)據(jù)中隱含的關(guān)聯(lián)特征。
Clementine提供了Apriori、Carma和GRI等經(jīng)典算法。本文用的是GRI算法,算法是由Smyth和Goodman于1992年提出的,是在ITRule算法的基礎(chǔ)上拓展形成的,可用于簡單的關(guān)聯(lián)分析。GRI算法的主要特點(diǎn)是:不但能夠處理分類型變量,而且前項(xiàng)還可以為數(shù)值型變量;數(shù)據(jù)只能按事實(shí)表方式存儲(chǔ);采用深度優(yōu)先搜索策略實(shí)現(xiàn)算法。
二、養(yǎng)老滿意度中關(guān)聯(lián)規(guī)則的應(yīng)用
(一)數(shù)據(jù)準(zhǔn)備
從調(diào)查數(shù)據(jù)的頻數(shù)分析中,我們發(fā)現(xiàn)部分變量的在取某值的頻數(shù)很低,甚至有的變量取值的頻數(shù)為0,為了后續(xù)更好的分析,利用Clementine對變量進(jìn)行篩選。軟件操作實(shí)現(xiàn)過程。其中設(shè)定的條件為:變量中缺失值所占比例大于70%;分類變量中類別值所占比例大于90%;分類變量的類別個(gè)數(shù)占總樣本的比例大于95%的應(yīng)視為不重要變量。指定總體滿意度為輸出變量,其他變量為輸入變量。1-概率p值越高,說明輸入變量與輸出變量的相關(guān)性越強(qiáng),輸入變量越重要。
(二)變量前后項(xiàng)設(shè)定
在建立關(guān)聯(lián)規(guī)則模型之前,首先設(shè)定模型的變量前后項(xiàng),職業(yè)、經(jīng)濟(jì)來源、居住狀況、娛樂活動(dòng)、社會(huì)活動(dòng)、村集體補(bǔ)貼和農(nóng)村合作醫(yī)療等變量均為有限個(gè)值,且各值之間無序,因此定義成標(biāo)稱類型;年齡、月平均收入、文化水平、低保制度和總體滿意度各變量值之間具有一個(gè)隱含的序,因此定義成連續(xù)型數(shù)值類型;同時(shí)指定總體滿意度為關(guān)聯(lián)規(guī)則的后件,其余為關(guān)聯(lián)規(guī)則的前件。
(三)基于GRI算法的關(guān)聯(lián)規(guī)則建模
根據(jù)上述的數(shù)據(jù)預(yù)處理的方法對調(diào)查數(shù)據(jù)進(jìn)行整理,預(yù)處理后的數(shù)據(jù)和篩選出來的變量建立GRI模型實(shí)現(xiàn)挖掘過程。
1.設(shè)定閥值
規(guī)則的支持度和置信度大于用戶設(shè)置的最小支持度和置信度的閾值時(shí)才是一條有效規(guī)則。所以在關(guān)聯(lián)規(guī)則挖掘中需要合理、自行設(shè)置最小支持度和置信度的閾值。因?yàn)檫@些閥值的大小直接決定關(guān)聯(lián)規(guī)則挖掘結(jié)果中規(guī)則的數(shù)量。如果支持度閥值太小,會(huì)生成大量的規(guī)則,并且會(huì)失去代表性,挖掘出的規(guī)則毫無意義。而如果支持度閥值設(shè)置太大,則可能無法找到閥值要求的規(guī)則。但是在軟件操作過程中并沒有明確的依據(jù)確定如何設(shè)置模型的最小支持度閾值和置信度閾值,所以本文在實(shí)際操作中,采用設(shè)置不同最小支持度閾值的方式進(jìn)行反復(fù)挖掘,即進(jìn)行若干次探索性的挖掘。我們在反復(fù)挖掘中最終選擇分析在最小支持度閾值為7%,最小置信度閾值為55%的情況下進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
2.關(guān)聯(lián)規(guī)則結(jié)果分析
因?yàn)橹挥性谔嵘却笥?的時(shí)候才有意義,所以本文從提升度大于1的關(guān)聯(lián)規(guī)則中按照最小支持度進(jìn)行排序,支持度大于7%的條件下,選取部分置信度大于55%的排名靠前且有代表性的規(guī)則,規(guī)則進(jìn)行論述,選出的規(guī)則。
后項(xiàng){總體滿意度=1}的關(guān)聯(lián)規(guī)則。規(guī)則1說明職業(yè)是務(wù)農(nóng)且參見農(nóng)村合作醫(yī)療的老年人,養(yǎng)老滿意度較高,其概率為55.6%;規(guī)則2說明和子女同住,且參加農(nóng)村合作醫(yī)療的農(nóng)村老年人,養(yǎng)老滿意度較高;規(guī)則3說明70歲以上務(wù)農(nóng)的農(nóng)村老年人,養(yǎng)老滿意度較高,概率為59.05%;綜合來看,職業(yè)為務(wù)農(nóng),參加農(nóng)村合作醫(yī)療,居住狀況為和子女同住的農(nóng)村老年人,養(yǎng)老滿意度普遍偏高。
后項(xiàng){總體滿意度=2}的關(guān)聯(lián)規(guī)則。規(guī)則6說明和子女同住,職業(yè)為非務(wù)農(nóng),沒有娛樂活動(dòng)的老年人對養(yǎng)老狀況不滿意,其概率為55.19%;規(guī)則7說明年齡在70歲以上,職業(yè)為非務(wù)農(nóng),所在地沒有社會(huì)活動(dòng)的農(nóng)村老年人對養(yǎng)老狀態(tài)不滿意,其概率為57.35%;綜合來看,職業(yè)為非務(wù)農(nóng),未參加農(nóng)村合作醫(yī)療,沒有村集體補(bǔ)貼,居住狀況為獨(dú)居或和配偶居住農(nóng)村老年人養(yǎng)老滿意度較低。從結(jié)果中我們還可以看出,是否參與社會(huì)活動(dòng)和娛樂活動(dòng),也與老年人養(yǎng)老滿意度的高低有很大關(guān)聯(lián)。
從基于GRI算法的關(guān)聯(lián)規(guī)則結(jié)果中可以看出,職業(yè)、年齡、收入水平、居住狀況、農(nóng)村合作醫(yī)療、集體補(bǔ)貼、娛樂活動(dòng)、社會(huì)活動(dòng)、經(jīng)濟(jì)來源等9個(gè)因素均對農(nóng)村老年人的養(yǎng)老滿意度有影響。一般來說,參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低,參加農(nóng)合的老年人養(yǎng)老滿意度較高。雖然目前農(nóng)村居民參保農(nóng)村合作醫(yī)療制度和農(nóng)村醫(yī)療保險(xiǎn)制度的比重在不斷提升,但是還不能覆蓋全部農(nóng)村居民,應(yīng)進(jìn)一步加大農(nóng)村合作醫(yī)療制度的宣傳,尤其是在農(nóng)村老年人中的宣傳,加強(qiáng)和完善農(nóng)村醫(yī)療保障制度的建設(shè),逐步提高農(nóng)村老年人的養(yǎng)老滿意度。
參考文獻(xiàn):
[1] 李放.農(nóng)村老年人養(yǎng)老狀況及其滿意度的實(shí)證研究[J].開發(fā)研究,2010,(1):58-61.
[2] 彭旋子.基于農(nóng)村居民意愿的養(yǎng)老模式選擇研究[D].杭州:浙江農(nóng)業(yè)大學(xué),2010:1-28.
[3] 張巍.黑龍江農(nóng)村社區(qū)養(yǎng)老模式研究[D].西安:陜西師范大學(xué),2012:1-8.
[4] 肖云,劉培森.新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)滿意度影響因素分析[J].經(jīng)濟(jì)體制改革,2011,(5):66-70.
[5] 崔萍.大連農(nóng)村養(yǎng)老模式研究[D].大連:大連理工大學(xué),2010:4-36.
[6] 歐陽彬.基于因子分析的新農(nóng)合農(nóng)戶滿意度研究[J].農(nóng)業(yè)經(jīng)濟(jì),2012,(11):143-146.
[責(zé)任編輯 陳麗敏]endprint
摘 要:基于河北省農(nóng)村老年人養(yǎng)老滿意度進(jìn)行問卷調(diào)查和實(shí)地調(diào)研,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)分析河北省農(nóng)村養(yǎng)老滿意度的影響因素及它們的影響程度,為進(jìn)一步提高河北省農(nóng)村老年人養(yǎng)老滿意度提供參考。在關(guān)聯(lián)規(guī)則挖掘中發(fā)現(xiàn),參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低。
關(guān)鍵詞:養(yǎng)老滿意度;GRI算法;關(guān)聯(lián)規(guī)則
中圖分類號(hào):F840 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-291X(2014)10-0049-03
引言
1999年以來,中國正式步入老齡化國家的行列,人口老齡化問題是中國經(jīng)濟(jì)社會(huì)發(fā)展面臨的重大現(xiàn)實(shí)問題之一。人口基數(shù)大、發(fā)展迅速、“未富先老”等是中國老齡化的特點(diǎn)。養(yǎng)老問題是關(guān)系國計(jì)民生的大事,關(guān)系到人民的切身利益,特別是在中國經(jīng)濟(jì)發(fā)展相對落后的農(nóng)村,社會(huì)養(yǎng)老保障制度不完善、農(nóng)民收入水平低下,大量勞動(dòng)力外流,使得在對老年人生活照料、精神慰藉和疾病護(hù)理等方面得不到保障,因此,探討農(nóng)村老年人養(yǎng)老滿意度的影響因素,進(jìn)而提高農(nóng)村老年人的養(yǎng)老滿意度尤其重要。本文在研究大量資料、參考論文相關(guān)實(shí)踐成果的基礎(chǔ)上,以“中國老齡事業(yè)發(fā)展‘十二五規(guī)劃”為指導(dǎo),在調(diào)查研究的基礎(chǔ)上,對調(diào)查數(shù)據(jù)進(jìn)行預(yù)處理和統(tǒng)計(jì)分析,通過關(guān)聯(lián)規(guī)則技術(shù)分析河北省農(nóng)村老年人養(yǎng)老滿意度的影響因素。
一、關(guān)聯(lián)規(guī)則的基本思想
關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng),尋找事物之間的聯(lián)系規(guī)律和結(jié)構(gòu)特征,挖掘它們之間的關(guān)聯(lián)關(guān)系。數(shù)據(jù)挖掘中,關(guān)聯(lián)分析的主要技術(shù)是關(guān)聯(lián)規(guī)則,最早由Agrawal、Imielinski和Swami提出。關(guān)聯(lián)規(guī)則挖掘是為了尋找同一事件中不同項(xiàng)之間的相關(guān)性。簡單關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要工具之一,屬于無監(jiān)督學(xué)習(xí)方法,能夠揭示數(shù)據(jù)中隱含的關(guān)聯(lián)特征。
Clementine提供了Apriori、Carma和GRI等經(jīng)典算法。本文用的是GRI算法,算法是由Smyth和Goodman于1992年提出的,是在ITRule算法的基礎(chǔ)上拓展形成的,可用于簡單的關(guān)聯(lián)分析。GRI算法的主要特點(diǎn)是:不但能夠處理分類型變量,而且前項(xiàng)還可以為數(shù)值型變量;數(shù)據(jù)只能按事實(shí)表方式存儲(chǔ);采用深度優(yōu)先搜索策略實(shí)現(xiàn)算法。
二、養(yǎng)老滿意度中關(guān)聯(lián)規(guī)則的應(yīng)用
(一)數(shù)據(jù)準(zhǔn)備
從調(diào)查數(shù)據(jù)的頻數(shù)分析中,我們發(fā)現(xiàn)部分變量的在取某值的頻數(shù)很低,甚至有的變量取值的頻數(shù)為0,為了后續(xù)更好的分析,利用Clementine對變量進(jìn)行篩選。軟件操作實(shí)現(xiàn)過程。其中設(shè)定的條件為:變量中缺失值所占比例大于70%;分類變量中類別值所占比例大于90%;分類變量的類別個(gè)數(shù)占總樣本的比例大于95%的應(yīng)視為不重要變量。指定總體滿意度為輸出變量,其他變量為輸入變量。1-概率p值越高,說明輸入變量與輸出變量的相關(guān)性越強(qiáng),輸入變量越重要。
(二)變量前后項(xiàng)設(shè)定
在建立關(guān)聯(lián)規(guī)則模型之前,首先設(shè)定模型的變量前后項(xiàng),職業(yè)、經(jīng)濟(jì)來源、居住狀況、娛樂活動(dòng)、社會(huì)活動(dòng)、村集體補(bǔ)貼和農(nóng)村合作醫(yī)療等變量均為有限個(gè)值,且各值之間無序,因此定義成標(biāo)稱類型;年齡、月平均收入、文化水平、低保制度和總體滿意度各變量值之間具有一個(gè)隱含的序,因此定義成連續(xù)型數(shù)值類型;同時(shí)指定總體滿意度為關(guān)聯(lián)規(guī)則的后件,其余為關(guān)聯(lián)規(guī)則的前件。
(三)基于GRI算法的關(guān)聯(lián)規(guī)則建模
根據(jù)上述的數(shù)據(jù)預(yù)處理的方法對調(diào)查數(shù)據(jù)進(jìn)行整理,預(yù)處理后的數(shù)據(jù)和篩選出來的變量建立GRI模型實(shí)現(xiàn)挖掘過程。
1.設(shè)定閥值
規(guī)則的支持度和置信度大于用戶設(shè)置的最小支持度和置信度的閾值時(shí)才是一條有效規(guī)則。所以在關(guān)聯(lián)規(guī)則挖掘中需要合理、自行設(shè)置最小支持度和置信度的閾值。因?yàn)檫@些閥值的大小直接決定關(guān)聯(lián)規(guī)則挖掘結(jié)果中規(guī)則的數(shù)量。如果支持度閥值太小,會(huì)生成大量的規(guī)則,并且會(huì)失去代表性,挖掘出的規(guī)則毫無意義。而如果支持度閥值設(shè)置太大,則可能無法找到閥值要求的規(guī)則。但是在軟件操作過程中并沒有明確的依據(jù)確定如何設(shè)置模型的最小支持度閾值和置信度閾值,所以本文在實(shí)際操作中,采用設(shè)置不同最小支持度閾值的方式進(jìn)行反復(fù)挖掘,即進(jìn)行若干次探索性的挖掘。我們在反復(fù)挖掘中最終選擇分析在最小支持度閾值為7%,最小置信度閾值為55%的情況下進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
2.關(guān)聯(lián)規(guī)則結(jié)果分析
因?yàn)橹挥性谔嵘却笥?的時(shí)候才有意義,所以本文從提升度大于1的關(guān)聯(lián)規(guī)則中按照最小支持度進(jìn)行排序,支持度大于7%的條件下,選取部分置信度大于55%的排名靠前且有代表性的規(guī)則,規(guī)則進(jìn)行論述,選出的規(guī)則。
后項(xiàng){總體滿意度=1}的關(guān)聯(lián)規(guī)則。規(guī)則1說明職業(yè)是務(wù)農(nóng)且參見農(nóng)村合作醫(yī)療的老年人,養(yǎng)老滿意度較高,其概率為55.6%;規(guī)則2說明和子女同住,且參加農(nóng)村合作醫(yī)療的農(nóng)村老年人,養(yǎng)老滿意度較高;規(guī)則3說明70歲以上務(wù)農(nóng)的農(nóng)村老年人,養(yǎng)老滿意度較高,概率為59.05%;綜合來看,職業(yè)為務(wù)農(nóng),參加農(nóng)村合作醫(yī)療,居住狀況為和子女同住的農(nóng)村老年人,養(yǎng)老滿意度普遍偏高。
后項(xiàng){總體滿意度=2}的關(guān)聯(lián)規(guī)則。規(guī)則6說明和子女同住,職業(yè)為非務(wù)農(nóng),沒有娛樂活動(dòng)的老年人對養(yǎng)老狀況不滿意,其概率為55.19%;規(guī)則7說明年齡在70歲以上,職業(yè)為非務(wù)農(nóng),所在地沒有社會(huì)活動(dòng)的農(nóng)村老年人對養(yǎng)老狀態(tài)不滿意,其概率為57.35%;綜合來看,職業(yè)為非務(wù)農(nóng),未參加農(nóng)村合作醫(yī)療,沒有村集體補(bǔ)貼,居住狀況為獨(dú)居或和配偶居住農(nóng)村老年人養(yǎng)老滿意度較低。從結(jié)果中我們還可以看出,是否參與社會(huì)活動(dòng)和娛樂活動(dòng),也與老年人養(yǎng)老滿意度的高低有很大關(guān)聯(lián)。
從基于GRI算法的關(guān)聯(lián)規(guī)則結(jié)果中可以看出,職業(yè)、年齡、收入水平、居住狀況、農(nóng)村合作醫(yī)療、集體補(bǔ)貼、娛樂活動(dòng)、社會(huì)活動(dòng)、經(jīng)濟(jì)來源等9個(gè)因素均對農(nóng)村老年人的養(yǎng)老滿意度有影響。一般來說,參加農(nóng)村合作醫(yī)療,有村集體補(bǔ)貼,職業(yè)為務(wù)農(nóng)的老年人的養(yǎng)老滿意度較高;與子女同住老年人的養(yǎng)老滿意度較高;未參加農(nóng)村合作醫(yī)療,職業(yè)為非務(wù)農(nóng)的老年人養(yǎng)老滿意度較低,參加農(nóng)合的老年人養(yǎng)老滿意度較高。雖然目前農(nóng)村居民參保農(nóng)村合作醫(yī)療制度和農(nóng)村醫(yī)療保險(xiǎn)制度的比重在不斷提升,但是還不能覆蓋全部農(nóng)村居民,應(yīng)進(jìn)一步加大農(nóng)村合作醫(yī)療制度的宣傳,尤其是在農(nóng)村老年人中的宣傳,加強(qiáng)和完善農(nóng)村醫(yī)療保障制度的建設(shè),逐步提高農(nóng)村老年人的養(yǎng)老滿意度。
參考文獻(xiàn):
[1] 李放.農(nóng)村老年人養(yǎng)老狀況及其滿意度的實(shí)證研究[J].開發(fā)研究,2010,(1):58-61.
[2] 彭旋子.基于農(nóng)村居民意愿的養(yǎng)老模式選擇研究[D].杭州:浙江農(nóng)業(yè)大學(xué),2010:1-28.
[3] 張巍.黑龍江農(nóng)村社區(qū)養(yǎng)老模式研究[D].西安:陜西師范大學(xué),2012:1-8.
[4] 肖云,劉培森.新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)滿意度影響因素分析[J].經(jīng)濟(jì)體制改革,2011,(5):66-70.
[5] 崔萍.大連農(nóng)村養(yǎng)老模式研究[D].大連:大連理工大學(xué),2010:4-36.
[6] 歐陽彬.基于因子分析的新農(nóng)合農(nóng)戶滿意度研究[J].農(nóng)業(yè)經(jīng)濟(jì),2012,(11):143-146.
[責(zé)任編輯 陳麗敏]endprint