国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

居民持有商業(yè)養(yǎng)老保險的影響因素分析

2022-07-27 04:02劉桂紅范洺源
三明學院學報 2022年3期
關鍵詞:決策樹養(yǎng)老保險商業(yè)

劉桂紅,陳 皓,管 強,范洺源

(三明學院,福建 三明 365004)

隨著經(jīng)濟的發(fā)展,我國居民對自身養(yǎng)老、醫(yī)療等社會保障方面產(chǎn)生了更多需求,對政府而言是新的挑戰(zhàn)[1]。在發(fā)達國家,保險行業(yè)一直作為保障民生的重要方式之一,同時在促進經(jīng)濟發(fā)展、維護社會穩(wěn)定、保障居民生活質量方面受到人們的廣泛認可。我國養(yǎng)老保障體系是由政府主管的社會基本養(yǎng)老保險、企業(yè)提供的退休養(yǎng)老福利與保險公司提供的商業(yè)養(yǎng)老保險組成。政府主管的社會基本養(yǎng)老保險是相關立法機構通過制定相關法律法規(guī),為了全體中國居民能夠在達到一定年齡后有一定的生活保障,強制性要求全體居民參與的保險。企業(yè)提供的退休養(yǎng)老福利是在市場上部分業(yè)績突出的公司為其員工額外提供的福利。保險公司提供的商業(yè)養(yǎng)老保險是由居民根據(jù)其自身的生活條件與對未來的期望自愿購買的保險,能夠在一定程度上滿足居民對高質量的養(yǎng)老水平的期待,但同時也要在合同規(guī)定的時間內(nèi)付出一定的費用作為交換。

目前我國所面臨的人口老齡化的壓力不斷加劇,而絕大部分居民仍主要以基本養(yǎng)老保險作為養(yǎng)老保障。政府限于財力基礎,并不能完全提供高水平的養(yǎng)老方式來確保老年人的生活質量[2]。社會養(yǎng)老負擔已成為我國不可忽視的嚴重問題,為此如何緩解此問題已迫在眉睫。商業(yè)養(yǎng)老保險能夠彌補個人消費的不理性,適度減緩消費短視,為年老時做好未雨綢繆的準備,是社會基本養(yǎng)老保險的重要補充。盡管目前我國對養(yǎng)老保險的需求空間不斷增長,且國家出臺相關政策促進保險行業(yè)的發(fā)展,但在中國家庭中的商業(yè)養(yǎng)老保險實際擁有率并不高。這與我國居民對商業(yè)養(yǎng)老保險認識不足,沒有正確認識到保險的積極作用有一定關系。因此了解哪些因素影響人們購買商業(yè)養(yǎng)老保險非常重要。

1 文獻回顧

已有的研究文獻中,關于壽險和基本養(yǎng)老保險影響因素的研究相對較為豐富。穆懷中等[3]從居民特點與相關政策方面對彰武縣農(nóng)民參加新農(nóng)保的相關影響因素進行分析。夏夢[4]通過發(fā)放問卷收集湖北省居民對參與社會養(yǎng)老保險的相關數(shù)據(jù),發(fā)現(xiàn)最重要的影響因素為居民的教育背景與家庭的經(jīng)濟水平。李紅芝[5]收集了武漢城鎮(zhèn)居民的相關樣本數(shù)據(jù),得出其教育程度、年紀、經(jīng)濟狀況等對是否持有基本養(yǎng)老保險有顯著的影響。王武林[1]通過相關調查分析,發(fā)現(xiàn)我國老年人養(yǎng)老意愿發(fā)生變化,主要受到性別、年齡、城鄉(xiāng)等相關因素影響,相比較以前更加希望通過社會養(yǎng)老保險養(yǎng)老,對子女養(yǎng)老的依賴程度降低。張曉宇[6]選取經(jīng)濟發(fā)展水平、老年人口撫養(yǎng)比、政府在社會保障和就業(yè)方面的公共財政支出、物價水平、城市化水平五個指標作為社會保險影響因素,對各區(qū)域社會保險影響因素進行實證比較研究。都閃閃[7]針對城鄉(xiāng)居民社會養(yǎng)老保險制度實施中存在的參保居民繳費水平低的問題,基于河南省某地級市近500戶居民的入戶調研數(shù)據(jù),利用Logistic回歸模型對城鄉(xiāng)居民基本養(yǎng)老保險參保繳費的影響因素進行了實證分析。王鑫鑫等[8]利用2017年中國鄉(xiāng)城人口流動調查數(shù)據(jù),實證分析了家庭養(yǎng)育負擔對流動人口中面臨養(yǎng)老和育兒雙重壓力的"三明治階層"養(yǎng)老保險支付意愿和參保行為的影響,并探究了造成兩者悖離的因素。段小萍等[9]研究表明我國城鄉(xiāng)居民養(yǎng)老保險的財務可持續(xù)性較低且存在區(qū)域差異。

隨著商業(yè)養(yǎng)老保險的發(fā)展,近年來關于商業(yè)養(yǎng)老保險的影響因素分析研究成為熱點。陳其芳[10]運用Probit模型對農(nóng)村居民購買商業(yè)養(yǎng)老保險意愿的影響因素進行實證分析,結果表明:目前我國有超半數(shù)以上的農(nóng)村居民不愿意購買商業(yè)養(yǎng)老保險。張強等[11]使用中國綜合社會調查項目2013年的調查數(shù)據(jù),發(fā)現(xiàn)教育程度、個體所處的經(jīng)濟發(fā)展水平環(huán)境等都能夠對商業(yè)養(yǎng)老保險參保行為產(chǎn)生顯著影響,但是在選取影響變量時,是主觀的先選定,這會導致部分重要影響變量漏掉。商航[12]根據(jù)中信保誠保險公司數(shù)據(jù)分析,得出對商業(yè)養(yǎng)老保險參保影響明顯的因素包括:健康、收入、對商業(yè)養(yǎng)老保險的認知、保障滿意度以及服務滿意度。袁雪梅等[13]依據(jù)各地區(qū)的經(jīng)濟發(fā)展水平,劃分為四類地區(qū)分別開展研究,通過實證分析,將影響居民持有商業(yè)養(yǎng)老保險的影響因素劃分為三個層次。王永飛[14]先定性分析了我國居民商業(yè)養(yǎng)老保險需求的影響因素,后運用中國綜合社會調查(2015)和中國保險年鑒(2016)的數(shù)據(jù),構建Logistic模型對我國居民商業(yè)養(yǎng)老保險需求的影響因素進行實證分析,但是只針對具體某些因素(經(jīng)濟、社會、個人、家庭因素)進行實證分析,沒有對影響商業(yè)養(yǎng)老保險需求的因素進行全面的分析。董艷華[15]設計問卷(個人、家庭、社會、供給因素)對133位天津居民關于商業(yè)養(yǎng)老保險需求影響進行調查分析,論述了各個因素是否對商業(yè)養(yǎng)老保險需求產(chǎn)生顯著影響。王娟等[16]總結歸納了影響居民購買商業(yè)養(yǎng)老保險的因素,但沒有做定量分析。鄒龍等[17]通過對湖南省有典型代表的10個縣市1000戶農(nóng)村居民進行走訪調查,采用多元線性回歸模型對問卷數(shù)據(jù)進行定性分析,分析影響因素與購買意愿的顯著性與相關性,并對湖南農(nóng)村地區(qū)今后發(fā)展商業(yè)養(yǎng)老保險提出建議。周林毅等[18]設計問卷(人口特征,社會特征,家庭特征)對福建省南平市太平人壽保險公司340位客戶關于商業(yè)養(yǎng)老保險購買進行調查分析,但是客戶群體是一家保險公司,有一定的局限性。郭天秀等[19]基于2015年中國社會綜合性調查(CGSS)數(shù)據(jù),選取個人特征、家庭特征、參保情況、社會保障4個指標,通過構建Logistic回歸模型,分析中國東、中、西地區(qū)之間影響農(nóng)村居民參加商業(yè)性養(yǎng)老保險行為的因素。張佳馨[20]主要研究了家庭收入結構因素對商業(yè)養(yǎng)老保險需求的影響,研究因素比較單一。馬鈺瑩[21]設計問卷(個人特征、家庭特征、認知特征、供給特征、外部特征)對山東煙臺435位農(nóng)村居民關于商業(yè)養(yǎng)老保險參與度進行調查分析,并提出針對性的對策建議,以推動商業(yè)養(yǎng)老保險在農(nóng)村的發(fā)展,解決日益嚴重的養(yǎng)老問題。周林毅等[22]設計問卷(12個商業(yè)養(yǎng)老保險影響因素)對福建省寧德市農(nóng)村669位是否購買商業(yè)養(yǎng)老保險進行調查分析,并提出相應建議。李龍隆等[23]設計問卷(14個商業(yè)養(yǎng)老保險影響因素)對靈活就業(yè)人員進行調查,獲得150組有效樣本數(shù)據(jù),利用因子分析和多元回歸法論證各因素是否顯著影響靈活就業(yè)人員購買商業(yè)養(yǎng)老保險。

總之已有商業(yè)養(yǎng)老保險影響因素研究主要有以下特點:第一:針對某些特定群體(農(nóng)村居民[10,17,19,22]),靈活就業(yè)人員(李龍隆等[23]),保險公司客戶[12,18]或特定地區(qū)天津市[15],南平市[18],煙臺市[21]展開,其結果往往不具有普遍性。第二:商業(yè)養(yǎng)老保險影響因素在研究前基本上是預先確定,這存在一定的主觀性(特別是自主設計問卷調查分析[15,17-18,21-23]),只是不同的文獻假設影響因素不同,通過不同方法去論證是否有影響。預先確定影響因素雖然便于分析,但是很有可能漏掉重要影響因素。第三:多數(shù)研究樣本量不夠大[18,21,23],對于具有10幾個影響因素的分析,由于各個因素具有相互作用,要使得各個因素組合下都具有可觀察數(shù)據(jù),往往需要較大樣本量,樣本量不大時其結果可信度會降低。第四:已有研究基本回答了那些影響因素是否顯著影響商業(yè)養(yǎng)老保險購買,但是沒有進一步指出這些顯著性影響因素是否具有不同的重要性程度。

針對這些不足,本文從全國范圍內(nèi)對我國居民持有商業(yè)養(yǎng)老保險的影響變量進行分析,使得研究結果更具有普遍性。本文沒有預先假設有哪些主要影響因素,而是構建Lasso-Lars的居民持有商業(yè)養(yǎng)老保險影響因素篩選模型對上百個可能影響變量進行篩選降維,確定主要影響因素,以避免漏掉重要影響因素(比如本文發(fā)現(xiàn)旅游支出因素是影響居民持有商業(yè)養(yǎng)老保險的重要指標,與以往文獻有明現(xiàn)區(qū)別)。采用樣本覆蓋了全國的29個省份(包括自治區(qū)、直轄市,不含新疆、西藏、港澳臺),353個縣(區(qū)、縣級市),1373個村(居)委會,樣本量達37289個,樣本量充足全面,使得結果更加可信。利用Logistic模型和ID3(Iterative Dichotomiser 3)決策法兩種方法對篩選出來的主要影響因素進行定量化對比論證分析,不僅回答了哪些影響因素是否顯著影響商業(yè)養(yǎng)老保險購買,而且確定了各個顯著性影響因素的重要性程度,這更加充分揭示商業(yè)養(yǎng)老保險影響因素的相互關系。因此本文研究結果具有較好的普遍性和可信性,能比較全面地揭示商業(yè)養(yǎng)老保險的影響因素,這不管從理論上和實際上都具有重要意義。

2 構建居民持有商業(yè)養(yǎng)老保險的影響因素分析模型

2.1 構建Lasso-Lars的居民持有商業(yè)養(yǎng)老保險的影響因素篩選模型

由于影響居民是否持有商業(yè)養(yǎng)老保險的因素極多,可能達到上百個,而其中起到較大或者決定性作用的影響因素是小部分。如果對上百個影響變量直接分析,則不能抓住問題本質。因此需要對多個影響變量進行篩選降維。而Lasso-Lars模型[24]適用于高維度空間中的變量篩選,能夠有效地把關系不大的變量去除,保留相關程度較大的變量。因此采用基于Lasso-Lars模型對居民持有商業(yè)養(yǎng)老保險的影響因素進行篩選。

假設居民商業(yè)養(yǎng)老保險的樣本集合為

λ為人工給定的常數(shù)。當λ從∞變化到0的過程中,能夠產(chǎn)生一個變量選擇序列β。β是Xi的各個維度對應的系數(shù)值,其系數(shù)值越大,可以認為此屬性的重要性程度越高。根據(jù)中的分量的取值大小對商業(yè)養(yǎng)老保險影響因素進行篩選。

2.2 構建Logistic回歸的居民持有商業(yè)養(yǎng)老保險的影響因素重要性程度模型

對居民持有商業(yè)養(yǎng)老保險進行分析時,可以假設認為居民是否持有商業(yè)養(yǎng)老保險服從二項分布,依據(jù)廣義線性模型,其對應的為 Logistic 模型[3]。 對于商業(yè)養(yǎng)老保險數(shù)據(jù)集 T={(X1,y1),…,(Xn,yn)},設pi=p(yi=1|Xi),則Logistic回歸模型為:

其中,pi表示第i個居民持有商業(yè)養(yǎng)老保險的概率,輸出值處于[0,1],1-pi表示第i個居民不持有商業(yè)養(yǎng)老保險的概率;ε表示隨機項,ω表示居民參加商業(yè)養(yǎng)老保險相關因素的回歸系數(shù),ω為p維向量,是Xi的各個維度對應的系數(shù)值,反映該因素對居民參與商業(yè)養(yǎng)老保險的作用方向和程度。如果該系數(shù)為正,說明該因素有利于居民持有商業(yè)養(yǎng)老保險,且該因素的取值越大,說明作用的效果越明顯,反之亦然。使用極大似然估計法求解ω,采用相關最優(yōu)化方法使似然函數(shù)l(ω)取值最大,其中l(wèi)(ω)公式如式(3):

2.3 構建ID3決策樹模型的居民持有商業(yè)養(yǎng)老保險的影響因素重要性程度模型

決策樹是一種從人的決策過程中受到啟發(fā)而發(fā)明的一種樹形結構,這恰好是人類在面臨是否購買商業(yè)養(yǎng)老保險時的一種自然而然的處理機制。圖1為一個具有4個非葉子節(jié)點、6個葉子結點的簡單決策樹的示意圖。其中圓形的節(jié)點代表非葉子節(jié)點,方框形狀代表葉子結點。樣本分類的時候將從根節(jié)點出發(fā),根據(jù)是否滿足內(nèi)部節(jié)點的要求而劃分到不同的內(nèi)部節(jié)點,直到劃分到葉節(jié)點結束。本文中內(nèi)部節(jié)點是該居民持有商業(yè)養(yǎng)老保險的影響因素,葉子節(jié)點代表該居民是否持有商業(yè)養(yǎng)老保險。

圖1 決策樹示意圖

ID3決策樹模型[25]使用選擇其最優(yōu)特征的原則是根據(jù)不同特征的信息增益大小做判斷,選擇信息增益最大的特征做劃分。信息增益是度量某個特征對數(shù)據(jù)集分類確定性的程度。ID3決策樹模型構建的核心是各個商業(yè)養(yǎng)老保險影響因素的信息增益的計算。對于第個商業(yè)養(yǎng)老保險影響因素的信息增益的公式為表示第j個商業(yè)養(yǎng)老保險影響因素的熵,kj為該商業(yè)養(yǎng)老保險數(shù)據(jù)集T中第j個維度的不同取值個數(shù),例如若第j個維度為性別,其不同取值的個數(shù)為2。p'ij為第j個維度的第i個取值在所有養(yǎng)老保險樣本中的占比。

表示在數(shù)據(jù)集 T={(X1,y1),…,(Xn,yn)}分類情況下關于第 j個商業(yè)養(yǎng)老保險影響因素的條件熵。 pij為特征Aj取值為ai的實例個數(shù)與總實例個數(shù)的占比E(T|Aj=ai),表示在已知實例的特征Aj取值為ai條件之下,其數(shù)據(jù)子集的信息熵。

商業(yè)養(yǎng)老保險影響因素的信息增益值越大,說明該商業(yè)養(yǎng)老保險影響因素越為重要,因此根據(jù)增益值確定居民持有商業(yè)養(yǎng)老保險的影響因素重要性程度。

3 居民持有商業(yè)養(yǎng)老保險影響因素的實證研究

居民持有商業(yè)養(yǎng)老保險數(shù)據(jù)來源于西南財經(jīng)大學開展的全國范圍內(nèi)的中國家庭金融調查(China Household Finance Survey,CHFS)[26-27]。CHFS對37289戶家庭參與調查訪問,全面覆蓋了全國的29 個省份(包括自治區(qū)、直轄市,不含新疆、西藏、港澳臺),353 個縣(區(qū)、縣級市),1373 個村(居)委會。該數(shù)據(jù)具有數(shù)據(jù)質量高、樣本量大、代表性強等特點。該數(shù)據(jù)全面客觀地反映了當時我國家庭金融的基本狀況,這為本文的研究提供了有力的支持。

3.1 商業(yè)養(yǎng)老保險數(shù)據(jù)預處理過程

初始得到的商業(yè)養(yǎng)老保險數(shù)據(jù)主要包含兩個問題:其一,樣本數(shù)據(jù)的格式不符合第二節(jié)中模型的輸入數(shù)據(jù)的格式要求;其二,數(shù)據(jù)沒有進行適當?shù)霓D化與處理以增強模型的解釋。

1)變量選取與命名

影響因素的命名與CHFS問卷命名規(guī)則相同,表1列出因變量為受訪者是否持有商業(yè)養(yǎng)老保險和部分自變量相關影響因素。

表1 影響因素變量命名

2)數(shù)據(jù)預處理

對數(shù)據(jù)處理工作主要包括確定影響變量的數(shù)據(jù)樣本、含有缺失值的樣本處理、對數(shù)值型數(shù)據(jù)進行最小最大標準化處理、分類型變量進行啞變量編碼四個步驟。

(1)確定有效數(shù)據(jù)。確定所需影響變量的數(shù)據(jù),刪除無關變量數(shù)據(jù)。

(2)缺失值處理。將含有缺失值的樣本進行技術填補。CHFS有效數(shù)據(jù)樣本有133183個,不含任何缺失數(shù)據(jù)的樣本只有43017個。如果直接忽略部分缺失數(shù)據(jù)樣本進行分析,則樣本信息不能充分挖掘,導致模型估計的結果有所偏差。本文主要采用k近鄰填補算法[28-29],對數(shù)據(jù)缺失值進行填補,其核心思想是利用最鄰近缺失數(shù)據(jù)的k個無缺失數(shù)據(jù)樣本去估計缺失數(shù)據(jù)。

(3)歸一化。對數(shù)值型變量進行最小最大歸一化處理,消除量綱的影響。最小最大歸一化即對每一個變量的每一個數(shù)值,減去該變量的最小值,并除以該變量的最大值減去最小值,見公式(5):

(4)啞變量編碼。對分類型變量進行啞變量編碼,以增強模型的解釋和預測能力。比如分類變量有小學、中學、大學、碩士、博士5種類別,則用啞變量編碼為(1,0,0,0)表示小學,(0,1,0,0)表示中學,(0,0,1,0)表示大學,(0,0,0,1)表示碩士,(0,0,0,0)表示博士。經(jīng)過填充缺失值后的養(yǎng)老保險的數(shù)據(jù)集樣本共有133183個,有變量(數(shù)值型和啞變量)101個。

3.2 基于Lasso-Lars算法的居民持有商業(yè)養(yǎng)老保險影響因素的篩選過程

對處理后的數(shù)據(jù)利用Python中sklearn庫中的Lasso-Lars算法進行回歸擬合,得到各個變量的系數(shù),其系數(shù)的絕對值大小代表著該變量的重要性程度。在回歸結果中,共計有變量101個,其中45個變量的系數(shù)不為0,17個變量的系數(shù)顯著大于0(其絕對值的取值大于0.01),56個變量系數(shù)為0,具體結果見表2。排除系數(shù)為0以及系數(shù)過小的變量,選取其系數(shù)絕對值最大的10個變量,得到的十個重要影響變量即g1018,k1101,d7102_1,g1019,a2005,g1001,a4002a_2,a2012_9,a2001_7,a2012_4。

表2 填補缺失值后的Lasso-Lars回歸結果系數(shù)表

續(xù)表2

3.3 基于Logistic模型的居民持有商業(yè)養(yǎng)老保險影響因素的重要程度實證分析

在總計133183樣本中,正負樣本極度不平衡(持有商業(yè)養(yǎng)老保險的作為正例樣本),其中正例樣本只有5000個左右,其余皆為負例樣本。為了保證正負樣本比例接近1∶1,對負例樣本進行欠采樣,隨機不放回抽樣抽取共5000個樣本,最后樣本共10000個。利用Python中statsmodels庫中的廣義線性模型對上面第三節(jié)第2部分篩選出來的十個重要影響變量進行關于居民是否持有商業(yè)養(yǎng)老保險變量的Logistic回歸分析。結果見表3??梢钥闯瞿P偷母鱾€系數(shù)均通過了t檢驗,說明模型擬合良好。

表3 填補缺失值后的Logistic模型回歸參數(shù)

Logistic回歸結果分析:

表3各變量系數(shù)是正的說明對持有商業(yè)養(yǎng)老保險起正面影響,系數(shù)是負的說明對持有商業(yè)養(yǎng)老保險起負面影響。變量旅游支出(g1018)的系數(shù)為6.6389,在所有變量中具有最大的影響權重,說明當居民的旅游支出越高,持有商業(yè)養(yǎng)老保險的概率就越大。發(fā)現(xiàn)旅游支出對是否持有商業(yè)養(yǎng)老保險影響最大,與當前研究結果[14-16]有明顯區(qū)別。是否持有商業(yè)養(yǎng)老保險,除了客觀條件外(如收入),主要還受居民消費傾向有關系。旅游支出越高,說明消費觀念靈活,對持有商業(yè)養(yǎng)老保險的接受度傾向高,它可以作為一個地區(qū)持有商業(yè)養(yǎng)老保險高低的重要指標。 變量持有現(xiàn)金(k1101)的系數(shù)為6.5274,在所有變量中權重排第二,說明當居民持有現(xiàn)金越多時,會增加持有商業(yè)養(yǎng)老保險的概率。說明可支配收入是關鍵,持有商業(yè)養(yǎng)老保險需要較好的經(jīng)濟基礎。這與其他研究結論[14-16]類似。變量伙食費(g1001)的系數(shù)為2.0107,在所有變量中權重排第三,說明當家庭伙食費越多,能夠增加持有商業(yè)養(yǎng)老保險的概率。愿意在家庭伙食費上投入較多,說明家庭對生活質量追求高,較大概率愿意在商業(yè)養(yǎng)老保險投入以滿足退休生活需求。是否擁有銀行理財產(chǎn)品 (d7102_1),文化程度 (高中)(a2012_9),經(jīng)濟、金融信息是否關注(a4002a_2)和文化程度(博士)(a2012_4)的系數(shù)都小于1,相對前三個重要影響變量的系數(shù)都比較小。說明是否擁有銀行理財產(chǎn)品,文化程度(高中),經(jīng)濟、金融信息是否關注,文化程度(博士)會正面影響持有商業(yè)養(yǎng)老保險的高低,但不是主要核心因素。而變量醫(yī)療、保健支出(g1019)的系數(shù)為-4.1995,在所有變量系數(shù)中負的權重最大,說明當居民對醫(yī)療保健支出越多時,持有商業(yè)養(yǎng)老保險的概率越低。這主要是因為居民注重近期見效行為,愿意投入醫(yī)療保健,而不愿意投入遠期保障行為。變量是否未婚(a2001_7)的系數(shù)為-1.5947,在所有變量系數(shù)中負的權重第二,說明當居民未婚時,會減少持有商業(yè)養(yǎng)老保險的概率。未婚人士家庭責任和保障意識不夠強,或者認為持有商業(yè)養(yǎng)老保險沒有必要。變量年齡(a2005)的系數(shù)為-0.9567,在所有變量系數(shù)中負的權重最小,說明當居民年齡越大時,會增加持有商業(yè)養(yǎng)老保險的概率,但不是主要影響因素。

總的來說,旅游支出、持有現(xiàn)金和伙食費越多,居民持有商業(yè)養(yǎng)老保險的比例就越高;而醫(yī)療、保健支出越多,居民持有商業(yè)養(yǎng)老保險的比例就越低。這四個因素是影響居民持有商業(yè)養(yǎng)老保險的最主要因素。文化程度水平、對我國經(jīng)濟與金融的參與程度因素雖對持有商業(yè)養(yǎng)老保險有影響,但不是最主要因素。影響居民是否持有商業(yè)養(yǎng)老保險可以歸為兩大方面,即可支配收入(持有現(xiàn)金),居民消費習慣(旅游支出,伙食費,醫(yī)療、保健支出)。

3.4 基于ID3決策樹模型的居民持有商業(yè)養(yǎng)老保險的影響因素實證分析

延續(xù)使用第三節(jié)第1部分使用的變量與數(shù)據(jù),類似第三節(jié)第3部分處理好樣本數(shù)據(jù),利用Python中sklearn庫中的ID3決策樹算法進行模型擬合,結果見圖2。模型的預測精度為92.13% ,說明ID3模型效果良好。由ID3決策樹模型得到的各個變量的相對重要性程度與比較見表4。

圖2 填補缺失值后的決策樹

表4 ID3模型的變量重要性

ID3決策樹結果分析:

通過ID3決策樹模型獲得變量年齡(a2005)的系數(shù)為0.336,旅游支出(g1018)的系數(shù)為 0.299,伙食費(g1001)的系數(shù)為0.098,變量醫(yī)療、保健支出 (g1019)的系數(shù)為0.079,變量持有現(xiàn)金(k1101)的系數(shù)為0.074,變量是否未婚 (a2001_7)的系數(shù)為0.063,變量文化程度 (博士)(a2012_4)的系數(shù)為0.038,變量文化程度(高中)(a2012_9)的系數(shù)為0.021,變量是否擁有銀行理財產(chǎn)品(d7102_1)的系數(shù)為0.013,變量對經(jīng)濟、金融信息是否關注(a4002a_2)的系數(shù)為0.012。根據(jù)系數(shù)大小發(fā)現(xiàn)對居民個體是否購買商業(yè)養(yǎng)老保險影響最大的前三個變量為年齡 (a2005)、旅游支出(g1018)和伙食費(g1001)。

Logistic回歸模型與ID3決策樹模型的結果對比分析:

圖3~4是Logistic模型與決策樹模型給出的變量重要性程度對比,分別為變量重要性程度絕對數(shù)值對比與變量重要性程度百分比對比??梢园l(fā)現(xiàn),Logistic模型與決策樹模型的結果有較多相同點和微小差異。對于變量旅游支出 (g1018)、伙食費 (g1001)、文化程度 (高中)(a2012_9)、是否未婚(a2001_7)和文化程度(博士)(a2012_4)給出了十分接近的重要性程度;對于變量是否擁有銀行理財產(chǎn)品(d7102_1)、對經(jīng)濟、金融信息是否關注(a4002a_2)有較小的差別;對于變量年齡(a2005)、持有現(xiàn)金(k1101)和醫(yī)療、保健支出(g1019)則有較大差異。

圖3 Logistic回歸模型與決策樹模型給出的變量重要性絕對值對比

圖4 Logistic回歸模型與決策樹模型給出的變量重要性百分比對比

其原因可以解釋為:Logistic回歸模型與ID3決策樹模型相比較而言,Logistic回歸模型更加側重于宏觀上的把握,對于地區(qū)的平均經(jīng)濟水平的變動十分敏感,ID3決策樹模型更加側重于刻畫個人決策的過程,其對于個人的持有現(xiàn)金(k1101)和醫(yī)療保健支出(g1019)不會過于敏感,而對于年齡的變化十分敏感。例如當兩個人的持有現(xiàn)金差異在5000元左右時,其差距不大,即決策樹模型對其認為重要性程度偏低。

4 結論與建議

4.1 結論

綜合Logistic回歸模型與ID3決策樹模型的分析結果,影響居民持有商業(yè)養(yǎng)老保險最重要的方面為個人消費習慣或家庭狀況,其次是對我國經(jīng)濟與金融的參與程度,而文化程度水平相對較弱。在個人消費習慣或家庭狀況中,旅游支出、持有現(xiàn)金、伙食費和醫(yī)療保健支出是影響居民持有商業(yè)養(yǎng)老保險的最重要的4個因素。從宏觀上看,個人旅游支出對居民持有商業(yè)養(yǎng)老保險的影響高于持有現(xiàn)金的影響,這表明家庭經(jīng)濟實力越強,并不意味著購買商業(yè)養(yǎng)老保險的概率越大。旅游支出指標體現(xiàn)了居民消費習慣和對生活質量的高追求,旅游支出高的,也較主動愿意購買商業(yè)養(yǎng)老保險,以此保障高質量的生活??芍涫杖耄ǔ钟鞋F(xiàn)金)是影響居民持有商業(yè)養(yǎng)老保險的第二重要因素,這與常識相符,這可以解釋為什么經(jīng)濟收入高的地區(qū)持有商業(yè)養(yǎng)老保險的比率高于經(jīng)濟收入低的地區(qū)?;锸迟M支出多的居民也更愿意購買商業(yè)養(yǎng)老保險。從微觀上看,當年齡增加時,該居民持有商業(yè)養(yǎng)老保險的意愿會顯著提高;如果個人處于已婚狀態(tài),那么該居民持有商業(yè)養(yǎng)老保險的概率會提高,原因是居民處于已婚狀態(tài)時會更加傾向于降低風險。而醫(yī)療、保健支出越多時,會減小持有商業(yè)養(yǎng)老保險的概率,原因是居民注重近期行為,缺乏遠期規(guī)劃。

對金融的了解與參與(是否持有銀行理財產(chǎn)品、對經(jīng)濟與金融信息是否關注)是影響居民持有商業(yè)養(yǎng)老保險的較為重要因素。如果居民能夠積極參與到金融領域或者對金融相關知識有所認識,將能夠提高居民持有商業(yè)養(yǎng)老保險的概率。這主要是因為對金融的了解有助于更好理解商業(yè)養(yǎng)老保險的正面積極功能,避免對該保險的誤解。

文化程度(高中)和文化程度(博士)是十大顯著影響因素中的兩個因素,而居民是否上過大學等文化程度變量則屬于不顯著影響因素被排除。說明文化程度對于居民持有商業(yè)養(yǎng)老保險的影響并不是呈現(xiàn)線性增長。這可以解釋為文化程度(高中)這個階段相比小學和初中有本質的變化,文化程度(博士)相比本科和碩士有本質變化。

4.2 相關建議

結合我國各地普遍的實際狀況以及本文得出的相關結論,現(xiàn)提出以下提高居民的商業(yè)養(yǎng)老保險持有率的相關建議:

提高居民經(jīng)濟水平,合理引導消費??芍涫杖耄ìF(xiàn)金持有量)是影響居民持有商業(yè)養(yǎng)老保險的第二重要因素,只有可支配收入增加了,才能為購買商業(yè)養(yǎng)老保險提供堅實基礎。因此國家需大力發(fā)展經(jīng)濟,增加居民收入,對無業(yè)居民進行引導,幫助其尋找工作,降低失業(yè)率,積極應對勞動力的有效供給,使居民普遍能夠承受商業(yè)養(yǎng)老保險的價格。真正做到“老有所養(yǎng)、老有所依、老有所學、老有所教、老有所樂”內(nèi)容,積極發(fā)展商業(yè)養(yǎng)老保險產(chǎn)業(yè)。合理引導居民購買商業(yè)養(yǎng)老保險,這與居民消費習慣意愿(旅游支出、伙食費用)有很大正相關關系,引導居民購買商業(yè)養(yǎng)老保險是追求高質量生活的一種體現(xiàn)。政府部門還應當繼續(xù)出臺有力于商業(yè)養(yǎng)老保險發(fā)展的政策,促使廣大居民做出更為理性的消費支出選擇,加強人們在老齡化時代的養(yǎng)老責任意識。

積極宣傳金融與經(jīng)濟的相關知識。一方面為居民開展免費金融經(jīng)濟知識講解,使居民能夠充分意識到金融的正面作用,減少居民對金融風險大的直觀感覺,幫助居民樹立正確的金融觀念。另一方面積極宣傳商業(yè)養(yǎng)老保險知識。調整養(yǎng)老保險教育方式,利用街道和社區(qū)宣傳和普及養(yǎng)老保險教育知識,引導城鄉(xiāng)居民正確理解養(yǎng)老保險的功能和意義,消除養(yǎng)老保險的誤解。

積極推行教育普及力度。文化程度對居民是否持有養(yǎng)老保險也產(chǎn)生重要影響。建議國家要優(yōu)化配置教育資源,加大對貧困地區(qū)教育發(fā)展的支出力度,促進義務教育均衡發(fā)展,提高高中階段教育的普及。增加博士專業(yè)學位研究生的招生數(shù)量,進一步創(chuàng)新專業(yè)學位研究生的培養(yǎng)模式。通過提高教育力度不斷促進養(yǎng)老保險健康快速發(fā)展。

猜你喜歡
決策樹養(yǎng)老保險商業(yè)
平安養(yǎng)老保險股份有限公司
平安養(yǎng)老保險股份有限公司
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
商業(yè)前沿
決策樹和隨機森林方法在管理決策中的應用
商業(yè)前沿
商業(yè)前沿
商業(yè)遙感已到瓜熟蒂落時?
基于決策樹的出租車乘客出行目的識別
基于肺癌CT的決策樹模型在肺癌診斷中的應用