国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在城鎮(zhèn)醫(yī)保中的應(yīng)用

2013-04-29 00:44:03張莎莎李偉
電腦知識與技術(shù) 2013年8期
關(guān)鍵詞:聚類算法數(shù)據(jù)倉庫城鎮(zhèn)居民

張莎莎 李偉

摘要:隨著國家基本醫(yī)療保險(xiǎn)制度的全面覆蓋,社會保障局?jǐn)?shù)據(jù)庫中數(shù)據(jù)也與日俱增,利用其中的數(shù)據(jù)來做進(jìn)一步的分析,把大量無序的數(shù)據(jù)變成科學(xué)的知識是社會保障系統(tǒng)工作的需求。以貴陽市社會保障局醫(yī)療保險(xiǎn)業(yè)務(wù)數(shù)據(jù)中城鎮(zhèn)居民統(tǒng)籌基金支付情況為目標(biāo),利用聚類分析法,通過搭建oracle數(shù)據(jù)倉庫平臺,并在此平臺上進(jìn)行主題數(shù)據(jù)倉庫構(gòu)建與設(shè)計(jì),進(jìn)行聯(lián)機(jī)分析得出城鎮(zhèn)居民統(tǒng)籌基金支付情況,為貴陽市城鎮(zhèn)居民統(tǒng)籌基金支付政策的科學(xué)制定與調(diào)整具有一定的指導(dǎo)意義。

關(guān)鍵詞:城鎮(zhèn)居民;數(shù)據(jù)倉庫;聯(lián)機(jī)分析;數(shù)據(jù)挖掘;聚類算法

中圖分類號:TP39 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2013)08-1739-04

1 概述

貴陽市社會保障局大力發(fā)展社會保障的信息建設(shè),并按照勞動和社會保障部門制定了《勞動與社會保障信息指標(biāo)體系》,于2001年6月設(shè)計(jì)建設(shè)了貴陽市社會保障信息體系,在其運(yùn)行的十幾年中,系統(tǒng)里面的數(shù)據(jù)不斷的增加,以往的軟件技術(shù)已經(jīng)不能滿足大量數(shù)據(jù)的分析工作,如何從這些數(shù)據(jù)中挖掘出有用的信息成為一個(gè)重要的工作。

常用的數(shù)據(jù)挖掘算法有回歸算法,分割算法,關(guān)聯(lián)算法,順序分析算法以及聚類算法等[1]。回歸算法是基于數(shù)據(jù)集中的其他屬性預(yù)測一個(gè)活多個(gè)連續(xù)變量,如利潤或虧損;分割算法是將數(shù)據(jù)分成組或分類,項(xiàng)具有相似屬性;關(guān)聯(lián)算法查找數(shù)據(jù)集中的不同屬性之間的相關(guān)性,這類算法最常見的是創(chuàng)建可用于市場藍(lán)分析的關(guān)聯(lián)準(zhǔn)則;順序分析算法是匯總數(shù)據(jù)中常見的順序或時(shí)間,如WEB路徑流;聚類算法最初由Cover和Hart于1968年提出的,是一個(gè)理論上比較成熟的方法,該算法思路非常簡單直觀,如果一個(gè)樣本在特征空間中的k 個(gè)最相似的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別,該方法在定類決策上只依據(jù)最鄰近的一個(gè)或者幾個(gè)樣本的類別來決定待分樣本所屬的類別[2]。

貴陽市城鎮(zhèn)居民的統(tǒng)籌基金支付情況的數(shù)值是離散的,病分為單病種和非單病種,國家所支付的統(tǒng)籌基金也是不同的,所以采用聚類分析法通過搭建oracle數(shù)據(jù)倉庫平臺,并在此平臺上進(jìn)行主題數(shù)據(jù)倉庫構(gòu)建與設(shè)計(jì),經(jīng)過進(jìn)行聯(lián)機(jī)分析得出城鎮(zhèn)居民統(tǒng)籌基金支付情況,為貴陽市城鎮(zhèn)居民統(tǒng)籌基金支付政策的科學(xué)制定與調(diào)整具有一定的指導(dǎo)意義。

2 總體構(gòu)架

本研究所用到的數(shù)據(jù)全部來源于貴陽市社會保障信息系統(tǒng)。數(shù)據(jù)主要有業(yè)務(wù)數(shù)據(jù)和數(shù)據(jù)字典組成。業(yè)務(wù)數(shù)據(jù)包括:居民個(gè)人參?;拘畔?,居民保險(xiǎn)清算基本信息;數(shù)據(jù)字典包括:居民保險(xiǎn)人員身份代碼表,居民保險(xiǎn)人員類別代碼表,居民參保所屬分中心代碼表,服務(wù)結(jié)構(gòu)代碼表,醫(yī)療結(jié)構(gòu)代碼表,醫(yī)療機(jī)構(gòu)類別代碼表等。由于社保信息系統(tǒng)在平時(shí)的運(yùn)行中,采用了非常嚴(yán)格的數(shù)據(jù)格式控制,所以其內(nèi)部數(shù)據(jù)完整,質(zhì)量較好,為下一步導(dǎo)入數(shù)據(jù)倉庫和數(shù)據(jù)分析奠定了很好的基礎(chǔ).社會保險(xiǎn)中城鎮(zhèn)居民醫(yī)療保險(xiǎn)數(shù)據(jù)挖掘與聯(lián)機(jī)分析方案的總體架構(gòu)包含:

數(shù)據(jù)整合:把從貴陽市社會保障局中抽取的數(shù)據(jù)進(jìn)行清理,轉(zhuǎn)化加載到數(shù)據(jù)倉庫中。

數(shù)據(jù)倉庫:將業(yè)務(wù)系統(tǒng)中面對應(yīng)用的數(shù)據(jù)按照分析主題進(jìn)行組織,并對數(shù)據(jù)進(jìn)行存儲。

聯(lián)機(jī)分析:應(yīng)用聯(lián)機(jī)分析處理工具,幫助用戶從不同緯度來分析各項(xiàng)數(shù)據(jù),具有復(fù)雜決策的功能。

數(shù)據(jù)挖掘:利用數(shù)據(jù)挖掘工具,把其中隱藏的信息挖掘出來,把日常無需的字段變成有用的信息。

2.1軟硬件配置

3 設(shè)計(jì)

3.1 數(shù)據(jù)倉庫主題域設(shè)計(jì)

醫(yī)療保險(xiǎn)業(yè)務(wù)從其面向的對象中分為兩類:城鎮(zhèn)職工基本醫(yī)療保險(xiǎn)和城鎮(zhèn)居民基本醫(yī)療保險(xiǎn).選定了城鎮(zhèn)居民基金支付主題,其數(shù)據(jù)設(shè)計(jì)到原有業(yè)務(wù)數(shù)據(jù)表格,如城鎮(zhèn)居民基本信息表,城鎮(zhèn)居民醫(yī)療結(jié)算表,以及醫(yī)療機(jī)構(gòu)代碼表等,從城鎮(zhèn)居民參保人員的性別,年齡,個(gè)人類型,個(gè)人身份,醫(yī)療機(jī)構(gòu)類別,所屬分中心等多個(gè)維度來分析基本醫(yī)療保險(xiǎn)基金支付的構(gòu)成情況,分析各類人員在單病種患病的情況下統(tǒng)籌支付金額的情況。

3.2 維度建模

3.3物理模型設(shè)計(jì)

4 實(shí)現(xiàn)過程

4.1建立數(shù)據(jù)倉庫

按照同樣的步驟,我們把本文的維度表及數(shù)據(jù)導(dǎo)入到oracle 數(shù)據(jù)庫中,建立本文需要的數(shù)據(jù)倉庫。

4.2 聯(lián)機(jī)分析

4.3數(shù)據(jù)挖掘

根據(jù)統(tǒng)計(jì)匯總發(fā)現(xiàn)患者在三級一,三級二就醫(yī),人員類別為普通人員,人員身份為居民且患單病種,年齡在6以下的人數(shù)比較多.,本文選擇滿足此條件的數(shù)據(jù)進(jìn)行挖掘。

5 結(jié)論

對統(tǒng)計(jì)數(shù)據(jù)中人數(shù)最多的數(shù)據(jù)進(jìn)行挖掘得到以下結(jié)果:

1)從年齡上看,患單病種的人數(shù)的支付基金年齡在6歲以下的滿意度高,而且統(tǒng)籌基金分布的人數(shù)比較多,說明國家的起付線制定和統(tǒng)籌基金支付具有一定的合理性。

2)從挖掘的結(jié)果上看,在年齡上低于6歲患單病種人數(shù)要多,為13619, 說明嬰幼兒應(yīng)該加強(qiáng)疾病的保健工作,患病的風(fēng)險(xiǎn)也很大,國家應(yīng)該在基金方面制定相對應(yīng)的措施來保障嬰幼兒的生活。

參考文獻(xiàn):

[1] 武森.高學(xué)東.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:冶金工業(yè)出版社,2003.

[2] 陳躍新.數(shù)據(jù)挖掘算法在醫(yī)保數(shù)據(jù)上的應(yīng)用研究[D].北京:國防科學(xué)技術(shù)大學(xué),2010.

[3] 胡潔.數(shù)據(jù)挖掘技術(shù)在設(shè)備狀態(tài)檢測的應(yīng)用研究[D].南京:南京大學(xué).2011.

猜你喜歡
聚類算法數(shù)據(jù)倉庫城鎮(zhèn)居民
城鎮(zhèn)居民住房分布對收入不平等的影響
基于數(shù)據(jù)倉庫的住房城鄉(xiāng)建設(shè)信息系統(tǒng)整合研究
天津城鎮(zhèn)居民增收再上新臺階
K—Means聚類算法在MapReduce框架下的實(shí)現(xiàn)
分布式存儲系統(tǒng)在液晶面板制造數(shù)據(jù)倉庫中的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:15
基于K?均值與AGNES聚類算法的校園網(wǎng)行為分析系統(tǒng)研究
探析電力系統(tǒng)調(diào)度中數(shù)據(jù)倉庫技術(shù)的應(yīng)用
基于改進(jìn)的K_means算法在圖像分割中的應(yīng)用
大規(guī)模風(fēng)電場集中接入對電力系統(tǒng)小干擾穩(wěn)定的影響分析
科技視界(2016年8期)2016-04-05 18:39:39
基于數(shù)據(jù)倉庫的數(shù)據(jù)分析探索與實(shí)踐
清镇市| 双桥区| 湘西| 茌平县| 西华县| 尚志市| 同德县| 萍乡市| 苏尼特左旗| 抚宁县| 潼南县| 屯留县| 新津县| 扎赉特旗| 姚安县| 平定县| 乾安县| 友谊县| 上思县| 大英县| 茂名市| 恭城| 吉林市| 灌南县| 赤城县| 三台县| 修武县| 临西县| 西华县| 怀仁县| 钦州市| 凤城市| 绥江县| 横峰县| 永平县| 淮安市| 南部县| 西安市| 噶尔县| 安顺市| 桂东县|