国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

醫(yī)保欺詐行為的主動發(fā)現(xiàn)

2016-08-06 09:40:21唐璟宜孫有坤周海林
合作經(jīng)濟與科技 2016年16期
關(guān)鍵詞:主成分分析

□文/唐璟宜 孫有坤 周海林

(安徽財經(jīng)大學金融學院 安徽·蚌埠)

?

醫(yī)保欺詐行為的主動發(fā)現(xiàn)

□文/唐璟宜 孫有坤 周海林

(安徽財經(jīng)大學金融學院 安徽·蚌埠)

[提要] 針對在醫(yī)療行業(yè)中存在的醫(yī)療保險欺詐行為,應(yīng)當有合適的方法去及時發(fā)現(xiàn)并制止,只有這樣才能使醫(yī)療保險金能真正落到實處。本文使用主成分分析、K-m eans聚類分析等方法,并運用M A TLA B、SPSS等軟件對數(shù)據(jù)進行分析,并對我國醫(yī)保行業(yè)現(xiàn)狀進行分析,為相關(guān)部門自動識別醫(yī)保詐騙提供具體的模型及識別方法。

關(guān)鍵詞:醫(yī)保欺詐;主動發(fā)現(xiàn);主成分分析;K-m eans聚類

收錄日期:2016年6月13日

一、數(shù)據(jù)挖掘預(yù)處理

由于本文主要研究的是醫(yī)保欺詐行為,所以數(shù)據(jù)處理中只保留所有參保人員,將非參保人員的就診拿藥數(shù)據(jù)剔除,減少無關(guān)數(shù)據(jù)的干擾。

(一)數(shù)據(jù)清洗。針對本文的研究目的,有目的地進行數(shù)據(jù)清洗。首先是刪除大量對于本次數(shù)據(jù)挖掘沒有用的數(shù)據(jù),只保留相關(guān)數(shù)據(jù)列;其次是對于缺失的必要數(shù)據(jù)采用數(shù)據(jù)歸約的方法填補空缺。

(二)數(shù)據(jù)轉(zhuǎn)換。將文本型、字符型數(shù)據(jù)轉(zhuǎn)換為數(shù)字型數(shù)據(jù),以方便后續(xù)研究。如用“1”和“0”代替性別的“男”、“女”;將出生日期轉(zhuǎn)換為患者年齡等。

二、醫(yī)保欺詐行為主動發(fā)現(xiàn)模型

(一)類型Ⅰ:醫(yī)??ǔ钟腥艘阉劳觥_@是最容易發(fā)現(xiàn)的騙保行為,故優(yōu)先考慮該種類型的騙保行為主動發(fā)現(xiàn)。通過MATLAB編程對醫(yī)??ê蜕矸葑C號列進行篩選處理,找到一個醫(yī)??↖D對應(yīng)多個醫(yī)保手冊號的情況。利用MATLAB軟件進行篩選,將篩選出的ID利用Excel的vlookup函數(shù)查找出對應(yīng)的身份證號,找出嫌疑人的關(guān)鍵信息??梢詫⒁豢▋扇擞?、一卡三人用的醫(yī)??↖D和醫(yī)保手冊號篩選出來。而病人也有死亡標志說明,可以查出死亡病人的ID再查找其醫(yī)保卡消費情況,對比病人的死亡時間以及賬單號的交易時間,若病人的死亡時間在前而交易時間在后,則為醫(yī)保欺詐記錄。根據(jù)所使用的數(shù)據(jù)表,暫未發(fā)現(xiàn)這類醫(yī)保欺詐,但仍應(yīng)該警惕,及時把死亡者的醫(yī)??ㄗN,避免這類醫(yī)保欺詐的發(fā)生。

(二)類型Ⅱ:醫(yī)保卡持有人未亡。對預(yù)處理后的數(shù)據(jù)進行分析,可以發(fā)現(xiàn)病人的醫(yī)保費用與參保人的年齡、消費頻率、消費藥品的金額之間具有一定的關(guān)聯(lián)性。本文主要從病人年齡與消費金額、病人消費頻率與消費金額兩方面的聯(lián)系,發(fā)現(xiàn)異??梢蓴?shù)據(jù),并針對這些可疑數(shù)據(jù)進行分析,進一步鑒別其特征,判斷是否屬于醫(yī)保欺詐行為。

表1 各個年齡段對應(yīng)的平均費用及其上限

表2 擬合函數(shù)計算的各年齡段平均費用及其上限

表3 各聚類對應(yīng)的案例數(shù)(單位:個)

1、模型Ⅰ:年齡醫(yī)費模型。根據(jù)研究的數(shù)據(jù)對象,建立病人年齡與醫(yī)保費用的關(guān)系模型,使用SPSS軟件進行分析。首先將所有參保人的年齡分成十個階段:0~9歲、10~19歲、20~29歲、30~39歲、40~49歲、50~59歲、60~69歲、70~79歲、80~89歲、90歲以上。在此,根據(jù)醫(yī)保欺詐的特點,醫(yī)保欺詐的費用越高越有可能存在欺詐行為,故只考慮平均費用置信區(qū)間的上限無意義。人為將置信區(qū)間設(shè)定為向上浮動10%。在EXCEL表中使用分類匯總操作,計算出各階段醫(yī)保支付費用平均值及平均費用置信區(qū)間的上限,如表1所示。(表1)

利用EXCEL畫出圖形,通過觀測散點的分布情況來確定擬合函數(shù),利用數(shù)理統(tǒng)計方法中的多元回歸統(tǒng)計方法可以得到因變量與自變量之間的回歸關(guān)系函數(shù)表達式。(圖1)

在圖中可以發(fā)現(xiàn)60歲以上的曲線呈明顯上升趨勢,于是建立分段函數(shù),分別對0~59歲和60歲以上進行擬合,擬合的回歸曲線如圖2和圖3所示。(圖2、圖3)

于是建立得到醫(yī)保費用關(guān)于年齡的函數(shù),如下:

在上述方程的基礎(chǔ)上建立初步篩選規(guī)則:按病人的年齡找到對應(yīng)的置信區(qū)間,若發(fā)現(xiàn)病人的實際花費其所在區(qū)間上限,則該病人醫(yī)保費用花費超過一般標準,具有醫(yī)保詐欺的嫌疑,將對這些病人進行進一步具體審查。(表2)

2、模型Ⅱ:消費頻率與金額模型。由于在醫(yī)保欺詐中,騙保人通常使用的手段包括兩種:一是拿著別人的醫(yī)??ㄅ渌?;二是在不同的醫(yī)院和醫(yī)生處重復配藥。這些行為使有醫(yī)保欺詐嫌疑的病人所對應(yīng)消費記錄中,某個醫(yī)??↖D對應(yīng)的藥費明細存在記錄多、頻率大、藥費總和高的特點。即消費金額高和消費頻率高是醫(yī)保欺詐一個最大的特征。于是,本文具體研究存在著這兩種消費特征的醫(yī)保記錄,具體識別其中的醫(yī)保欺詐行為,依據(jù)此種情況,可以將藥費和頻率等基于k-means算法進行聚類分析。

K-means算法是以數(shù)據(jù)點到原型的某種距離作為優(yōu)化的目標函數(shù),利用函數(shù)求極值的方法得到迭代運算的調(diào)整規(guī)則。本文使用的K-means算法以歐式距離作為相似度測度,通過對某一初始聚類中心向量的最優(yōu)分類,得到對應(yīng)評價指標最小。算法采用誤差平方和準則函數(shù)作為聚類準則函數(shù)。首先在ACCESS中進行數(shù)據(jù)預(yù)處理,再利用SPSS分析數(shù)據(jù)屬性的特征,選擇典型數(shù)據(jù)作為初始聚類中心,進行k-means聚類分析求出每個病人的消費頻率與消費藥品的總金額。

本文選擇四類數(shù)據(jù)作為初始的聚類中心:1、消費頻率高,消費金額大;2、消費頻率低,消費金額大;3、消費頻率高,消費金額??;4、消費頻率低,消費金額小。結(jié)果如表3所示。(表3)從表3中可以看出第一類數(shù)據(jù)含有341個樣本,這類病人消費頻率高且消費額大,可能存在醫(yī)保欺詐行為。用這種方法可以快速發(fā)現(xiàn)所有有欺詐嫌疑的記錄。

3、類型Ⅲ:醫(yī)師、科室參與欺詐。當找出所有可疑的欺詐記錄后,可以通過不同表之間的數(shù)據(jù)映射關(guān)系來找到與嫌疑人員有關(guān)的嫌疑科室、嫌疑醫(yī)生,從而可以確定協(xié)助作案的科室醫(yī)生,便于以后的重點監(jiān)督和排查。

根據(jù)醫(yī)保詐騙的作案特點,在某些情況下,科室可以通過偽造病歷和票據(jù)通過醫(yī)保報銷,以騙取醫(yī)保金,造成某些患者費用和頻率較高。為了有針對性地對這類數(shù)據(jù)進行查找,根據(jù)這幾個表的映射關(guān)系,篩選出與嫌疑人員ID有關(guān)的科室并且統(tǒng)計他們與嫌疑人員進行操作的次數(shù),以此進行查找。首先統(tǒng)計原始數(shù)據(jù),原始數(shù)據(jù)有下醫(yī)囑科室與執(zhí)行科室兩種科室,在醫(yī)保詐騙事件中,下醫(yī)囑科室的欺詐嫌疑較大,因此重點分析下醫(yī)囑科室信息。利用疑似人員的醫(yī)??ㄌ柡Y選出與之相關(guān)的科室,并統(tǒng)計出與這些疑似ID進行交易的次數(shù)來確定科室的嫌疑度。根據(jù)與嫌疑ID交易的次數(shù)進行排序,當某些科室的交易次數(shù)和與其相鄰的科室樣本突然發(fā)生較大變化,可以此作為分界點,劃分出嫌疑科室。與嫌疑科室同理,可以采用同樣的方法查詢出嫌疑醫(yī)生。由這種方法,可以找到醫(yī)保欺詐事件高發(fā)的重點科室,這些科室可能本身存在嫌疑,或是較為容易被不法分子利用空隙進行醫(yī)保欺詐。

圖1 各年齡段對應(yīng)的平均費用散點圖

圖2 0~59歲醫(yī)保支付平均費用的回歸曲線圖

圖3 60歲以上醫(yī)保支付平均費用的回歸曲線圖

三、醫(yī)保欺詐數(shù)據(jù)分析

根據(jù)數(shù)據(jù)處理的結(jié)果,發(fā)現(xiàn)我國醫(yī)療保險存在如下三類的欺詐現(xiàn)象:(1)醫(yī)療保險需求方的欺詐違規(guī)行為。在現(xiàn)實情況中主要表現(xiàn)有:冒名頂替就醫(yī)、以藥換藥、倒賣藥品等;(2)醫(yī)療保險服務(wù)提供方的欺詐違規(guī)行為。主要可能表現(xiàn)為:重復收費、虛報醫(yī)療費用、倒賣醫(yī)療票據(jù)等;(3)醫(yī)療保險服務(wù)提供方與需求方聯(lián)合的欺詐違規(guī)行為。主要的欺騙手段有:在醫(yī)院掛床、用物充藥、幫助提供虛假證明、偽造虛假病歷等。其中,第一類行為最為普遍,第二、第三類行為較少,但一旦發(fā)生將會發(fā)生嚴重影響。這些行為對我國的醫(yī)療保險基金造成嚴重損失,危害我國醫(yī)療保險基金的公平性與公正性。

四、對完善醫(yī)保制度的建議

(一)進一步改革支付制度。在總額控制支付模式的框架下,應(yīng)當以總額預(yù)付為主,結(jié)合多種付費方式的復合型支付制度,綜合考慮如按病種、床日、人頭、項目付費等因素,從多個角度來合理定價,減少由于藥費過高而使參保病人產(chǎn)生的騙保心理,讓參保病人住的安心,讓醫(yī)?;鹩玫綄嵦?。

(二)建立醫(yī)保信息智能網(wǎng)絡(luò)平臺。一個參保病人對應(yīng)一個電子賬戶,將病例電子化,詳細記錄病人的一切看病用藥信息。該賬戶應(yīng)做到全國甚至世界范圍內(nèi)共享。

(三)完善對醫(yī)保定點醫(yī)院的內(nèi)部管理。合理劃分基金管理機構(gòu)的職責并做到權(quán)力制衡,建立醫(yī)療服務(wù)監(jiān)督評價體系和獎懲制度。

(四)完善對醫(yī)保定點醫(yī)院的外部監(jiān)督。加大對醫(yī)保定點醫(yī)院、醫(yī)師以及各類機構(gòu)的違規(guī)行為的查懲力度,如發(fā)現(xiàn)有醫(yī)保違規(guī)行為,將取消涉案醫(yī)保醫(yī)師的執(zhí)業(yè)資質(zhì)。

五、總結(jié)

前人的研究包括采用基于統(tǒng)計回歸或神經(jīng)網(wǎng)絡(luò)思想的優(yōu)化改進方法,而這些方法都屬于輔助學習方法,需要基于一定量的已知數(shù)據(jù),或擁有較為豐富的先驗知識,以獲取識別因子作為學習材料,用以主動識別其他大量數(shù)據(jù)中包含的可能欺詐數(shù)據(jù)。該方法的問題在于欺詐樣本點的選取過于依賴人的主觀性,對于普遍意義上欺詐數(shù)據(jù)的識別不具備較強的參考價值。

為避免人工篩選欺詐數(shù)據(jù)帶來的主觀誤差,需要找到非輔助學習的方法。聚類分析法可以滿足這一條件,但傳統(tǒng)的聚類分析采用歐氏距離作為分類標準,不足之處在于將各種影響因素的重要程度視為相同的,會造成一些不重要的參量(如年齡)卻和一些重要的參量(如病人一個月之內(nèi)的開藥次數(shù))同等的影響著最后的分類。

為解決該問題,本文將主成分分析引進聚類分析,成為基于主成分分析的聚類分析算法。主成分分析模型是一種降維的算法,可以有效地將存在欺騙行為的數(shù)據(jù)范圍縮小化,減少數(shù)據(jù)的冗余性,并保持數(shù)據(jù)的有效性。同時,聚類分析能夠很好的反映類之間的關(guān)系,本文中的各個因素雖然是彼此獨立的,但是對于存在欺詐行為的情況時,數(shù)據(jù)內(nèi)部會產(chǎn)生相關(guān)性,通過聚類分析可以快速有效地掌握它們之間的關(guān)系。在改進的主成分聚類分析法中,將這兩種統(tǒng)計方法的優(yōu)勢結(jié)合,相輔相成,以達到綜合評價的目的。

主要參考文獻:

[1]殷瑞飛.數(shù)據(jù)挖掘中的聚類方法及其應(yīng)用——基于統(tǒng)計學視角的研究[D].廈門:廈門大學,2008.

[2]江小平,李成華,向文,張新訪,顏海濤.K-m eans聚類算法的M apReduce并行化實現(xiàn)[J].華中科技大學學報(自然科學版),2011.6.39.

[3]王文華.基于蟻群算法模糊聚類的圖像分割[D].重慶:重慶大學,2009.

基金項目:國家級大學生創(chuàng)新項目(編號:201510378153)

中圖分類號:D 9

文獻標識碼:A

猜你喜歡
主成分分析
Categorizing Compiler Error Messages with Principal Component Analysis
計算機教育(2016年8期)2016-12-24 10:38:04
關(guān)于AI上市公司發(fā)展水平評價
大學生創(chuàng)業(yè)自我效能感結(jié)構(gòu)研究
塔里木河流域水資源承載力變化及其驅(qū)動力分析
我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實證研究
時代金融(2016年29期)2016-12-05 15:41:07
基于NAR模型的上海市房產(chǎn)稅規(guī)模預(yù)測
主成分分析法在大學英語寫作評價中的應(yīng)用
大學教育(2016年11期)2016-11-16 20:33:18
江蘇省客源市場影響因素研究
SPSS在環(huán)境地球化學中的應(yīng)用
考試周刊(2016年84期)2016-11-11 23:57:34
長沙建設(shè)國家中心城市的瓶頸及其解決路徑
循化| 玉屏| 大余县| 琼结县| 晋城| 无为县| 平谷区| 鹤山市| 长子县| 疏勒县| 哈尔滨市| 秀山| 浙江省| 资兴市| 阿尔山市| 罗山县| 西峡县| 封丘县| 和平县| 衡阳县| 辉县市| 龙江县| 二连浩特市| 阿拉善右旗| 托里县| 句容市| 吐鲁番市| 潍坊市| 丰县| 于田县| 含山县| 吉隆县| 绥滨县| 修武县| 炉霍县| 普兰店市| 马龙县| 灵台县| 曲周县| 河东区| 东兰县|