国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的2型糖尿病風險預(yù)測模型的建立和應(yīng)用

2019-05-09 11:48陳淑良常紅王冬平張策
糖尿病新世界 2019年4期
關(guān)鍵詞:感知器準確率神經(jīng)網(wǎng)絡(luò)

陳淑良 常紅 王冬平 張策

[摘要] 目的 采用數(shù)據(jù)挖掘方法,考察2型糖尿病的危險因素,確定最優(yōu)風險預(yù)測模型,為建立手機APP軟件提供算法,為糖尿病I級預(yù)防提供風險預(yù)測支持。 方法 收集某醫(yī)院2016年1月—2017年7月的糖尿病患者全數(shù)據(jù)集,共5 571例,通過與同期體檢健康對照組5 571例進行對比研究,分別建立Logistic 回歸模型和多層感知器神經(jīng)網(wǎng)絡(luò)模型,比較優(yōu)劣,確定最終預(yù)測模型。 結(jié)果 結(jié)果顯示 Logistic 回歸和多層感知器神經(jīng)網(wǎng)絡(luò)模型對訓練樣本的預(yù)測準確率分別為89.7%、80.4%,對測試樣本的預(yù)測準確率分別為89.8%、79.8%。 結(jié)論 Logistic回歸模型對2型糖尿病風險預(yù)測效能較高,預(yù)測結(jié)果也更容易結(jié)合臨床實際,用于風險控制手機APP軟件后臺編程。

[關(guān)鍵詞] 2 型糖尿病;風險預(yù)測分析;Logistic回歸模型;多層感知器神經(jīng)網(wǎng)絡(luò)模型;決策樹分析模型

[中圖分類號] R587.1????????? [文獻標識碼] A????????? [文章編號] 1672-4062(2019)02(b)-0001-03

Establishment and Application of Risk Prediction Model for Type 2 Diabetes Based on Data Mining

CHEN Shu-liang1, CHANG Hong1, WANG Dong-ping2, ZHANG Ce1

1.The Second Affiliated Hospital of Dalian Medical University, Dalian, Liaoning Province, 116027 China; 2. Zhongshan College, Dalian Medical University, Dalian, Liaoning Province, 116023 China

[Abstract] Objective To investigate the risk factors of type 2 diabetes by using data mining methods, to determine the optimal risk prediction model, to provide algorithms for establishing mobile APP software, and to provide risk prediction support for diabetes level I prevention. Methods A total of 5 571 patients with diabetes mellitus from January 2016 to July 2017 in the hospital were enrolled. A logistic regression model and a multi-layer perceptron neural network model were established by comparing with 5 571 healthy people in the same period, comparing the pros and cons, determine the final prediction model. Results The results showed that the prediction accuracy of the logistic regression and multi-layer perceptron neural network model for training samples were 89.7% and 80.4%, respectively, and the prediction accuracy for the test samples was 89.8% and 79.8%, respectively. Conclusion Logistic regression model has higher predictive effect on risk of type 2 diabetes, and the prediction results are more easily combined with clinical practice. It is used for background programming of risk control mobile APP software.

[Key words] Type 2 diabetes; Risk prediction analysis; Logistic regression model; Multilayer perceptron neural network model; Decision tree analysis model

隨著經(jīng)濟發(fā)展,生活水平的提高,人口不斷向老齡化、城鎮(zhèn)化方向發(fā)展,糖尿病已經(jīng)成為嚴重危害人類健康的重大公共衛(wèi)生問題,其中全世界約有3.5億人患有2型糖尿?。═2DM)[1]。流行病學資料顯示我國每年新發(fā)的2型糖尿病人數(shù)達到 680 萬~740萬[2],由于2型糖尿病臨床確診前有較長的潛隱期,因此,對高危人群的篩查和防治是控制2型糖尿病發(fā)病的有效途徑[3]。近年來,數(shù)據(jù)挖掘方法廣泛應(yīng)用于醫(yī)學領(lǐng)域,在疾病診斷、預(yù)后、風險評估等方面表現(xiàn)出良好的應(yīng)用價值[4-6],也為臨床慢性病的控制提供了有效的工具和手段[7]。在前期的文獻檢索過程中,發(fā)現(xiàn)對糖尿病及其并發(fā)癥的研究較多,但各研究的樣本量不多,從數(shù)百例到數(shù)千例不等,達不到數(shù)據(jù)挖掘的準確度要求[8-9]。該研究收集2016年1月—2017年7月11 142例數(shù)據(jù),預(yù)測未知人群的2型糖尿病風險,做好慢性病的I級預(yù)防,并期望將這種數(shù)據(jù)模型軟件化,制成手機APP軟件,為2型糖尿病以及其他慢性疾病的I級預(yù)防提供理論依據(jù)及必要的預(yù)測工具,現(xiàn)報道如下。

1? 資料與方法

1.1? 一般資料

對醫(yī)院的內(nèi)分泌科住院的糖尿病患者全數(shù)據(jù)集5 571例進行分析。同時,在同期42 716名體檢中心健康人數(shù)據(jù)集中隨機抽取5 571名數(shù)據(jù)作為對照組,隨機種子數(shù)為1 794,數(shù)據(jù)處理過程中對數(shù)據(jù)進行脫敏操作,保護患者隱私,通過醫(yī)院倫理委員會審查。

納入的糖尿病患者,診斷均符合2010版《中國2型糖尿病防治指南》[10]診斷標準:①糖尿病癥狀加上隨機血糖檢測,靜脈血漿葡萄糖≥11.1 mmol/L或②空腹血糖(FPG)靜脈血漿葡萄糖≥7.0 mmol/L或③葡萄糖負荷后2 h血糖≥11.1 mmol/L,癥狀不典型者,臨床診斷必須經(jīng)過另一天的重復(fù)試驗所證實。

1.2? 變量及定義

①文化程度分為“高學歷”“低學歷”;②吸煙分為 “是” “否”;③飲酒分為“是”“否”;④地區(qū)分為市區(qū)、市區(qū)外;⑤婚姻分為“已婚”‘未婚;⑥職業(yè)分為腦力為主、體力為主;⑦體質(zhì)指數(shù) (body mass index,BMI)= 體重(kg)/身高(m)2;⑧高血壓:確診為高血壓者;⑨甘油三酯(TG):正常值0.4~1.81 mmol/L;⑩糖化血紅蛋白:正常值≤6.5%;{11}高血脂疾病史:均符合《血脂異常防治建議》中關(guān)于高血脂的診斷標準,已被確診為高血脂癥;{12}冠心病疾病史[11]:以往被確診為冠心病;{13}甲狀腺疾病史[12]:以往被確診為甲狀腺性疾病;{14}糖尿病家族史:根據(jù)既往病例判斷,直系親屬患有糖尿病。

1.3? 統(tǒng)計方法

采用SPSS 17.0統(tǒng)計學軟件進行數(shù)據(jù)統(tǒng)計分析。采用軟件的隨機數(shù)功能從全數(shù)據(jù)集中選取70%,作為訓練樣本。余下的30%作為測試樣本。訓練樣本用于計算參數(shù)和建立Logistic回歸模型和神經(jīng)網(wǎng)絡(luò)模型,測試樣本用于評估預(yù)測效果。

2? 結(jié)果

2.1? 一般情況

該研究共納入11 142例數(shù)據(jù),糖尿病組男性3 124例,女性2 447例,平均年齡(62.49±0.17)歲,健康對照組男性 3 002例,女性2 569 例,平均年齡(44.75±0.19)歲[13-14]。

2.2? logistic 回歸分析

模型變量篩選過程采用多因素建模篩選,按照“一般情況”(性別、年齡、文化程度、職業(yè)、民族、家庭住址、婚姻狀況、吸煙情況、飲酒)“既往病史”(家族史、高血壓、冠心病、甲狀腺、高血脂)“檢驗結(jié)果”(收縮壓、舒張壓、總膽固醇、低密度脂蛋白、高密度脂蛋白、甘油三酯、谷草轉(zhuǎn)氨酶、谷丙轉(zhuǎn)氨酶、糖化血紅蛋白、BMI),將因素分為不同的模型,分別回歸,將有意義的因素篩選出來進入最終的模型,得出糖尿病的最終影響因素。

Logistc回歸結(jié)果,如表1,建立多因素預(yù)測方程為:

P=1/(1+e(16.089-0.09×年齡+2.687×高血壓病史-1.471×冠心病病史-4.549×甲狀腺病史-0.021×收縮壓+0.005×谷草轉(zhuǎn)氨酶+2.941×糖尿病家族史+0.129×糖化血紅蛋白)。

根據(jù)所建方程對訓練樣本進行預(yù)測,其預(yù)測準確率為89.7%。其對測試樣本的預(yù)測準確率是89.8%。

2.3? 多層感知器神經(jīng)網(wǎng)絡(luò)分析

該多層感知器神經(jīng)網(wǎng)絡(luò)模型共分為2層。見圖1。以2.2中篩選出的變量為自變量,以是否發(fā)生糖尿病為因變量建立多層感知器神經(jīng)網(wǎng)絡(luò)模型,其對訓練樣本的預(yù)測準確率為80.4%,對測試樣本的預(yù)測準確率為79.8%。

3? 討論

該文研究結(jié)果表明,二個模型預(yù)測準確率均較高,Logistic回歸模型得出的因素比較全面,對2型糖尿病的風險預(yù)測結(jié)果相對準確,可以較好地應(yīng)用于慢病風險預(yù)測。我們結(jié)合臨床實踐,并考慮決策樹在多類別選擇時,錯誤可能會增長的比較快,故該次研究未采用,多層感知器神經(jīng)網(wǎng)絡(luò)模型雖然有諸多優(yōu)勢,但其是一個黑箱系統(tǒng),至今沒有明確的公式,結(jié)果不容易解釋,同時其對數(shù)據(jù)預(yù)測準確率也不優(yōu)于Logistic模型。數(shù)據(jù)顯示,兩個模型在影響因素的選擇方面取得了良好的一致性,印證了對真實世界數(shù)據(jù)集預(yù)測的相符性[15-18]。

該文最終采用Logistic回歸模型用于手機預(yù)測APP的編程,是目前流行病學和醫(yī)學中最常用的分析方法之一。首先從該文的結(jié)果可以看出,相同條件下Logisitc模型結(jié)果準確率較高,其次其可以將建模結(jié)果公式化,相比于神經(jīng)網(wǎng)絡(luò)模型,更適用于軟件編程等實際應(yīng)用過程,另外, Logistic回歸中的回歸系數(shù)和OR值,可對模型和變量具有較好的解釋性,從而量化影響因素對輸出變量的影響,可應(yīng)用于慢病風險預(yù)測。采用Logistic回歸模型結(jié)果,可進一步編寫具有自學習能力的慢病風險預(yù)測手機APP軟件,利用手機APP軟件,公眾可把相關(guān)危險因素輸入軟件,即可自行簡便且免費獲得罹患該疾病風險的初步信息,并根據(jù)專業(yè)醫(yī)生建議制定不同的防控措施,以期降低糖尿病的發(fā)病率。

[參考文獻]

[1]? Nathan DM. Diabetes: advances in diagnosis and treatment[J]. JAMA, 2015, 314(10): 1052-1062.

[2]? 中華醫(yī)學會糖尿病學分會.新診斷2型糖尿病患者短期胰島素強化治療專家共識[J].中華醫(yī)學雜志,2013,93(20):1524-1526.

[3]? Bhushan R, Elkind-hirsch KE, Bhushan M, et al. Improved glycemic control and reduction of cardiometabolic risk factors in subjects with type 2 diabetes and metabolic syndrome treated with exenatide in a clinical practice setting[J]. Diabetes Technol Ther, 2009, 11(6): 353-359.

[4]? 吳偉,郭軍巧,安淑一,等.使用思維進化算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)建立腎綜合征出血熱預(yù)測模型[J].中國衛(wèi)生統(tǒng)計,2016,33(1):27-30.

[5]? 葉華容,楊怡,林萱,等.BP神經(jīng)網(wǎng)絡(luò)在高頻彩超特征診斷乳腺癌中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2016,33(1):71-72.

[6]? Tseng WT, Chiang WF, Liu SY, et al. The application of data mining techniques to oral cancer prognosis[J]. J Med Syst, 2015, 39(5): 59-66.

[7]? Gonzalez GH, Tahsin T, Goodale BC, et al. Recent advances and emerging applications in text and data mining for biomedical discovery[J]. Brief Bioinform, 2015, 17(1): 33-42.

[8]? 黃雅鈴,楊曉波,龍禹,等.廣西地區(qū)妊娠期糖尿病的危險因素分析及其風險預(yù)測模型的建立[J].廣西醫(yī)科大學學報,2017,34(6):835-838.

[9]? 呂喆,陳亦棋,沈麗君,等.2型糖尿病患者糖尿病視網(wǎng)膜病變風險預(yù)測模型的建立和初步驗證[J].中華眼底病雜志,2017,33(3).

[10]? 中華醫(yī)學會糖尿病學分會.中國2型糖尿病防治指南(2010年版)[J].中國實用鄉(xiāng)村醫(yī)生雜志,2011,20(6):4-5.

[11]? 中華醫(yī)學會心血管病學分會,中華心血管病雜志編輯委員會.非ST段抬高急性冠狀動脈綜合征診斷和治療指南[J].中華心血管病雜志,2012,40(5):353-367.

[12]? 黨樂,胡雅婷,張永莉.多種抗體檢測在甲狀腺疾病診斷中的應(yīng)用價值[J].中國醫(yī)藥導(dǎo)報,2016,13(18):65-68.

[13]? 楊小軍,張雪超,李安琪.利用Excel和Tableau實現(xiàn)業(yè)務(wù)工作數(shù)據(jù)化管理[J].電腦編程技巧與維護,2017(12):66-68.

[14]? 陳春明,孔靈芝.中華人民共和國衛(wèi)生部疾病控制司.中國成人超重和肥胖癥預(yù)防控制指南[M].北京:人民衛(wèi)生出版社,2006.

[15]? 宋健,吳學森,張杰,等.三種統(tǒng)計學模型在糖尿病個體患病風險預(yù)測中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2017(2):312-314.

[16]? 趙曉華.基于大數(shù)據(jù)下2型糖尿病及并發(fā)癥患者就診信息的挖掘研究[D].廣州:廣州中醫(yī)藥大學,2016.

[17]? Leon BM, Maddox TM. Diabetes and cardiovascular disease: Epidemiology, biological mechanisms, treatment recommendations and future research[J]. World J Diabetes, 2015, 6(13): 1246-1258.

[18]? 王東營,張琨,許天敏.宮頸癌患病危險因素及一級預(yù)防[J].現(xiàn)代腫瘤醫(yī)學,2017,25(11):1827-1830.

猜你喜歡
感知器準確率神經(jīng)網(wǎng)絡(luò)
火箭貯箱噴涂機器人直接示教運動感知器設(shè)計與分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
感知器在礦井突水水源識別中的應(yīng)用
AI超市
高速公路車牌識別標識站準確率驗證法
基于神經(jīng)網(wǎng)絡(luò)的拉矯機控制模型建立
復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)在基于WiFi的室內(nèi)LBS應(yīng)用
基于支持向量機回歸和RBF神經(jīng)網(wǎng)絡(luò)的PID整定