黃文婧
摘 要:近年來(lái),糖尿病發(fā)病率呈逐年上升的趨勢(shì),影響糖尿病的因素有很多,例如睡眠不足、飲食不合理等等,這些都與我們的生活習(xí)慣息息相關(guān)。本文以數(shù)學(xué)建模賽題為例糖尿病發(fā)病率問(wèn)題進(jìn)行分析。針對(duì)問(wèn)題一,首先,根據(jù)糖尿病診斷的相關(guān)資料本文將空腹血糖濃度分為三個(gè)階段,以此為標(biāo)準(zhǔn)來(lái)判斷發(fā)病率大小。其次,從性別、年齡和總體情況三個(gè)方面來(lái)比較兩家單位的發(fā)病率。年齡方面,通過(guò)相關(guān)分析比較兩家單位患病率與年齡之間的相關(guān)性,得到設(shè)計(jì)研究院中的年齡與發(fā)病概率的相關(guān)系數(shù)大于網(wǎng)絡(luò)公司。并且兩家單位的患病率都隨著年齡的增長(zhǎng)而增長(zhǎng)。性別方面,通過(guò)獨(dú)立樣本非參數(shù)檢驗(yàn)來(lái)判斷,得到不同單位的性別相同的員工患病情況不存在顯著性差異,且網(wǎng)絡(luò)公司男女患病率之間的差異要略大于設(shè)計(jì)研究院??傮w上,直接比較兩單位的平均患病率,設(shè)計(jì)研究院的糖尿病發(fā)病率為12.76%,要高于網(wǎng)絡(luò)公司的發(fā)病率11.64%。針對(duì)問(wèn)題二,題目要求分析不同的工作、生活行為方式對(duì)糖尿病患病率產(chǎn)生的影響。因?yàn)闃颖緮?shù)據(jù)量過(guò)少,所以采用建立灰色模型的方法對(duì)影響因素進(jìn)行分析。首先,計(jì)算出每種情況的人數(shù)占總體的概率,其次,通過(guò)灰色生成中的均值生成對(duì)樣本數(shù)據(jù)進(jìn)行擴(kuò)充,并利用灰色關(guān)聯(lián)分析求出各種情況與患病率的關(guān)聯(lián)度。結(jié)果表明,不加班和自帶飯與患病率關(guān)聯(lián)度最大,關(guān)聯(lián)度分別為0.4593和0.4478,且兩種因素與患病率都呈負(fù)相關(guān),即經(jīng)常加班和吃盒飯容易誘發(fā)糖尿病??傮w上,加班情況和用餐情況與患病率的相關(guān)度分別為0.4634及0.4145,也就是說(shuō)加班情況對(duì)糖尿病患病率的影響比用餐情況更大。
關(guān)鍵詞:相關(guān)分析;獨(dú)立樣本非參數(shù)檢驗(yàn);均值生成;灰色關(guān)聯(lián)分析
中圖分類(lèi)號(hào):R184 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2019)06-0190-04
1 問(wèn)題重述
糖尿病是一種常見(jiàn)的內(nèi)分泌代謝疾病,其發(fā)病率呈逐年上升的趨勢(shì)。本文計(jì)劃通過(guò)研究不同年齡、不同職業(yè)人群中糖尿病患病情況,分析各種工作、生活行為方式對(duì)糖尿病患病率的影響,對(duì)糖尿病防治提供參考。附件中給出了某設(shè)計(jì)研究院和網(wǎng)絡(luò)公司體檢數(shù)據(jù),以及對(duì)兩家單位員工訪(fǎng)談的數(shù)據(jù)。問(wèn)題一:請(qǐng)根據(jù)上述附件的數(shù)據(jù)資料比較兩家單位糖尿病發(fā)病率,提出本文的結(jié)論;問(wèn)題二:在前一問(wèn)基礎(chǔ)上分析不同的工作、生活行為方式可能對(duì)糖尿病患病率產(chǎn)生的影響。
2 問(wèn)題假設(shè)
(1)假設(shè)糖尿病診斷結(jié)果由空腹血糖濃度決定;(2)假設(shè)附錄中血糖數(shù)據(jù)可以反映樣本的真實(shí)血糖狀況,即樣本空腹血糖濃度高于7.0mmol/L情況下一定患糖尿病,空腹血糖值低于6.1mmol/L一定不患病;(3)假設(shè)在空腹血糖受損階段(6.1mmol/L-7mmol/L),血糖越高發(fā)病率越大,且概率服從均勻分布;(4)假設(shè)抽取的訪(fǎng)談人數(shù)能反應(yīng)兩家單位的基本情況。
3 符號(hào)說(shuō)明
符號(hào)說(shuō)明表1所示[1-2]。
4 模型的建立
4.1 問(wèn)題一模型的建立和求解
4.1.1 衡量發(fā)病率
通過(guò)查閱有關(guān)糖尿病診斷的資料得知[3],血糖濃度高于7mmol/L即診斷為患糖尿病,發(fā)病率視為1,血糖濃度低于6.1mmol/L為正?;蛘叩脱菭顩r,發(fā)病率視為0。血糖濃度介于7mmol/L和6.1mmol/L之間為空腹血糖受損階段,也是從正常到糖尿病的一個(gè)過(guò)渡階段,有可能發(fā)展成為糖尿病,發(fā)病概率可以視作幾何概型,空腹血糖受損階段發(fā)病率表達(dá)式如下:
(1)
由此我們可以得到每一個(gè)樣本較為準(zhǔn)確的發(fā)病率。
4.1.2 年齡因素比較
由于直接觀察圖一無(wú)法得出患病率和年齡的關(guān)系,也難以比較兩家單位的患病率。所以將年齡按每五歲為一區(qū)間分成8類(lèi)[4-5]。求出每一區(qū)間的患病率平均值,如圖1所示。
在年齡這一因素下比較兩家單位患病率。兩家單位的不同點(diǎn)在于:由圖1可見(jiàn),在中年階段設(shè)計(jì)院平均患病率要高于網(wǎng)絡(luò)公司,在青年和老年階段網(wǎng)絡(luò)公司的平均患病率高于設(shè)計(jì)研究院。兩家單位的相同點(diǎn)在于,患病率都隨著年齡的增長(zhǎng)而增長(zhǎng),由圖1中的趨勢(shì)線(xiàn)可以判斷。
比較兩家單位年齡與發(fā)病率的相關(guān)程度,通過(guò)相關(guān)分析中的雙變量相關(guān)來(lái)分析,將數(shù)據(jù)導(dǎo)入SPSS,得到表2、 表3的數(shù)據(jù)[6-7]。
由表2、表3可以得到設(shè)計(jì)研究院中的年齡與發(fā)病概率的Pearson相關(guān)系數(shù)為0.091,而網(wǎng)絡(luò)公司年齡與發(fā)病率的Pearson相關(guān)系數(shù)為0.046,這兩個(gè)相關(guān)系數(shù)都是小于0.3的,所以可以得知兩家單位的年齡與發(fā)病率相關(guān)性較小。又由于設(shè)計(jì)研究院的年齡與發(fā)病率的Pearson相關(guān)系數(shù)大于網(wǎng)絡(luò)公司,所以得到設(shè)計(jì)研究院的年齡與發(fā)病率的相關(guān)性要略大于網(wǎng)絡(luò)公司年齡與發(fā)病率的相關(guān)性。
4.1.3 性別因素比較
分別求出設(shè)計(jì)研究院和網(wǎng)絡(luò)公司的男女患病率進(jìn)行比較,結(jié)果如表4所示。
由表4可見(jiàn),在設(shè)計(jì)研究院中女性的患病率比男性高;在網(wǎng)絡(luò)公司中男性患病率比女性高。
在比較兩家單位的發(fā)病率的過(guò)程中,對(duì)兩家單位男女的患病率進(jìn)行頻率估計(jì),得到兩家單位患病率的頻率分布直方圖如圖2-3所示。
通過(guò)觀測(cè)圖發(fā)現(xiàn)兩家單位的患病率數(shù)據(jù)明顯不服從正態(tài)分布,并且無(wú)法通過(guò)變量變換將發(fā)病率的數(shù)據(jù)轉(zhuǎn)化為近似正態(tài)分布。為了達(dá)到分析兩家單位男女患病率是否存在顯著性差異的目的,本文通過(guò)獨(dú)立樣本非參數(shù)檢驗(yàn)中的檢驗(yàn)來(lái)判斷:?jiǎn)挝粌?nèi)部男女患病率是否存在顯著性差異,以及不同單位的同一性別樣本是否存在顯著性差異[8]。
首先計(jì)算網(wǎng)絡(luò)公司男女員工患病率是否存在顯著性差異,將男性記為1,女性記為2,根據(jù)之前求出的男女患病率,代入中進(jìn)行計(jì)算,得出含有檢驗(yàn)統(tǒng)計(jì)量和概率值的表5所示。同理得到表6所示。
通過(guò)分析表5可以得到,檢驗(yàn)統(tǒng)計(jì)量為0.349,概率值為1.000,因?yàn)轱@著性水平,即檢驗(yàn)統(tǒng)計(jì)量取值為0.349時(shí),原假設(shè)成立的概率為1.000,所以接受原假設(shè),即網(wǎng)絡(luò)公司的男女的患病率不存在顯著性差異。通過(guò)分析表6可以得到,檢驗(yàn)統(tǒng)計(jì)量為0.562,概率值為0.910,同理可得設(shè)計(jì)研究院男女的患病率不存在顯著性差異。但是通過(guò)比較漸進(jìn)顯著性可以得到,網(wǎng)絡(luò)公司男女患病率之間的差異要略大于設(shè)計(jì)研究院。
其次分別計(jì)算設(shè)計(jì)研究院和網(wǎng)絡(luò)公司中男性和女性患病率是否存在顯著性差異,同樣將男性記為1,女性記為2,根據(jù)之前求出的兩家單位中男女的患病率,代入進(jìn)行計(jì)算,得到含有檢驗(yàn)統(tǒng)計(jì)量和概率值,如表7、8所示。
通過(guò)分析兩表可以得到,判斷兩家單位男性患病率顯著性差異情況時(shí),檢驗(yàn)計(jì)量為0.603,概率值為0.860。因?yàn)轱@著性水平,,即在檢驗(yàn)統(tǒng)計(jì)量為0.603時(shí),原假設(shè)成立的概率為0.860,所以接受原假設(shè),網(wǎng)絡(luò)公司的男性患病率和設(shè)計(jì)研究院的男性患病概率不存在顯著性差異;判斷兩家單位女性患病率顯著性差異情況時(shí),檢驗(yàn)統(tǒng)計(jì)量為0.463,概率值為0.983,,同理可得,兩家單位的女性的患病率同樣不存在顯著性差異。
4.1.4 總體比較
算出兩家單位患病率平均值,并繪制兩家單位患病占總體的百分比情況,如圖4-5所示。
發(fā)現(xiàn)設(shè)計(jì)研究院的平均發(fā)病率為12.76%,網(wǎng)絡(luò)公司平均發(fā)病率為11.64%。也就是設(shè)計(jì)研究院的平均發(fā)病率要高于網(wǎng)絡(luò)公司。
設(shè)計(jì)研究院和網(wǎng)絡(luò)公司男女比例均為3:2,并且已經(jīng)證明兩家單位男女患病率均無(wú)顯著性差異。同時(shí),設(shè)計(jì)研究院?jiǎn)T工的平均年齡為48.20歲,明顯高于網(wǎng)絡(luò)公司員工的平均年齡36.48歲,所以可以初步推斷年齡可能對(duì)患病率的影響比性別大。性別和年齡與患病率相關(guān)性的比較結(jié)果符合我們查閱的相關(guān)資料[9],可以間接驗(yàn)證我們的分析是正確的。
4.2 問(wèn)題二模型的建立和求解
在問(wèn)題二中,我們需要分析不同的工作、生活行為方式可能對(duì)糖尿病患病率產(chǎn)生的影響。各種加班情況的嚴(yán)重程度及各種午餐情況的不健康程度無(wú)法進(jìn)行數(shù)量化,所以將八種情況當(dāng)做并列因素。為了便于直觀分析,根據(jù)訪(fǎng)談人數(shù)分別計(jì)算在設(shè)計(jì)研究院和網(wǎng)絡(luò)公司中經(jīng)常加班、偶爾加班、不加班、說(shuō)不清、單位餐廳、自帶、盒飯、其他情況的頻率。如表9所示。
由于只有兩組數(shù)據(jù),樣本數(shù)據(jù)量達(dá)不到數(shù)據(jù)處理的要求,所以通過(guò)均值生成法對(duì)樣本進(jìn)行增廣擴(kuò)充,將第一組和第二組數(shù)據(jù)求平均得到了第三組數(shù)據(jù),將第二組和第三組數(shù)據(jù)求平均得到了第四組數(shù)據(jù),以此進(jìn)行了數(shù)據(jù)擴(kuò)展的處理,擴(kuò)充后的樣本與原樣本如表10所示。
得到擴(kuò)充過(guò)的數(shù)據(jù)之后,通過(guò)灰色關(guān)聯(lián)分析求各指標(biāo)與患病率的關(guān)聯(lián)度。
(1)確定比較對(duì)象(評(píng)價(jià)對(duì)象)和參考數(shù)列(評(píng)價(jià)標(biāo)準(zhǔn))。把影響糖尿病患病率的八個(gè)指標(biāo)作為比較對(duì)象,
。四組糖尿病患病率作為參考數(shù)列,即
(2)對(duì)指標(biāo)數(shù)據(jù)進(jìn)行無(wú)量綱化處理并確定各指標(biāo)對(duì)應(yīng)的權(quán)重,,為第個(gè)評(píng)價(jià)指標(biāo)對(duì)應(yīng)的權(quán)重。無(wú)量綱化處理的公式如下:
(2)
無(wú)量綱化后的數(shù)據(jù)如下矩陣:
參考數(shù)列,由于本題中八個(gè)評(píng)價(jià)指標(biāo)為平行指標(biāo)并且無(wú)權(quán)重差異,所以我們認(rèn)定這八個(gè)指標(biāo)權(quán)重相同,。
(3)計(jì)算灰色關(guān)聯(lián)系數(shù)并計(jì)算灰色加權(quán)關(guān)聯(lián)度。
計(jì)算出無(wú)量綱化矩陣后,構(gòu)建綜合評(píng)價(jià)模型,計(jì)算灰色關(guān)聯(lián)系數(shù)的方程如下:
(3)
為比較數(shù)列對(duì)參考數(shù)列在第個(gè)指標(biāo)上的關(guān)聯(lián)系數(shù),分別為兩級(jí)最小差和兩級(jí)最大差,其中為分辨系數(shù),分辨系數(shù)越大,分辨率越大,一般情況下取。
計(jì)算得到八個(gè)指標(biāo)關(guān)聯(lián)系數(shù)矩陣如下:
其中,, =3.9268。
在求出各指標(biāo)的關(guān)聯(lián)系數(shù)后,計(jì)算灰色加權(quán)關(guān)聯(lián)度?;疑訖?quán)關(guān)聯(lián)度的計(jì)算公式為:
(4)
其中,為第個(gè)指標(biāo)與患病率的灰色加權(quán)關(guān)聯(lián)度,因?yàn)楦髦笜?biāo)所占權(quán)重相同且均為,所以各指標(biāo)與患病率的關(guān)聯(lián)度分別為:
(4)評(píng)價(jià)分析,灰色關(guān)聯(lián)度越大,該評(píng)價(jià)指標(biāo)與患病率關(guān)聯(lián)越緊密。由灰色關(guān)聯(lián)度排序可以看出在八種情況中,加班情況說(shuō)不清和其他用餐情況這兩種與患病率的關(guān)聯(lián)度最大。在不考慮說(shuō)不清和其他者兩種指標(biāo)的情況下,關(guān)聯(lián)度最大的是不加班和自帶午餐這兩種情況,關(guān)聯(lián)度分別為0.4593和0.4478。求出加班情況和用餐情況與患病率的相關(guān)度分別為0.4634及0.4145。也就是說(shuō)在這兩家單位的員工中,加班情況對(duì)糖尿病患病率的影響比用餐情況更大。而在其他糖尿病發(fā)病率研究的文獻(xiàn)中,可以得知缺乏睡眠會(huì)干擾胰島素的血糖調(diào)節(jié)機(jī)制,對(duì)肥胖和胰島素耐受性產(chǎn)生明顯的影響。而飲食對(duì)糖尿病患病率的影響也表現(xiàn)在每日鹽和油的攝取上。這說(shuō)明了不加班和自帶飯與患病率呈負(fù)相關(guān),即經(jīng)常加班和吃盒飯容易誘發(fā)糖尿病。
參考文獻(xiàn)
[1] 錢(qián)榮立.關(guān)于糖尿病的新診斷標(biāo)準(zhǔn)與分型[J].中國(guó)糖尿病雜志,2000(1):4-5.
[2] 馬辰星,許穎,康向輝,等.空腹血糖診斷糖尿病截點(diǎn)的探討與評(píng)價(jià)[J].中國(guó)全科醫(yī)學(xué),2014,17(17):1943-1945.
[3] 陳妍,劉建國(guó),徐磊,等.空腹血糖、餐后2h血糖及糖化血紅蛋白對(duì)糖尿病的診斷價(jià)值[J].鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2012,47(04):534-537.
[4] 錢(qián)榮立.關(guān)于糖尿病新診斷標(biāo)準(zhǔn)與分型的意義[J].臨床內(nèi)科雜志,2000(03):133.
[5] 汪秋實(shí),閆麗,呂淑榮,等.糖尿病前期人群血脂異常及其危險(xiǎn)因素分析[J].東南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2015,34(5):749-754.
[6] 孫繼佳,陸奕宇,蘇式兵.灰色關(guān)聯(lián)分析方法在中醫(yī)學(xué)臨床信息分析中的應(yīng)用[J].數(shù)理醫(yī)藥學(xué)雜志,2011,24(1):12-14.
[7] 張娜.基于灰色理論與關(guān)聯(lián)規(guī)則的中藥注射劑不良反應(yīng)成因研究[D].北京中醫(yī)藥大學(xué),2010.
[8] 焦春義.影響教師健康因素的灰色關(guān)聯(lián)分析和綜合關(guān)聯(lián)分析[J].南陽(yáng)師范學(xué)院學(xué)報(bào),2009(6):26-28.
[9] 程茅偉,宋毅,易國(guó)勤,等.湖北省城鄉(xiāng)居民糖尿病和空腹血糖受損流行狀況分析[J].華中科技大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2010,39(4):572-576.