□吳培莎
(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院 廣東 廣州 510631)
探究城鎮(zhèn)居民生活及健康狀態(tài)同心臟病的聯(lián)系
□吳培莎
(華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院 廣東 廣州 510631)
本文基于一份心臟病調(diào)查數(shù)據(jù),探究個(gè)體的生活習(xí)慣以及健康狀態(tài)同心臟病之間的聯(lián)系。首先,基于APRIORI關(guān)聯(lián)規(guī)則算法得出客觀指標(biāo)和健康指標(biāo)之間的強(qiáng)關(guān)聯(lián)規(guī)則;然后,根據(jù)提升度的排序以及結(jié)合客觀事實(shí)刪除客觀指標(biāo)中與健康指標(biāo)強(qiáng)相關(guān)的變量;最后,將剔除了相關(guān)變量的數(shù)據(jù)集進(jìn)行K-Means聚類,得出保持愉悅情緒,不宜過度疲勞以及控制飲食清淡,調(diào)節(jié)血糖、血壓、血脂在正常狀況對(duì)于心臟健康的重要性。
APRIORI關(guān)聯(lián)規(guī)則;K-Means聚類
本文所使用的數(shù)據(jù)是一份心臟病調(diào)查數(shù)據(jù)??偣灿?20個(gè)樣本。數(shù)據(jù)集包含20個(gè)指標(biāo),其中有12項(xiàng)為客觀指標(biāo),分別是:性別,年齡,工作強(qiáng)度,婚姻,擁有車的數(shù)量,鍛煉頻率,飲食,熬夜頻率,是否有寵物,抽煙頻率,家族藥物史;8項(xiàng)為健康指標(biāo),分別是:情緒,疲勞度,血壓,肥胖,血糖,血脂,是否患糖尿病,是否患心臟病8項(xiàng),其中“是否患有心臟病”是本文的研究變量。
首先,將除年齡外的11個(gè)客觀指標(biāo)列為關(guān)聯(lián)規(guī)則的前項(xiàng),除是否患有心臟病的7個(gè)健康指標(biāo)列為關(guān)聯(lián)規(guī)則的后項(xiàng)。選擇10%的最小支持度和80%的最小置信度,得到47條關(guān)聯(lián)規(guī)則,這些關(guān)聯(lián)規(guī)則的提升度都大于1,故都為有效的規(guī)則。按提升度降序排列,可以精煉為一下幾條比較符合常理的規(guī)則:
(1)工作高強(qiáng)度、很少鍛煉、經(jīng)常熬夜者、有家族醫(yī)藥史的個(gè)體容易感到緊張壓力大。工作強(qiáng)度中等且經(jīng)常運(yùn)動(dòng)者,則情緒比較平靜。這說明工作強(qiáng)度、鍛煉頻率、熬夜頻率、是否有家族醫(yī)藥史與個(gè)體的情緒存在很大關(guān)聯(lián)。
(2)工作強(qiáng)度中等且有家族醫(yī)藥史者,經(jīng)常熬夜且有家族醫(yī)藥史者,運(yùn)動(dòng)不定期但工作強(qiáng)度中等者,血壓會(huì)比較高。可以看到,是否有家族醫(yī)藥史,熬夜頻率以及鍛煉頻率與個(gè)體的血壓有比較大的關(guān)聯(lián)。
(3)工作高強(qiáng)度、很少鍛煉經(jīng)常熬夜者,經(jīng)常抽煙但很少鍛煉且有家族醫(yī)藥史者比較容易有高血脂。同情緒一樣,工作強(qiáng)度、鍛煉頻率、熬夜頻率、是否有家族醫(yī)藥史同高血脂存在一定的關(guān)聯(lián),另外,抽煙的頻率越高,越容易得高血脂。
為了確定K-Means聚類的簇?cái)?shù),本文采用所有樣本到聚類中心距離的均值為判斷標(biāo)準(zhǔn)。研究結(jié)果顯示,當(dāng)聚類個(gè)數(shù)達(dá)到5h,樣本到中心點(diǎn)的距離均值趨于一個(gè)比較穩(wěn)定的值,所以確定k為5。5個(gè)簇類樣本占總樣本的比例分別為34.1%,20%,17.3%,15.9%,12.7%,這5個(gè)簇類犯心臟病的概率分別為2.67%,31.82%,13.16%,14.29%,71.43%。
觀察聚類1,犯心臟病的概率只有2.67%,這類人群幾乎血壓、血脂、血糖都是正常,幾乎不患糖尿病,且60%以上的人飲食比較清淡,不養(yǎng)寵物,情緒和疲勞程度都比較正常。
觀察聚類5,犯心臟病的概率達(dá)到了71.43%,這類人中血壓和血脂雙高的人達(dá)到了85.7%,他們口味比較重,而且80%以上的人時(shí)常感覺到緊張和壓力大,而且極度的疲勞。這說明血糖和血脂這些指標(biāo)是可能患心臟病的危險(xiǎn)信號(hào);情緒上的緊張、高壓力和極度的疲勞也會(huì)危害人的心臟健康;另一方面,飲食上偏油膩也可能是患心臟病的因素之一。聚類1和聚類5的人大部分都不養(yǎng)寵物,這說明犯心臟病的概率高低和是否養(yǎng)寵物不存在極大的關(guān)聯(lián)。
聚類2中犯心臟病的概率為31.82%,這類人同聚類五中的人一般,血壓和血脂雙高,且飲食大都比較油膩,但是68.2%的人情緒一般,77.3%疲勞程度正常。將其與聚類5聯(lián)系起來,可以說明當(dāng)在血壓、血脂偏高的情況,保持愉悅的心態(tài),工作和生活不要過度疲勞,可以降低一半以上患心臟病的概率。
聚類3和聚類4患病的概率接近,聚類3犯病的概率會(huì)比聚類4偏低,但是聚類3中血壓和血脂雙高的人都達(dá)到了78.9%以上,而聚類4中68.6%血壓正常,血脂高的人占97.1%,其他指標(biāo)相差不大。這說明血脂高比血壓高更危險(xiǎn)一點(diǎn)。
個(gè)體的生活習(xí)慣,狀態(tài)影響著其患心臟病的比率,控制清淡飲食,保持適當(dāng)?shù)墓ぷ髁康荒苓^于疲乏,緩解緊張情緒,壓力不適宜過大,可以在一定程度上維持心臟健康。個(gè)體應(yīng)多關(guān)注自己的血壓、血糖、血脂的狀況,在這些指標(biāo)不正常的情況下及時(shí)調(diào)節(jié),保持良好心態(tài),有助于降低患心臟病的比率。
1004-7026(2017)15-0110-01
R195
A
10.16675/j.cnki.cn14-1065/f.2017.15.072
吳培莎(1995-),女,漢族,廣東汕頭人,華南師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,2014級(jí)本科生,研究方向:金融數(shù)學(xué)。