石福艷 趙 倩 潘 靜 雷淑林 王麓璐 楊麗平△ 徐勇勇
潛類別模型在常見慢性病與日常生活方式關(guān)聯(lián)性研究中的應(yīng)用*
石福艷1,2趙 倩3潘 靜3雷淑林3王麓璐3楊麗平3△徐勇勇2△
目的 探討潛在類別模型在超聲診斷的常見慢性病與人群日常生活行為方式分型關(guān)聯(lián)性研究中的應(yīng)用。方法 采用潛在類別分析方法分析早餐是否規(guī)律、吸煙、被動(dòng)吸煙、大量飲酒、鍛煉情況等生活行為模式,根據(jù)人群生活行為方式對(duì)研究人群聚類后,比較不同行為方式人群的人口學(xué)特征及B超診斷常見慢性病分布情況。結(jié)果 1164例研究對(duì)象的行為方式可分為3大類,分別是行為方式基本健康組、行為方式亞健康組和行為方式不健康組。各組人數(shù)分布情況依次為:208人(17.3%)、223人(21.4%)和733人(61.3%)。三組人群的年齡、性別、血型、婚姻狀況、文化程度和職業(yè)狀況的內(nèi)部構(gòu)成不同(所有P<0.05)。本研究結(jié)果顯示:除脂肪肝在3類行為方式組中的分布不同外,其他B超診斷常見慢性病的分布無統(tǒng)計(jì)學(xué)差異(P>0.05)。大多數(shù)診斷結(jié)果(除腎結(jié)石、脂肪肝、肝囊腫外)的變化趨勢(shì)均符合從行為方式基本健康組、行為方式亞健康組、行為方式不健康組依次增高的變化趨勢(shì)。多因素logistic回歸分析結(jié)果表明,影響脂肪肝的主要因素有肥胖、吸煙、大量飲酒及低豆制品攝入。結(jié)論 潛在類別模型可用于人群的日常行為方式分型研究,探索不同行為方式與慢性病之間的關(guān)聯(lián)性,揭示健康行為干預(yù)的重點(diǎn)人群和內(nèi)容,進(jìn)而為有針對(duì)性制定干預(yù)措施提供科學(xué)依據(jù)。
潛在類別模型 體檢 超聲 生活行為 慢性病
隨著人類社會(huì)的發(fā)展,影響人類健康的疾病譜及死亡譜也在發(fā)生變化,由過去的急性傳染病、寄生蟲病、營養(yǎng)缺乏等疾病逐步轉(zhuǎn)移到以心腦血管疾病、惡性腫瘤、代謝性疾病等為主的慢性疾病(簡稱慢性病),目前慢性病是影響全球人群健康最主要的死因[1]。世界衛(wèi)生組織調(diào)查結(jié)果顯示,行為因素及生活方式已成為影響居民健康的主要因素[2]。大量研究表明,采取健康的生活方式,如不吸煙、適度飲酒、有規(guī)律的鍛煉及健康飲食習(xí)慣等,可促進(jìn)人群健康,降低患病風(fēng)險(xiǎn)[3-5]。健康行為通常呈現(xiàn)成簇性發(fā)生的特點(diǎn),即大多數(shù)個(gè)體表現(xiàn)出不止一種健康行為,此即健康行為的多維度特征[6]。
潛在類別分析(latent class analysis,LCA)是探討存在統(tǒng)計(jì)學(xué)關(guān)聯(lián)的分類外顯變量背后的類別潛變量的一種統(tǒng)計(jì)學(xué)技術(shù)。該方法的分析目的在于利用潛類別解釋多個(gè)外顯分類變量之間的復(fù)雜關(guān)聯(lián),使之能以最少的潛類別數(shù)解釋外顯變量之間的關(guān)聯(lián),并使各潛類別內(nèi)部的外顯變量之間滿足局部獨(dú)立的要求。潛在類別分析常用于社會(huì)學(xué)、生物醫(yī)學(xué)及心理學(xué)等多個(gè)領(lǐng)域的多維特征分類研究[7-8]。
研究常見慢性病與人群日常行為方式之間的關(guān)聯(lián)性,對(duì)不同行為模式人群采取有針對(duì)性干預(yù)措施,進(jìn)而實(shí)現(xiàn)對(duì)慢性病的有效管理、制定公共健康干預(yù)措施以及識(shí)別高危人群等具有重要意義。本研究采用潛在類別方法,分析西安市西京醫(yī)院健康管理中心體檢人群的健康行為模式及不同行為模式下的人群特征及B超診斷常見慢性疾病的分布差異,為快速識(shí)別健康行為重點(diǎn)干預(yù)人群和有針對(duì)性制定健康干預(yù)措施提供科學(xué)依據(jù)?,F(xiàn)將研究結(jié)果報(bào)告如下。
1.數(shù)據(jù)來源
選取2014年3月-7月期間在西安市西京醫(yī)院健康管理中心進(jìn)行健康體檢的人群進(jìn)行問卷調(diào)查。調(diào)查內(nèi)容包括:體檢者的一般情況、飲食習(xí)慣、生活習(xí)慣疾病史及家族史等。除調(diào)查問卷收集的內(nèi)容外,納入本次分析研究的項(xiàng)目還包括體格檢查、腹部B超檢查等相關(guān)內(nèi)容。篩選調(diào)查中資料不全或資料有缺項(xiàng)者,共有1164名體檢人員符合本次研究要求。
2.研究變量
本研究所涉及的常見慢性病主要為體檢時(shí)腹部B超診斷疾病,主要包括:脂肪肝、肝囊腫、肝血管瘤、膽囊息肉、膽囊炎、膽結(jié)石、腎結(jié)石、腎囊腫等。納入本次研究的行為因素主要有:肥胖、吸煙、被動(dòng)吸煙、飲酒、蔬果攝入情況、鍛煉情況、豆制品攝入情況、腌制食品攝入情況、油炸食品攝入情況及早餐食用情況。
3.統(tǒng)計(jì)學(xué)處理
(1)潛在類別分析的基本模型
潛在類別模型包括潛在類別概率(latent class probabilities)和條件概率(conditional probabilities)兩種類型參數(shù)。假設(shè)有三個(gè)外顯變量A、B、C,其水平數(shù)分別為I、J、K,且其彼此之間不相互獨(dú)立。若存在某一具有T個(gè)潛類別的潛變量X,該變量不僅可以解釋A、B、C三者間的關(guān)系,而且在X的每個(gè)類別中可維持A、B、C這三個(gè)外顯變量的局部獨(dú)立性,即為潛在類別分析,則其基本的潛在類別模型為:
(2)模型擬合及參數(shù)估計(jì)
潛在類別分析主要采用極大似然法(maximum likelihood,ML)進(jìn)行參數(shù)估計(jì),其迭代過程中常用的算法有最大期望法(expectation-maximization,EM)、牛頓-拉普森(Newton- Raphson,NR)和Fisher計(jì)分法等,其中以EM算法最為常用。
(3)模型評(píng)價(jià)
模型評(píng)價(jià)的工作在于找出包含較少參數(shù)、較為簡單,但又具有較好擬合優(yōu)度的模型。其常用的評(píng)價(jià)指標(biāo)有:Pearsonχ2值、似然比χ2值、Akaike信息準(zhǔn)則(AIC)和Baysian信息準(zhǔn)則(BIC)等。其中Pearsonχ2值和似然比χ2值所對(duì)應(yīng)的P值大于0.05,表明模型擬合得好;AIC和BIC統(tǒng)計(jì)量值越小,則意味著模型擬合的越好。有研究者指出當(dāng)樣本量以數(shù)千計(jì)時(shí),BIC指標(biāo)更可靠,否則AIC更佳〔9〕。
(4)個(gè)體的潛在分類
在確定模型后,需要將各觀察值分類到適當(dāng)?shù)臐撛陬悇e當(dāng)中,以說明觀察值的后驗(yàn)類別屬性,即潛在聚類分析。潛在聚類分析是在一定的概率模型之下,利用估計(jì)所得的潛類別概率和潛類別中各外顯變量的條件概率計(jì)算外顯變量反應(yīng)每種組合分類到各潛類別的后驗(yàn)概率,然后依據(jù)后驗(yàn)概率的大小決定該組合的個(gè)體應(yīng)歸入的潛類別。后驗(yàn)概率的計(jì)算公式為:
(5)統(tǒng)計(jì)分析軟件
本研究的潛在類別分析采用Mplus 5.1軟件,其他統(tǒng)計(jì)學(xué)分析采用SPSS13.0軟件完成。
1.一般人口學(xué)特征
本次調(diào)查的1164名體檢人群中,男性630人,占54.1%,女性534人,占45.9%。血型的分布情況為:A型血、B型血、AB型、O型及血型不清楚者分別有207人(17.8%)、246人(21.1%)、93人(8.0%)、264人(22.7%)和354人(30.4%)。文化程度的分布情況分別為:初中及以下298人(25.6%)、高中233人(20.0%)、大專236人(20.3%)、本科264人(22.7%)、研究生及以上133人(11.4%)。本次研究對(duì)象中以企事業(yè)單位為主,占46.9%,其次為離退休人員(14.9%)和商業(yè)及服務(wù)人員(11.9%)。研究對(duì)象的年齡范圍為22~87歲,平均年齡(47.9±10.5)歲。
2.模型擬合結(jié)果
為了選擇合適的潛類別模型,我們從潛類別數(shù)為1的初始模型開始,擬合了5個(gè)潛變量模型。表1 給出了5個(gè)潛類別模型的擬合結(jié)果。
由擬合信息可知:當(dāng)潛類別數(shù)為3時(shí),模型滿足了數(shù)據(jù)擬合的要求(L2=426.456,P> 0.05),且其BIC值最小(BIC=10914.446);當(dāng)潛類別數(shù)增加到4個(gè)潛類別數(shù)后模型擬合優(yōu)度未見明顯改善,其BIC值又呈增大趨勢(shì),故可選擇包含3個(gè)潛類別的模型作為本研究分析的理想模型。
3.模型的參數(shù)估計(jì)
基于3潛類別分析模型,利用EM 算法對(duì)潛類別概率和潛類別下各項(xiàng)目的條件概率進(jìn)行估計(jì),結(jié)果見表2。
在模型參數(shù)估計(jì)之后,依據(jù)各項(xiàng)目的條件概率特點(diǎn)對(duì)各潛在類別進(jìn)行解釋。由表3可知,在納入模型的10個(gè)項(xiàng)目中,除3個(gè)項(xiàng)目(肥胖、高腌制食品攝入和高油炸食品攝入)外,其他項(xiàng)目在三個(gè)類別的分布差異較明顯。根據(jù)分布差異明顯的七個(gè)項(xiàng)目對(duì)各類別命名如下:類別1中7個(gè)項(xiàng)目回答均為“否”(賦值為0),其條件概率均最大,因而可將該組定義為“行為方式基本健康組”;類別3中7個(gè)項(xiàng)目回答均為“是”(賦值為1),其條件概率均最大,因而可將該組定義為“行為方式不健康組”;類別2中除“吸煙”和“大量飲酒”兩個(gè)項(xiàng)目回答為“是”(賦值為1)外,其余項(xiàng)目回答均為“否”(賦值為0),故將該組定義為“吸煙、飲酒組”或“行為方式亞健康組”,為了和其他兩組的命名一致,本文將其命名為“行為方式亞健康組”。類別1、類別2和類別3三組人群的比例分別為17.4%、21.3%和61.3%。
4.不同類別人群的人口學(xué)特征
三類人群在年齡、性別、血型、婚姻狀況、文化程度和職業(yè)方面的差異均有統(tǒng)計(jì)學(xué)意義(所有P<0.05)。具體情況見表3。由表3可知,年齡在40~49歲之間的人群在行為方式基本健康組和行為方式亞健康組所占比例較大,分別為21.7%和22.8%;年齡≥60歲人群及年齡<30歲人群在行為方式不健康組中所占比例最高,其所占比例分別為80.7%和70.3%。在行為方式基本健康組,男性比例(93.3%)遠(yuǎn)遠(yuǎn)高于女性(6.7%),在行為方式不健康組女性所占比例較高,由此可知,男性的行為方式較為健康。另外,文化程度在三種行為方式組中的分別不同,其中初中及以下文化程度的人群在生活方式健康組及生活方式亞健康組的分布比例較高,而研究生及以上學(xué)歷者在生活方式不健康組的分布比例較高,為13.5%。
5.不同行為模式人群B超診斷結(jié)果分布情況
本次調(diào)查結(jié)果顯示:在各B超診斷結(jié)果中,除脂肪肝外,其他B超診斷結(jié)果在3類行為方式組中的分布情況均無統(tǒng)計(jì)學(xué)差異(P>0.05)。大多數(shù)慢性病如膽囊炎、膽結(jié)石等在行為方式亞健康組和(或)行為方式不健康組中的比例較B超健康組中的比例高。此外,大多數(shù)診斷結(jié)果(除腎結(jié)石、脂肪肝、肝囊腫外)的變化趨勢(shì)符合從行為方式基本健康組、行為方式亞健康組、行為方式不健康組依次增高的變化趨勢(shì)。具體情況見表4。對(duì)三類不同生活行為方式人群中的脂肪肝患病率進(jìn)行對(duì)比分析,分析結(jié)果顯示:三組人群的脂肪肝總體患病率不同(χ2=12.207,P=0.002)。進(jìn)一步對(duì)三類不同生活行為方式人群中的脂肪肝患病率進(jìn)行卡方分割比較分析,分析結(jié)果表明:行為方式不健康組與行為方式基本健康組兩組的脂肪肝患病率不同,行為方式不健康組的脂肪肝患病率較高(χ2=10.775,P=0.001)。而行為方式基本健康組與行為方式亞健康組、行為方式亞健康組與行為方式不健康組之間的脂肪肝患病率之間無差別(P>0.0125)。
*:相應(yīng)P值采用Fisher確切概率法計(jì)算得到。
6.脂肪肝多因素logistic回歸分析
對(duì)體檢人群中患病率較高的病種-脂肪肝的影響因素進(jìn)行分析。具體分析方法為:先采用單因素logistic回歸分析方法,分別分析影響脂肪肝的主要因素,然后以入選水準(zhǔn)α=0.05,剔出變量水準(zhǔn)取0.1進(jìn)行多因素logistic 逐步回歸分析。以是否患有脂肪肝為應(yīng)變量(2=是,0=否),以肥胖、吸煙、被動(dòng)吸煙、大量飲酒、蔬果攝入、豆制品攝入、缺乏體育鍛煉、腌制食品攝入、高油炸食品攝入及早餐不規(guī)律等為自變量,先進(jìn)行單因素logistic回歸分析,然后以入選水準(zhǔn)α=0.05,剔出變量水準(zhǔn)取0.1進(jìn)行多因素logistic 回歸分析。多因素逐步分析結(jié)果表明影響脂肪肝的主要危險(xiǎn)因素有肥胖、吸煙、大量飲酒及低豆制品攝入,具體結(jié)果見表5。
潛在類別分析是一種描述分類變量間相互關(guān)系所用的方法,該方法綜合了結(jié)構(gòu)方程模型與對(duì)數(shù)線性模型的思想,可以做探索性研究,也可以用于驗(yàn)證性研究,拓展了潛變量模型的應(yīng)用范圍[10]。本研究以1164例體檢人群的生活行為方式為基礎(chǔ),采用潛在類別分析方法對(duì)其分布規(guī)律及其與慢性病的關(guān)系進(jìn)行了探索研究。
研究結(jié)果顯示,1164名研究對(duì)象的行為方式可歸為三個(gè)組,分別是生活方式基本健康組、生活方式亞健康組和生活方式不健康組。三組人群分布情況分別為: 208人(17.4%)、223人(21.3%)和733人(61.3%)。除肥胖、高腌制食品攝入和高油炸飲食三個(gè)項(xiàng)目外,其他項(xiàng)目在三類人群中的分布特征明顯。生活方式基本健康組以不吸煙,無被動(dòng)吸煙,非大量飲酒、蔬果攝入較高,豆制品攝入較多、早餐規(guī)律和經(jīng)常鍛煉等的條件概率較高;生活方式亞健康組以吸煙、大量飲酒等條件概率較高;生活方式不健康組在吸煙、大量飲酒、被動(dòng)吸煙、低蔬果攝入,低豆制品攝入、早餐不規(guī)律和缺乏鍛煉等條目的條件概率較高。三類人群的行為方式受年齡、性別、血型、婚姻狀況、文化程度和職業(yè)的影響(各P<0.05)。各人群特征在三類人群中的分布規(guī)律不明顯,原因可能為本研究在收集資料時(shí)未采用隨機(jī)化抽樣技術(shù),所得樣本的某些人口學(xué)特征的構(gòu)成偏性較大(如性別中男性比例較大;職業(yè)狀況中以企事業(yè)單位的人群為主;婚姻狀況中已婚者的比例較大等)。
本研究結(jié)果顯示,脂肪肝在3類生活方式組中的總體患病率不同。其亞組分析結(jié)果表明,生活方式不健康組與生活方式基本健康組的脂肪肝患病率不同,但生活方式基本健康組與生活方式亞健康組、生活方式亞健康組與生活方式不健康組之間的脂肪肝患病率無差異。該結(jié)果提示人群行為及生活方式與脂肪肝患病率密切相關(guān),其中飲食習(xí)慣對(duì)脂肪肝的患病率的影響較大。為證實(shí)該研究結(jié)果,進(jìn)一步對(duì)脂肪肝影響因素進(jìn)行多因素logistic回歸分析,分析結(jié)果表明影響脂肪肝的主要行為危險(xiǎn)因素有肥胖、吸煙、大量飲酒及低豆制品攝入,該研究結(jié)論與潛在類別分型研究結(jié)論基本一致。該研究結(jié)果進(jìn)一步證實(shí)潛在類別分析研究可以用于常見慢性病與生活方式的關(guān)聯(lián)性研究中。但因本研究所采用的樣本含量較小、其他慢性病的陽性檢出人數(shù)較少等原因,本次研究中未發(fā)現(xiàn)其他B超診斷常見慢性病(如膽囊炎、膽結(jié)石、腎結(jié)石、肝囊腫等)在3類生活方式分型中的分布差異性,未得出其他慢性病與某種生活方式譜之間的關(guān)聯(lián)性。另外,該研究結(jié)果可能與本研究中未對(duì)常見生活方式疾病譜進(jìn)行具體分類有關(guān)系。本研究組擬在后續(xù)研究中通過擴(kuò)大樣本量,根據(jù)疾病特點(diǎn)對(duì)人群日常生活及行為方式進(jìn)行具體分類等方式,進(jìn)一步開展有關(guān)潛在分類分析方法在常見慢性病發(fā)病及患病狀況與人群可干預(yù)生活行為方式之間關(guān)聯(lián)性研究中的深入研究,進(jìn)而為有針對(duì)性開展常見慢性病生活方式健康教育及健康促進(jìn)提供科學(xué)依據(jù),也為有效開展人群常見慢性病防治工作奠定基礎(chǔ)。
綜上可知,本次調(diào)查研究的體檢人群中(主要以企事業(yè)單位人群為主)存在許多不良的生活習(xí)慣和行為方式,導(dǎo)致其健康狀況下降。因此,有必要在人群中,特別是以腦力勞動(dòng)為主的人群中開展戒煙、控酒、平衡膳食、體育鍛煉等健康促進(jìn)方式宣傳教育,這對(duì)降低人群中的危險(xiǎn)因素水平,改變?nèi)藗兊牟唤】敌袨楹蜕罘绞?,進(jìn)而降低常見慢性病患病率、提高人群健康及生活質(zhì)量等具有重要意義。
[1]龔幼龍.社會(huì)醫(yī)學(xué).北京:人民衛(wèi)生出版社,2000:39.
[2]WHO.Global status report on noncommunicable diseases 2010.Geneva:World Health Organization,2011.
[3]GIH.Healthy Behaviors:Addressing Chronic Disease at Its Roots.Issue Brief(Grantmakers in Health),2004,(19):1-39.
[4]胡月,陳福寬,龔磊,等.農(nóng)村居民生活方式及健康行為調(diào)查.中國公共衛(wèi)生,2013,29(6):796-798.
[5]Lantz PM,House JS,Lepkowski JM,et al.Socioeconomic factors,health behaviors,and mortality:Results from a nationally representative prospective study of US adults.JAMA,1998,279(21):1703-1708.
[6]Spring B,Moller AC,Coons MJ.Multiple health behaviours:overview and implications.J Public Health(Oxf),2012,34 Suppl 1:i3-i10.
[7]de Vries H,van’t Riet J,Spigt M,et al.Clusters of lifestyle behaviors:from the Dutch SMILE study.Prev Med,2008,46(3):203-208.
[8]邱皓政.潛在類別模型的原理與技術(shù).北京:教育科學(xué)出版社,2008.
[9]Lin TH,Dayton CM.Model selection information criteria for non-nested latent class models.Journal of Education and Behavioral Statistics,1997,22(3):249-264.
[10]曾憲華,肖琳,張巖波.潛在類別分析原理及實(shí)例分析.中國衛(wèi)生統(tǒng)計(jì),2013,30(6):815-817.
(責(zé)任編輯:劉 壯)
Application of Latent Class Model in the Research on the Correlation Between Common Chronic Diseases and Lifestyle
Shi Fuyan,Zhao Qian,Pan Jing,et al.
(Department of Health Statistics,School of Public health,Weifang Medical College(261053)Weifang)
Objective To investigate the application of latent class model in the research on the correlation between common chronic diseases diagnosed by ultrasound and lifestyle.Methods Latent class analysis(LCA)was used to indentify patterns of health behavior among eating breakfast,smoking,passive smoking,heavy drinking and exercise,and to classify the individuals.Further studies were conducted to compare demographic characteristics and the distributions of common chronic diseases diagnosed by ultrasound in different subgroups.Results Out of 1164 subjects,three subgroups of health behavior were identified which included“healthy behavioral patterns”(17.4%),“sub-healthy behavioral patterns”(21.3%)and“unhealthy behavioral patterns”(61.3%).The internal constituents of sex,blood type,marital status,educational level and occupational status were different(allP<0.05).No differences of the distribution of common chronic diseases diagnosed by ultrasound were found except for fatty liver among three behavior subgroups.Cholecystitis and gallbladder removal have a larger proportion in the sub-health behavior groups and(or)unhealthy behavior group than that in the healthy group diagnosed by type-B sonic.Except for kidney stones,fatty liver and liver cyst,most chronic diseases have the largest distribution in the unhealthy subgroup.Multi-logistic regression Results showed that risk factors associated with fatty liver were Obesity,smoking,heavy drinking and low soy food intake.Conclusions Latent class model can be applied in the classification of health behavior patterns,which can indicate the key health behavior intervention and provide scientific evidence for the intervention measures.
Latent class model;Medical examination;Ultrasound; Health behavior;Chronic diseases
國家自然科學(xué)基金(No.81473071;No.81573250);濰坊醫(yī)學(xué)院青年創(chuàng)新基金(K1302013)
1.山東省濰坊市濰坊醫(yī)學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室(261053)
2.陜西省西安市第四軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室
3.陜西省西安市第四軍醫(yī)大學(xué)第一附屬醫(yī)院綜合診療科
△通信作者:楊麗平,E-mail:ylp-1971@163.com
徐勇勇,E-mail:xuyongy@fmmu.edu.cn