胡夢(mèng)妍,劉錦波,周春華,李新莉
隨著社會(huì)經(jīng)濟(jì)的發(fā)展、人民生活水平的提高、生活方式及飲食結(jié)構(gòu)的改變,高尿酸血癥發(fā)病率呈上升趨勢(shì)[1]。長(zhǎng)期嘌呤代謝異??梢鹨幌盗懈吣蛩嵫Y相關(guān)性疾?。?],高尿酸血癥常伴有心腦血管疾病、代謝綜合征等,與胰島素抵抗密切相關(guān)[3-4]。高尿酸血癥及其并發(fā)癥嚴(yán)重影響人們的正常生活與身心健康[5],因此采取有效措施降低高尿酸血癥發(fā)病率具有重要意義。
既往高尿酸血癥的流行病學(xué)研究通常采用的是多元線性回歸、Logistic回歸或Cox回歸模型進(jìn)行危險(xiǎn)因素的篩選,但這些方法對(duì)資料的類型和分布等均有較嚴(yán)格的限定和要求,易受到共線性問題的影響,不同程度地降低了統(tǒng)計(jì)分析效能。分類樹模型作為一種新興數(shù)據(jù)處理方式,可以快速、有效地識(shí)別影響疾病發(fā)生的主要因素,克服共線性問題,并通過樹形圖展現(xiàn)不同水平變量間的交互關(guān)系[6]。因此,本研究采用整群抽樣方法對(duì)2012年7—11月桂林醫(yī)學(xué)院附屬醫(yī)院體檢中心的體檢者進(jìn)行橫斷面調(diào)查,包括問卷調(diào)查、身體測(cè)量、實(shí)驗(yàn)室檢查和肝臟超聲檢查,并構(gòu)建高尿酸血癥發(fā)病風(fēng)險(xiǎn)的分類樹模型,采用CRT法篩選高尿酸血癥的危險(xiǎn)因素,以便采取有效的防治措施降低高尿酸血癥發(fā)病率。
本文創(chuàng)新點(diǎn):
(1)本研究運(yùn)用分類樹模型CRT法篩選高尿酸血癥的危險(xiǎn)因素,以樹形圖的形式把結(jié)果直觀地展現(xiàn)出來,提示具有何種特征的人群是高尿酸血癥的危險(xiǎn)人群。(2)分類樹模型通過樹形圖提示三酰甘油(TG)分別與非酒精性脂肪性肝?。∟AFLD)和體質(zhì)指數(shù)(BMI)對(duì)高尿酸血癥的發(fā)生影響重大。但是分類樹模型的運(yùn)用也存在一些局限性,當(dāng)解釋變量眾多,自身分類也較多時(shí),必須對(duì)過于龐大的樹形圖進(jìn)行修剪。
1.1 一般資料 采用整群抽樣方法進(jìn)行橫斷面調(diào)查,納入2012年7—11月在桂林醫(yī)學(xué)院附屬醫(yī)院體檢中心體檢且資料完整的體檢者(均為漢族)6 241例,年齡20~70歲,平均年齡(46.3±11.8)歲;其中男 3 271例、平均年齡(46.7±12.1)歲,女2 970例、平均年齡(45.8±11.4)歲。所有體檢者簽署知情同意書。調(diào)查當(dāng)天,體檢者接受問卷調(diào)查、身體測(cè)量、實(shí)驗(yàn)室檢查和肝臟超聲檢查。排除標(biāo)準(zhǔn):年齡<20歲、嚴(yán)重心肺腦疾病、腎功能不全、惡性腫瘤、近期服用影響嘌呤代謝的藥物以及因資料不全而無(wú)法納入分析者。本研究通過桂林醫(yī)學(xué)院附屬醫(yī)院倫理委員會(huì)批準(zhǔn)(YXLL-2012-11)。
1.2 方法
1.2.1 問卷調(diào)查 調(diào)查內(nèi)容包括體檢者的基本信息,如生活習(xí)慣、家族史、疾病史(包括高血壓、高脂血癥、糖尿病等)。
1.2.2 身體測(cè)量 體檢者免冠、脫鞋、站直測(cè)量身高;體檢者脫鞋、排空膀胱測(cè)量體質(zhì)量;體檢者安靜休息5~10 min后坐位測(cè)量血壓,連續(xù)2次測(cè)量右臂肱動(dòng)脈血壓,若2次測(cè)量差異大,則加測(cè)第3次,取多次結(jié)果平均值。體質(zhì)指數(shù)(BMI)=體質(zhì)量(kg)/身高2(m2)。
1.2.3 實(shí)驗(yàn)室檢查 體檢者隔夜禁食,次日抽取空腹靜脈血,采用羅氏公司Cobas C501全自動(dòng)生化分析儀檢測(cè)生化指標(biāo):血尿酸(UA)、三酰甘油(TG)、總膽固醇(TC)、低密度脂蛋白膽固醇(LDL-C)、高密度脂蛋白膽固醇(HDL-C)及空腹血糖(FPG)。
1.2.4 肝臟超聲檢查 由專業(yè)超聲醫(yī)師采用邁瑞DC-6 Expert Ⅱ型彩色多普勒超聲檢查儀對(duì)體檢者行肝臟超聲檢查。
1.3 質(zhì)量控制 調(diào)查員均為經(jīng)統(tǒng)一培訓(xùn)合格的醫(yī)學(xué)專業(yè)人員;血壓計(jì)和體重計(jì)均經(jīng)體檢中心校正;問卷調(diào)查表均由調(diào)查員詳細(xì)詢問體檢者后填寫;使用EpiData 3.02軟件輸入調(diào)查數(shù)據(jù),所有數(shù)據(jù)由雙人兩次錄入及邏輯核查,并進(jìn)行核對(duì)、校正,保證數(shù)據(jù)的準(zhǔn)確性。對(duì)現(xiàn)場(chǎng)調(diào)查問卷、采樣以及數(shù)據(jù)錄入等各個(gè)環(huán)節(jié)進(jìn)行質(zhì)量控制。
1.4 診斷標(biāo)準(zhǔn) 高尿酸血癥診斷標(biāo)準(zhǔn)為正常嘌呤飲食狀態(tài)下,男性空腹UA>420 μmol/L,女性空腹UA>360 μmol/L[7]。高血壓診斷標(biāo)準(zhǔn)依據(jù)《中國(guó)高血壓防治指南2010》[8]:在未使用抗高血壓藥物情況下,收縮壓≥ 140 mm Hg(1 mm Hg=0.133 kPa)和 /或舒張壓≥ 90 mm Hg,或既往高血壓,正服用抗高血壓藥。非酒精性脂肪性肝?。∟AFLD)診斷標(biāo)準(zhǔn)參照中華醫(yī)學(xué)會(huì)肝臟病學(xué)分會(huì)脂肪肝和酒精性肝病學(xué)組相關(guān)指南[9]。
1.5 統(tǒng)計(jì)學(xué)方法 采用SPSS 18.0統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析,符合正態(tài)分布的計(jì)量資料以(x ±s)表示,兩組間比較采用成組t檢驗(yàn);計(jì)數(shù)資料以相對(duì)數(shù)表示,兩組間比較采用χ2檢驗(yàn)。雙側(cè)檢驗(yàn)水準(zhǔn)為α=0.05。
高尿酸血癥的危險(xiǎn)因素篩選采用分類樹模型CRT法。分類樹模型可以根據(jù)自變量對(duì)因變量進(jìn)行分類和檢測(cè),常用的分類樹方法有CHAID法和CRT法兩種。CHAID法僅適用于分析分類變量,而CRT法可用于檢測(cè)連續(xù)變量和分類變量間的相互作用,其分類樹模型生長(zhǎng)的顯著性水平為P=0.05,χ2值最大且有顯著性意義的因變量逐次被分類樹模型檢測(cè)出來,作為子節(jié)點(diǎn)顯示于樹形圖的各層,分類樹模型可自動(dòng)識(shí)別連續(xù)變量的最佳分界點(diǎn)并對(duì)其進(jìn)行拆分,母節(jié)點(diǎn)和子節(jié)點(diǎn)的最小樣本量分別為100和50(統(tǒng)計(jì)軟件自動(dòng)設(shè)置的默認(rèn)值)以限制樹的生長(zhǎng),繪制分類樹模型的ROC曲線,以ROC曲線下面積(AUC)評(píng)價(jià)分類樹模型的精確性,其區(qū)間為 0.5~1.0。
2.1 不同性別高尿酸血癥患病率比較 共檢出高尿酸血癥患者3 271例(男755例,女280例),高尿酸血癥患病率為16.6%,其中男性高尿酸血癥患病率(23.1%,755/3 271)高于女性(9.4%,280/2 970),差異有統(tǒng)計(jì)學(xué)意義(χ2=209.782,P<0.01)。
2.2 構(gòu)建高尿酸血癥發(fā)病風(fēng)險(xiǎn)的分類樹模型 患高尿酸血癥(病例)賦值為1,無(wú)高尿酸血癥(對(duì)照)賦值為0,并對(duì)二分類變量(性別、高血壓和NAFLD)進(jìn)行賦值(見表1),其余連續(xù)變量(年齡、BMI、TG、TC、LDL-C、HDL-C、FPG)的最佳分界點(diǎn)由分類樹模型進(jìn)行識(shí)別及拆分,將所有變量選入分類樹模型,根據(jù)分類樹模型對(duì)根節(jié)點(diǎn)和子節(jié)點(diǎn)最低樣本量,本分類樹模型經(jīng)過生長(zhǎng)和修剪后共包含5層,共篩查出影響高尿酸血癥的7個(gè)解釋變量:年齡、性別(男性)、BMI、TG、LDL-C、FPG和NAFLD(見圖1)。
分類樹模型樹形圖結(jié)果顯示,樹型結(jié)構(gòu)的第一層是按TG拆分的,TG是高尿酸血癥最重要的危險(xiǎn)因素,TG>2.335 mmol/L的人群高尿酸血癥患病率(39.4%)高于TG≤2.335 mmol/L的人群(12.4%);BMI>24.885 kg/m2的人群高尿酸血癥患病率(45.0%)高于 BMI≤ 24.885 kg/m2的人群 ( 29.9%) 。
在TG≤2.335 mmol/L的人群中,篩選出的主要危險(xiǎn)因素為NAFLD,其中有NAFLD且年齡≤39.5歲的人群高尿酸血癥患病率(39.2%)高于年齡>39.5歲的人群(23.8%);在無(wú)NAFLD人群中,TG>1.115 mmol/L、BMI>28.175 kg/m2的人群高尿酸血癥患病率(32.3%)高于BMI≤28.175 kg/m2的人群(14.4%);在 TG ≤ 2.335 mmol/L的 人 群 中, 無(wú) NAFLD, 且TG≤1.115 mmol/L的人群,篩選出的危險(xiǎn)因素為性別,如為男性且BMI>23.325 kg/m2,則其高尿酸血癥患病率(12.4%)高于BMI≤23.325 kg/m2的人群(6.8%);如為女性同時(shí)FPG>6.015 mmol/L,則其高尿酸血癥患病率(14.5%)高于FPG≤6.015 mmol/L 的人群(3.0%)。
2.3 分類樹模型的評(píng)價(jià) 利用該分類樹模型所得預(yù)測(cè)概率繪制 ROC曲線,AUC為 0.762〔95% CI (0.751,0.772)〕,說明該分類樹模型精確性較好(見圖2),分界點(diǎn)為0.16,靈敏度為78.9% 〔95% CI(0.763, 0.814)〕,特異度為58.9% 〔95% CI(0.575,0.602)〕,約登指數(shù)為0.378。分類樹模型的錯(cuò)分矩陣和Risk統(tǒng)計(jì)量見表2。Risk統(tǒng)計(jì)量為0.163,表示使用該模型對(duì)高尿酸血癥發(fā)病風(fēng)險(xiǎn)預(yù)測(cè)的正確率為83.7%,模型擬合效果較好。
高尿酸血癥的致病因素復(fù)雜,目前其發(fā)病機(jī)制尚未完全清楚。本研究使用分類樹模型CRT法分析高尿酸血癥的危險(xiǎn)因素,分析各變量具體影響的人群、提示具有何種特征的人群更易發(fā)生高尿酸血癥,對(duì)高危人群進(jìn)行飲食或行為干預(yù),對(duì)降低發(fā)病風(fēng)險(xiǎn)具有重大的公共衛(wèi)生學(xué)意義。
表1 分類變量及賦值Table 1 Categorical variables and assignments
圖2 分類樹模型的ROC曲線Figure 2 ROC curve of classification regression tree model
表2 分類樹模型錯(cuò)分矩陣和Risk統(tǒng)計(jì)量表Table 2 Classification matrix and statistical risk for assessing the accuracy of classification regression tree model in screening the risk factors for hyperuricaemia
本研究結(jié)果顯示,男性高尿酸血癥患病率(23.1%)高于女性(9.4%),提示性別(男性)可能為高尿酸血癥的影響因素之一。
構(gòu)建高尿酸血癥發(fā)病風(fēng)險(xiǎn)分類樹模型,共篩選出7個(gè)解釋變量,分別為年齡、性別(男性)、BMI、TG、LDL-C、FPG及NAFLD,與相關(guān)研究結(jié)果相符[10]。分類樹模型預(yù)測(cè)高尿酸血癥的AUC為0.762,說明該分類樹模型對(duì)高尿酸血癥發(fā)病風(fēng)險(xiǎn)的預(yù)測(cè)效果較好。分類樹模型除可以篩選危險(xiǎn)因素外,還可以提供更科學(xué)合理的信息。在分類樹模型中,目標(biāo)變量是按照統(tǒng)計(jì)檢驗(yàn)所得的χ2值大小依次拆分,基于統(tǒng)計(jì)學(xué)意義的拆分點(diǎn)具有科學(xué)合理性。因此,位于主要枝干的解釋變量對(duì)目標(biāo)變量影響較大, 隨著分枝的細(xì)化影響逐漸減小,所以分類樹模型可以揭示各變量對(duì)模型的重要性[11]。本研究篩選出的與高尿酸血癥密切相關(guān)的主干變量包括TG、BMI、NAFLD,提示高TG 、高BMI及有NAFLD與高尿酸血癥密切相關(guān)。
本研究結(jié)果提示,TG作為第一個(gè)分類節(jié)點(diǎn)對(duì)高尿酸血癥發(fā)病風(fēng)險(xiǎn)影響最大,TG>2.335 mmol/L的人群高尿酸血癥患病率(39.4%)高于TG≤2.335 mmol/L的人群(12.4%),TG>2.335 mmol/L人群是高尿酸血癥高危人群。因此,重點(diǎn)篩查高TG人群對(duì)降低高尿酸血癥發(fā)病率具有重要意義。血脂異常導(dǎo)致高尿酸血癥的可能機(jī)制為TG升高促進(jìn)游離脂肪酸生成和利用,游離脂肪酸代謝增加可加速對(duì)三磷腺苷的利用,使UA生成增加[12-14]。同時(shí),脂代謝異??衫奂叭肭蛭?dòng)脈及出球微動(dòng)脈,當(dāng)病變血管狹窄甚至閉塞時(shí),腎臟清除UA減少,進(jìn)一步導(dǎo)致UA升高[15]。
其次在分類樹模型中,BMI、NAFLD為第2層分支變量,其中BMI在第2層、第3層和第4層共出現(xiàn)3次,提示BMI、NAFLD與高尿酸血癥關(guān)系較為密切。在第2層中,BMI拆分點(diǎn)為24.885 kg/m2,與我國(guó)超重或肥胖的標(biāo)準(zhǔn)基本相符[16],但該拆分點(diǎn)的確定是基于顯著的統(tǒng)計(jì)學(xué)意義,不是憑借臨床實(shí)踐或個(gè)人經(jīng)驗(yàn),因此較人為設(shè)定的拆分點(diǎn)更為合理。結(jié)果表明高尿酸血癥患病率在超重或肥胖人群中顯著升高,這與其他相關(guān)研究結(jié)果一致[17]。因此對(duì)超重或肥胖人群應(yīng)注意檢測(cè)UA,及早發(fā)現(xiàn)有無(wú)高尿酸血癥。
另外,NAFLD作為分支變量出現(xiàn)在分類樹模型中的第2層,在TG≤2.335 mmol/L的人群中,篩選出的主要危險(xiǎn)因素為NAFLD,其中有NAFLD的人群高尿酸血癥患病率(27.4%)顯著高于無(wú)NAFLD的人群(10.0%),提示NAFLD在高尿酸血癥中的重要性。高尿酸血癥和NAFLD同屬代謝綜合征(MS),其中心環(huán)節(jié)為胰島素抵抗,胰島素抵抗可以激活腎素-血管緊張素系統(tǒng),一方面血管緊張素Ⅱ可以減少腎血流量,使UA排泄減少,另一方面通過加重氧化應(yīng)激反應(yīng),促進(jìn)UA合成。因此,應(yīng)高度重視超重或肥胖及NAFLD人群有無(wú)高尿酸血癥,同時(shí)改善其生活方式和膳食結(jié)構(gòu)、嚴(yán)格控制體質(zhì)量、積極改善肝臟胰島素抵抗進(jìn)而治療NAFLD ,這對(duì)預(yù)防高尿酸血癥意義重大。
分類樹模型除了可以快速、有效地識(shí)別影響疾病發(fā)生的主要因素外,還可通過樹形圖展現(xiàn)不同水平變量間的關(guān)系。本研究結(jié)果顯示,在TG>2.335 mmol/L的人群中,BMI>24.885 kg/m2的人群高尿酸血癥患病率(45.0%)顯著高于BMI≤24.885 kg/m2的人群(29.9%)。另外分類樹模型中各層的分支變量基本為TG和BMI,提示TG和BMI作為主要候選變量,其與高尿酸血癥關(guān)系密切。因此,對(duì)于肥胖人群,除需要控制體質(zhì)量外,還需特別注意控制血脂水平,從而降低高尿酸血癥發(fā)病率。
目前分類樹模型正逐步成為分析復(fù)雜多因子疾病的有力工具[18],特別是對(duì)大樣本量的病因研究。本研究樣本量較大,適合應(yīng)用分類樹模型進(jìn)行研究。
綜上所述,年齡、性別(男性)、BMI、TG、LDL-C、FPG及NAFLD是高尿酸血癥的危險(xiǎn)因素,其中TG、BMI、NAFLD 是高尿酸血癥主要的危險(xiǎn)因素。應(yīng)該提倡科學(xué)的生活方式,積極控制體質(zhì)量、血脂、血糖,治療NAFLD,進(jìn)而降低高尿酸血癥發(fā)病率,這對(duì)于降低高尿酸血癥人群心腦血管疾病風(fēng)險(xiǎn)具有重要意義。
志謝:感謝桂林醫(yī)學(xué)院附屬醫(yī)院體檢中心提供數(shù)據(jù)及全體醫(yī)護(hù)人員對(duì)本研究的大力支持。
作者貢獻(xiàn):胡夢(mèng)妍進(jìn)行研究設(shè)計(jì)、數(shù)據(jù)統(tǒng)計(jì)分析、撰寫論文并對(duì)文章負(fù)責(zé);劉錦波、周春華負(fù)責(zé)研究實(shí)施、資料收集整理;李新莉進(jìn)行質(zhì)量控制及審校。
本文無(wú)利益沖突。
本文不足:
(1)研究對(duì)象來源于中國(guó)桂林,存在選擇偏倚。(2)影響高尿酸血癥的因素還有許多,如種族、飲食習(xí)慣、生活方式、遺傳及基因多態(tài)性等,上述因素與高尿酸血癥的關(guān)系仍需進(jìn)一步深入研究。