国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

運用隨機森林分析糖尿病視網膜病變的影響因素與HIF-1α基因多態(tài)性的關系

2016-12-23 03:10趙靜莊彥
浙江醫(yī)學 2016年23期
關鍵詞:多態(tài)性基因型視網膜

趙靜 莊彥

運用隨機森林分析糖尿病視網膜病變的影響因素與HIF-1α基因多態(tài)性的關系

趙靜 莊彥

目的 采用隨機森林算法分析糖尿病人群合并視網膜病變的影響因素以及與HIF-1α基因多態(tài)性的關系。方法選取糖尿病合并視網膜患者病變200例(DR組)和糖尿病不合并視網膜病變患者200例(NDR組),收集各臨床及生化指標,并行HIF-1α基因多態(tài)性檢測,利用隨機森林方法進行降維,logistic回歸對降維后的變量進行分析。結果 兩組HIF-1α基因多態(tài)性基因型頻率比較差異有統(tǒng)計學意義(χ2=9.88,P=0.01),經隨機森林算法篩出6個重要性得分最高且錯誤率最低的變量納入logistic回歸模型進行分析,年齡(OR=1.03,95%CI:1.01~1.06),GG基因型(OR=16.20,95%CI:1.98~132.55),肌酐(OR=1.02,95%CI:1.00~1.03),糖化血紅蛋白(OR=4.46,95%CI:3.35~5.96)為危險因素,行ROC曲線分析logistic回歸模型擬合能力高,AUC=0.926,95%CI:0.901~0.952。結論 糖尿病合并視網膜病變與HIF-1α基因多態(tài)性相關。

糖尿病性視網膜病變 隨機森林 HIF-1α基因多態(tài)性

糖尿病視網膜病變(DR)是糖尿?。―M)常見的微血管并發(fā)癥之一,是DM患者的主要致盲因素。DR的發(fā)病機制至今仍不明確,國外有研究提示組織缺氧在DR的進展中起著至關重要的作用[1],缺氧誘導因子-1α(HIF-1α)成為許多疾病的重要相關基因,rs11549467(G1790A)是該基因的常見單核苷酸多態(tài)性位點[2]。當前國內外尚缺乏該基因多態(tài)性與DR的相關性研究,由于DR相關影響因素極其復雜,傳統(tǒng)的資料分析方法難以避免各變量間的相互影響,而隨機森林算法運行穩(wěn)健,對數(shù)據(jù)集不做要求、不存在過擬合與共線性等問題[3]。筆者采用了基于機器學習理論的隨機森林模型和基于流行病學研究設計的logistic回歸模型,分析DR與HIF-1α基因多態(tài)性及關聯(lián)因素間的關系,并建立風險預測模型,通過ROC曲線下面積(AUC)預測模型的優(yōu)劣,現(xiàn)將結果報道如下。

1 對象和方法

1.1 對象 選取溫州市中西醫(yī)結合醫(yī)院2014年1月至2016年1月DM患者400例,均為漢族,彼此間無血緣關系,年齡32~88(52.36±10.98)歲。根據(jù)2002年悉尼國際眼科學會議制訂的新DR國際分型,將是否患有DR分為DR組和糖尿病未合并視網膜病變患者(NDR組),每組200例。排除合并其他心腦血管疾病,嚴重肝腎功能疾病,自身免疫性疾病,惡性腫瘤等。DR組男98例,女102例,符合2002年悉尼國際眼科學會議制訂的新DR國際診斷標準[4]。NDR組男106例,女94例。本研究得到醫(yī)院倫理委員會批準,所有研究對象均充分了解研究方案并簽署知情同意書。

1.2 方法 問卷內容包括一般情況、健康相關行為、飲酒、吸煙、飲食習慣、運動情況、疾病史、身高、體重、血壓等,抽取受試者空腹靜脈血,測定各項生化指標。

1.3 HIF-1α基因型檢測 所有患者均晨起抽取外周靜脈血2ml,采用DNA試劑盒提取人類白細胞基因組DNA。將提取好的DNA置于-20℃冰箱保存?zhèn)溆?。基因引物:上游引?5′-TGT GGC CAT TGT AAA AAC TCA-3′,下游引物:5′-TTT AAT TCA TCA GTG GTG GCA-3′。行直接測序方法,讀取個體的基因型,所有DNA提取由溫州醫(yī)科大學附屬第一醫(yī)院血液內科生物實驗室完成,所有測序過程由華大基因公司完成。

1.4 統(tǒng)計學處理 應用SPSS17.0統(tǒng)計軟件,經Hardy-Weinberg平衡檢驗確認樣本的群體代表性,基因型及等位基因頻率的比較采用χ2檢驗;計量資料以表示,兩組間比較采用t檢驗。采用R軟件得出隨機森林的變量重要性評分并進行排序,把評分最高且誤差率最低的變量納入logistic模型進行多因素分析,得出預測概率為檢驗變量,實際應變量為“金標準”狀態(tài)變量值= 1,進行ROC曲線分析,判斷模型擬合能力的指標采用ROC曲線下面積、一致率,Youden指數(shù)=靈敏度+特異度-1,根據(jù)最大Youden指數(shù)確定最佳臨界點。

1.4.1 變量重要性得分 以是否合并視網膜病變?yōu)橐蜃兞?,各項生化指標及基因多態(tài)性作為自變量,建立隨機森林模型,森林中每個節(jié)點處預選的變量個數(shù)為全部變量數(shù)的平方根,通過基尼指數(shù)(Gini)計算每個變量對分類樹中每個節(jié)點上觀測值的異質性影響,從而比較變量的重要性,如應變量為臨界點數(shù)值時,均歸入低賦值組。詳見表1、2,圖1。

表1 變量賦值表

1.4.2 降維統(tǒng)計 降維將根據(jù)重要性評分排列后的數(shù)據(jù)集進行滾動窗口序列特征選擇(SWSFS)過程,即從重要性得分最大的變量開始,逐個引入變量,每加入一個變量即運行一次隨機森林,以此獲得每個隨機森林的分類誤差。以進入模型變量數(shù)為橫坐標,分類誤差為縱坐標繪制錯誤率圖。尋找圖中變量數(shù)相對較少、錯誤率相對較低時對應的變量組合作為降維后的變量集。

2 結果

2.1 兩組臨床及生化指標的結果對比 DR組在年齡、收縮壓、空腹血糖、糖化血紅蛋白(HbA1C)、TG、TC、LDL-C、肌酐均明顯高于NDR組(均P<0.05);兩組患者性別、BMI、舒張壓、HDL、ALT、AST、谷氨酰轉移酶、TBil、白蛋白、尿酸方面比較均無統(tǒng)計學差異(均P>0.05),詳見表3。

表2 變量重要性得分

圖1 隨機森林變量重要性得分排序

2.2 變量篩選 隨機森林篩選變量根據(jù)變量重要性得分,對變量進行排序,運行(SWSFS)過程,并繪制誤差率圖(見圖2)。結果顯示,在變量數(shù)為6時具有最小的分類誤差,所以將重要性得分排在前6位變量的納入經典logistic回歸模型進行分析。所選變量分別是年齡、高血壓病史、LDL、HIF-1α基因多態(tài)性、肌酐、HbA1C。

2.3 兩組患者HIF-1α(rs11549467)基因多態(tài)性比較 兩組患者HIF-1α(rs11549467)基因多態(tài)性基因型頻率比較有統(tǒng)計學差異,詳見表4。

2.4 Hardy-Weinberg平衡分析 兩組患者HIF-1α(rs11549467)基因多態(tài)性基因型Hardy-Weinberg平衡分析,結果顯示,兩組趨向于遺傳平衡,詳見表5。

2.5 logistic多因素分析 根據(jù)隨機森林篩選變量,納入logistic回歸分析,logistic回歸模型如下:Logit(p)= -17.51+0.03X1+0.00X2+0.16X3+0.86X4+2.79X5+0.02X6+ 1.50X7,其中年齡(OR=1.03,95%CI:1.01~1.06)、GG基因型(OR=16.20,95%CI:1.98~132.55)、肌酐(OR=1.02,95% CI:1.00~1.03)、HbA1C(OR=4.46,95%CI:3.35~5.96)為危險因素,詳見表6。

2.6 logistic回歸模型擬合能力分析及最佳臨界點確定一致率為(152+192)/400=86.00%,受試者工作特征曲線下面積(AUC)為0.926,95%CI:0.901~0.952,標準誤為0.013(P<0.01)。該模型擬合能力高(圖3)。根據(jù)ROC曲線靈敏度為0.96和特異度為0.77,Youden指數(shù)=0.72最大,對應的預測概率為0.45,確定該點為最佳診斷點,即各大影響因素根據(jù)logistic回歸模型計算的概率≥0.45時,多因素與并發(fā)DR的相關性較大。

3 討論

既往研究表明,DR的發(fā)生、發(fā)展與DM病程、高血壓、高血糖、血脂異常、慢性腎病及相關實驗室檢查指標等多種因素有關[5]。本研究結果顯示HbA1C與HIF基因rs11549467位點GG基因型是DR發(fā)生的重要相關因素,HbA1C水平的升高增加了DR的風險,OR高達4.46,結果與既往研究結果一致。

HIF-1是一種轉錄因子,參與細胞低氧誘導的特異應答,HIF-1α的蛋白水平和活性是決定HIF-1活性的主要成分,HIF-1α與血管內皮生長因子(VEGF)啟動子區(qū)域的毗連反應元素相結合,對VEGF表達起關鍵作用[5]。國外研究認為DR病變的病理基礎是視網膜微循環(huán)障礙,在微循環(huán)缺血及低氧狀態(tài)下,視網膜產生VEGF并導致其微血管病變的出現(xiàn),VEGF上調是DR發(fā)病的核心環(huán)節(jié)[6-7]。本研究中HIF基因rs11549467位點GG基因型患者發(fā)生DR的風險增加近16.20倍,考慮該基因位點變異可能是DR發(fā)生、發(fā)展的相關因素之一,與國內外研究結果類似[8-9],推測rs11549467的單核苷酸替換影響HIF-1α下游誘導生物學效應,影響HIF-1α在DR的表達,增加DR的風險。

表3 兩組患者臨床及生化指標比較

圖2 不勝數(shù)SWSFS過程分類錯誤率圖

表4 兩組患者HIF-1α基因多態(tài)性基因型比較[例(%)]

表5 兩組HIF-1α基因多態(tài)性基因型Hardy-Weinberg平衡檢驗[例(%)]

表6 DR影響因素logistic回歸分析結果

圖3 logistic回歸模型ROC曲線

人體是一個有機的統(tǒng)一體,其內聯(lián)系錯綜復雜,傳統(tǒng)的logistic單因素分析對多重共線性數(shù)據(jù)資料處理存在較大偏倚,甚至有些結果與生物學現(xiàn)象相悖,而隨機森林算法作為新興的機器學習方法,對數(shù)據(jù)類型不做要求、可降低對多重共線性數(shù)據(jù)資料偏倚度,綜合考慮各因子對結果的影響,能篩選對結局變量影響更大的因子變量并得出變量重要性評分,在生物醫(yī)學方面具有較好的應用前景[3]。分子流行病學的模型有利于對DM患者DR的預測。因此,本模型的建立引入遺傳因素,加強對DR易感危險的預測精度,從而增強評估的能力。通過多因素logistic回歸方法篩選變量在確定高危個體及篩檢上有一定的價值,當個體將其危險因素的狀況代入所建立的logistic回歸模型時如果計算的概率≥0.45時,即可對該DM患者DR易感性進行預警,該診斷點靈敏度為0.96和特異度為0.77。模型擬合能力高提示應加強檢查并提供有效的個體治療策略。

本研究尚存在局限性,首先本研究樣本量仍偏小,結果仍有待擴大樣本量來證實;其次實驗未能直接證實HIF-1α基因多態(tài)性下游相關蛋白羧化/磷酸化指標,有待下階段實驗繼續(xù)闡述。

[1]Joussen A M,Poulaki V,Mitsiades N,et al.Nonsteroidal anti-inflammatory drugs prevent early diabetic retinopathy via TNF-alpha suppression[J].FASEB J,2002,16(3):438-440.

[2]Kim H O,Jo YH,Lee J,et al.The C1772T genetic polymorphism in human HIF-1alpha gene associates with expression of HIF-1alpha protein in breast cancer[J].Oncol Rep,2008,20(5): 1181-1187.

[3]宋欠欠,李軼群,侯艷,等.隨機森林的變量捕獲方法在高維數(shù)據(jù)變量篩選中的應用[J].中國衛(wèi)生統(tǒng)計,2015,32(1):49-53.

[4]惠延年,王琳.糖尿病視網膜病變和黃斑水腫的國際臨床分類法[J].國際眼科雜志,2004,4(1):56-59.

[5]Sun J K,Cavallerano J D,Silva P S.Future promise of and potentialpitfalls for automated detection of diabetic retinopathy[J].JAMAOphthalmol,2015,17:1-2.

[6]PoulakiV,Qin W,Joussen A M,et al.Acute intensive insulin therapy exacerbates diabetic blood-retinal barrier breakdown via hypoxia-inducible factor-1alpha and VEGF[J].Clin Invest,2002, 109(6):805-815.

[7]Na X,Wu G,Ryan C K,et al.Overproduction of vascular endothelial growth factor related to von Hippel-Lindau tumor suppressor gene mutations and hypoxia-inducible factor-1alpha expression in renalcellcarcinomas[J].J Urol,2003,170:588-592.

[8]Ollerenshaw M,Page T,Hammonds J,et al.Polymorphisms in the hypoxia inducible factor-1 α gene(HIF-1A)are associated with the renal cell carcinoma phenotype[J].Cancer Genet Cytogenet, 2004,153(2):122-126.

[9]陳捷,林蕾.HIF-1α基因多態(tài)性與大動脈粥樣硬化型腦梗死的相關性研究[J].浙江醫(yī)學,2014,36(23):1917-1920.

Association of HIF-1α gene polymorphisms with susceptibility of diabetic retinopathy studied by random forest algorithm

ZHAO Jing,ZHUANG Yan.Department of Ophthalmology,Wenzhou Hospital of Integrated TCM and Western Medicine,Wenzhou 325000,China

【 Abstract】 Objective To investigate the association of HIF-1α gene polymorphism with susceptibility of diabetic retinopathy by random forest algorithm. Methods Clinical and biochemical indicators from 200 diabetic patients with retinopathy and 200 diabetic patients without retinopathy were collected.The SNP polymorphisms in HIF-1α gene (rs11549467)were detected.Random forests method was used for dimension reduction,the variants after the dimension reduction were analyzed with logistic regression. Results There were significant differences in genotype frequency of HIF-1α gene polymorphisms between patients with and without diabetic retinopathy(χ2=6.55,P=0.04).Six variables were screened by random forest algorithm, the variables with the highest importance scores and the lowest error rate entered the logistic regression model.Age(OR=1.03, 95%CI:1.01-1.06),GG genotype(OR=16.20,95%CI:1.98-132.55),creatinine(OR=1.02,95%CI:1.00-1.03),glycated hemoglobin (OR=4.46,95%CI=3.35-5.96)were risk factors of diabetic retinopathy.The area under the curve(AUC)of logistic regression model was 0.926(95%CI:0.901-0.952). Conclusion HIF-1α gene polymorphism may be involved in the pathogenesis of diabetic retinopathy.

Diabetic retinopathy Random forest algorithm HIF-1 alpha gene polymorphism

2016-05-17)

(本文編輯:嚴瑋雯)

325000 溫州市中西醫(yī)結合醫(yī)院眼科(趙靜);溫州醫(yī)科大學附屬第一醫(yī)院血液內科(莊彥)

莊彥,E-mail:matozhao@126.com

猜你喜歡
多態(tài)性基因型視網膜
HBV基因型的研究現(xiàn)狀與發(fā)展趨勢探討
單核苷酸多態(tài)性與中醫(yī)證候相關性研究進展
深度學習在糖尿病視網膜病變診療中的應用
MTHFR C677T基因多態(tài)性與頸動脈狹窄及其側支循環(huán)形成的關系
家族性滲出性玻璃體視網膜病變合并孔源性視網膜脫離1例
高度近視視網膜微循環(huán)改變研究進展
球結膜下注射慶大霉素致視網膜損傷1例
結核分枝桿菌北京基因型菌株大片段的多態(tài)性研究
蒙古斑在維吾爾族新生兒中分布的多態(tài)性
ZNF804A rs1344706多態(tài)性與精神分裂癥的關聯(lián)分析