国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

GA-BP與BP神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)研究中的應(yīng)用與比較

2018-07-16 06:08張怡君左穎婷劉近春姜麗君張巖波郭東星
中國衛(wèi)生統(tǒng)計 2018年2期
關(guān)鍵詞:代償遺傳算法肝硬化

張怡君 左穎婷 劉近春 姜麗君 李 金 張巖波 郭東星△

【提 要】 目的 將BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模型引入到肝硬化病例資料中,對肝硬化分期診斷的分類進行預(yù)測分析,比較兩種分類方法的預(yù)測性能。方法 根據(jù)肝硬化患者病例資料,進行BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模型的建模和預(yù)測。結(jié)果 BP神經(jīng)網(wǎng)絡(luò)的ACC為67.50%,GA-BP神經(jīng)網(wǎng)絡(luò)的ACC為92.50%,GA-BP神經(jīng)網(wǎng)絡(luò)的TPR、TNR、PV+、PV-、AUC四個指標(biāo)均高于BP神經(jīng)網(wǎng)絡(luò),且建模時間大大縮短。結(jié)論 GA-BP神經(jīng)網(wǎng)絡(luò)可以提高分類預(yù)測效果,具有對肝硬化分期分類預(yù)測的可行性。

人工神經(jīng)網(wǎng)絡(luò)(artificial neural network)是一種類似人類神經(jīng)系統(tǒng)的信息處理技術(shù),模仿生物神經(jīng)網(wǎng)絡(luò)用于處理數(shù)據(jù)的數(shù)學(xué)模型[1-3]。BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[4]。BP神經(jīng)網(wǎng)絡(luò)模型對自變量類型的要求不高,可以是連續(xù)的,也可以是離散的,對自變量是否滿足正態(tài)性及相互獨立等條件不需要考慮,對變量間復(fù)雜的非線性關(guān)系有較好的識別能力[5]。但存在收斂時間過長、穩(wěn)健性差、易陷入局部極小值等不足[6]。

遺傳算法(genetic algorithm,GA) 起源于對生物系統(tǒng)進行的計算機模擬研究,是一種基于生物遺傳和進化機制的適合于復(fù)雜系統(tǒng)優(yōu)化的自適應(yīng)概率優(yōu)化技術(shù)。遺傳算法具有優(yōu)化模型參數(shù)或結(jié)構(gòu)、采用全局搜索、強大的可擴展性和包容性等優(yōu)點,可以同許多技術(shù)聯(lián)合使用。

將遺傳算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合,可以避免神經(jīng)網(wǎng)絡(luò)易陷入局部極小、易出現(xiàn)過擬合現(xiàn)象、泛化能力差等問題。遺傳算法不僅能發(fā)揮神經(jīng)網(wǎng)絡(luò)的泛化的映射能力,而且能使神經(jīng)網(wǎng)絡(luò)具有很快的收斂性和較強的學(xué)習(xí)能力[7]。GA-BP神經(jīng)網(wǎng)絡(luò)模型是近年來常用的預(yù)測模型,集中了遺傳算法以及神經(jīng)網(wǎng)絡(luò)模型的優(yōu)點,較單一神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果更佳。

對象和方法

1.研究對象

本研究采用回顧性流行病學(xué)調(diào)查方法,調(diào)查對象為2006年1月到2015年12月間山西醫(yī)科大學(xué)第一附屬醫(yī)院消化內(nèi)科的肝硬化患者。通過對患者病歷的查閱,篩選出符合標(biāo)準(zhǔn)的病歷。入選標(biāo)準(zhǔn):病歷資料完整,有詳細的基本信息、臨床表現(xiàn)和實驗室檢查記錄,必須有計算Child分級[8]的指標(biāo):是否腹水、白蛋白含量、總膽紅素含量、是否并發(fā)肝性腦病和凝血酶原時間(區(qū)分肝硬化代償期或失代償期)。

調(diào)查開始前,對調(diào)查人員進行統(tǒng)一培訓(xùn),學(xué)習(xí)了解病歷資料的結(jié)構(gòu)和內(nèi)容。數(shù)據(jù)錄入時采用雙重錄入的方式,確保錄入數(shù)據(jù)的準(zhǔn)確性。

2.方法

(1)神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)模型主要包括前饋神經(jīng)網(wǎng)絡(luò)和反饋神經(jīng)網(wǎng)絡(luò)兩類。前饋神經(jīng)網(wǎng)絡(luò),是指數(shù)據(jù)從輸入層通過隱含層到達輸出層,信號只向前傳播,如圖1所示。反饋神經(jīng)網(wǎng)絡(luò),則是數(shù)據(jù)是從輸入層通過隱含層到達輸出層,輸出值又反向傳播回輸入層,直到網(wǎng)絡(luò)穩(wěn)定,如圖2所示。

圖1 前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

圖2 反饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

①BP神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),采用最速下降法的學(xué)習(xí)規(guī)則,其主要特點是信號前向傳遞,誤差反向傳播。在前向傳遞中,輸入信號從輸入層經(jīng)隱含層逐層處理,直至輸出層,每一層的神經(jīng)元狀態(tài)只影響下一層神經(jīng)元狀態(tài)。如果輸出層得不到期望輸出,則轉(zhuǎn)入反向傳播,根據(jù)預(yù)測誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值,從而使BP神經(jīng)網(wǎng)絡(luò)預(yù)測輸出不斷逼近期望輸出。

②BP神經(jīng)網(wǎng)絡(luò)的構(gòu)建

BP神經(jīng)網(wǎng)絡(luò)為三層神經(jīng)網(wǎng)絡(luò),輸入層、隱含層、輸出層。隱含層可以為一個也可以為多個,已有許多研究證明一個隱含層就可以滿足對輸入數(shù)據(jù)的非線性映射。

輸入層節(jié)點數(shù)取決于自變量的個數(shù)。

隱含層節(jié)點數(shù)過多過少都會對網(wǎng)絡(luò)的預(yù)測效果產(chǎn)生很大的影響,但目前對于網(wǎng)絡(luò)的隱含層節(jié)點數(shù)沒有一個確定的公式,只能通過經(jīng)驗公式做為初步估計,然后采用試湊法確定隱含層的節(jié)點數(shù)。公式如下:

H≤n-1;

H=log2n

其中,H是隱含層節(jié)點數(shù)目,n是輸入層節(jié)點數(shù)目,m是輸出層節(jié)點數(shù)目,a是[1,10]之間的數(shù)目。

輸出層節(jié)點數(shù)一般通過實際問題得出,如分類預(yù)測時,分類為n個類別,則輸出層節(jié)點數(shù)就為n個神經(jīng)元。

(2)遺傳算法

遺傳算法模擬自然界遺傳機制和生物進化論而成的一種并行隨機搜索最優(yōu)方法,按照選擇的適應(yīng)度函數(shù)并通過遺傳中的選擇、交叉和變異對個體進行篩選,使適應(yīng)度好的個體被保留,適應(yīng)度差的個體被淘汰,新的群體既繼承了上一代的信息,又優(yōu)于上一代。這樣反復(fù)循環(huán),直至滿足條件。

遺傳算法的基本操作:①選擇,從群體中選出優(yōu)良的個體,使他們有機會作為父代為下一代繁衍子孫;②交叉,將群體中的各個個體隨機搭配成對,對每一個個體,以交叉概率交換它們之間的部分染色體;③變異,對種群的每一個個體,以變異概率改變某一個或多個基因座上的基因值為其他的等位基因。

遺傳算法的基本計算流程如圖3所示。

(3)GA-BP神經(jīng)網(wǎng)絡(luò)

GA-BP神經(jīng)網(wǎng)絡(luò)包括確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、遺傳算法優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)預(yù)測三部分。根據(jù)輸入輸出參數(shù)個數(shù)確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),進而確定遺傳算法個體的長度。遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值時,種群中的每個個體都包含了一個網(wǎng)絡(luò)的權(quán)值和閾值,個體通過適應(yīng)度函數(shù)計算個體適應(yīng)度值,并通過選擇、交叉和變異操作找到最優(yōu)適應(yīng)度對應(yīng)的個體。BP神經(jīng)網(wǎng)絡(luò)預(yù)測用最優(yōu)個體對網(wǎng)絡(luò)初始權(quán)值和閾值賦值,網(wǎng)絡(luò)訓(xùn)練后輸出分類預(yù)測結(jié)果。GA-BP神經(jīng)網(wǎng)絡(luò)算法流程如圖4所示。

圖3 遺傳算法基本計算流程圖

圖4 GA-BP神經(jīng)網(wǎng)絡(luò)算法流程圖

為了比較遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)前后的預(yù)測效果,先將全部自變量輸入,建立BP神經(jīng)網(wǎng)絡(luò)模型;再將遺傳優(yōu)化提取的自變量作為輸入,利用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)優(yōu)化后重新建立模型進行測試。利用相同的測試集和訓(xùn)練集,對比分析預(yù)測效果。隨機選取訓(xùn)練集和測試集,其比例為9:1,重復(fù)選擇100次。

(4)分類預(yù)測的評價

常用的分類預(yù)測評價指標(biāo)有準(zhǔn)確率(accuracy,ACC)、真陽性率(true positive rate,TPR)、真陰性率(true negative rate,TNR)、陽性預(yù)測值(positive predictIve value,PV+)、陰性預(yù)測值(negative predictIve value,PV-)、ROC曲線下面積(the area under the curves,AUC)等。

結(jié)  果

1.調(diào)查對象基本情況

從1099份原始記錄中選出符合標(biāo)準(zhǔn)的422份病例作為本研究的調(diào)查對象,具體篩選過程如圖5所示。

圖5 樣本篩選流程圖

通過Child-Pugh分級[9]計算,其中82例代償期患者,340例失代償期患者。

(1)人口學(xué)特征分析

調(diào)查對象中男性223例,占52.8%,女性199例,占47.2%;調(diào)查對象的平均年齡(56.63±13.624)歲,最大年齡107歲,最小年齡17歲。

(2)綜合因素描述

初步進行單因素χ2分析,將并發(fā)癥、臨床表現(xiàn)和既往史中P值在0.05附近的變量分別納入到綜合變量中,綜合變量的取值為單個變量取值之和。見表1。

表1 綜合變量描述

(3)實驗室檢查描述

實驗室檢查的統(tǒng)計描述見表2。

表2 實驗室檢查描述

2.BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果

(1)隱含層節(jié)點數(shù)

BP神經(jīng)網(wǎng)絡(luò)的隱含層節(jié)點數(shù)對于BP神經(jīng)網(wǎng)絡(luò)預(yù)測效果有很大的影響:隱含層節(jié)點數(shù)過少,網(wǎng)絡(luò)不能充分學(xué)習(xí),網(wǎng)絡(luò)的預(yù)測誤差會加大;隱含層節(jié)點數(shù)太多,會使網(wǎng)絡(luò)的訓(xùn)練時間延長,容易發(fā)生過擬合。所以本研究首先應(yīng)該確定合適的隱含層節(jié)點數(shù),采用的是試湊法,分別將BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)在隱含層節(jié)點數(shù)[20,60]中取點,重復(fù)50次,分別記錄BP神經(jīng)網(wǎng)絡(luò)的誤差率和GA-BP神經(jīng)網(wǎng)絡(luò)的誤差率,比較50次預(yù)測結(jié)果中位數(shù),如圖6所示。故本研究的隱含層節(jié)點數(shù)定為35。

圖6 隱含層節(jié)點數(shù)的確定

(2)BP、GA-BP神經(jīng)網(wǎng)絡(luò)模型結(jié)果

根據(jù)肝硬化數(shù)據(jù)輸入輸出特點確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),輸入變量38個,輸出變量1個,所以BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)為38-35-1。BP神經(jīng)網(wǎng)絡(luò)參數(shù)配置:學(xué)習(xí)率為0.1,訓(xùn)練目標(biāo)最小誤差0.1。

GA-BP神經(jīng)網(wǎng)絡(luò)參數(shù)配置:染色體長度為38,種群大小設(shè)置為30。

隨機選取測試集和訓(xùn)練集,重復(fù)選擇100次,記錄兩個模型每次測試集的ACC、TPR、TNR、PV+、PV-、AUC,用中位數(shù)描述集中趨勢,上、下四分位數(shù)(QL~QU)描述離散趨勢,具體見表4。

表4 模型預(yù)測效果

從分類預(yù)測評價指標(biāo)可以看出,GA-BP神經(jīng)網(wǎng)絡(luò)的分類效果較BP神經(jīng)網(wǎng)絡(luò)更優(yōu)。

討  論

肝硬化是肝臟疾病中常見的病變,肝硬化發(fā)展到失代償期就到了比較嚴(yán)重的階段,出現(xiàn)多種并發(fā)癥,預(yù)后差,而且肝硬化發(fā)展到失代償期病情不可逆,所以將病情控制在肝硬化失代償期前對肝硬化的治療、預(yù)后都有很重要的意義。本研究嘗試通過統(tǒng)計方法,對肝硬化代償期和失代償期進行預(yù)測分類。

GA-BP神經(jīng)網(wǎng)絡(luò)利用了遺傳算法的全局搜索且不易陷入局部極小值的優(yōu)勢,不僅對自變量進行優(yōu)化,還對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化,計算全局最優(yōu),彌補了BP神經(jīng)網(wǎng)絡(luò)易陷入局部極小、易出現(xiàn)過擬合現(xiàn)象、泛化能力差等缺陷。比較遺傳算法優(yōu)化前后的預(yù)測效果,結(jié)果顯示優(yōu)化后預(yù)測性能得到了改善和提升,且建模時間大大縮短,說明GA-BP神經(jīng)網(wǎng)絡(luò)模型的分類預(yù)測效果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。

本文只研究了肝硬化分期,范圍太小,研究的問題過于局限。由于肝硬化失代償期和代償期的分期診斷不是很明確,本文采用Child分級的方法,可能對預(yù)測結(jié)果有一定的影響。同時符合納入標(biāo)準(zhǔn)的病例較少,抽樣誤差可能較大。對此,本研究擬繼續(xù)收集病例,以增加研究樣本量,下一步計劃將肝硬化前期、肝硬化、肝癌做為分類結(jié)局,對其進行分類預(yù)測分析。

猜你喜歡
代償遺傳算法肝硬化
臨床肝膽病雜志(2022年8期)2022-09-07
失代償期肝硬化并發(fā)真菌感染的相關(guān)危險因素
基于遺傳算法的智能交通燈控制研究
防治肝硬化中醫(yī)有方
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
藏醫(yī)對肝硬化的認識及治療研究
肝硬化并發(fā)癥的診治
阿德福韋酯聯(lián)合加味逍遙膠囊治療乙肝肝硬化代償期的臨床觀察
活血化瘀藥在肝硬化病的臨床應(yīng)用
基于改進的遺傳算法的模糊聚類算法
营口市| 秦皇岛市| 仁怀市| 嘉峪关市| 育儿| 镇宁| 江陵县| 徐汇区| 楚雄市| 霞浦县| 顺平县| 五莲县| 岳阳市| 渝北区| 安塞县| 峡江县| 福鼎市| 崇明县| 静安区| 九台市| 衡水市| 新安县| 海门市| 应用必备| 尚志市| 深州市| 揭阳市| 嫩江县| 丹巴县| 包头市| 团风县| 健康| 平原县| 太白县| 准格尔旗| 洛宁县| 宜昌市| 新郑市| 莲花县| 庆云县| 鹤峰县|