李婷 孫媛媛 李雪玲 董慧
摘要:為了輔助醫(yī)生進(jìn)行糖尿病的診斷,增加診斷的準(zhǔn)確性,探尋最適合用于糖尿病輔助診斷的機(jī)器學(xué)習(xí)分類算法。研究使用隨機(jī)森林、樸素貝葉斯分類、邏輯回歸、BP神經(jīng)網(wǎng)絡(luò)以及Adaboost集成算法5類機(jī)器學(xué)習(xí)分類算法進(jìn)行建模,預(yù)測(cè)糖尿病的患病風(fēng)險(xiǎn),同時(shí)采用多個(gè)評(píng)價(jià)指標(biāo)驗(yàn)證模型效果的優(yōu)劣。結(jié)論:五種算法的準(zhǔn)確率均高于73%,其中邏輯回歸模型和BP神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率最高,達(dá)76.6%,但邏輯回歸模型的精確率最高且ROC曲線包圍面積(AUC) 最大,精確度高,達(dá)到82%。綜合比較五種算法的評(píng)價(jià)指標(biāo)可見,基于邏輯回歸算法的模型更適合用于構(gòu)建糖尿病輔助診斷模型。
關(guān)鍵詞:機(jī)器學(xué)習(xí)算法;輔助診斷;數(shù)據(jù)挖掘;糖尿病;風(fēng)險(xiǎn)預(yù)測(cè)
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)10-0027-03