李鈺 黃代政 黃超
摘要:目的:文章闡述了人工智能在醫(yī)療領(lǐng)域的應(yīng)用,并結(jié)合機(jī)器學(xué)習(xí)算法,依據(jù)實(shí)例數(shù)據(jù)的類型特點(diǎn),對(duì)患者就醫(yī)影響因素進(jìn)行預(yù)測。突出機(jī)器學(xué)習(xí)算法的高效和準(zhǔn)確性,同時(shí)為此類調(diào)查數(shù)據(jù)的分析提供新的思路。方法:對(duì)某醫(yī)院門診患者做問卷調(diào)查,采用貝葉斯網(wǎng)絡(luò)、隨機(jī)森林模型對(duì)患者就醫(yī)影響因素進(jìn)行分析,揭示了各個(gè)影響因素之間的內(nèi)在聯(lián)系及重要程度。結(jié)果:貝葉斯網(wǎng)絡(luò)顯示患者就醫(yī)影響因素之間相互影響,隨機(jī)森林模型擬合度為0.8。結(jié)論:機(jī)器學(xué)習(xí)可以根據(jù)數(shù)據(jù)類型從中獲取知識(shí),從而降低錯(cuò)誤率,使管理者做出精準(zhǔn)決策,有效提高解決問題的效率。
關(guān)鍵詞:人工智能;機(jī)器學(xué)習(xí);醫(yī)院選擇;預(yù)測研究
中圖分類號(hào):TP391 ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)13-0085-03
隨著大數(shù)據(jù)時(shí)代的到來,人工智能技術(shù)及其應(yīng)用所涉及的領(lǐng)域已相對(duì)全面,包括醫(yī)學(xué)、社會(huì)學(xué)、計(jì)算機(jī)科學(xué)等各個(gè)學(xué)科范疇的知識(shí),涵蓋機(jī)器學(xué)習(xí)、圖像識(shí)別等多個(gè)研究范疇。人工智能應(yīng)用的推廣將為各行各業(yè)提供全新的改革方案,有效推動(dòng)高新技術(shù)的發(fā)展,使民生福祉達(dá)到新的高度[1]。
近年來,公共衛(wèi)生關(guān)注的焦點(diǎn)問題仍為衛(wèi)生資源配置問題,而患者的就醫(yī)行為在一定程度上可以反映當(dāng)下的衛(wèi)生資源配置情況以及衛(wèi)生政策問題。經(jīng)文獻(xiàn)查閱,針對(duì)患者就醫(yī)影響因素的研究來看,多數(shù)國內(nèi)外研究僅局限于基于二元 Logistic 回歸模型或SPSS基本統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析等方法得出數(shù)據(jù)的分布規(guī)律,進(jìn)而推斷出影響患者就醫(yī)選擇的相關(guān)因素。在人工智能背景下,本文為了更好地考慮患者對(duì)醫(yī)療機(jī)構(gòu)的選擇,依據(jù)實(shí)例數(shù)據(jù)的特點(diǎn),考慮采用機(jī)器學(xué)習(xí)模型來對(duì)患者醫(yī)院選擇做預(yù)測,充分研究患者在醫(yī)院就診選擇中不同影響因素的內(nèi)在關(guān)系,為此類調(diào)查數(shù)據(jù)的分析提供新的研究思路。同時(shí),為優(yōu)化醫(yī)療資源配置及提高醫(yī)療機(jī)構(gòu)核心競爭力起到關(guān)鍵性作用。
1人工智能在醫(yī)療領(lǐng)域的應(yīng)用
人工智能是計(jì)算機(jī)學(xué)科的一個(gè)分支,目前已廣泛應(yīng)用于人類生活中的各個(gè)場景,涵蓋圖像識(shí)別、機(jī)器學(xué)習(xí)、知識(shí)圖譜等[2]。人工智能通過對(duì)感知信號(hào)的處理,經(jīng)過不斷學(xué)習(xí)、推理,進(jìn)而做出最佳決策。它所特有的快速處理且相對(duì)獨(dú)立的特性決定了在醫(yī)療發(fā)展上擁有廣闊的前景。目前,人工智能技術(shù)逐漸也成為醫(yī)療產(chǎn)業(yè)的重點(diǎn)技術(shù)[3]。從國際角度看,美國不斷出臺(tái)人工智能相關(guān)政策,向醫(yī)療領(lǐng)域開放適當(dāng)?shù)恼當(dāng)?shù)據(jù)庫,便于為人工智能技術(shù)積累足夠的醫(yī)療數(shù)據(jù),推動(dòng)醫(yī)療人工智能的發(fā)展[4];日本將信息通信技術(shù)與人工智能技術(shù)相融合,使醫(yī)學(xué)知識(shí)與技術(shù)發(fā)揮其更大作用;德國強(qiáng)調(diào)在衛(wèi)生健康等社會(huì)領(lǐng)域,人工智能需注重?cái)?shù)據(jù)的保護(hù)及創(chuàng)新,使人工智能合理融入人類社會(huì);法國先后出臺(tái)相關(guān)政策并巨資投資開發(fā)人工智能技術(shù),決定在人工智能技術(shù)支撐下結(jié)合國家健康數(shù)據(jù)研究所成立衛(wèi)生健康數(shù)據(jù)中心[5]。作為引領(lǐng)未來發(fā)展的戰(zhàn)略性技術(shù),我國把發(fā)展人工智能技術(shù)上升為國家戰(zhàn)略,人工智能將成為推動(dòng)各領(lǐng)域高速發(fā)展的新驅(qū)動(dòng)[6]。
回顧近年我國面臨的醫(yī)療衛(wèi)生現(xiàn)狀,人口老齡化、慢性病治愈力下降、衛(wèi)生資源供給緩慢且分配不均而導(dǎo)致衛(wèi)生服務(wù)體系嚴(yán)重失衡,使得大醫(yī)院人滿為患,小醫(yī)院無人問津,這些突出問題表明,現(xiàn)階段對(duì)醫(yī)療人工智能的巨大需求[7]。機(jī)器學(xué)習(xí)是人工智能技術(shù)的實(shí)現(xiàn)形式之一,在人工智能系統(tǒng)中普遍使用。能夠從大規(guī)模數(shù)據(jù)中進(jìn)行學(xué)習(xí),推理出新的規(guī)律,引導(dǎo)管理者做出正確的決策[8]。
2 實(shí)例分析
本文以廣西某綜合性醫(yī)院門診的問卷調(diào)查數(shù)據(jù)為例,根據(jù)數(shù)據(jù)類型特點(diǎn),構(gòu)建貝葉斯網(wǎng)絡(luò)以及隨機(jī)森林模型,探討患者在醫(yī)院就診選擇中不同影響因素之間的內(nèi)在關(guān)系及其重要程度。該研究屬于現(xiàn)況研究,調(diào)查對(duì)象為某階段至該醫(yī)院就醫(yī)的患者人群,調(diào)查內(nèi)容涉及影響患者就醫(yī)選擇的主觀因素及客觀因素,包括患者基本情況、醫(yī)院方面因素、患者主觀方面因素以及其他客觀外在因素等。本次研究共調(diào)查3655人,所有問卷均由患者自愿填寫并獨(dú)立完成,問卷真實(shí)有效,記有效問卷3428份,有效回收率為93.78%。
2.1貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
本文采用的數(shù)據(jù)集類型屬于多分類因子型數(shù)據(jù),數(shù)據(jù)量大,因問卷數(shù)據(jù)在完整和確定性上存在一定局限,故采用貝葉斯網(wǎng)絡(luò)對(duì)數(shù)據(jù)進(jìn)行描述。與其他不確定性評(píng)價(jià)方法相比,貝葉斯根據(jù)人們的信念概率,使數(shù)據(jù)得到一個(gè)合理的解釋[9]。首先,可將相關(guān)因素圖解可視化;其次,對(duì)于不確定性問題有較強(qiáng)的處理能力,能在有限、不完整、不確定信息條件下自動(dòng)進(jìn)行學(xué)習(xí)和推理,得出正確結(jié)論。將貝葉斯方法應(yīng)用到不確定性多種影響因素所導(dǎo)致結(jié)果的分析時(shí),不僅能對(duì)信息的價(jià)值做出科學(xué)的判斷,還能對(duì)調(diào)查結(jié)果的可能性加以數(shù)量化的評(píng)價(jià),將先驗(yàn)知識(shí)或主觀概率巧妙地有機(jī)結(jié)合。
首先,對(duì)原始數(shù)據(jù)進(jìn)行收集、整理、錄入以及缺失值處理,由于數(shù)據(jù)均為問卷數(shù)據(jù),題中每一個(gè)數(shù)值代表該題的變量,故將數(shù)值型數(shù)據(jù)轉(zhuǎn)換為因子型。隨后從數(shù)據(jù)集中隨機(jī)抽取2/3數(shù)據(jù)作為訓(xùn)練集構(gòu)建模型,剩下的1/3數(shù)據(jù)作為測試集對(duì)模型加以驗(yàn)證。最后使用爬山算法對(duì)數(shù)據(jù)進(jìn)行結(jié)構(gòu)學(xué)習(xí)。爬山算法屬于人工智能算法的一種,對(duì)于貝葉斯網(wǎng)絡(luò)的爬山算法,是貝葉斯網(wǎng)絡(luò)基于評(píng)分搜索方法中搜索算法的算法之一,通過三個(gè)搜索算子對(duì)初始網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行修改,得到若干候選網(wǎng)絡(luò)結(jié)構(gòu),分別對(duì)每個(gè)候選網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行評(píng)分,取評(píng)分最優(yōu)的候選網(wǎng)絡(luò)與初始網(wǎng)絡(luò)相比較,如果候選網(wǎng)絡(luò)的評(píng)分高于初始網(wǎng)絡(luò),則取該候選網(wǎng)絡(luò)作為當(dāng)前網(wǎng)絡(luò)繼續(xù)搜索,否則,就停止搜索,并返回當(dāng)前網(wǎng)絡(luò)結(jié)構(gòu),在上述原理基礎(chǔ)上經(jīng)過反復(fù)迭代,得到最優(yōu)網(wǎng)絡(luò)圖如圖1所示。
可以清楚地看到,貝葉斯網(wǎng)絡(luò)圖是一個(gè)有向無環(huán)圖。兩個(gè)因素之間的箭頭連線具有指向性,說明他們之間存在某種關(guān)聯(lián)。由圖1可知,每一個(gè)圓圈內(nèi)的變量代表數(shù)據(jù)中涉及的影響因素,箭頭的指向代表影響因素間的依賴關(guān)系。因此,就醫(yī)開銷影響、參保類型、年齡、教育、疾病類型、居住受到職業(yè)類型的影響;醫(yī)生問診時(shí)長、就醫(yī)意愿受到疾病類型的影響;職業(yè)類型受到月收入的影響;患者的等待時(shí)間受到醫(yī)療開銷的影響;醫(yī)療機(jī)構(gòu)類型選擇受到醫(yī)療開銷的影響。因此,貝葉斯網(wǎng)絡(luò)與統(tǒng)計(jì)相互結(jié)合,克服了許多計(jì)算與概念方面的解釋性難題,用圖形的方法描述各個(gè)變量之間的相互聯(lián)系,易于讀者對(duì)數(shù)據(jù)集形成一個(gè)清晰的架構(gòu)。
2.2隨機(jī)森林模型
根據(jù)選用的研究數(shù)據(jù)可知,本文選用的研究數(shù)據(jù)為問卷數(shù)據(jù),數(shù)據(jù)量較大,納入的特征數(shù)據(jù)集均為多分類數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)統(tǒng)計(jì)方法具有精度低、速度慢等弊端[10]。隨機(jī)森林是決策樹的集成方法之一,決策樹在擬合多元線性回歸模型時(shí),如果特征之間存在較強(qiáng)共線性,會(huì)導(dǎo)致每棵樹的分類方式相同,使得預(yù)測變量高度相關(guān)。隨機(jī)森林可高效處理大規(guī)模數(shù)據(jù),且適應(yīng)于高維度數(shù)據(jù)的應(yīng)用場景。此外,在缺失數(shù)據(jù)的場景中,依然能夠保證較高的分類[11]。故考慮采用隨機(jī)森林算法對(duì)數(shù)據(jù)集進(jìn)行深入分析,對(duì)研究數(shù)據(jù)集納入的職業(yè)、居住地、疾病類型等12個(gè)特征進(jìn)行抽樣,每次從12個(gè)特征中有放回地抽取等量的樣本數(shù)據(jù)來進(jìn)行建模,形成相對(duì)應(yīng)的分類樹,以確保所有的特征都會(huì)被使用,這樣平均之下就會(huì)減弱不同樹之間特征的高度相關(guān)性,以減小總體的方差,達(dá)到總體的最優(yōu)。隨機(jī)森林算法樣式如圖2所示。
運(yùn)用R語言統(tǒng)計(jì)分析軟件對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步處理,采用隨機(jī)森林模型可視化變量的重要性以探究患者在醫(yī)院就診選擇中不同影響因素的重要性程度,隨機(jī)森林模型變量的重要性如圖3所示。
由圖3可知,經(jīng)隨機(jī)森林模型運(yùn)算得到Mean Decrease Accuracy以及Mean Decrease Gini兩個(gè)結(jié)果,結(jié)果分析如下:
Mean Decrease Accuracy是把一個(gè)變量的取值變?yōu)殡S機(jī)數(shù),隨機(jī)森林預(yù)測準(zhǔn)確性的降低程度。該值越大表示該變量的重要性越大。即模型顯示變量的重要性依次為職業(yè)、居住地、醫(yī)療開銷影響、患者等待時(shí)長、疾病類型、醫(yī)生問診時(shí)長、教育、參保類型、就醫(yī)意愿、年齡、月收入、到本院就診的原因。
Mean Decrease Gini是計(jì)算每個(gè)變量對(duì)分類樹每個(gè)節(jié)點(diǎn)上觀測值的異質(zhì)性的影響,從而比較變量的重要性。該值越大表示該變量的重要性越大,即模型顯示變量的重要性依次為職業(yè)、居住地、患者等待時(shí)長、教育、醫(yī)療開銷影響、疾病類型、參保類型、醫(yī)生問診時(shí)長、年齡、月收入、到本院就診的原因及就醫(yī)意愿。
通常使用AUC值來作為模型的評(píng)價(jià)標(biāo)準(zhǔn),即AUC是衡量學(xué)習(xí)器優(yōu)劣的一種性能指標(biāo)。為驗(yàn)證模型的優(yōu)劣程度,故進(jìn)一步對(duì)隨機(jī)森林模型進(jìn)行評(píng)價(jià),經(jīng)檢驗(yàn),隨機(jī)森林?jǐn)M合優(yōu)度的AUC值為0.80,模型效果較好。
3結(jié)束語
綜上所述,機(jī)器學(xué)習(xí)可以從輸入的數(shù)據(jù)中獲取知識(shí),從而使更多的問題得到解決,降低錯(cuò)誤率的發(fā)生,有效提高解決問題的效率。本文采用貝葉斯網(wǎng)絡(luò)中的爬山算法以及隨機(jī)森林模型可視化變量的重要性對(duì)患者就醫(yī)選擇影響因素進(jìn)行了分析研究,兩種方法學(xué)的應(yīng)用展現(xiàn)了其各自的內(nèi)在優(yōu)勢(shì)。
一方面,貝葉斯網(wǎng)絡(luò)可直觀地揭示影響患者在醫(yī)院就診選擇方面的關(guān)鍵因素與其他因素的內(nèi)在關(guān)聯(lián)和相關(guān)規(guī)律。不同于以往的假設(shè)檢驗(yàn)統(tǒng)計(jì)方法做出的定性分析,采用貝葉斯網(wǎng)絡(luò)模型分析患者就醫(yī)選擇的影響因素,能夠利用分析結(jié)果將患者分流情況做定量分析。另一方面,隨機(jī)森林憑借其快捷、高效的性能特點(diǎn),對(duì)大量冗雜的醫(yī)療數(shù)據(jù)進(jìn)行高速處理,已在衛(wèi)生服務(wù)領(lǐng)域發(fā)揮著重要作用。采用隨機(jī)森林模型對(duì)患者就醫(yī)選擇影響因素進(jìn)行評(píng)估,對(duì)變量的重要性程度進(jìn)行可視化,準(zhǔn)確對(duì)患者就醫(yī)行為影響因素做預(yù)測,進(jìn)而有效、正確地引導(dǎo)醫(yī)療衛(wèi)生政策的制定以及實(shí)施。
貝葉斯網(wǎng)絡(luò)和隨機(jī)森林算法屬于人工智能機(jī)器學(xué)習(xí)范疇,由此可見,人工智能在一定程度上煥發(fā)醫(yī)療行業(yè)新活力,為優(yōu)化衛(wèi)生資源配置提供技術(shù)價(jià)值參考。促使醫(yī)院管理者做出精準(zhǔn)醫(yī)療決策,提高衛(wèi)生服務(wù)利用,對(duì)于衛(wèi)生醫(yī)療體系的建設(shè)有著階段性的影響。
參考文獻(xiàn):
[1] 李治軍,王昊欣.基于大數(shù)據(jù)時(shí)代背景的人工智能在計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)中的應(yīng)用探討[J].電腦知識(shí)與技術(shù),2021,17(20):127-129.
[2] 許家睿.人工智能在輔助醫(yī)療領(lǐng)域現(xiàn)狀與未來發(fā)展趨勢(shì)概述[J].中國新通信,2021,23(1):232-234.
[3] 邵長年.論人工智能進(jìn)入醫(yī)療領(lǐng)域的機(jī)遇與挑戰(zhàn)[J].中國醫(yī)療器械信息,2020,26(20):170-171.
[4] 袁紫藤,陶金婷,談瑩,等.國內(nèi)外醫(yī)療人工智能應(yīng)用現(xiàn)狀及相關(guān)政策[J].醫(yī)學(xué)信息學(xué)雜志,2019,40(5):2-9.
[5] 任潔,尚傳強(qiáng),徐果.人工智能在醫(yī)療領(lǐng)域的發(fā)展給衛(wèi)生監(jiān)督帶來的挑戰(zhàn)及對(duì)策[J].中國衛(wèi)生監(jiān)督雜志,2019,26(6):547-551.
[6] 朱振一,王巍.人工智能在醫(yī)療領(lǐng)域的發(fā)展現(xiàn)狀及前景分析[J].世界最新醫(yī)學(xué)信息文摘,2019,19(50):77-78.
[7] 孫一帆.人工智能帶來的醫(yī)療變革[J].中國新通信,2019,21(1):210-211.
[8] 高一冉.基于人工智能的機(jī)器學(xué)習(xí)在醫(yī)療中的應(yīng)用[J].科技傳播,2019,11(7):138-139.
[9] 程和祥,聶煒昌.人工智能中的貝葉斯方法[J].重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2020,34(5):17-23.
[10] 韓玉,施海龍,曲波,等.隨機(jī)森林方法在醫(yī)學(xué)中的應(yīng)用[J].中國預(yù)防醫(yī)學(xué)雜志,2014,15(1):79-81.
[11] 姚登舉,楊靜,詹曉娟.基于隨機(jī)森林的特征選擇算法[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2014,44(1):137-141.
【通聯(lián)編輯:梁書】