胡傳志 黃華
摘 要:本文基于多主智的體群學(xué)習(xí)算法(GLBMA)提出了一個(gè)協(xié)作學(xué)習(xí)模型,通過各agent能夠針對(duì)某一領(lǐng)域問題交換意見,分別擴(kuò)充或修改各自原有的知識(shí),直到達(dá)成共識(shí)。把該模型用于惡性腫瘤早期輔助診斷可以解決專家知識(shí)分布存儲(chǔ)聯(lián)合求解的醫(yī)療問題。
關(guān)鍵詞:機(jī)器學(xué)習(xí);協(xié)作;agent;醫(yī)學(xué)診斷
惡性腫瘤是一種常見病,嚴(yán)重威脅著人類的健康,越是早期發(fā)現(xiàn),其治愈惡性越高,惡性腫瘤的臨床具有隱蔽性,較早較準(zhǔn)的發(fā)現(xiàn)很重要。惡性腫瘤的診斷是一個(gè)綜合的處理過程[1],通常是根據(jù)病人的臨床體癥和相關(guān)影像學(xué)和病理組織學(xué)檢查而最終確診的,像咳嗽,發(fā)熱,X光,血液,細(xì)胞學(xué)檢查等等,這種檢查結(jié)果與醫(yī)生水平,臨床經(jīng)驗(yàn)等等人為因素有很大關(guān)系。而且由于思維慣性,不太可能對(duì)每一病人做出特異的檢查,容易造成誤診和漏診。在信息時(shí)代,通過計(jì)算機(jī)深入研究各種引起癌癥種種常見臨床表現(xiàn)數(shù)據(jù),并在此基礎(chǔ)上得出診斷結(jié)果,必將成為的惡性腫瘤早期輔助診斷發(fā)展趨勢(shì)。
1 惡性腫瘤早期診斷流程
⑴特征數(shù)據(jù)提取。通常診斷結(jié)果是通過三個(gè)方面數(shù)據(jù)分析得出的。一是:往往癌癥與年齡、性別,家族史、既往史、吸煙史、術(shù)后病理、等有關(guān)的。二是:通過儀器X射線檢查、CT檢查、纖維支氣管鏡檢查、PAT痰等等檢查的結(jié)果,三是:通過惡性腫瘤有許多顯著的臨床特征如:1)大小便習(xí)慣改變,2)傷口長(zhǎng)期不愈合,3)乳房或身體其他部位無痛性的、較硬的腫塊,4)消化不良或吞咽困難,5)明顯的變化的疣或痣,6)或刺激性的咳嗽或聲音嘶啞等等。對(duì)上述的進(jìn)行量測(cè)特征提取,將結(jié)果數(shù)值化,作為agent知識(shí)庫(kù)的輸入值,數(shù)據(jù)主要是有關(guān)由此引起的惡性腫瘤的概率用P表示,它可以通過專家經(jīng)驗(yàn)獲得,或者是通過一個(gè)統(tǒng)計(jì)分析的結(jié)果。這樣就可以建立許多數(shù)據(jù)對(duì)。
⑵數(shù)據(jù)的預(yù)處理。首先對(duì)單個(gè)數(shù)據(jù)對(duì)采?。?或0,P)形式,1表示存在上述三個(gè)方面的某個(gè)特征,如有吸煙史,0則表示沒有,P為其對(duì)應(yīng)的概率,同上初始值源于專家,我們把上述的三個(gè)方面的所有特征組成兩個(gè)序列,都是采用(年齡、性別,…,X射線檢查、CT檢查,…,大小便習(xí)慣改變,傷口長(zhǎng)期不愈合,…)這種序列,其順序是固定的,因?yàn)闆Q策過程采用的BP神經(jīng)網(wǎng)絡(luò),它的對(duì)應(yīng)的輸入采取的是由P組成的有序序列(P1,P2,…, Pn),我們把這些由0,1組成的序列如(1,1,0,…,0,1)作為系統(tǒng)中監(jiān)控agent的輸入控制信息。這個(gè)監(jiān)控agent來激活下層agent。同時(shí)接受來自下層agent的反饋信息序列。
2 基于群體協(xié)作學(xué)習(xí)模型GLBMA
GLBMA(Group Learning Based Multi-Agent)其目標(biāo)是多個(gè)agent協(xié)調(diào)各自的行為,通過群體學(xué)習(xí)合作完成共同的目標(biāo)。文獻(xiàn)[2]把基于主智能體的GLBMA應(yīng)用于機(jī)器人足球,其中引入了主智能體的概念。
把GLBMA應(yīng)用于惡性腫瘤早期診斷,我們選用監(jiān)控agent的概念。其作用與主agent有所不同,在這里監(jiān)控agent不是執(zhí)行學(xué)習(xí)任務(wù)的主角,而是起協(xié)調(diào)和任務(wù)分配作用。其它體癥agent,如:咳嗽agent為輔智能體,激活后這些agent將成為學(xué)習(xí)任務(wù)的主角。通過監(jiān)控agent和輔助agent以及輔助agent之間的信息交互來實(shí)現(xiàn)整個(gè)團(tuán)隊(duì)的學(xué)習(xí),達(dá)到共同目標(biāo)。
⑴agent模型。在惡性腫瘤早期診斷系統(tǒng)中,agent是有統(tǒng)一的機(jī)構(gòu),每個(gè)agent一般都有自主性,交互性,主動(dòng)性,其一般包括,通信管理模塊,推理控制模塊,agent狀態(tài)欄,和agent知識(shí)庫(kù),改造文獻(xiàn)[3]的模型,可以設(shè)計(jì)agent模塊如圖1。
通信管理模塊:(Communication Module,CM)完成的是agent與用戶或與其他agent之間的信息傳遞,它負(fù)責(zé)將從外界接收到的信息傳遞到內(nèi)部控制,或者將內(nèi)部控制塊的信息傳送給指定的agent或人。
學(xué)習(xí)系統(tǒng)模塊:可以完成特定的學(xué)習(xí)任務(wù),目前主要有三種學(xué)習(xí)策略:類比學(xué)習(xí)系統(tǒng),解釋性學(xué)習(xí)系統(tǒng)和歸納邏輯程序設(shè)計(jì)學(xué)習(xí)系統(tǒng)。
⑵訓(xùn)練。對(duì)該系統(tǒng)每個(gè)agent,提供足夠的臨床案例加以訓(xùn)練,使之更好的實(shí)現(xiàn)和盡可能的提高該系統(tǒng)的準(zhǔn)確性非常必要,特別是對(duì)函數(shù)fi的調(diào)整很重要,盡可能多的輸入涉及到更多的agent病例,從而使更多的agent交互,另外使知識(shí)庫(kù)更完備,使函數(shù)更加準(zhǔn)確。
3 結(jié)束語(yǔ)
本文把基于多主智的體群學(xué)習(xí)算法(GLBMA)應(yīng)用于惡性腫瘤早期診斷系統(tǒng)中,通過主智能體和輔智能體的角色切換來實(shí)現(xiàn)整個(gè)團(tuán)隊(duì)的學(xué)習(xí),改進(jìn)了傳統(tǒng)的學(xué)習(xí)算法。仿真試驗(yàn)表明,GLBML可以解決學(xué)習(xí)狀態(tài)空間過大,連續(xù)狀態(tài)空間的行為選擇及多智能體合作求解等問題。
[參考文獻(xiàn)]
[1]惡性腫瘤有哪些診斷方法?2002-01-18,http://www.em800.com/m/ca7264.htm.
[2]程顯毅,李淑琴,夏德深.基于主智能體的群體學(xué)習(xí)算法GLBMA的研究. 江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,26(5):437-440.
[3]劉貴全,陳小平,蔡慶生,劉潔.一個(gè)基于Agent協(xié)作式學(xué)習(xí)系統(tǒng).中國(guó)科技大學(xué)學(xué)報(bào),2000,30(1):34-37.