国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

皮膚科領(lǐng)域圖像識(shí)別入門(mén)方法研究

2018-12-07 05:14溫娟蔣雯雯周揚(yáng)
醫(yī)藥前沿 2018年35期
關(guān)鍵詞:紅斑狼瘡圖像識(shí)別皮膚科

溫娟 蔣雯雯 周揚(yáng)

(1中山大學(xué)附屬第七醫(yī)院 廣東 深圳 518107)

(2珠海金山辦公軟件有限公司 廣東 珠海 519000)

1.引言

2011年斯坦福大學(xué)在Nature上發(fā)表了一篇文章,利用13萬(wàn)個(gè)皮膚病的圖像數(shù)據(jù)庫(kù)訓(xùn)練AI算法,進(jìn)行人工智能自動(dòng)診斷皮膚病的探索。圖像數(shù)據(jù)庫(kù)包含了皮膚鏡圖像、手機(jī)相片、病理圖片等。將AI診斷系統(tǒng)用于鑒別皮膚良性腫瘤、惡性腫瘤和其他的一些非腫瘤性皮膚病,結(jié)果AI診斷結(jié)果與皮膚科專家診斷結(jié)果吻合度非常高,診斷效果打成平手。而AI算法的診斷效率遠(yuǎn)高于皮膚科專家。我國(guó)將AI算法應(yīng)用于皮膚科疾病診斷起步相對(duì)較晚,原因之一是AI算法和皮膚科疾病診斷相結(jié)合的資料匱乏,皮膚科醫(yī)務(wù)工作者面對(duì)繁多的人工智能算法資料往往無(wú)從下手。針對(duì)此情況,本文介紹了一幫助皮膚科醫(yī)務(wù)工作快速掌握人工智能圖像識(shí)別算法的方法。

2.基礎(chǔ)知識(shí)

圖像識(shí)別算法非常多,目前學(xué)術(shù)界公認(rèn)的基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法效果較好。本文也僅討論基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法基礎(chǔ)原理。

2.1 反向傳播算法

反向傳播算法[1]是一種求函數(shù)某個(gè)鄰域內(nèi)極值的算法,神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于圖像識(shí)別的基礎(chǔ)。其圖數(shù)學(xué)原理來(lái)源于高等數(shù)據(jù)中的多元復(fù)合函數(shù)與偏導(dǎo)。

若要求公式(1)的極小值,則可以用反向傳播算法解決。反向傳播算法要先求出函數(shù)對(duì)各個(gè)自變量的偏導(dǎo),即求出函數(shù)的梯度。如公式(2)所示

反復(fù)利用該不等式,就可以不斷找到新x的使z越來(lái)越小,直到找到極小值。

2.2 softmax函數(shù)

為了說(shuō)明softmax的實(shí)際意義,假定現(xiàn)有3張大小為10103的圖片,圖片上病癥內(nèi)容分別為紅斑狼瘡,帶狀皰疹和銀屑病。每張圖片在計(jì)算機(jī)中的表示可以認(rèn)為是10103=300個(gè)數(shù)值,那么3張圖片就有3003=900個(gè)數(shù)值。若要使用人工智能中的神經(jīng)網(wǎng)絡(luò)算法分析圖片中的病癥,就需要用3張圖片的900個(gè)數(shù)值和一些未知數(shù)(如x,y)構(gòu)造一個(gè)矩陣。如公式(5)所示。

該矩陣的構(gòu)造方法下節(jié)討論。矩陣的3行分別對(duì)應(yīng)3張圖片,3列分別對(duì)應(yīng)紅斑狼瘡,帶狀皰疹和銀屑病。其中含義是第1張圖片上的病癥是紅斑狼瘡的得分,含義是第2張圖片上的病癥是帶狀皰疹的得分,其余的含義同理?,F(xiàn)在已知第1張圖片是紅斑狼瘡病癥,第2張圖片是帶狀皰疹病癥,第3張圖片是銀屑病病癥。那么當(dāng)然是希望找到合適的x,y使矩陣中的,,盡可能大,而矩陣中的其它元素盡可能小。通常要對(duì)z進(jìn)行歸一化處理[2]。令

則矩陣z的softmax函數(shù)如公式所示。

顯然,矩陣softmax(z)中的元素的取值范圍是[0,1]。因此可以把每個(gè)元素都看作一個(gè)概率。以第1張圖片對(duì)應(yīng)的第1行為例,表示第1張圖片是紅斑狼瘡的概率,表示第1張圖片是帶狀皰疹的概率,表示第1張圖片銀屑病的概率?,F(xiàn)在已知第1張圖片是紅斑狼瘡的病癥圖片,那么圖像識(shí)別算法的目的就是要找到一組使盡可能大,使,盡可能小[3]。如果考慮3張圖片,則希望找到一組使公式(9)中的E收盡可能大。矩陣z的構(gòu)造方法見(jiàn)3.1節(jié)。

2.3 python語(yǔ)言

以上兩小節(jié)討論了基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法涉及的一些基礎(chǔ)原理和概念。在實(shí)際實(shí)現(xiàn)算法時(shí),并不需要從0開(kāi)始實(shí)現(xiàn)所有步驟。目前學(xué)術(shù)界和工業(yè)界都有很多框架(如tensorflow和keras),可以幫助快速實(shí)現(xiàn)算法。這些框架往往提供的多種編程語(yǔ)言的調(diào)用接口。但從實(shí)際情況看,python語(yǔ)言語(yǔ)法簡(jiǎn)單,入門(mén)成本最低。因此推薦用python作為人工智能算法的入門(mén)語(yǔ)言。

3.訓(xùn)練與使用模型

基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法通常需要2步[4]。第1步,訓(xùn)練模型。直觀地講就是找到一組合適的參數(shù),使分類正確的概率盡可能大,分類錯(cuò)誤的概率盡可能小。神經(jīng)網(wǎng)絡(luò)中的模型本質(zhì)上是一組參數(shù)的集合。第2步,使用模型。根據(jù)模型中的參數(shù)去判斷新的圖片屬于哪一類。

3.1 訓(xùn)練模型

2.2節(jié)已討論過(guò),在計(jì)算機(jī)中保存的3張大小為10103的圖片,本質(zhì)上是保存3300個(gè)數(shù)值。這里用矩陣d[3][300]表示。隨機(jī)構(gòu)造一矩陣p[300][3],該矩陣有900個(gè)參數(shù)。令

這樣就得到2.2節(jié)中討論的z。不同的是2.2節(jié)中的z只有x,y兩個(gè)未知數(shù)。而此處的未知數(shù)是用矩陣p表示,共有900個(gè)未知數(shù)。雖然未知數(shù)的個(gè)數(shù)不同,但矩陣的結(jié)構(gòu)完全相同。得到矩陣z后就可以構(gòu)造公式(9)中的E。得到E之后再利用2.1節(jié)討論的反向傳播算法得到E的極大值。當(dāng)E為極大值時(shí),矩陣p[300][3]中的參數(shù)即為訓(xùn)練的模型參數(shù)。

3.2 使用模型

假定現(xiàn)有一個(gè)未知病癥的圖片,大小仍然是10103。將該圖片看作一個(gè)m[1][300]的矩陣,則m與上節(jié)訓(xùn)練出的p相乘,得到一個(gè)13的矩陣r[1][3]。此時(shí)r的3列對(duì)應(yīng)3種病癥的得分。新圖片中的病癥即為得分最高的一列對(duì)應(yīng)的病癥。延續(xù)節(jié)中的假設(shè),3列分別對(duì)應(yīng)紅斑狼瘡,帶狀皰疹和銀屑病。那么如果第1列的數(shù)值最大,該圖片的病癥即為紅斑狼瘡。

4.結(jié)論

針對(duì)AI圖像識(shí)別算法在皮膚科醫(yī)務(wù)工作者中了解較少的實(shí)際情況。以實(shí)際病例為出發(fā)點(diǎn),介紹了AI圖像識(shí)別算法要使用的基礎(chǔ)知識(shí)和訓(xùn)練使用模型的原理,幫助皮膚科醫(yī)務(wù)工作者快速入門(mén)。為了描述問(wèn)題方便,假定的圖片大小比較小,病癥種類和病癥圖片數(shù)量也較小。在現(xiàn)實(shí)使用中皮膚科醫(yī)務(wù)工作者可以根據(jù)實(shí)際情況加大圖片的樣本數(shù),盡可能多收集病癥種類。基于神經(jīng)網(wǎng)絡(luò)的圖像識(shí)別算法在很多領(lǐng)域已經(jīng)取得較大成績(jī)。皮膚病學(xué)診斷比較依賴形態(tài)學(xué)特征,隨著樣本數(shù)量增大、病癥數(shù)據(jù)的增多,AI圖像識(shí)別算法在皮膚科將有廣闊的發(fā)展前景。

猜你喜歡
紅斑狼瘡圖像識(shí)別皮膚科
依托皮膚科獨(dú)立病區(qū)開(kāi)展皮膚科住院醫(yī)師規(guī)范化教學(xué)查房探討
系統(tǒng)性紅斑狼瘡臨床特點(diǎn)
基于Resnet-50的貓狗圖像識(shí)別
高速公路圖像識(shí)別技術(shù)應(yīng)用探討
皮膚科醫(yī)生6招教你抗“冬癢”
圖像識(shí)別在物聯(lián)網(wǎng)上的應(yīng)用
圖像識(shí)別在水質(zhì)檢測(cè)中的應(yīng)用
邢臺(tái)市中醫(yī)院皮膚科
伴脫發(fā)的頭皮深在性紅斑狼瘡并發(fā)干燥綜合征一例
系統(tǒng)性紅斑狼瘡并發(fā)帶狀皰疹的護(hù)理