金倫 錢萊 陸嘯云
摘 要:中草藥種類多、人工識別復(fù)雜,引入人工智能和圖像處理技術(shù),可以提高中草藥識別的速度、準(zhǔn)確度。本文基于卷積神經(jīng)網(wǎng)絡(luò)和TensorFlow框架開發(fā)一個(gè)中草藥識別系統(tǒng),能夠部署于PC端和手機(jī)端,利用攝像頭拍攝中藥材圖片,將其傳輸給基于TensorFlow部署的后臺,利用訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò)識別中草藥的具體名稱和類別,準(zhǔn)確度達(dá)到了91.2%,具有一定的作用和意義。
關(guān)鍵詞:中草藥 卷積神經(jīng)網(wǎng)絡(luò) TensorFlow 圖像處理
中圖分類號:TP3文獻(xiàn)標(biāo)識碼:A文章編號:1003-9082(2020)02-000-01
引言
目前,國內(nèi)醫(yī)院和個(gè)人對于中草藥需求量非常大,但是由于中草藥種類繁多,原材料識別難度非常大,傳統(tǒng)的人工分類需要豐富的經(jīng)驗(yàn),并且準(zhǔn)確度也非常低,不利于提高治病救人的水平,因此無法滿足當(dāng)前的實(shí)際需求[1]。2018年浙江師范大學(xué)國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201810345008)提出利用人工智能在圖像處理方面的技術(shù),識別和分類中草藥,人工智能處理速度快,準(zhǔn)確度高,因此成本更加低廉。本文基于利用卷積神經(jīng)網(wǎng)絡(luò)的TensorFlow開發(fā)中草藥識別系統(tǒng),能夠利用ResNet50卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)不同種類的中草藥分類功能,具有一定的作用和意義。
一、關(guān)鍵技術(shù)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種深度前饋人工神經(jīng)網(wǎng)絡(luò),已成功地應(yīng)用于圖像識別,CNN包括兩層基本結(jié)構(gòu),一是特征提取層,每一個(gè)神經(jīng)元的輸入與前一層局部連接,可以提取這一部分的局部特征,一旦提取局部特征之后,就可以確定這些特征與其他特征之間的位置關(guān)系;二是特征映射層,網(wǎng)絡(luò)的每一個(gè)計(jì)算層都可以由多個(gè)特征映射組成,每一個(gè)特征映射都可以描述為一個(gè)平面,平面上所有的神經(jīng)元的權(quán)值相同[2]。卷積神經(jīng)網(wǎng)絡(luò)的每一個(gè)卷積層都可以跟著一個(gè)用來求取局部平均與二次提取的計(jì)算層,這樣就可以大大地減小特征分辨率[3]。CNN結(jié)構(gòu)如下所述。
輸入層的主要作用就是對原始的圖像數(shù)據(jù)進(jìn)行預(yù)處理。
卷積層一般包含兩個(gè)操作,其一是進(jìn)行局部的關(guān)聯(lián),將每個(gè)神經(jīng)元看做是一個(gè)過濾器;其二是進(jìn)行窗口滑動(dòng),過濾器對局部的數(shù)據(jù)進(jìn)行計(jì)算。卷積層的關(guān)鍵作用就是獲取圖像的局部特征,每一卷積層都可以作為一個(gè)特征提取層,并且可以減少參數(shù)的設(shè)置數(shù)量,提高卷積準(zhǔn)確度[7]。
池化層的主要作用是用來壓縮數(shù)據(jù)和參數(shù)的數(shù)量,減小過擬合。換句話說,池化層就是用來壓縮圖像的[8]。在卷積層提取的圖像特征基礎(chǔ)上,池化可以計(jì)算某一個(gè)局部的卷積特征平均值,也可以計(jì)算最大值或最小值,減小卷積層特征的維數(shù),這樣就可以持續(xù)降低分類器的計(jì)算復(fù)雜度,減輕分類器的負(fù)擔(dān),也可以避免分類器過度擬合,
全連接層可以輸出分類結(jié)果,起到了一個(gè)分類器的作用,能夠?qū)⒂?xùn)練好的模型輸出出來,這樣就可以提取圖像的特征。
二、TensorFlow在中草藥識別系統(tǒng)中的應(yīng)用與設(shè)計(jì)
中草藥識別系統(tǒng)的主要功能包括注冊、登錄、選擇圖片、識別圖片和退出等功能,該系統(tǒng)采用最為關(guān)鍵的技術(shù)就是TensorFlow技術(shù),該技術(shù)采用了TensorFlow Keras平臺搭建的的ResNet50卷積神經(jīng)網(wǎng)絡(luò)。ResNet50是一種卷積神經(jīng)網(wǎng)絡(luò),主要用于分類。中草藥識別系統(tǒng)引入的卷積神經(jīng)網(wǎng)絡(luò)ResNet50算法的具體應(yīng)用流程如圖1所示。
攝像頭拍攝的樹莓派圖像轉(zhuǎn)碼為base64格式,將數(shù)據(jù)發(fā)送給服務(wù)器,服務(wù)器利用keras搭建的resnet50架構(gòu)訓(xùn)練完成得到的模型來進(jìn)行識別圖像,獲取圖像類別并進(jìn)行在數(shù)據(jù)庫下的模糊搜索,最終將識別結(jié)果通過http協(xié)議以json格式返回給樹莓派。卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由以tensorflow作為backbench的keras框架搭建而成,并由前臺django來進(jìn)行實(shí)時(shí)調(diào)用,以API接口的形式讓前端設(shè)備來進(jìn)行調(diào)用。在resnet的訓(xùn)練過程中,采用了0.001的學(xué)習(xí)率,batchsize大小為50,在訓(xùn)練1000個(gè)epochs之后在測試集中達(dá)到了83.2%的準(zhǔn)確率,在訓(xùn)練5000個(gè)epochs之后,準(zhǔn)確率到達(dá)了91.2%,基本達(dá)到了應(yīng)用的要求。
結(jié)語
基于TensorFlow的中草藥識別系統(tǒng)能夠?qū)z像頭拍攝的圖片、利用神經(jīng)網(wǎng)絡(luò)進(jìn)行處理,將識別的結(jié)果反饋給用戶,滿足中草藥識別的功能。未來,中草藥識別系統(tǒng)將會(huì)引入更加先進(jìn)的技術(shù),為中草藥在醫(yī)療診斷的應(yīng)用提供輔助支撐,具有更加良好的作用。
參考文獻(xiàn)
[1]王林玉,王莉,鄭婷一.基于卷積神經(jīng)網(wǎng)絡(luò)和關(guān)鍵詞策略的實(shí)體關(guān)系抽取方法[J].模式識別與人工智能,2017,30(5):465-472.
[2]周法律,張璐瑤,湯嵐鳳,等.中草藥原植物葉片圖像在線識別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].電腦知識與技術(shù),2014,10(13):3114-3116.
[3]武國彬,初雅莉,陳昌穩(wěn).基于Android的中草藥手機(jī)智能識別系統(tǒng)[J].微型機(jī)與應(yīng)用,2013(18):11-13,17.