葉華清,蔡圣杰,鄭成勇
(五邑大學(xué) 數(shù)學(xué)與計(jì)算科學(xué)學(xué)院,廣東 江門 529020)
北柴胡由傘形科植物柴胡的根組織干燥形成,是現(xiàn)代臨床常用中藥之一[1].藏柴胡和錐葉柴胡都是北柴胡的偽品,它們的性狀特征比較相似,給采集和使用過(guò)程中的鑒別工作帶來(lái)了一定的困難.目前市場(chǎng)上時(shí)常發(fā)生一些用藏柴胡[2]或者錐葉柴胡[3]替代北柴胡的事件,對(duì)消費(fèi)者的利益造成損害.因此,建立有效的北柴胡鑒別方法是必要的[4].傳統(tǒng)的柴胡鑒別使用的方法通常是性狀鑒別[5]、薄層色譜(TLC)[6]或者是高效液相色譜(HPLC)[7].性狀鑒別法容易受主觀因素的影響,TLC 及HPLC等方法則通常分析成本較高,分析時(shí)間較長(zhǎng).
太赫茲(Terahertz,THz)是一種新興技術(shù),具有無(wú)損檢測(cè)、穿透性強(qiáng)、光子能量低等優(yōu)點(diǎn)[8],已被廣泛地應(yīng)用于藥材的檢測(cè).但經(jīng)搜索文獻(xiàn)發(fā)現(xiàn),近年來(lái)將太赫茲技術(shù)應(yīng)用于柴胡鑒別的研究較少,本文提出利用太赫茲技術(shù)鑒別北柴胡.
在深度學(xué)習(xí)領(lǐng)域中[9-10],殘差連接解決了深度網(wǎng)絡(luò)梯度消失的問(wèn)題.多尺度融合技術(shù)則是計(jì)算機(jī)視覺(jué)領(lǐng)域中常被使用且不會(huì)損害精度的技術(shù),GoogLeNet 中的單元結(jié)構(gòu)——Inception 塊就是其中之一,通過(guò)不同尺度提取的信息往往比單一尺度提取的信息更豐富.為了將深度學(xué)習(xí)方法應(yīng)用于北柴胡鑒別,并充分利用太赫茲光譜數(shù)據(jù)的多尺度信息,本文依據(jù)太赫茲光譜數(shù)據(jù)的特點(diǎn),將Inception塊中的二維卷積核收縮為一維卷積核,以此構(gòu)建一維Inception(1D Inception,1DIn)塊結(jié)構(gòu),然后通過(guò)殘差連接,構(gòu)建含1DIn 的殘差網(wǎng)絡(luò),用于北柴胡鑒別,并將其與傳統(tǒng)的機(jī)器學(xué)習(xí)方法作對(duì)比.
太赫茲(THz)是波動(dòng)頻率單位之一,又稱太赫,或太拉赫茲,等于1012Hz,通常用于表示電磁波頻率.太赫茲輻射是一種頻率為0.1~10 THz 的電磁輻射,從頻率上看,在無(wú)線電波和光波,毫米波和紅外線之間;從能量上看,在電子和光子之間.
太赫茲輻射具有以下顯著特征[11]:1)指紋圖譜.太赫茲輻射的光子能量與分子中旋轉(zhuǎn)躍遷的激發(fā)能量相似,因此分子振動(dòng)和旋轉(zhuǎn)等信息包含在太赫茲光譜中.這就是太赫茲光譜的指紋特征,也是它能夠應(yīng)用于物質(zhì)檢測(cè)和識(shí)別的重要原因.2)良好的生物安全性.與X 射線相比,太赫茲波在1 THz 下具有約4 meV 的非常低的光子能量,并且是非電離的.因此,太赫茲波不會(huì)對(duì)生物組織等樣品造成電離損傷.3)相干測(cè)量.太赫茲波通常是由相干激光脈沖利用非線性光學(xué)效應(yīng)或相干電流驅(qū)動(dòng)的偶極振蕩產(chǎn)生的,因此太赫茲波是相干的,可以直接測(cè)量電場(chǎng)的振幅和相位信息.4)高空間、時(shí)間分辨率.與微波和毫米波相比,太赫茲波具有更短的波長(zhǎng),可以實(shí)現(xiàn)更高的分辨率.太赫茲脈沖具有良好的時(shí)間分辨率,脈沖寬度在亞皮秒到皮秒的時(shí)間尺度上,可以分析分子、電子等的瞬態(tài)變化.因此,可以將太赫茲時(shí)間分辨光譜用于物質(zhì)的檢測(cè)和識(shí)別.5)滲透性好.太赫茲波具有良好的穿透性,可以穿透包括塑料、服裝和陶瓷在內(nèi)的一般介電材料.這使得太赫茲光譜法有可能探測(cè)危險(xiǎn)物品.盡管太赫茲波很容易被水等極性分子吸收和損失,但此時(shí)的吸收光譜也可以用來(lái)評(píng)估樣品的含水量.
本文所用的太赫茲光譜數(shù)據(jù)由江門華訊方舟科技有限公司利用其太赫茲時(shí)域光譜儀(型號(hào)為CCT-1800)采集而來(lái).由于水對(duì)太赫茲波具有較強(qiáng)的吸收力,因此在太赫茲數(shù)據(jù)采集過(guò)程中,需對(duì)樣品倉(cāng)持續(xù)吹掃氮?dú)猓苊饪諝庵械乃麑?duì)實(shí)驗(yàn)造成干擾[12].
Inception 塊是GoogLeNet 中的單元塊,它的出現(xiàn)是卷積神經(jīng)網(wǎng)絡(luò)(CNN)發(fā)展歷程中的一個(gè)里程碑[13].在此之前,大部分流行的網(wǎng)絡(luò)架構(gòu)主要采取不斷堆疊卷積層來(lái)獲得更深的網(wǎng)絡(luò),以獲得更好的性能.然而增大網(wǎng)絡(luò)深度往往會(huì)讓網(wǎng)絡(luò)模型顯得愈加沉重冗余.針對(duì)該問(wèn)題,谷歌團(tuán)隊(duì)提出了Incepetion 塊,目前其版本已歷經(jīng)了從v1 到v4[14]的重大飛躍.Inception 網(wǎng)絡(luò)最大的優(yōu)點(diǎn)是使用了大量的Inception 塊.因?yàn)橛辛诉@些Inception 塊,Inception 網(wǎng)絡(luò)能夠?qū)斎氲膱D像數(shù)據(jù)并行執(zhí)行多個(gè)卷積運(yùn)算以及多個(gè)池化操作運(yùn)算,同時(shí)該網(wǎng)絡(luò)可以將所有運(yùn)算的輸出結(jié)果拼接為一個(gè)特別深的特征圖,以提取并融合圖像的多尺度特征,獲得更好的圖像表征[15].
本文構(gòu)建的是含Inception 塊的殘差網(wǎng)絡(luò)架構(gòu),它融合了殘差網(wǎng)絡(luò)和Inception 塊的優(yōu)點(diǎn).無(wú)論是Inception 塊,還是GoogLeNet,都是面向圖像的網(wǎng)絡(luò)架構(gòu),但太赫茲光譜數(shù)據(jù)只有一維,并不能直接輸入其中.為此,本文構(gòu)建了一種可直接接受太赫茲光譜數(shù)據(jù)輸入的僅含一維卷積核的一維Inception(1D Inception,1DIn)塊結(jié)構(gòu).圖1展示了所構(gòu)建的 1DIn 塊結(jié)構(gòu)圖.它由輸入層、一維卷積層、拼接層、輸出層構(gòu)成,其中的一維卷積層由上至下分別包含32 個(gè)尺寸為1、2n+1、4n+1、8n+1(n為正整數(shù))的一維卷積核.輸入數(shù)據(jù)通過(guò) 4 個(gè)不同尺寸的卷積層后得到4 個(gè)通道數(shù)為32 的輸出,將其在通道維度拼接,然后作為1DIn 塊的輸出.
圖1 1D Inception 塊結(jié)構(gòu)圖
通過(guò)1DIn 塊堆疊及殘差連接而成的網(wǎng)絡(luò)結(jié)構(gòu)如圖2 所示.整個(gè)結(jié)構(gòu)可以分為7 個(gè)部分.前6 個(gè)部分各是一個(gè)1DIn 塊,最后1 個(gè)部分是輸出塊.輸出塊包含一個(gè)全局平均池化(GAP)層、一個(gè)全連接(FC)層和一個(gè)Softmax 層.除了1DIn 塊和輸出塊以外,殘差連接也必不可少.每3 個(gè)1DIn塊,進(jìn)行一次殘差連接,以保證梯度更新的效率.在殘差連接中,輸入一個(gè)尺寸為1 的卷積層調(diào)整通道數(shù)與深層特征通道數(shù)保持一致,最后與深層特征相加后輸出.
圖2 基于1D Inception 塊的網(wǎng)絡(luò)結(jié)構(gòu)圖
實(shí)驗(yàn)所用數(shù)據(jù)集由北柴胡、藏柴胡、錐葉柴胡的太赫茲光譜數(shù)據(jù)構(gòu)成.3 種柴胡的批次數(shù)及樣本數(shù)如表1 所示.所有實(shí)驗(yàn)均采用批次留一法[16].
表1 數(shù)據(jù)集概況統(tǒng)計(jì)
圖3 給出了3 種柴胡的吸收系數(shù)譜的均值曲線.圖3 表明,在1.2~1.8 THz 范圍內(nèi),3 種柴胡的吸收系數(shù)譜均值曲線區(qū)分明顯.
圖3 3 種柴胡的吸收系數(shù)譜與頻率的對(duì)應(yīng)關(guān)系圖
將柴胡樣品連同特制模具放于已充滿氮?dú)獾奶掌潤(rùn)z測(cè)儀(為保證光譜測(cè)量的準(zhǔn)確性,樣本重復(fù)測(cè)量100 次,取平均值作為該樣品的原始光譜)中獲取太赫茲光譜數(shù)據(jù).
本太赫茲時(shí)域光譜儀的測(cè)量范圍為0.004 6~10.0021 THz,由于0.004 6~0.100 0 THz 和1.800 0~10.002 1 THz 波段的信噪比較低,故實(shí)驗(yàn)使用頻率在0.100 0~1.800 0 THz 范圍內(nèi)的吸收系數(shù)譜數(shù)據(jù)作分析.
為驗(yàn)證殘差網(wǎng)絡(luò)鑒別北柴胡的有效性,首先對(duì)殘差網(wǎng)絡(luò)的卷積核尺寸進(jìn)行消融實(shí)驗(yàn),搜索適合的卷積核尺寸;然后將其與支持向量機(jī)(線性核)、邏輯回歸(LR)、K 近鄰(KNN)、隨機(jī)森林(RF)、ExtraTree[17]、ExtraTrees[18]、AdaBoost[19]、GBoost[20]、XGBoost[21]等進(jìn)行對(duì)比.網(wǎng)絡(luò)訓(xùn)練所用損失函數(shù)為交叉熵函數(shù),優(yōu)化器為ADAM.模型的評(píng)估指標(biāo)為總體精度.
為了給殘差網(wǎng)絡(luò)中的1DIn 塊中4 個(gè)卷積核設(shè)置合適的尺寸,我們進(jìn)行了大量的消融實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果如表2 所示.為了避免實(shí)驗(yàn)結(jié)果的偶然性,對(duì)卷積核的每種組合均進(jìn)行5 次隨機(jī)實(shí)驗(yàn).表2 最后一列是5 次實(shí)驗(yàn)精度的均值和標(biāo)準(zhǔn)差.
從平均精度可以看出,隨著卷積核增大,精度大體是先下降然后上升;當(dāng)卷積核組合為1、13、25、49 時(shí),5 次實(shí)驗(yàn)平均精度最高,達(dá)到了88.77%;此后再下降.原因可能是因?yàn)樵诰矸e核尺寸較小時(shí),每個(gè)Inception 塊的感受野也較小,當(dāng)6 層Inception 塊疊加后,模型最后一層中每個(gè)特征點(diǎn)僅是附近相鄰特征信息的提取結(jié)果,并未看到整條光譜的全部信息;而隨著卷積核尺寸的增大,模型最后一層中每個(gè)特征點(diǎn)的感受野也隨之增大,并逐漸覆蓋整個(gè)光譜,但隨之而來(lái)的背景噪音也更多,在卷積核組合為1、13、25、49 時(shí)剛好達(dá)到最佳平衡.
表3 給出了本文方法與支持向量機(jī)(線性核)、LR、KNN、RF、XGBoost、AdaBoost 等分類方法的實(shí)驗(yàn)對(duì)比結(jié)果.所有對(duì)比方法均經(jīng)過(guò)了參數(shù)優(yōu)化.表3 表明,本文方法顯著優(yōu)于其他9 種方法.分析其原因可能是 Inception 塊中并行的不同大小的卷積層構(gòu)成了一個(gè)感受野各不相同的特征提取器,使得原本特征提取較單一的結(jié)構(gòu)變?yōu)榱艘粋€(gè)多尺度特征提取結(jié)構(gòu),該結(jié)構(gòu)不僅有偏向注意微小局部信息的卷積層,也有偏向注意較大范圍局部信息的卷積層,使得模型的學(xué)習(xí)能力更全面.
表3 不同模型在柴胡數(shù)據(jù)集上的實(shí)驗(yàn)精度
本文針對(duì)太赫茲光譜數(shù)據(jù)構(gòu)建了一種含一維 Inception 塊的殘差網(wǎng)絡(luò),用于北柴胡鑒別.對(duì)比實(shí)驗(yàn)結(jié)果表明,本文方法顯著優(yōu)于9 種非深度學(xué)習(xí)方法.所提模型結(jié)構(gòu)相對(duì)簡(jiǎn)單,層數(shù)較少,其突出的分類性能表明了基于深度學(xué)習(xí)的太赫茲光譜數(shù)據(jù)分類潛力巨大.基于 transformer 架構(gòu)的太赫茲光譜數(shù)據(jù)分析將是下一步值得探索的課題.
五邑大學(xué)學(xué)報(bào)(自然科學(xué)版)2023年4期