吳玉琳
(棗莊職業(yè)學(xué)院 山東 棗莊 277800)
隨著我國經(jīng)濟(jì)水平的高速發(fā)展,脊髓損傷發(fā)病率呈逐年升高趨勢[1]。脊髓損傷不僅會給患者本人帶來身體和心理的嚴(yán)重傷害,還會對整個社會造成巨大的經(jīng)濟(jì)負(fù)擔(dān)。在脊髓損傷之后,因肢體感覺和運(yùn)動功能障礙缺乏自主運(yùn)動能力導(dǎo)致長時間單一姿勢臥床是發(fā)生褥瘡的主要原因。因此,快速、準(zhǔn)確分析脊髓損傷者臥床姿態(tài)并及時提醒,對預(yù)防褥瘡等并發(fā)癥和現(xiàn)代化醫(yī)療有重大意義。
本文利用脊髓損傷者臥位時足底圖像作為特征圖像,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的臥姿狀態(tài)識別算法。首先,獲取特征圖像并進(jìn)行預(yù)處理。其次,利用卷積神經(jīng)網(wǎng)絡(luò)對特征圖像進(jìn)行分類進(jìn)而獲知臥姿狀態(tài)。
為降低成本,使用視頻傳感器拍攝的臥位圖像作為特征圖像。人體臥位時,兩腳處于自然擺位狀態(tài)且足底的形狀為長方形,有良好的方向區(qū)分性。因脊髓損傷者肢體運(yùn)動功能障礙,在某一臥位姿態(tài)時足部無自主運(yùn)動,采集到的足底圖像就比較穩(wěn)定。此外,在患者翻身時,因肢體是被動擺位,能保證足部姿態(tài)與臥位姿態(tài)強(qiáng)相關(guān)性。因此,本文提出利用足底圖像作為特征圖像,根據(jù)足底圖像方向變化得知脊髓損傷者當(dāng)前臥位姿態(tài)。
原始圖像由視頻傳感器直接獲取,其中包含噪聲和部分人為干擾,預(yù)處理可以使圖像標(biāo)準(zhǔn)化,減少之后分類的難度。
2.1.1 圖像去噪
通過視頻傳感器獲取的數(shù)字圖像,常常因設(shè)備和外部環(huán)境因素而含有噪音。因此,在對圖像處理之前需要對原始圖像進(jìn)行數(shù)字去噪,降低對后續(xù)圖像處理的不良影響。
中值濾波器是一種非線性數(shù)字濾波器,主要原理是設(shè)置一個大小為N的觀察窗口并對窗口內(nèi)的N個數(shù)進(jìn)行排序,若N為奇數(shù),輸出取中間值,否則輸出取中間兩個值的平均。每次丟掉最前面的一個數(shù),取一個新采樣重復(fù)計算來濾除圖像中的斑點(diǎn)噪音和椒鹽噪音。
2.1.2 圖像光平衡
利用圖像傳感器獲取數(shù)字圖像時,往往會受到外界光照因素的影響,采集的足底彩色圖像常常會有偏色現(xiàn)象或者不同程度的高光和陰影。本文將Gray World[2]色彩均衡方法融入圖像預(yù)處理過程中,消除待處理圖像的偏色問題,為提高姿態(tài)識別提供了保障。
本文所用GrayWorld色彩均衡具體方法如下:
(1)在RGB色彩空間中計算有顏色偏差圖像的R,G,B分量和,分別記為:sR,sG,sB
(2)計算顏色均衡調(diào)整參數(shù):
(3)利用色彩均衡調(diào)整色彩分量:
本文定義了四種基本臥位姿態(tài):仰臥、俯臥、左側(cè)臥和右側(cè)臥。采用的人體睡姿識別方法就是利用計算機(jī)視覺來識別靜態(tài)圖像中的睡姿,識別的結(jié)果是四種基本睡姿中的一種。
卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是神經(jīng)網(wǎng)絡(luò)的一種,但其微觀結(jié)構(gòu)與其他神經(jīng)網(wǎng)絡(luò)有很大不同,它的每一層數(shù)據(jù)由若干矩陣數(shù)據(jù)節(jié)點(diǎn)構(gòu)成,而不是由若干向量節(jié)點(diǎn)構(gòu)成。在計算過程中采用卷積模式,因此被稱為卷積神經(jīng)網(wǎng)絡(luò)。
卷積神經(jīng)網(wǎng)絡(luò)對圖像的旋轉(zhuǎn)、平移或縮放具有高度不變性。卷積神經(jīng)網(wǎng)絡(luò)的一個很大的亮點(diǎn)是其使用的下采樣算法,減少了運(yùn)算復(fù)雜度,并且能夠隨著模型網(wǎng)絡(luò)層數(shù)的增加,提取出更為抽象的信息。圖1A和圖1B分別顯示了一個典型的用于識別的卷積神經(jīng)網(wǎng)絡(luò)——LeNet-5[2]和一個用于人臉識別的卷積神經(jīng)網(wǎng)絡(luò)[3]。
圖1 卷積神經(jīng)網(wǎng)絡(luò)
本文采用了與LeNet-5類似但又更為復(fù)雜映射關(guān)系的卷積神經(jīng)網(wǎng)絡(luò),此網(wǎng)絡(luò)規(guī)模大提升了脊髓損傷者臥位姿態(tài)的識別率。
經(jīng)多次迭代學(xué)習(xí)后,可計算一個平均矩陣。
本文使用的卷積神經(jīng)網(wǎng)絡(luò)設(shè)定5個隱含層,第一隱含層設(shè)定1000個神經(jīng)元,第二隱含層和第三隱含層均設(shè)定500個神經(jīng)元,第四隱含層和第五隱含層均設(shè)定200個神經(jīng)元。當(dāng)訓(xùn)練樣本較大時,需要相應(yīng)減少神經(jīng)元個數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)的輸出的臥位姿態(tài)如下表所定義:
表1 卷積神經(jīng)網(wǎng)絡(luò)輸出定義
本實(shí)驗(yàn)采用已標(biāo)注的300張正常光照情況下脊髓損傷者各種臥位姿態(tài)下足底正面拍攝圖像作為數(shù)據(jù)集,隨機(jī)選擇此數(shù)據(jù)集的70%(210張)用于訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò),剩余20%(90張)用于驗(yàn)證結(jié)果。
實(shí)驗(yàn)結(jié)果如下表2所示:
表2 實(shí)驗(yàn)結(jié)果
本實(shí)驗(yàn)將210張脊髓損傷者各種臥位姿態(tài)下足底正面拍攝圖像直接作為卷積神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練,得益于卷積神經(jīng)網(wǎng)絡(luò)具有提取目標(biāo)深層信息的能力,并不需要提取特征。訓(xùn)練后的卷積神經(jīng)網(wǎng)絡(luò)用于識別臥位姿態(tài),識別效果非常好(準(zhǔn)確率為98.9%)。
本文綜合分析了脊髓損傷者臥位時的多種圖像,確定使用足底圖像作為特征圖像,隨后引入卷積神經(jīng)網(wǎng)絡(luò)將足底圖像進(jìn)行分類,進(jìn)而識別臥位姿態(tài)。通過實(shí)驗(yàn)表明,選擇脊髓損傷者臥位時足底圖像作為特征圖像有較好的區(qū)分度,使用卷積神經(jīng)網(wǎng)絡(luò)識別足底圖像進(jìn)而確定臥位姿態(tài)有較高的準(zhǔn)確率。下一步,需要獲取更大的數(shù)據(jù)集,測試算法的穩(wěn)定性并繼續(xù)優(yōu)化算法,保證準(zhǔn)確率的前提下減少隱含層數(shù)量。