江躍龍
(廣州鐵路職業(yè)技術(shù)學(xué)院,廣州 510610)
隨著城市高速發(fā)展,道路交通擁擠,交通事故已經(jīng)成為備受各界矚目的問(wèn)題。軌道交通列車(chē)司機(jī)長(zhǎng)期工作或駕駛產(chǎn)生的疲勞,勢(shì)必影響軌道交通行車(chē)以及人民生命安全,對(duì)軌道列車(chē)司機(jī)駕駛行為、值乘制度以及工作條件等方面的調(diào)查、工作狀態(tài)保證和監(jiān)督環(huán)節(jié),有利于保障軌道交通安全行駛。軌道交通列車(chē)行駛安全是鐵路運(yùn)輸?shù)拿},是解決我國(guó)城市公共交通擁擠重要途徑。根據(jù)前期調(diào)研發(fā)現(xiàn),目前疲勞檢測(cè)技術(shù)主要概況以下幾個(gè)方面:利用AdaBoost算法定位檢測(cè)人臉位置、膚色分割區(qū)分人臉信息、高斯膚色模型和支持向量機(jī)來(lái)檢測(cè)人臉信息、級(jí)聯(lián)支持向量機(jī)融合多特征、遺傳算法、灰度直方圖和高斯混合模型多特征膚色識(shí)別小樣本訓(xùn)練集的膚色模型建立、自適應(yīng)雙高斯混合模型的膚色分割、彩色空間膚色模型、粒子群與遺傳算法結(jié)合在PCA人臉識(shí)別、基于K均值聚類(lèi)方法的膚色分割、支持向量機(jī)和遺傳算法。
在列車(chē)司機(jī)長(zhǎng)時(shí)間駕駛疲勞檢測(cè)其中最關(guān)鍵技術(shù)之一是人臉檢測(cè)和人臉感興趣區(qū)域(ROI)定位,而人臉檢測(cè)和人臉感興趣區(qū)域(ROI)定位又涉及到的技術(shù)是列車(chē)司機(jī)的人臉檢測(cè)和人臉感興趣區(qū)域(ROI)定位技術(shù),其包括人臉膚色與列車(chē)司機(jī)的駕駛室分割技術(shù)。
如何實(shí)時(shí)智能檢測(cè)軌道交通列車(chē)司機(jī)疲勞狀態(tài)是軌道交通列車(chē)行車(chē)安全保障。檢測(cè)軌道交通列車(chē)司機(jī)的是否處于駕駛疲勞狀態(tài),其中主要關(guān)鍵技術(shù)之一是檢測(cè)到列車(chē)司機(jī)的人臉檢測(cè)。列車(chē)司機(jī)的人臉檢測(cè)是指列車(chē)駕駛室采集司機(jī)的圖像,通過(guò)機(jī)器視覺(jué)技術(shù)判斷采集圖像是否有司機(jī)人臉,如果有則定位司機(jī)人臉ROI(感興趣)區(qū)域位置,并將司機(jī)人臉從駕駛室的背景中分離出來(lái)。
而近年來(lái)國(guó)內(nèi)外研究使用傳統(tǒng)人臉檢測(cè)技術(shù)主要方法有以下幾種:
(1)基于幾何特征的方法。包括基于膚色和紋理的方法,其一般是通過(guò)提取我們?nèi)祟?lèi)的集合特征(人的眼睛、下巴、鼻子、口型、嘴巴)等重要特征點(diǎn)信息位置,而每個(gè)人臉在形狀、大小和結(jié)構(gòu)上存在各種差異,因此幾何特征提取人臉的精確性不是很好。
(2)基于模板的方法。其中主要思路是將人臉的圖像通過(guò)另外一種方式或者空間域?qū)θ四槇D像做LBP運(yùn)算,然后從該結(jié)果提取直方圖最后提取人臉特征信息。
(3)基于知識(shí)的方法。主要將人的臉看作眼睛、眉毛、嘴巴、鼻子等器官器官之間的幾何位置關(guān)系來(lái)檢測(cè)人臉,該方法由于每個(gè)人的外貌各異,因此在人臉檢測(cè)上存在一定誤差。
(4)劉春生等在研究針對(duì)傳統(tǒng)高斯膚色模型在膚色和光照變化較大情況下不能有效提取膚色區(qū)域的問(wèn)題,通過(guò)加權(quán)相似度人臉和灰度人臉的像素點(diǎn),得到人臉膚色模型的相似度信息和灰度分布信息,然后利用Adaboost算法進(jìn)一步檢測(cè)人臉信息的方法。該方法在一定程度上解決了和提高人臉檢測(cè)的準(zhǔn)確性和魯棒性,在實(shí)際工程應(yīng)用中,不同膚色的多人臉圖像時(shí)膚色檢測(cè)和人臉檢測(cè)效果并不是很理想。
(5)基于膚色的人臉檢測(cè)法。由于膚色的人臉檢測(cè)容易受到光照不同強(qiáng)度的影響,膚色提取過(guò)程中會(huì)有噪點(diǎn)存在,會(huì)誤認(rèn)為是膚色信息,影響檢測(cè)準(zhǔn)確度。
由于人臉模式的復(fù)雜性和多樣性,以及外界環(huán)境的不確定性,人臉檢測(cè)的對(duì)這些條件適應(yīng)性較差,這些情況使得人臉檢測(cè)成為一項(xiàng)熱門(mén)而又極具有挑戰(zhàn)性的課題。目前,已經(jīng)有一些用于人臉檢測(cè)的技術(shù)研究主要有人臉檢測(cè)定位方法的研究,目前主流技術(shù)如圖1所示。
圖1 目前人臉檢測(cè)技術(shù)
色彩空間通常是指人的眼睛和視覺(jué)感知系統(tǒng)在有限能力下,為了能夠識(shí)別準(zhǔn)確識(shí)別圖像的顏色,通過(guò)媒介或連續(xù)圖像的顏色來(lái)表示,在專業(yè)圖像處理技術(shù)術(shù)語(yǔ)中,通常圖像中的顏色空間是由一個(gè)特定的3-D坐標(biāo)和該坐標(biāo)中任意一個(gè)空間(如:三維坐標(biāo)值表示,,坐標(biāo)值),任何一個(gè)坐標(biāo)值表示一個(gè)單點(diǎn)或者顏色。目前主要有五種類(lèi)型的顏色模型,其包括RGB(red green blue)、HSL(hue saturation lightness)HSV(hue saturation value)、YUV(luminance,blue–luminance,red-luminance)、CMYK(cyan,magenta,yellow,key)。列車(chē)司機(jī)圖像有兩種基本的色彩空間,RGB圖像和灰度圖像,然后圖像還有別的色彩空間,比如:BGR,LAB,HSV等,如圖2將列車(chē)司機(jī)駕駛室圖進(jìn)行R紅色,G綠色和B藍(lán)色顯示如圖3所示。
圖2 列車(chē)司機(jī)駕駛室
圖3 列車(chē)司機(jī)駕駛室(R紅色G綠色B藍(lán)色)顯示
我們傳統(tǒng)的色彩空間是對(duì)一幅圖像色彩的一種描述方法。如一張列車(chē)司機(jī)的圖像,我們根據(jù)該列車(chē)司機(jī)的RGB原色和白點(diǎn)描述以便可以正確解釋和表達(dá)該司機(jī)圖像的色彩空間。顏色將某種顏色空間轉(zhuǎn)換到另一種顏色空間(類(lèi)似我們信號(hào)處理,在時(shí)域空間上無(wú)法分析時(shí)候,常常將會(huì)轉(zhuǎn)換到頻域空間上進(jìn)行分析),這樣有助于不丟失信息或顏色顯示正常,同時(shí)也有助于我們后期對(duì)該圖像信息進(jìn)行提取特征以及相關(guān)處理。色彩空間傳統(tǒng)將其定義由三個(gè)基色(R紅色,G綠色和B藍(lán)色)和白點(diǎn)的CIE 1931色度坐標(biāo)(,)組成。在CIE 1931圖上繪制三角形可提供輪廓,幫助可視化顏色空間所包含的可見(jiàn)顏色。
圖4 1931 CIE色品圖
針對(duì)HSV顏色空間表達(dá)彩色圖像的方式由色調(diào)(hue)、飽和度(saturation)明度(value)三個(gè)部分組成,其與BGR顏色空間相比,HSV顏色空間如圖5所示,對(duì)跟蹤某種顏色的物體容易跟蹤,在HSV顏色空間常用作分割指定顏色的物體。
圖5 HSV顏色空間
色彩空間模型中,分量表征色彩空間中的明亮度(luminance)(灰階值)。“亮度”是RGB輸入信號(hào)來(lái)轉(zhuǎn)換后的分量,而、共同表征某種圖像顏色的色調(diào)信息,其中表示Blue(藍(lán)色)分量,表示RGB輸入圖像信號(hào)藍(lán)色信息與RGB輸入圖像信號(hào)亮度值之間的差異,表示Red(紅色)分量,表示RGB輸入圖像信號(hào)紅色信息與該輸入的圖像信息亮度值之間的差值。
色彩空間YCbCr的亮度信息分量與、色調(diào)信息的采樣比例為4∶2∶2,該比例是按照人類(lèi)視覺(jué)對(duì)亮度信號(hào)變化敏感和對(duì)色度的變化不太敏感的規(guī)律來(lái)定義。
RGB與YCbCr色彩空間之前互換的公式[2]如下所示:
每個(gè)人都存在一定差別,每個(gè)人的膚色都有區(qū)別,表現(xiàn)出不一樣的皮膚顏色,外界的光照強(qiáng)度和視覺(jué)環(huán)境對(duì)膚色有一定的影響,可以通過(guò)顏色信息來(lái)分割膚色與背景顏色進(jìn)行分離,實(shí)現(xiàn)膚色與背景分離提供理論依據(jù)。人的膚色,不僅不依賴于面部的細(xì)節(jié)特征,而且還具有相對(duì)的穩(wěn)定性,還與大多數(shù)背景物體的顏色信息存在很大區(qū)別,因此,在膚色識(shí)別中,許多研究學(xué)者常用的顏色空間為YCbCr顏色空間來(lái)進(jìn)行人物和背景分離。
RGB顏色空間隨著光強(qiáng)發(fā)生變化時(shí),RGB顏色空間中R,G,B三個(gè)分量也會(huì)同時(shí)發(fā)生變化,容易受到光照強(qiáng)度的影響,而在YCbCr顏色空間中,受光強(qiáng)影響較小,也相對(duì)獨(dú)立,對(duì)膚色的聚類(lèi)特性比較好,一張列車(chē)司機(jī)的彩圖可以通過(guò)YCbCr顏色空間將色度與亮度分離進(jìn)行,Cb和Cr分量?jī)删S獨(dú)立分布,能夠比較好地區(qū)分膚色的分布區(qū)域情況,因此YCbCr顏色空間比較適合人的膚色與背景分割和識(shí)別。
不同色彩空間的選擇,直接對(duì)膚色檢測(cè)的結(jié)果產(chǎn)生影響,目前常用于膚色檢測(cè)的常用色彩空間有YIQ、YUV、HIS、和YCbCr等顏色空間。徐俊等使用YCbCr色彩空間求出每個(gè)像素點(diǎn)屬于膚色的隸屬度,在復(fù)雜背景中獲得很好的人臉檢測(cè)效果。Zarit等證明HSV色彩空間檢測(cè)膚色像素性能最好。Sobottka等認(rèn)為:使用H和S就足夠?qū)⒛w色和背景分割開(kāi),除了不需要考慮V外,其對(duì)光照和陰影的影響也有較高的穩(wěn)定性。因此,圖6所示列車(chē)司機(jī)膚色在HSV色彩空間的分布圖
圖6 列車(chē)司機(jī)在駕駛室原始圖和生成HSV空間圖
圖7 列車(chē)司機(jī)在駕駛室生成H分量、V分量、S分量
該高斯模型也是目前傳統(tǒng)常用的膚色模型,其通過(guò)計(jì)算圖像的像素的頻率估計(jì)并得到一個(gè)膚色概率圖,根據(jù)圖像的信息數(shù)值閾值來(lái)確定人的膚色和背景顏色,克服了幾何模型的缺點(diǎn)。用高斯概率密度函數(shù)分布,將一個(gè)事物分解為若干的概率密度函數(shù)(正態(tài)分布曲線)形成的模型,高斯模型主要實(shí)現(xiàn)思路是將圖像灰度直方圖所反映的圖像中某個(gè)灰度值出現(xiàn)的概率的估計(jì)。對(duì)于復(fù)雜的圖像所包含的感興趣區(qū)域和背景區(qū)域相差比較大,而且背景區(qū)域和感興趣區(qū)域在灰度上有一定的差異,在實(shí)現(xiàn)灰度直方圖將呈現(xiàn)出一個(gè)峰對(duì)應(yīng)于感興趣區(qū)域,另一個(gè)峰對(duì)應(yīng)于背景的中心灰度的雙峰-谷形狀,可以解決圖像的分割問(wèn)題。
傳統(tǒng)的膚色建模方法有:閾值法、直方圖統(tǒng)計(jì)、一維高斯模型、混合高斯模型和區(qū)域級(jí)檢測(cè)。膚色RGB色彩空間變換到Y(jié)CbC空間中,在—空間中空間的高斯分布,對(duì)于彩色圖像中每個(gè)像素,計(jì)算該點(diǎn)屬于皮膚像素的概率,該點(diǎn)離高斯分布中心和膚色的相似度,彩色圖像轉(zhuǎn)化成灰度圖,其中每個(gè)像素的灰度值對(duì)應(yīng)該點(diǎn)與膚色的相似度。
通過(guò)大量對(duì)膚色像素點(diǎn)測(cè)試及訓(xùn)練后,選取的膚色模型的經(jīng)驗(yàn)值參數(shù)為:
膚色樣本庫(kù)中分量的頻率直方圖如圖8所示,分量的頻率直方圖,分量的頻率直方圖,圖中橫坐標(biāo)表示正則化頻率,縱坐標(biāo)表示概率。
圖8 列車(chē)司機(jī)的YCbCr空間分量
圖9 列車(chē)司機(jī)YCbCr各個(gè)分量頻譜直方圖
由上圖可知,列車(chē)司機(jī)分布圖可知,和分量窄高斯分布,分布主要在100級(jí)別左右,分布集中,方差小的特性,這樣我們就可以很容易提取和分量列車(chē)司機(jī)的一些特性。
在YCbCr空間上由色度和構(gòu)成的二維平面上膚色分布是相對(duì)比較集中的,可以用Gauss分布來(lái)描述,圖10是列車(chē)司機(jī)的圖片大小為(3848,4088)提取主顏色示意圖,這樣就很容易分離皮膚和背景顏色。
圖10 列車(chē)司機(jī)主顏色提取
訓(xùn)練的時(shí)候,需要確定的是均值和。如下面的公式:
計(jì)算人臉的皮膚相似度時(shí),我們采用了下面的公式:
由于目前硬件設(shè)備采集的彩色圖象都是在RGB色彩空間,在RGB彩色空間中由于收到光照強(qiáng)度影響,每個(gè)分量膚色的差異不明顯,分割背景圖比較困難,而膚色的人臉檢測(cè)技術(shù)需要選取膚色顏色空間和建立膚色模型因此,在膚色區(qū)域的亮、色分離(皮膚與背景圖分離)常常將RGB色彩空間轉(zhuǎn)化為YCbCr色彩空間(YCbCr色彩空間),適用于膚色在色度上的差異遠(yuǎn)小于亮度上差異的特點(diǎn),RGB色彩空間可以根據(jù)它們之間的關(guān)系式直接轉(zhuǎn)換為YCbCr色彩空間。經(jīng)膚色分割后得到二值圖像會(huì)出現(xiàn)背景原色與人的皮膚顏色相似的像素點(diǎn)以及噪聲的產(chǎn)生被誤認(rèn)為膚色像素點(diǎn)或者小區(qū)域。人臉的局部區(qū)域如眼睛、頭發(fā)、眉毛等非膚色區(qū)域而導(dǎo)致的整個(gè)人臉的非完全填充,需要對(duì)檢測(cè)后的人臉圖像進(jìn)行二次形態(tài)處理,將處理好的二值圖像進(jìn)行水平、垂直投影到膚色比較集中的區(qū)域。利用檢測(cè)到的人臉矩形區(qū)域可以對(duì)圖像進(jìn)行分割,獲得其中的ROI(region of interest)“感興趣區(qū)域”,該區(qū)域是提取出的需處理的區(qū)域,該區(qū)域包含了圖像的主要信息和關(guān)鍵信息,可以在處理中近似代替原始圖像,在檢測(cè)到人臉區(qū)域后,要將ROI區(qū)域保存下來(lái)作為新的人臉圖像,ROI人臉區(qū)域得到興趣landmark關(guān)鍵點(diǎn)。
本文提出了一種基于YCbCr高斯膚色模型的人臉檢測(cè)算法,利用人臉膚色分量具有類(lèi)高斯的分布特性,將其引入CbCr高斯膚色模型中,建立膚色模型,以線性加權(quán)的方式完成融合判斷,以此獲得列車(chē)司機(jī)在途行駛過(guò)程圖像中獲取可能的人臉區(qū)域,具體主要實(shí)現(xiàn)思路(如圖11所示)如下。
圖11 軌道交通列車(chē)司機(jī)人臉檢測(cè)流程
在列車(chē)駕駛室里采集列車(chē)的圖像,將獲得列車(chē)司機(jī)的RGB圖像轉(zhuǎn)換到Y(jié)CbCr色彩空間中;統(tǒng)計(jì)采集到列車(chē)司機(jī)的圖像像素點(diǎn)個(gè)數(shù);對(duì)統(tǒng)計(jì)到列車(chē)司機(jī)圖像像素點(diǎn)個(gè)數(shù)后,建立司機(jī)膚色模型;計(jì)算某個(gè)像素點(diǎn)出現(xiàn)概率;判斷閾值,進(jìn)行先腐蝕后膨脹的開(kāi)運(yùn)算;消除噪點(diǎn)(雜點(diǎn)),計(jì)算列車(chē)司機(jī)皮膚區(qū)域的面積,計(jì)算矩形區(qū)域的面積;根據(jù)膚色區(qū)域的長(zhǎng)和寬,去除非人的區(qū)域;將列車(chē)司機(jī)的人臉區(qū)域框出來(lái),顯示定位列車(chē)司機(jī)人臉區(qū)域,然后將進(jìn)一步對(duì)列車(chē)司機(jī)的眼睛進(jìn)行判斷是否疲勞。
本文實(shí)驗(yàn)室基于在Intel(R)Core(TM)i7-9750H CPU@2.60 GHz2.59 GHz16.0 GB(15.8 GB可用)的環(huán)境下,采用MATLAB 6.0分別編程實(shí)現(xiàn),圖12所示列車(chē)司機(jī)膚色似然圖和二值化圖、圖13所示列車(chē)司機(jī)人臉定位過(guò)程圖。
圖12 列車(chē)司機(jī)膚色似然圖和二值化圖
圖13 列車(chē)司機(jī)人臉定位過(guò)程
本文對(duì)于在列車(chē)行駛過(guò)程中提出一種面向軌道交通列車(chē)司機(jī)人臉檢測(cè)方法,主要是將利用人臉膚色分量具有類(lèi)高斯的分布特性,將其引入CbCr高斯膚色模型中,建立YCbCr高斯膚色模型的人臉檢測(cè)思路,包括顏色空間選擇、高斯膚色模型建立、閾值計(jì)算、形態(tài)學(xué)濾波和應(yīng)用算法訓(xùn)練人臉?lè)诸?lèi)器的過(guò)程,并分析人臉檢測(cè)的準(zhǔn)確性和實(shí)時(shí)性。實(shí)驗(yàn)結(jié)果表明,復(fù)雜光照下對(duì)列車(chē)司機(jī)人臉檢測(cè)能有效提高人臉檢測(cè)率和降低誤檢率,為后續(xù)根據(jù)PERCLOS算法檢測(cè)出列車(chē)駕司機(jī)是否在疲勞駕駛,系統(tǒng)就會(huì)發(fā)出預(yù)警信號(hào)以及驗(yàn)證PERCLOS深度學(xué)習(xí)疲勞檢測(cè)的方法準(zhǔn)確性研究奠定一定基礎(chǔ)。