劉帆 強(qiáng)發(fā)軍 趙明旭 倪旭 韓冷
摘要:本文對圖像質(zhì)量主觀評價和客觀評價方法進(jìn)行了介紹和優(yōu)缺點分析,針對主觀評價方法耗時耗力、隨機(jī)性大等缺點,構(gòu)建了一種圖像質(zhì)量客觀評價模型,介紹幾種常用的圖像質(zhì)量客觀評價算法并對其進(jìn)行計算機(jī)仿真,實現(xiàn)了多路圖像質(zhì)量高低定量排序。進(jìn)行對比實驗,對該圖像質(zhì)量客觀評價模型進(jìn)行驗證,實驗結(jié)果表明該模型所采用的客觀圖像質(zhì)量評價與主觀評價基本保持一致。
關(guān)鍵詞:圖像處理;質(zhì)量評價;主觀評價;客觀評價;算法設(shè)計
中圖分類號:TP391.41 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2020)06-0107-04
1 圖像質(zhì)量評價方法
圖像質(zhì)量的評價方法可以分為主觀評價和客觀評價兩大類,其中,主觀評價方法直觀、比較準(zhǔn)確以及有效,但是由于在一定的測試環(huán)境中由多個觀測者來對圖像進(jìn)行評分,然后對大量評分?jǐn)?shù)據(jù)進(jìn)行統(tǒng)計分析,因此耗時,不易實現(xiàn);客觀評價方法一般是由某個數(shù)學(xué)模型來計算出圖像質(zhì)量的分?jǐn)?shù),比較經(jīng)濟(jì)實用,但是要求客觀評價的結(jié)果應(yīng)該與主觀評價的結(jié)果具有較好的相關(guān)性。
1.1 主觀評價方法
圖像質(zhì)量主觀評價就是選擇一批非專業(yè)的觀測員,讓他們在特定的環(huán)境下,連續(xù)觀看一系列的測試序列,觀看時長大概10到30分鐘,然后采用不同的方法讓他們對視頻序列的質(zhì)量評分。主觀評價結(jié)果有兩種表示方法:一種是絕對評分MOS(Mean Opinion Score),表示待測視頻的絕對質(zhì)量;另一種是差值表達(dá)DMOS(Difference Mean Opinion Score),表示待測視頻與參考視頻質(zhì)量的差值。主觀評價方法主要包括雙刺激連續(xù)質(zhì)量分級法、雙刺激損傷分級法、單刺激連續(xù)質(zhì)量評估法、絕對分類評價法等4種。
由于人是視頻的最終接收者,因此主觀評價是最可靠和最準(zhǔn)確的方法。但是主觀評價方法需要投入大量的人力和物力,測試環(huán)境要求嚴(yán)格,評測得到結(jié)果所需時間長,而且無法嵌入到實際的系統(tǒng)中,應(yīng)用范圍很有限。目前主觀評價方法主要用于驗證客觀評價方法的有效性,可以根據(jù)主觀評價實驗來驗證其他方法的結(jié)果。
1.2 客觀評價方法
圖像質(zhì)量主觀評估由于需要大量的非專業(yè)人員對圖像進(jìn)行評價,比較耗時且結(jié)果易受多種因素影響,因此在實際應(yīng)用中需要一種客觀的、簡單的圖像質(zhì)量評價方法。根據(jù)用于評價的輸入數(shù)據(jù)形式,可以將客觀評價方法主要分為五類:(1)媒體層模型(Media-layer models),利用解碼后的視頻信號來計算體驗質(zhì)量QoE(Quality of Experience),不需要測試系統(tǒng)的任何信息,因此能很好應(yīng)用到如編解碼比較和編解碼優(yōu)化的場景中。(2)帶參數(shù)的包層模型(Parametric packet-layer models),與媒體層不同的是,該模型預(yù)測QoE只用到包頭的信息,而不接觸媒體信息,因此該模型的算法復(fù)雜度低。(3)參數(shù)規(guī)劃模型(Parametric planning models),只使用與媒體相關(guān)的網(wǎng)絡(luò)規(guī)劃參數(shù)和終端應(yīng)用參數(shù),因此需要事先知道測試系統(tǒng)的信息。(4)碼流模型(Bitstream-layer models),利用碼流信息和包頭信息來度量QoE。(5)混合模型(Hybrid models),將以上兩個或更多的模型特性結(jié)合一起,能夠使用的信息更加全面。
1.3 影響圖像質(zhì)量的因素
在研究圖像頻質(zhì)量評價方法前,有必要分析影響圖像頻質(zhì)量的因素。一方面,當(dāng)前網(wǎng)絡(luò)帶寬有限,如果要在網(wǎng)絡(luò)上實現(xiàn)圖像頻高速傳播,必須對圖像頻進(jìn)行一系列處理,如信號采集、壓縮等[1-2],這樣可以減小圖像頻文件的大小以適應(yīng)網(wǎng)絡(luò)帶寬。然而,對圖像頻進(jìn)行壓縮處理的同時,必然會引起圖像頻質(zhì)量下降。另一方面,網(wǎng)絡(luò)的不可靠性同樣會對圖像頻帶來各種各樣的失真。當(dāng)前IP網(wǎng)絡(luò)盡力傳輸機(jī)制,無法保證服務(wù)質(zhì)量。同時,在現(xiàn)實網(wǎng)絡(luò)中有諸多不穩(wěn)定的因素如:網(wǎng)絡(luò)傳輸過程中,設(shè)備電壓不穩(wěn),導(dǎo)致比特傳輸錯誤;網(wǎng)絡(luò)發(fā)生堵塞,導(dǎo)致數(shù)據(jù)包丟失。所以不可靠的網(wǎng)絡(luò)傳輸也是圖像頻質(zhì)量降低的重要原因。
由此可知網(wǎng)絡(luò)應(yīng)用的圖像頻質(zhì)量的損傷主要來源于兩個因素。一是為了適應(yīng)網(wǎng)絡(luò)的需求,對圖像頻進(jìn)行壓縮編碼,而有損壓縮的編碼方式使得解碼后的圖像頻無法完全恢復(fù)成原始圖像頻,從而產(chǎn)生的圖像頻質(zhì)量模糊等現(xiàn)象。二是網(wǎng)絡(luò)的不穩(wěn)定性導(dǎo)致可能出現(xiàn)的傳輸誤碼,從而導(dǎo)致圖像頻質(zhì)量失真等現(xiàn)象。
2 圖像質(zhì)量客觀評價算法設(shè)計
2.1 算法概述
清晰度也指模糊度或粗糙度,是指人眼能感覺出的相鄰影像間的明顯程度,圖像質(zhì)量的好壞與其清晰度直接相關(guān)。導(dǎo)致圖像清晰度下降的原因是模糊現(xiàn)象的產(chǎn)生,在圖像的采集、傳輸、壓縮和濾波等各種處理過程中都可能產(chǎn)生模糊,比如曝光期間成像系統(tǒng)和被攝物體相對運(yùn)動產(chǎn)生的運(yùn)動模糊,成像系統(tǒng)聚焦不良或部分景物處于散焦?fàn)顟B(tài)產(chǎn)生的離焦模糊,光的衍射、以及壓縮之后高頻丟失等產(chǎn)生的各類模糊,電子系統(tǒng)高頻性能不良也會損失圖像的高頻分量而使圖像模糊等。圖像模糊是由于圖像高頻分量的丟失造成的邊緣或者細(xì)節(jié)不清晰,清晰圖像比模糊圖像包含更豐富的細(xì)節(jié)信息,即高頻分量[3],圖像邊緣和紋理失真很小,幾乎可以忽略。所以可以通過衡量圖像包含高頻分量所占的比例來評價圖像的清晰度。在數(shù)字圖像處理中,梯度函數(shù)常被用來提取邊緣信息,聚焦越好的圖像,具有越尖銳的邊緣,圖像梯度函數(shù)值就越大。常用的梯度函數(shù)有:能量梯度函數(shù)、方差函數(shù)和Roberts梯度算子等。
2.1.1 能量梯度函數(shù)
利用相鄰點的差分計算一個點的梯度值,計算公式如下:
2.1.2 方差函數(shù)
該方法是一個比較流行的自動對焦的清晰度評價函數(shù)。由于清晰圖像比模糊圖像存在更大的灰度級差異,所以方差函數(shù)可作為圖像清晰度高低的一個評價標(biāo)準(zhǔn)。方差函數(shù)計算公式如下:
2.1.3 Roberts梯度算子
2.2 算法仿真
由于方差函數(shù)法運(yùn)算過程簡便,算法復(fù)雜度低,被廣泛應(yīng)用于圖像質(zhì)量評價中,因此這里也采取方差函數(shù)法進(jìn)行圖像質(zhì)量評價。
在VC++環(huán)境[4-5]下編寫程序,利用4幅施加不同程度高斯噪聲的圖像來檢驗圖像質(zhì)量評價算法,如圖1所示,高斯噪聲系數(shù)σ越大,圖像中包含的高斯噪聲越多,圖像質(zhì)量越差。采取方差函數(shù)法對4幅圖像進(jìn)行計算,得到的評價值分別為:43.95,41.66,39.87,36.63,評價值與圖像效果的對應(yīng)性較強(qiáng)。
對matlab系統(tǒng)自帶的lena圖片施加不同程度高斯噪聲進(jìn)行圖像質(zhì)量評價算法驗證。采取方差函數(shù)法對4幅圖像進(jìn)行計算,如圖2所示,得到的評價值分別為:50.89,47.56,45.38,42.21,評價值與圖像效果的對應(yīng)性較強(qiáng)。
3 對比實驗
3.1 實驗素材選取
實驗素材的選取對整個研究過程具有重要地位,所選擇的視頻素材序列要盡可能多的視頻場景,而且所包含的內(nèi)容需包含典型的空域復(fù)雜度(SC,Spatial Complexity)和時域復(fù)雜度(TC,Temporal Complexity)??沼驈?fù)雜度越高,表示視頻圖像包含的邊緣與紋理越多;時域復(fù)雜度越高,視頻運(yùn)動越劇烈。文本將序列分為四類,其中第I類表示運(yùn)動平緩但空域內(nèi)容復(fù)雜;第II類表示運(yùn)動劇烈且空域內(nèi)容復(fù)雜:第III類表示運(yùn)動平緩且空域內(nèi)容平滑;第IV類表示運(yùn)動劇烈但空域內(nèi)容簡單。本文所選取的原始視頻序列涵蓋所有這四種類型。
3.2 主觀評價過程
3.2.1 觀測人員
觀測人員即是應(yīng)邀請參加主觀評價的評分人員,參與評測的人員都是隨即選取的技術(shù)人員,并且不是研究視頻圖像方面的專業(yè)人員,一共有8人參與此次主觀評測,并且所有的觀測人員具有正常的視力。每個失真序列都被所有的觀測者評價。在評測開始之前,每個觀測者都被告知實驗的目的,并且經(jīng)歷一段短時間的訓(xùn)練。訓(xùn)練的視頻序列不屬于本文建立的視頻數(shù)據(jù)庫里的一部分。每個訓(xùn)練視頻持續(xù)時間為10s,并且視頻質(zhì)量從好到壞。
3.2.2 顯示設(shè)備
實驗中,在PC使用Matlab的XGL工具箱進(jìn)行視頻的播放以及打分。界面如圖3所示。視頻顯示設(shè)備為23ich的液晶顯示器,分辨率為1440×900。為了避免由于尺寸變換帶來失真,視頻以各自原始分辨率播放,顯示畫面的其余部分為黑色背景,并在畫面下方有一個連續(xù)標(biāo)尺,并有一個十字光標(biāo)在標(biāo)尺正中。在視頻播放完之后,會在屏幕上顯示一個質(zhì)量打分標(biāo)尺,標(biāo)尺最左端標(biāo)記“Bad”,最右端標(biāo)記“Excellent”,中間等間隔距離分別標(biāo)記“Poor”、“Fair”和“Good”,5個質(zhì)量等級分別對應(yīng)1-5分。觀測者可用鼠標(biāo)移動標(biāo)尺中央處的十字光標(biāo)。在移動十字光標(biāo)后,觀測者要求按下鍵盤上的任意鍵來輸入對視頻的打分。一旦打分鍵入,將無法更改。當(dāng)完成當(dāng)前的評分,下一個視頻將開始播放。
3.2.3 主觀評價數(shù)據(jù)處理
采用MOSj來表示視頻j的評分,N為參與評分的人數(shù),dij表示第i個人對視頻j的評分,則MOSj如下式計算:
3.3 實驗結(jié)果
對圖1和圖2分別進(jìn)行主觀圖像質(zhì)量評價,得到結(jié)果如表1和表2所示??梢钥闯?,2.2節(jié)中所采用的客觀評價得分排序與主觀評價相同。實驗結(jié)果表明該模型所采用的客觀圖像質(zhì)量評價與主觀評價基本保持一致,驗證了模型和算法的正確性。
4 結(jié)語
圖像質(zhì)量的評價方法可以分為主觀評價和客觀評價兩大類,其中,主觀評價方法直觀、比較準(zhǔn)確以及有效,但是由于在一定的測試環(huán)境中由多個觀測者來對圖像進(jìn)行評分,然后對大量評分?jǐn)?shù)據(jù)進(jìn)行統(tǒng)計分析,因此耗時,不易實現(xiàn);本文針對主觀評價方法的缺點,構(gòu)建了一種圖像質(zhì)量客觀評價模型,設(shè)計了算法并對其進(jìn)行計算機(jī)仿真,實現(xiàn)了多路圖像質(zhì)量高低定量排序。進(jìn)行對比實驗,對該圖像質(zhì)量客觀評價模型進(jìn)行驗證,實驗結(jié)果表明該模型所采用的客觀圖像質(zhì)量評價與主觀評價基本保持一致,驗證了模型和算法的正確性。
參考文獻(xiàn)
[1] 阮秋琦.數(shù)字圖像處理(MTALAB版)(第二版)[M].北京:電子工業(yè)出版社,2014.
[2] 左飛,萬晉森,劉航.數(shù)字圖像處理原理與實踐[M].北京:電子工業(yè)出版社,2012.
[3] 原魁,何文浩,肖晗.基于FPGA的嵌入式圖像處理系統(tǒng)設(shè)計[M].北京:電子工業(yè)出版社,2013.
[4] 齊舒.Visual C++.NET高級編程(第1版)[M].北京:清華大學(xué)出版社,2002.
[5] 葉乃文,王丹.面對對象程序設(shè)計(第2版)[M].北京:清華大學(xué)出版社,2009.