殷 夫,紀(jì) 震,周家銳,張海婕
1)深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院,深圳 518052;2)廣州軍區(qū)武漢陸軍總醫(yī)院核醫(yī)學(xué)科,武漢 430070
【電子與信息科學(xué) / Electronics and Information Science】
PET/CT圖像質(zhì)量主觀評(píng)價(jià)與感知模型
殷 夫1,紀(jì) 震1,周家銳1,張海婕2
1)深圳大學(xué)計(jì)算機(jī)與軟件學(xué)院,深圳 518052;2)廣州軍區(qū)武漢陸軍總醫(yī)院核醫(yī)學(xué)科,武漢 430070
針對(duì)面向醫(yī)學(xué)領(lǐng)域的主觀評(píng)價(jià)數(shù)據(jù)庫(kù)缺乏,導(dǎo)致醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)(image quality assessment,IQA)算法性能難以分析的問題,基于雙重刺激失真水平測(cè)試法,建立正電子發(fā)射斷層顯像/計(jì)算機(jī)斷層掃描醫(yī)學(xué)圖像的主觀評(píng)價(jià)數(shù)據(jù)庫(kù).對(duì)比13種國(guó)際通用IQA算法在數(shù)據(jù)庫(kù)上的性能,分析不同退化方法對(duì)IQA算法的影響.結(jié)果表明,對(duì)新建立的圖像評(píng)價(jià)數(shù)據(jù)庫(kù)來(lái)說(shuō),特征相似性(feature similarity,F(xiàn)SIM)圖像評(píng)價(jià)模型在相關(guān)性及穩(wěn)定性方面明顯優(yōu)于其他IQA算法,包括目前醫(yī)學(xué)領(lǐng)域主流的峰值信噪比評(píng)價(jià)指標(biāo).
計(jì)算機(jī)圖像處理;圖像質(zhì)量評(píng)價(jià)算法;雙重刺激失真水平測(cè)試法;電子發(fā)射斷層顯像/計(jì)算機(jī)斷層掃描;特征相似性;圖像質(zhì)量主觀評(píng)價(jià)數(shù)據(jù)庫(kù)
正電子發(fā)射斷層顯像(positron emission tomography,PET)是目前最先進(jìn)的核醫(yī)學(xué)影像技術(shù)之一.PET檢查采用正電子核素作為示蹤劑,通過觀察病灶部位對(duì)示蹤劑的攝取,了解其功能代謝狀態(tài),從而對(duì)疾病作出正確診斷[1].計(jì)算機(jī)斷層掃描(computed tomography,CT)是臨床廣泛應(yīng)用,且迅速發(fā)展的X線斷層成像技術(shù).通過將PET與CT同機(jī)整合,并將其輸出的不同性質(zhì)的圖像進(jìn)行融合顯示,即可形成PET/CT醫(yī)學(xué)成像系統(tǒng).將PET和CT進(jìn)行結(jié)合,不僅保留了經(jīng)典解剖影像的作用,還加入了先進(jìn)的分子影像功能,其結(jié)合遠(yuǎn)優(yōu)于各自單獨(dú)的價(jià)值[2].PET/CT的出現(xiàn)是醫(yī)學(xué)影像學(xué)的又一次革命,受到醫(yī)學(xué)界的廣泛關(guān)注.
醫(yī)學(xué)圖像,特別是放射醫(yī)學(xué)成像,是臨床醫(yī)學(xué)研究、診斷和治療的重要依據(jù).發(fā)展醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)方法,對(duì)評(píng)估和優(yōu)化成像系統(tǒng)、醫(yī)學(xué)圖像的壓縮方法以及成像算法具有重大意義.醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)(image quality assessment,IQA)包括主觀評(píng)價(jià)和客觀評(píng)價(jià)兩類[3].
醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)最可靠的評(píng)價(jià)方法為主觀評(píng)價(jià)方法.主觀評(píng)價(jià)方法是通過心理學(xué)測(cè)試,直接獲得人類視覺系統(tǒng)(human visual system,HVS)對(duì)圖像質(zhì)量的主觀評(píng)價(jià)分?jǐn)?shù),是一類比較可靠的評(píng)價(jià)方法.但是該方法存在代價(jià)高、耗時(shí)長(zhǎng)、實(shí)時(shí)性差和易受主客觀因素影響等缺點(diǎn),在現(xiàn)實(shí)中往往難以應(yīng)用,因此通常使用客觀感知模型來(lái)模仿HVS的功能.然而,客觀算法的研究依賴于主觀評(píng)價(jià)結(jié)果,需采用建立圖像質(zhì)量感知評(píng)價(jià)數(shù)據(jù)庫(kù)的方式獲得主觀評(píng)價(jià)結(jié)果[4].遺憾的是,目前缺乏面向醫(yī)學(xué)圖像的主觀評(píng)價(jià)數(shù)據(jù)庫(kù),客觀感知模型往往只能在自然圖像數(shù)據(jù)庫(kù)中檢驗(yàn)其性能.因此,建立一個(gè)由醫(yī)生參與評(píng)分的標(biāo)準(zhǔn)主觀圖像數(shù)據(jù)庫(kù)尤為必要.
客觀評(píng)價(jià)方法采用算法感知模型計(jì)算圖像質(zhì)量客觀評(píng)價(jià)分?jǐn)?shù),其目的是使計(jì)算機(jī)模仿HVS的功能.目前醫(yī)學(xué)圖像處理系統(tǒng)主要采用峰值信噪比(peak signal to noise ratio,PSNR)作為圖像質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),并不能真實(shí)反映圖像的視覺感知量[5].從基本方法上來(lái)說(shuō),醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)與自然圖像質(zhì)量評(píng)價(jià)都是評(píng)估圖像之間的感知差異.但醫(yī)學(xué)圖像的成像目的是病灶診斷,病灶信號(hào)的可識(shí)別能力是醫(yī)學(xué)圖像質(zhì)量的重要特征[6].常見的通用圖像質(zhì)量評(píng)價(jià)方法是否適用于醫(yī)學(xué)圖像,仍須通過在醫(yī)學(xué)圖像主觀評(píng)價(jià)數(shù)據(jù)庫(kù)上通過實(shí)驗(yàn)進(jìn)行驗(yàn)證.
建立圖像質(zhì)量感知主觀評(píng)價(jià)數(shù)據(jù)庫(kù)的意義在于衡量圖像客觀評(píng)價(jià)算法的性能.而目前缺乏面向醫(yī)學(xué)圖像的主觀評(píng)價(jià)數(shù)據(jù)庫(kù).為此,本研究建立基于PET/CT醫(yī)學(xué)圖像的主觀評(píng)價(jià)數(shù)據(jù)庫(kù),并在此基礎(chǔ)上,選取13種國(guó)際通用IQA算法,就各客觀算法的準(zhǔn)確性、單調(diào)性和一致性進(jìn)行評(píng)價(jià)分析,提出了比PSNR更符合視覺感知特點(diǎn)、性能更優(yōu)的醫(yī)學(xué)感知模型.
1.1 測(cè)試圖片
在圖像質(zhì)量主觀感知評(píng)價(jià)數(shù)據(jù)庫(kù)的開發(fā)中,需要測(cè)試者進(jìn)行質(zhì)量感知評(píng)價(jià)的圖片被稱為測(cè)試圖片.其中,未經(jīng)任何處理的圖片稱為原始圖片,對(duì)原始圖片經(jīng)過某種退化方法處理后的圖片稱為退化圖片.
該數(shù)據(jù)庫(kù)中包含原始圖片12張,均來(lái)源于某醫(yī)院PET/CT中心病例圖像數(shù)據(jù)庫(kù).其中,測(cè)試圖片分為含病灶圖片與無(wú)病灶圖片,兩者數(shù)量比例約為2∶1;垂直與水平分辨率均為96 dpi,尺寸為968×968 像素.為保證原始圖片無(wú)編碼損失,選擇存儲(chǔ)格式為BMP.
在構(gòu)造退化圖片時(shí),該數(shù)據(jù)庫(kù)針對(duì)PET/CT圖像設(shè)計(jì)了多種退化方法,基本包含了實(shí)際PET/CT圖像編碼和圖像傳輸中可能導(dǎo)致的各種失真,包括在進(jìn)行圖片壓縮保存中的JPEG壓縮(記為JPG)與JPEG2000壓縮(記為JP2)、醫(yī)生在進(jìn)行病灶診斷時(shí)對(duì)圖片進(jìn)行對(duì)比度調(diào)節(jié)而造成的對(duì)比度變化(contrast change,CC)、 儀器故障產(chǎn)生的高斯白噪聲(white Gaussian noise,WGN)、 高斯模糊(Gaussian blur,GB)和模塊缺失,以及因患者在進(jìn)行PET/CT檢查時(shí)運(yùn)動(dòng)所產(chǎn)生的運(yùn)動(dòng)模糊(motion blur,MB)這6種退化方法.每種退化方法有4個(gè)退化水平,經(jīng)多次主觀測(cè)試實(shí)驗(yàn)得到退化參數(shù)如表1.其中,JPG與JP2的退化參數(shù)為壓縮質(zhì)量;CC的退化參數(shù)為對(duì)比度變化率;WGN的退化參數(shù)為噪聲分布率;GB的退化參數(shù)為高斯濾波的標(biāo)準(zhǔn)偏差;MB的退化參數(shù)為像素大小.按照以上原則,本研究所構(gòu)建的數(shù)據(jù)庫(kù)共有288張退化圖片,是原始圖片數(shù)、退化方法數(shù)和退化水平數(shù)之積.?dāng)?shù)據(jù)庫(kù)訪問的網(wǎng)址為http://dsp.szu.edu.cn/petct/.
1.2 測(cè)試方法
雙重刺激失真水平測(cè)試法(double-stimulus impairment scale method,DSIS)的測(cè)試以循環(huán)方式進(jìn)行[7].每次循環(huán)時(shí),首先向測(cè)試者呈現(xiàn)無(wú)失真的原始圖片,接下來(lái)顯現(xiàn)相應(yīng)的退化圖片,并要求測(cè)試者在留有對(duì)原始圖片印象的情況下對(duì)退化圖片失真情況進(jìn)行評(píng)價(jià).在約30 min的測(cè)試中,測(cè)試圖片的呈現(xiàn)順序需是隨機(jī)的.在所有測(cè)試者完成評(píng)價(jià)后,計(jì)算每張圖片獲得的平均分(mean-opinion-score,MOS)作為最終測(cè)試結(jié)果.圖1給出DSIS方法測(cè)試流程[8].其中,t1=10s,顯示原始圖片;t2=3s,無(wú)顯示;t3=10s,顯示測(cè)試圖片;t4為5~11s,無(wú)顯示;測(cè)試者可以在t3和t4階段對(duì)測(cè)試圖片進(jìn)行評(píng)價(jià).
表1 各退化方法退化參數(shù)
圖1 DSIS方法測(cè)試流程圖[6]Fig.1 Test flow chart of DSIS method[6]
病灶信號(hào)的可識(shí)別能力是醫(yī)學(xué)圖像質(zhì)量的重要特征,因此將主觀測(cè)試評(píng)價(jià)指標(biāo)規(guī)定為:“5”為圖像質(zhì)量?jī)?yōu),不影響診斷;“4” 為圖像質(zhì)量良,不影響診斷;“3” 為圖像質(zhì)量較差,影響診斷;“2” 為圖像質(zhì)量差,明顯影響診斷;“1” 為圖像質(zhì)量極差,無(wú)法診斷.
1.3 測(cè)試環(huán)境
DSIS測(cè)試時(shí),所有圖片使用巨峰公司型號(hào)為C22SP+21.3″2MP的彩色LED器醫(yī)用顯示器進(jìn)行呈現(xiàn).該顯示器具有彩色和灰階成像功能,適用于多種醫(yī)療影像設(shè)備以及臨床科室.
根據(jù)ITU-R_BT.500-11協(xié)議中電視圖像質(zhì)量主觀評(píng)價(jià)方法(methodologyforsubjectiveassessmentofthequalityoftelevisionpictures)的要求,將顯示器亮度設(shè)置為70、對(duì)比度設(shè)置為50、銳利度設(shè)置為7、飽和度設(shè)置為50、色溫設(shè)置為6 500K、伽馬設(shè)置為DICOM500.
所有主觀測(cè)試均在某醫(yī)院PET/CT中心會(huì)議室進(jìn)行,室內(nèi)光照正常.
1.4 測(cè)試人員
ITU-R_BT.500-11協(xié)議中要求至少有15名非圖像處理專業(yè)測(cè)試者參加測(cè)試,每個(gè)測(cè)試者必須具有正常的視覺靈敏度與正常的色視覺[8].Chandler等[9]發(fā)現(xiàn),測(cè)試者的專業(yè)對(duì)其圖像質(zhì)量感知評(píng)價(jià)具有影響.例如,專業(yè)為圖像處理領(lǐng)域的測(cè)試者傾向于對(duì)超過一定壓縮閾值的壓縮圖片給出較低評(píng)價(jià),而攝影師則對(duì)噪聲模糊圖片給出較低評(píng)價(jià).測(cè)試者的專業(yè)水平可能會(huì)造成圖像質(zhì)量評(píng)價(jià)結(jié)果的偏差.因此需對(duì)此因素進(jìn)行控制.
本研究因測(cè)試圖片為醫(yī)用PET/CT圖片,故所挑選測(cè)試人員均為影像學(xué)范疇的專業(yè)醫(yī)生,其中,主治醫(yī)師10人,醫(yī)師5人.
1.5 數(shù)據(jù)處理
主觀評(píng)價(jià)測(cè)試完成后,每張圖片將獲得來(lái)自不同測(cè)試者的多個(gè)分?jǐn)?shù),其分布與測(cè)試者數(shù)量、評(píng)價(jià)偏差趨勢(shì)和測(cè)試環(huán)境等因素有關(guān)[10].在構(gòu)造數(shù)據(jù)庫(kù)時(shí),需對(duì)所采集數(shù)據(jù)進(jìn)行以下處理:
(1)
其中,j為測(cè)試條件;k為測(cè)試圖片;r為重復(fù)次數(shù);N為測(cè)試者數(shù)量;U為測(cè)試圖片主觀評(píng)價(jià)分?jǐn)?shù).
(2)
計(jì)算結(jié)果顯示,大部分測(cè)試者對(duì)圖像質(zhì)量的感知程度較為一致.這說(shuō)明,本研究所構(gòu)造的數(shù)據(jù)庫(kù)具有較好的標(biāo)準(zhǔn)性與客觀性.
2.1 客觀模型研究現(xiàn)狀
傳統(tǒng)的客觀評(píng)價(jià)模型,如PSNR模型與MSE模型,是通過逐點(diǎn)計(jì)算失真圖像與原始圖像每個(gè)像素點(diǎn)差異的統(tǒng)計(jì)特性來(lái)反映圖像的失真程度.這類方法雖然形式簡(jiǎn)單、計(jì)算量小,但其獨(dú)立于圖像內(nèi)容,在許多情況下都無(wú)法與人眼視覺感知保持一致[11].因此,學(xué)術(shù)界提出更符合HVS的圖像質(zhì)量評(píng)價(jià)模型,代表性的有基于場(chǎng)景統(tǒng)計(jì)特性的信息保真度準(zhǔn)則(informationfidelitycriterion,IFC)[12]和視覺信息保真度(visualinformationfidelity,VIF)[13]模型,基于結(jié)構(gòu)相似性(structuralsimilarity,SSIM)的結(jié)構(gòu)相似性指標(biāo)(structuralsimilarityindex)模型[14],多尺度結(jié)構(gòu)相似度(multi-scalestructuralsimilarity,MS-SSIM)指標(biāo)模型[15]和FSIM(afeaturesimilarityindexforimagequalityassessment)[16]模型,基于HVS的NQM(noisequalitymeasure)[17]與視覺信噪比(visualsignaltonoiseratio,VSNR)[18]模型,以及基于梯度模方差的GMSD(gradientmagnitudesimilaritydeviation)[19]模型.
2.2 客觀算法數(shù)據(jù)預(yù)處理
理想情況下客觀模型預(yù)測(cè)值與主觀評(píng)價(jià)結(jié)果應(yīng)為線性關(guān)系[11],即
SMOSp=kSMOS
(3)
其中,SMOSp為客觀算法評(píng)價(jià)分?jǐn)?shù)(MOS of perception models,MOSp);k為線性常數(shù);SMOS為所有測(cè)試者完成評(píng)價(jià)后計(jì)得的每張圖片獲得的平均分.
主觀評(píng)價(jià)過程會(huì)引入非線性因素,因此視頻質(zhì)量專家組(video quality experts group,VQEG)建議,在衡量?jī)烧呦嚓P(guān)性之前,需對(duì)測(cè)試算法的實(shí)驗(yàn)結(jié)果進(jìn)行非線性補(bǔ)償[20].有2種非線性回歸可供參考:多項(xiàng)式擬合和Logistic回歸.本研究使用增加線性條件限制的5參數(shù)非線性Logistic模型作為評(píng)價(jià)值的非線性模型,如式(4),并采用最小均方差法進(jìn)行擬合.
quality(x)=β1Logistic(β2,(x-β3))+
β4x+β5
(4)
其中,quality(x)為擬合后的預(yù)測(cè)值;β1為MOS最大值與最小值之差;β2為預(yù)測(cè)值集合方差的倒數(shù);β3為預(yù)測(cè)值的平均值;β4的值設(shè)為-1;β5為MOS的平均值.最小均方差模型為
(5)
其中,τ為模型評(píng)價(jià)參數(shù),在這里為預(yù)測(cè)集合方差的倒數(shù);x為預(yù)測(cè)值與平均值之差.
2.3 算法定量指標(biāo)
客觀圖像質(zhì)量評(píng)價(jià)算法的性能一般通過以下方面進(jìn)行衡量:① 算法準(zhǔn)確性,即客觀評(píng)價(jià)值與主觀評(píng)價(jià)值之間的差異應(yīng)足夠??;② 單調(diào)性,即客觀評(píng)價(jià)值應(yīng)隨主觀評(píng)價(jià)值的增減而增減;③ 一致性,即客觀評(píng)價(jià)算法在測(cè)試集上表現(xiàn)出的性能與其在訓(xùn)練集上的性能相似.
本研究基于文獻(xiàn)[3],按照以下3方面的客觀指標(biāo)來(lái)評(píng)價(jià)算法性能.
1)皮爾遜線性相關(guān)系數(shù)(Pearsonlinearcorrelationcoefficient,PLCC)為
(6)
2)均方誤差根(rootmeansquarederror,RMSE)為
(7)
3)斯皮爾曼秩相關(guān)系數(shù)(Spearman’srankordercorrelationcoefficient,SROCC)為
(8)
2.4 實(shí)驗(yàn)結(jié)果
建立圖像質(zhì)量感知主觀評(píng)價(jià)數(shù)據(jù)庫(kù)的意義在于衡量圖像客觀評(píng)價(jià)算法的性能.本研究選擇13種國(guó)際通用IQA算法進(jìn)行評(píng)價(jià)分析,包括PSNR、SSIM、MS-SSIM、VSNR、VIF、VIFP[13]、UQI[12]、IFC、NQM、WSNR、SNR、GMSD和FSIM.實(shí)驗(yàn)以構(gòu)造的PET/CT醫(yī)學(xué)圖像質(zhì)量主觀評(píng)價(jià)數(shù)據(jù)庫(kù)為基礎(chǔ),運(yùn)用式(6)和式(8),計(jì)算各客觀算法在該數(shù)據(jù)庫(kù)上的性能指標(biāo)PLCC及SROCC,結(jié)果分別如表2和表3.
表2 客觀算法在各退化類型上的線性相關(guān)系數(shù)對(duì)比
表3 客觀算法在各退化類型上的SROCC對(duì)比
2.4.1 CC和SROCC
表2和表3中的JPG與JP2分別代表JPEG壓縮與JPEG2000壓縮,“all”分別為各客觀算法在PET/CT數(shù)據(jù)庫(kù)上的PLCC及SROCC指標(biāo),其中性能排名前3位的客觀算法已用粗體加下劃線標(biāo)出.“all2”為去掉對(duì)比度變化圖片的客觀算法在PET/CT數(shù)據(jù)庫(kù)上的PLCC及SROCC指標(biāo).“mean”值表示各個(gè)客觀算法在不同退化方法上相關(guān)系數(shù)與秩相關(guān)系數(shù)的平均值.
從PLCC及SROCC這2個(gè)指標(biāo)來(lái)看,GMSD與FSIM是性能最優(yōu)的算法,兩者的cPLCC值分別為0.883與0.890,cSROCC值分別為0.862與0.869.VIF是性能較優(yōu)的算法,cPLCC值與cSROCC值分別為0.800與0.780.其余客觀算法性能指標(biāo)均較低,其中基于結(jié)構(gòu)相似度的SSIM與UQI算法性能最差,SSIM算法的cPLCC值與cSROCC值分別僅為0.665與0.563,與主觀評(píng)價(jià)分?jǐn)?shù)相關(guān)性較差.
2.4.2 對(duì)比度變化圖片對(duì)客觀算法性能影響
分析評(píng)分普遍較低的原因時(shí),考慮圖片提供的信息紋理和形狀屬于初級(jí)視覺信息,情感和認(rèn)知屬于高級(jí)視覺信息.研究認(rèn)為,對(duì)比度變化會(huì)產(chǎn)生部分圖片信息缺失,造成高級(jí)視覺信息偏差,然而已有的客觀方法在建立模型時(shí)并未考慮這一因素,導(dǎo)致主客觀分?jǐn)?shù)相關(guān)性較差[10].因此,在實(shí)驗(yàn)中排除對(duì)比度變化圖片的主觀數(shù)據(jù),重新計(jì)算客觀算法在數(shù)據(jù)庫(kù)上的性能.實(shí)驗(yàn)結(jié)果如表2及表3中“all2”值所示.
由表2和表3得出,大部分客觀算法的性能在去掉對(duì)比度變化后均提升明顯.其中,VIF模型的性能最佳,其cPLCC值由0.801提高為0.931,cSROCC值由0.780提高為0.903.而SSIM與UQI算法性能最差,SSIM算法的cPLCC值與cSROCC值分別僅為0.716與0.608.各客觀算法PLCC與SROCC性能排名與之前全部圖片測(cè)試結(jié)果基本一致.
2.4.3 退化方法對(duì)圖像質(zhì)量評(píng)價(jià)的影響
通過比較各算法的PLCC值、SROCC值以及平均值可以發(fā)現(xiàn):
1)同一種退化方法上,各個(gè)客觀算法的性能都有明顯差異,但在高斯白噪聲與高斯模糊圖片上,各個(gè)客觀算法的性能指標(biāo)都較高.在對(duì)比度變化圖片上,各客觀算法的性能指標(biāo)均較低.除VIF、PSNR和NQM外,其他客觀算法在JPG與JP2上的性能均較差.
2)同一客觀算法在不同退化類型圖片上的性能也有明顯差異.例如,SNR算法在JPG與JP2上的cSROCC值較低,而在其他退化圖片上cSROCC值均大于0.880,性能優(yōu)秀.
3)FSIM與VIF在所有退化類型圖片上的性能都較好,SROCC的平均值超過0.900,但FSIM是唯一一個(gè)在對(duì)比度變化退化方法下SROCC值達(dá)到0.900的算法.值得注意的是,傳統(tǒng)醫(yī)學(xué)圖像質(zhì)量評(píng)價(jià)算法PSNR在各退化類型圖片上的SROCC平均值高達(dá)0.915,但在全部圖片數(shù)據(jù)下的SROCC值僅為0.722.
圖2 全部圖片下的客觀分?jǐn)?shù)及MOSFig.2 (Color online) Objective score and MOS on all pictures
2.4.4 VIF與PSNR性能對(duì)比
通過對(duì)比性能較優(yōu)的VIF算法,分析PSNR在單一退化方法上性能較好,而在總體測(cè)試性能較差的原因.圖2分別顯示了VIF與PSNR模型在構(gòu)造的PET/CT醫(yī)學(xué)圖像質(zhì)量主觀評(píng)價(jià)數(shù)據(jù)庫(kù)上的SROCC擬合曲線.圖3(a)中不同形狀的點(diǎn)為不同退化方法的測(cè)試圖片VIF評(píng)價(jià)分?jǐn)?shù),與之對(duì)應(yīng)的曲線表示該退化方法下,計(jì)算SROCC時(shí)的擬合曲線.圖3(b)中不同形狀的點(diǎn)為不同退化方法的測(cè)試圖片PSNR評(píng)價(jià)分?jǐn)?shù),與之對(duì)應(yīng)的曲線表示該退化方法下,計(jì)算SROCC值時(shí)的擬合曲線.
圖3 不同退化方法下的客觀分?jǐn)?shù)及MOSFig.3 (Color online) Objective scores and MOS on all distortion algorithms
在圖2(a)中,各數(shù)據(jù)點(diǎn)較緊密的分布在擬合曲線的兩邊,VIF分?jǐn)?shù)與MOS擬合度較好,相關(guān)性較高,因此總體的PLCC值及SROCC值均較高.在圖3(a)中,不同退化方法下,各退化類型圖片的數(shù)據(jù)點(diǎn)緊密的分布在擬合曲線的兩邊,VIF分?jǐn)?shù)與MOS擬合度很好,相關(guān)性高,因此在計(jì)算各性能指標(biāo)時(shí),PLCC值及SROCC值均較高.同時(shí)發(fā)現(xiàn)進(jìn)行對(duì)比度變化的數(shù)據(jù)點(diǎn)相比其他退化類型分布較分散,因此在去掉對(duì)比度變化后,VIF的性能有了明顯提高.
在圖2(b)中,數(shù)據(jù)點(diǎn)較分散的分布在擬合曲線的兩邊,PSNR分?jǐn)?shù)與MOS擬合度較差,相關(guān)性較低,因此總體的PLCC值及SROCC值均不高.在圖3(b)中,在不同退化方法下,各退化類型圖片分?jǐn)?shù)的數(shù)據(jù)點(diǎn)較緊密的分布在擬合曲線的兩邊,PSNR分?jǐn)?shù)與MOS擬合度較好,相關(guān)性較高,因此在計(jì)算各性能指標(biāo)時(shí),PLCC值及SROCC值均較高,SROCC值均高于0.870.但所有數(shù)據(jù)點(diǎn)的整體分布較分散,整體SROCC值僅為0.722.因此,PSNR算法在不同退化方法上性能優(yōu)異,而在所有測(cè)試數(shù)據(jù)上性能較差.
本研究通過對(duì)PET/CT醫(yī)學(xué)圖像進(jìn)行質(zhì)量評(píng)價(jià),首次構(gòu)建了PET/CT醫(yī)學(xué)圖像質(zhì)量主觀評(píng)價(jià)數(shù)據(jù)庫(kù).并以此為基礎(chǔ),對(duì)國(guó)際通用客觀模型的性能進(jìn)行對(duì)比研究,得到以下結(jié)論:
1)醫(yī)學(xué)圖像質(zhì)量主觀評(píng)價(jià)需要進(jìn)行大量心理學(xué)測(cè)試,測(cè)試圖片的數(shù)據(jù)量對(duì)最終得到的圖片MOS分?jǐn)?shù)影響較大,在DSIS測(cè)試中,發(fā)現(xiàn)ITU協(xié)議中規(guī)定的每張測(cè)試圖片15個(gè)主觀評(píng)價(jià)分?jǐn)?shù)的測(cè)試數(shù)據(jù)量可以保證測(cè)試的可靠性;
2)對(duì)比度變化圖片對(duì)主觀評(píng)價(jià)測(cè)試結(jié)果有較大的影響,原因可能是對(duì)比度變化包含認(rèn)知等方面的后期視覺信息,而醫(yī)生對(duì)PET/CT圖像的對(duì)比度變化十分敏感,不同醫(yī)生對(duì)此類圖片的評(píng)分差異明顯,目前的客觀算法對(duì)這類圖片質(zhì)量的評(píng)價(jià)較差;
3)退化方法對(duì)圖像質(zhì)量評(píng)價(jià)結(jié)果影響巨大,不同退化方法上,圖片的客觀評(píng)價(jià)分?jǐn)?shù)與主觀評(píng)價(jià)分?jǐn)?shù)的一致性有非常明顯的差別,一些客觀方法在單一的退化方法上性能較好,而在多種退化方法上的性能較差.實(shí)驗(yàn)結(jié)果顯示,F(xiàn)SIM效果最佳,且比傳統(tǒng)的醫(yī)學(xué)圖像客觀質(zhì)量評(píng)價(jià)算法PSNR有明顯優(yōu)勢(shì).
/ References:
[1] Wang Rongfu.PET/CT:new technology application of molecular imaging[M].Beijing:Beijing Medical University Press,2011:1-5.(in Chinese) 王榮福.PET/CT:分子影像學(xué)新技術(shù)應(yīng)用[M].北京:北京大學(xué)醫(yī)學(xué)出版社,2011:1-5.
[2] Chen Shengzu.PET/CT technology principle and oncology application[M].Beijing:People’s Military Medical Press,2007:3-10.(in Chinese) 陳盛祖.PET/CT技術(shù)原理及腫瘤學(xué)應(yīng)用[M].北京:人民軍醫(yī)出版社,2007:3-10.
[3] Lin Chunyi,Yin Junxun,Gao Xue,et al.A multi-level medical image semantic modeling approach based on statistical learning[J].Journal of Shenzhen University Science and Engineering,2007,24(2):138-143.(in Chinese) 林春漪,尹俊勛,高 學(xué),等. 基于統(tǒng)計(jì)學(xué)習(xí)的多層醫(yī)學(xué)圖像語(yǔ)義建模方法[J].深圳大學(xué)學(xué)報(bào)理工版,2007,24(2):138-143.
[4] Zhou Jinchao,Dai Ruwei,Xiao Baihua.Overview of image quality assessment[J].Computer Science,2008,35(7):1-8.(in Chinese) 周景超,戴汝為,肖柏華.圖像質(zhì)量評(píng)價(jià)研究綜述[J].計(jì)算機(jī)科學(xué),2008,35(7):1-8.
[5] Zhang Min,Zhang Lei.Non-shift edge based ratio (NSER):an image quality assessment metric based on early vision features[J].IEEE Signal Processing Letters,2011,18(5):315.
[6] Hu Yuanyuan,Niu Xiamu.Image quality assessment based on human visibility threshold theory and structural similarity[J].Journal of Shenzhen University Science and Engineering,2010,27(2):185-191.(in Chinese) 胡媛媛,牛夏牧.基于視覺閾值的結(jié)構(gòu)相似度圖像質(zhì)量評(píng)價(jià)算法[J].深圳大學(xué)學(xué)報(bào)理工,2010,27(2):185-191.
[7] Zhang Xuemin,Shu Hua.Outline of experimental psychology[M].Beijing:Beijing Normal University Publishing Group,2004.(in Chinese) 張學(xué)敏,舒 華.實(shí)驗(yàn)心理學(xué)綱要[M].北京:北京師范大學(xué)出版社,2004.
[8] ITU.ITU-R_BT. 500-11Methodology for the subjective assessment of the quality of television pictures[S].
[9] Vu E C L,Chandler D M.Visual fixation patterns when judging image quality:effects of distortion type,amount,and subject experience[C]// IEEE Symposium on Image Analysis and Interpretation.Santa Fe(Argentina):IEEE Press,2008:73-76.
[10] Larson E C,Chandler D M.Most apparent distortion:full-reference image quality assessment and therole of strategy[J].Journal of Electronic Imaging,2010,19(1):011006-1-011006-21.
[11] Mou Xuanqin,Xue Wufeng,Zhang Min.Methods of partial reference image quality assessment based on early vision.CN101482973[P],China,2009.(in Chinese) 牟軒沁,薛武峰,張 敏.基于早期視覺的部分參考圖像質(zhì)量評(píng)價(jià)方法[P]. CN101482973.中國(guó),2009.
[12] Sheikh H R,Bovik A C,Veciana G de.An information fidelity criterion for image quality assessment using natural scene statistics[J].IEEE Transactions on Image Processing,2005,14(12):2117-2122.
[13] Sheikh H R,Bovik A C.Image information and visual quality[J].IEEE Transactions on Image Processing,2006,15(2):430-444.
[14] Wang Z,Bovik A C,Sheikh H R.Image quality assessment:from error measurement to structural similarity[J].IEEE Transactions on Image Processing,2004,13(4):600-612.
[15] Wang Zhou,Simoncelli E P,Bovik A C.Multi-scale structural similarity for image quality assessment[C]// Proceedings of the 37th IEEE AsilomarConference on Signals,Systems,and Computers.Pacific Grove(USA):IEEE Press,2003:1398-1402.
[16] Zhang Lin,Zhang Lei,Mou Xuanqin,et al.FSIM:a feature similarity index for image quality assessment[J].IEEE Transactions on Image Processing,2011,20(8):2378-2386.
[17] Damera-Venkata N,Kite T D,Geisler W S,et al.Image quality assessment based on a degradation model[J].IEEE Transactions on Image Processing,2000,9(4):636-650.
[18] Chandler D M,Hemami S S.VSNR:a wavelet-based visual signal-to-noise ratio for natural images[J].IEEE Transactions on Image Processing,2007,16(9):2284-2298.
[19] Xue Wufeng,Mou Xuanqin,Zhang Lei,et al.Blind image quality assessment using joint statistics of gradient magnitude and Laplacian features[J].IEEE Transactions on Image Processing,2014,23(11):4850-4862.
[20] Video Quality Experts Group.Final report from the video quality experts group on the validation of objective models of video quality assessment,Phase II[R/OL].(2003-08-25).http://www.vqeg.org/.
【中文責(zé)編:英 子;英文責(zé)編:木 南】
Subjective assessment and perception model of PET/CT image quality
Yin Fu1, Ji Zhen1?, Zhou Jiarui1, and Zhang Haijie2
1) College of Computer Science and Software Engineering, Shenzhen University, Shenzhen 518052, P.R.China 2) Nuclear Medicine Department, Wuhan General Hospital of Guangzhou Military Command, Wuhan 430070, P.R.China
Image quality assessment (IQA) is highly dependent on subjective assessment. However, no subjective image quality assessment database is presently available for medical image, which poses a big challenge for the evaluation of medical IQA algorithms. In this paper, we propose the first positron emission tomography/computed tomography medical image subjective assessment database based on the double-stimulus impairment scale method. Performances of thirteen commonly used IQA algorithms are compared on the database. Moreover, effects of different image distortions on IQA algorithms are analyzed. Experimental results show that the feature similarity model outperforms other IQA methods, including peak signal to noise ratio, the most commonly used algorithm in the medical field.
computer image processing; image quality assessment; double-stimulus impairment scale method; positron emission tomography/computed tomography; feature similarity; subjective image quality assessment database
:Yin Fu,Ji Zhen,Zhou Jiarui,et al.Subjective assessment and perception model of PET/CT image quality[J]. Journal of Shenzhen University Science and Engineering, 2015, 32(2): 205-212.(in Chinese)
TP 391.41; TP 391.77
A
10.3724/SP.J.1249.2015.02205
國(guó)家自然科學(xué)基金資助項(xiàng)目(u1201256)
殷 夫(1989—),男(漢族),湖北省漢川市人,深圳大學(xué)碩士研究生.E-mail:slintch@sina.com
Received:2014-10-13;Accepted:2015-02-04
Foundation:National Natural Science Foundation of China(u1201256)
? Corresponding author:Professor Ji Zhen.E-mail:jizhen@szu.edu.cn
引 文:殷 夫,紀(jì) 震,周家銳,等.PET/CT圖像質(zhì)量主觀評(píng)價(jià)與感知模型[J]. 深圳大學(xué)學(xué)報(bào)理工版,2015,32(2):205-212.