黨長(zhǎng)青
(唐山學(xué)院電子信息系,河北唐山063020)
圖像作為一種重要的信息載體,是組成多媒體信息的重要內(nèi)容。隨著計(jì)算機(jī)技術(shù)、現(xiàn)代通信技術(shù)以及信息多媒體技術(shù)的快速發(fā)展,人們?cè)诠ぷ骱蜕钪性絹?lái)越多地接觸到各種各樣的圖像信息。面對(duì)日益龐大的信息海洋,如何有效地組織管理和檢索大規(guī)模的圖像數(shù)據(jù),并且從大量的數(shù)字圖像中快速準(zhǔn)確地檢索出用戶需要的圖像,成為一個(gè)迫切需要解決的問題。
20世紀(jì)70年代,數(shù)據(jù)庫(kù)專家就開始研究如何對(duì)圖像資源進(jìn)行有效的管理和查詢,最早使用的方法是基于文本的圖像檢索(TBIR),即首先用文本對(duì)圖像進(jìn)行標(biāo)注,并用基于文本的數(shù)據(jù)庫(kù)管理系統(tǒng)DBMS來(lái)建立起標(biāo)注和圖像之間的關(guān)聯(lián),從而實(shí)現(xiàn)圖像檢索功能。但是基于文本的圖像檢索技術(shù)在圖像信息飛速增長(zhǎng)的今天存在很大的缺陷:首先,手工對(duì)圖像進(jìn)行注解所需的工作量太大;其次,由于個(gè)人感知的差異,不同的人對(duì)相同的圖像可能有不同的理解,圖像注解的主觀性和不準(zhǔn)確性可能導(dǎo)致檢索過(guò)程產(chǎn)生誤差。所以利用圖像本身的內(nèi)容來(lái)進(jìn)行圖像檢索勢(shì)在必行,從而產(chǎn)生了基于內(nèi)容的圖像檢索技術(shù)(CBIR)。
基于內(nèi)容的圖像檢索不同于以往的基于文本的圖像檢索方法,它是指直接根據(jù)描述圖像對(duì)象內(nèi)容的各種特征進(jìn)行檢索,根據(jù)用戶提出的反映圖像內(nèi)容特征的查詢要求,能夠從圖像數(shù)據(jù)庫(kù)中檢索出具有指定特征或含有特征內(nèi)容的圖像(包括視頻片斷),并且融合了計(jì)算機(jī)圖像處理、模式識(shí)別、數(shù)據(jù)庫(kù)等關(guān)鍵技術(shù)。由于基于內(nèi)容的圖像檢索技術(shù)固有的優(yōu)越性,使得其正逐漸成為目前研究的熱點(diǎn),并廣泛地應(yīng)用于眾多領(lǐng)域。
圖像特征包括3個(gè)方面:①顏色特征。②形狀特征。③紋理特征。
顏色是物體表面的一種最直觀、最明顯的視覺特征,每種物體都有其特有的顏色特征,同一類事物往往有著相似或相同的顏色特征,因此可以利用顏色特征來(lái)區(qū)分不同物體。而且顏色特征計(jì)算起來(lái)比較方便,因此利用顏色特征進(jìn)行圖像檢索已經(jīng)成為基于內(nèi)容檢索技術(shù)中最重要的方法之一。目前顏色特征的描述方法主要有顏色直方圖法、顏色相關(guān)圖法、顏色矩法、顏色聚合矢量法等。
形狀是圖像表達(dá)和圖像檢索中的一個(gè)非常重要的特征內(nèi)容。在二維圖像空間中,形狀是一個(gè)非常直觀的特征,因此具備良好的可區(qū)分性,但是不同于顏色和紋理等特征,形狀特征的提取必須以建立在對(duì)圖像中物體或區(qū)域的邊緣提取和分割基礎(chǔ)上。形狀一般指被一條封閉的輪廓曲線所包圍的區(qū)域,對(duì)形狀特征的描述,既可以描述其邊界特征,也可以描述其所包圍的區(qū)域。所以,目前常用的形狀特征描述方法主要分為以下兩種:基于邊界的形狀描述和基于區(qū)域的形狀描述。
紋理特征是一種不依賴于顏色或亮度的反映圖像中同質(zhì)現(xiàn)象的視覺特征。紋理是圖像的重要低層物理表征,廣泛存在于各種自然物體表面。例如云彩、水波、織物等都有各自的紋理特征。紋理特征包含了物體表面結(jié)構(gòu)組織排列的重要信息以及它們與周圍環(huán)境的聯(lián)系,反映了圖像或物體本身的屬性。正因?yàn)槿绱?,紋理特征在基于內(nèi)容的圖像檢索中得到了廣泛的應(yīng)用。目前,紋理的描述和分析方法很多,人們可以從圖像中具有結(jié)構(gòu)規(guī)律的特性加以分析得到紋理特征,或者可以對(duì)圖像中顏色強(qiáng)度的空間分布信息進(jìn)行統(tǒng)計(jì)得到紋理信息。紋理特征的描述方法主要有:統(tǒng)計(jì)分析方法、頻譜分析方法和結(jié)構(gòu)分析方法。
圖像檢索就是將檢索圖像和圖像庫(kù)(即:數(shù)據(jù)庫(kù)中的圖像,假設(shè)1 000幅,進(jìn)行相似度計(jì)算,就是將檢索圖像和圖像庫(kù)中的1 000幅圖像依次比較,然后按某種相似度計(jì)算方法進(jìn)行相似度計(jì)算(比如歐式距離),然后對(duì)他們進(jìn)行排序(如對(duì)1 000個(gè)計(jì)算結(jié)果使用冒泡排序進(jìn)行排序,大的在前,小的在后,我們返回前面的20幅作為我們的檢索結(jié)果)。
對(duì)于圖像檢索而言,相關(guān)反饋就是為了進(jìn)一步提高檢索精度而采用的方法,其實(shí)不采用相關(guān)反饋也是一個(gè)完整的檢索系統(tǒng)。但是為了提高檢索性能,我們?cè)趯?duì)圖像進(jìn)行相似度計(jì)算后,對(duì)返回的結(jié)果進(jìn)行評(píng)價(jià),標(biāo)出相關(guān)圖像(就是檢索相似的圖像,比如我們檢索花,返回的結(jié)果中有花的圖像就是相關(guān)圖像,而沒有花的圖像就是無(wú)關(guān)圖像)和無(wú)關(guān)圖像。然后按照相關(guān)反饋算法進(jìn)行反饋。重新對(duì)圖像庫(kù)進(jìn)行檢索,如此反復(fù),直到得到滿意的結(jié)果。
作為傳統(tǒng)數(shù)據(jù)庫(kù)檢索技術(shù)的拓展,基于內(nèi)容的圖像檢索系統(tǒng)主要是根據(jù)圖像的內(nèi)容特征進(jìn)行檢索的,同傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)檢索系統(tǒng)相比,基于內(nèi)容的圖像檢索系統(tǒng)存在很大的不同。在傳統(tǒng)數(shù)據(jù)庫(kù)中,檢索匹配是精確匹配的,而基于內(nèi)容的圖像檢索系統(tǒng)檢索匹配過(guò)程是一個(gè)近似匹配的過(guò)程?;趦?nèi)容的圖像檢索系統(tǒng)的檢索流程,歸納為以下幾個(gè)步驟:
首先,對(duì)用戶選擇的圖像數(shù)據(jù)庫(kù)中所有圖像,按照指定的特征提取方法,提取其相應(yīng)的圖像特征,并且以多維特征向量的形式存儲(chǔ)到數(shù)據(jù)庫(kù)中,從而形成圖像的特征庫(kù)。
其次,當(dāng)用戶提交圖例作為查詢圖像時(shí),系統(tǒng)通過(guò)對(duì)查對(duì)查詢圖像進(jìn)行特征提取,把用戶提交的查詢圖像轉(zhuǎn)換成其內(nèi)部的表示形式即特征向量。圖像特征提取是把圖像的內(nèi)容以特征向量表達(dá)出來(lái),因?yàn)槲覀冊(cè)谟?jì)算相似度的時(shí)候,都是計(jì)算特征向量的相似度。
計(jì)算圖像庫(kù)中所有圖像和查詢圖像之間的相似度,并且進(jìn)行相似度排序。當(dāng)遍歷完整個(gè)圖像特征庫(kù)時(shí),系統(tǒng)會(huì)根據(jù)相似度排序結(jié)果,把與查詢圖像最相似的前K幅圖像作為檢索結(jié)果返回給用戶,這樣就完成了一次圖像檢索過(guò)程。