李莉
摘 要 隨著多媒體信息技術(shù)的快速發(fā)展,多媒體信息的數(shù)據(jù)庫信息含量越來越大,基于內(nèi)容的多媒體檢索技術(shù)的出現(xiàn),解決了怎樣快速從多媒體數(shù)據(jù)庫中檢索出自己所需的信息的難題?;趦?nèi)容的多媒體檢索技術(shù)主要包括圖像檢索技術(shù)、視頻檢索技術(shù)、音頻檢索技術(shù)。
關(guān)鍵詞 多媒體 檢索 計算機
中圖分類號:TP37 文獻(xiàn)標(biāo)識碼:A
0 引言
隨著計算機應(yīng)用的普及以及信息技術(shù)的快速發(fā)展,多媒體數(shù)據(jù)廣泛應(yīng)用于各種企業(yè)的信息系統(tǒng)中,但是現(xiàn)有的采用結(jié)構(gòu)化查詢語言檢索信息數(shù)據(jù)庫的技術(shù),不能有效滿足對含有大量信息的多媒體信息的檢索。因此,基于內(nèi)容的多媒體檢索技術(shù)得以出現(xiàn)并且快速發(fā)展,該技術(shù)不但可以通過包含直接含義的文字進(jìn)行信息檢索,還可以通過對圖像、聲音、視頻信息進(jìn)行檢索存儲在數(shù)據(jù)庫中的信息。目前,基于內(nèi)容的多媒體檢索技術(shù)發(fā)展十分迅速,國內(nèi)外很多的研究機構(gòu)對這種新技術(shù)展開了研究,并取得了豐碩的成果。由于基于內(nèi)容的多媒體檢索技術(shù)設(shè)計的具體技術(shù)比較多,本文只簡單的介紹基于內(nèi)容的多媒體檢索的技術(shù)的原理及其特點,并且闡述了基于多媒體圖像、視頻和聲頻的檢索方法,最后對基于內(nèi)容的多媒體檢索技術(shù)的發(fā)展趨勢進(jìn)行了分析。
1 基于內(nèi)容的多媒體檢索技術(shù)的原理與特點
基于內(nèi)容的檢索的近年來多媒體檢索技術(shù)研究的熱點問題,它不同于傳統(tǒng)的單單依靠文本進(jìn)行檢索,該技術(shù)通過對多媒體的圖像、聲音、視頻內(nèi)容的分析,根據(jù)多媒體的內(nèi)容和語義環(huán)境,如圖像中的顏色、形狀,聲音中的音調(diào)、音色等,視頻中的鏡頭的運動、場景,然后建立相應(yīng)的檢索庫,并進(jìn)行相應(yīng)的檢索。基于內(nèi)容的多媒體檢索技術(shù)只是信息檢索技術(shù)的一個分支,它主要通過圖像處理、計算機視覺等方法相互融合建立的,是多種技術(shù)合成的結(jié)果。
基于內(nèi)容的多媒體檢索技術(shù)與傳統(tǒng)的基于關(guān)鍵詞的數(shù)據(jù)庫檢索技術(shù)相比,它有自己的特點:該技術(shù)可以通過對圖像、視頻、音頻進(jìn)行分析提取信息線索,從而進(jìn)行檢索;基于內(nèi)容的檢索結(jié)果一般與檢索條件具有一定的相似度,但是并不一定完全滿足,它采取近似匹配的方法和技術(shù)進(jìn)行檢索;基于內(nèi)容的多媒體檢索的系統(tǒng)信息量非常大,它包括媒體庫、特征庫和知識庫,各個數(shù)據(jù)庫都包含有不同的信息,這樣就可以滿足不同的用戶的多層次的檢索要求。
2 基于內(nèi)容的多媒體檢索方法
基于內(nèi)容的多媒體檢索方法具體又分為基于內(nèi)容的圖像檢索、基于內(nèi)容的視頻檢索、基于內(nèi)容的音頻檢索等技術(shù)。
隨著計算機圖像數(shù)碼技術(shù)的發(fā)展,檢索數(shù)據(jù)庫中的圖像信息量越來越大,怎樣才能快速從圖像數(shù)據(jù)庫中找出與檢索圖像相符的信息,這是決定檢索成敗的關(guān)鍵。通過對圖像的顏色、紋理、形狀等分析獲得圖像的客觀視覺內(nèi)容特征,判斷檢索圖像的相似性,這是基于內(nèi)容的圖像檢索技術(shù)的主流發(fā)展方向。該方法研究的主要內(nèi)容主要是在數(shù)字圖像處理的基礎(chǔ)上對圖像的視覺特征進(jìn)行提取,以及對多維索引和檢索系統(tǒng)進(jìn)行設(shè)計。根據(jù)圖像特征的作用區(qū)域可以把圖像檢索系統(tǒng)分為基于全局特征檢索和基于區(qū)域特征及其空間關(guān)系檢索兩種檢索。其中基于全局特征檢索主要依靠對全幅圖像的視覺特征進(jìn)行檢索,而基于區(qū)域特征及其空間關(guān)系的檢索主要是按照分割開的圖像的特征相似性進(jìn)行檢索,但是它要顧及區(qū)域之間的相似性。
基于內(nèi)容的視頻檢索技術(shù)與圖像檢索技術(shù)有很多相似之處,因為視頻本身就是一組動態(tài)圖像組成的,視頻是一組圖像按照時間連續(xù)的表現(xiàn)的。利用可視化特征視頻數(shù)據(jù)建立有效的索引是視頻檢索的前提,鏡頭、代表幀、運動特征等都是視頻特征,依靠這些建立視頻的索引,就可以利用關(guān)鍵幀的特征和鏡頭的時間特征進(jìn)行檢索。目前,常用的視頻檢索方法有三種,分別為基于關(guān)鍵幀的檢索、基于運動的檢索、瀏覽檢索。基于運動的檢索,主要是基于鏡頭和視頻對象的時間特征進(jìn)行檢索,該方法可以查詢攝像機的操作和場景移動等信息,還可以根據(jù)物體的運動方向和運動幅度等特征檢索運動中的物體?;陉P(guān)鍵幀的檢索,主要是對視頻鏡頭的關(guān)鍵幀進(jìn)行檢索,該方法快速方便,并且關(guān)鍵幀既可以當(dāng)做靜態(tài)圖像處理,也可以當(dāng)做視頻瀏覽。
多媒體的音頻數(shù)據(jù)具有物理和感知兩種特征。物理特征一般都是來自于音頻信號本身,主要包括頻率等;而感知特征主要是依賴于人的聽覺,主要包括音調(diào)、音高等。根據(jù)音頻數(shù)據(jù)的物理和感知特征進(jìn)行檢索,就能夠得到需求的音頻信息。
3 基于內(nèi)容的多媒體檢索技術(shù)的發(fā)展趨勢
基于內(nèi)容的多媒體檢索技術(shù)日益成熟,逐漸應(yīng)用于各種檢索數(shù)據(jù)庫中,它能夠方便人們快速的從海量的多媒體信息數(shù)據(jù)庫中檢索出自己所需要的信息。隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,人們可以通過網(wǎng)絡(luò)獲取世界各地的數(shù)據(jù)庫中的多媒體信息,基于內(nèi)容的多媒體檢索技術(shù)的應(yīng)用范圍會更加的廣泛?;趦?nèi)容的多媒體檢索技術(shù)是一種新的檢索手段,其研究周期還比較短,同時互聯(lián)網(wǎng)的發(fā)展使得數(shù)據(jù)檢索的對象和范圍更加復(fù)雜多樣,為了使該檢索技術(shù)應(yīng)用領(lǐng)域更廣泛,該技術(shù)還需要解決與其他多種檢索技術(shù)相互結(jié)合的問題,提高檢索的效率。
參考文獻(xiàn)
[1] 陳芳,柳燕.基于內(nèi)容的多媒體檢索技術(shù)淺析[J].計算機與數(shù)字工程,2007,35(7).
[2] 鐘少君,陳新.基于內(nèi)容的多媒體信息檢索[J].山西電子技術(shù),2005(3).
[3] 王曙燕,周明全,耿國華.基于內(nèi)容的多媒體信息檢索技術(shù)研究[J].現(xiàn)代電子技術(shù),2005,193(2).
[4] 陳春穎,周雄偉,余以勝.基于內(nèi)容的多媒體檢索策略探析[J].情報雜志,2004(5).