當前,研究多媒體數(shù)據(jù)庫內(nèi)容檢索、數(shù)據(jù)特點、數(shù)據(jù)庫系統(tǒng)構(gòu)建等都是熱點問題,研究多媒體數(shù)據(jù)的管理和有效檢索具有重要的理論與應(yīng)用價值。高性能計算機支持下的多媒體數(shù)據(jù)庫性能的迅速提升,使得內(nèi)容多媒體檢索技術(shù)走向成熟,利用這門新型的數(shù)據(jù)庫技術(shù)可以有效進行內(nèi)容檢索和查詢。因此,研究媒體數(shù)據(jù)庫系統(tǒng)中的關(guān)鍵問題,如多媒體數(shù)據(jù)庫系統(tǒng)的建模問題、多媒體數(shù)據(jù)庫存儲問題、多媒體數(shù)據(jù)庫組織的策略與技術(shù)問題、內(nèi)容檢索的多媒體數(shù)據(jù)庫體系結(jié)構(gòu)問題、內(nèi)容的多媒體數(shù)據(jù)的查詢和檢索問題、內(nèi)容檢索的圖像和視頻信息處理問題等方面的研究,都是目前從事多媒體數(shù)據(jù)庫與內(nèi)容檢索研究者的重點研究課題。
為此,由馬修軍撰寫的《多媒體數(shù)據(jù)庫與內(nèi)容檢索》(2007年7月由北京大學出版社出版)一書,對內(nèi)容檢索的多媒體數(shù)據(jù)庫系統(tǒng)研究,具有一定的啟發(fā)、參考意義和作用。該教材綜合性地論述了多媒體信息檢索最新技術(shù)以及多媒體信息管理技術(shù)和發(fā)展趨勢。本書在系統(tǒng)闡述各種媒體的內(nèi)容檢索技術(shù)基礎(chǔ)之上,通過一個統(tǒng)一的理論框架,探究各種媒體檢索技術(shù)的深度和廣度。在目前最新內(nèi)容檢索技術(shù)背景之下,重點闡述了多媒體數(shù)據(jù)庫的關(guān)鍵技術(shù),以便于讀者理解和掌握。多媒體數(shù)據(jù)庫建設(shè)與理論研究也是當前設(shè)計所需要的,多媒體數(shù)據(jù)庫建設(shè)、內(nèi)容檢索系統(tǒng)和商業(yè)多媒體數(shù)據(jù)庫系統(tǒng),都是當前我國重要科研課題,為圖書查詢工作帶來了極大的便利。
書中,第一,闡述了特征抽取、內(nèi)容表示、索引、數(shù)據(jù)檢索、信息檢索、用戶任務(wù)、多媒體相關(guān)技術(shù)等有關(guān)概念,在此基礎(chǔ)上,闡述了多媒體信息管理的技術(shù)需求、多媒體信息分類、多媒體信息管理功能需求,進一步闡述了多媒體技術(shù)、數(shù)據(jù)庫管理系統(tǒng)、信息檢索技術(shù)、模式識別技術(shù)等相關(guān)技術(shù)問題,以及發(fā)展趨勢和未來的研究問題。第二,論述了多媒體數(shù)據(jù)類型與編碼,關(guān)于簡單文本、結(jié)構(gòu)化文本、文本壓縮、數(shù)字圖像、圖形表示、圖像壓縮原理、靜態(tài)圖像壓縮標準JPEG、聲音和音頻、聲音的物理特性、聲音的數(shù)字表示、電子樂器數(shù)字接口、音頻壓縮、視頻和動畫、模擬視頻、數(shù)字視頻、視頻壓縮、其他視頻標準、多媒體表示標準、同步多媒體集成語言、MHEG標準、多媒體元數(shù)據(jù)標準、XML技術(shù)、語義Web與互操作、多媒體元數(shù)據(jù)標準化框架等。這些基本理論的闡釋有助于學生對多媒體數(shù)據(jù)庫知識體系的理解和掌握。第三,闡述了文本處理與信息檢索。具體在信息檢索模型研究方面,闡述了信息檢索模型分類、經(jīng)典檢索模型和擴展經(jīng)典檢索模型;在文本處理方面,闡述了文本預處理、文本特性和文本聚類;在文本索引方面,闡述了倒排文件表、后綴數(shù)組、簽名文件、相關(guān)反饋和查詢擴展等。第四,分別論述了Web信息檢索、基于內(nèi)容的音頻和音像的檢索、視頻索引、檢索與結(jié)構(gòu)化、多媒體數(shù)據(jù)庫、多媒體數(shù)據(jù)庫中高維特征的索引和檢索技術(shù)、多媒體通信與分布式多媒體數(shù)據(jù)庫系統(tǒng)、數(shù)字圖書館和多媒體信息安全等。
多媒體數(shù)據(jù)包含有文字、圖像、視頻和音頻等十分豐富的信息內(nèi)容。利用多媒體數(shù)據(jù)庫可以按照內(nèi)容檢索提取出特定的信息,使得人們可以很便捷地、有效地利用存儲的多媒體信息。內(nèi)容檢索是一個逐步求精的過程,先要對初始化檢索進行說明,通過相似性進行匹配,選擇一個滿意的示例進行特征調(diào)整以形成新的查詢,最后逐步縮小檢索范圍,直到用戶滿意為止。多媒體數(shù)據(jù)庫數(shù)據(jù)模型的實現(xiàn)有賴于關(guān)系數(shù)據(jù)庫的多媒體擴展、面向?qū)ο蟮亩嗝襟w數(shù)據(jù)庫和超媒體數(shù)據(jù)庫三種方式?;趦?nèi)容的圖像表示方面,圖像媒體相似性檢索主要通過顏色相似性、紋理相似性和形狀相似性特征進行?;趦?nèi)容檢索多媒體數(shù)據(jù)庫構(gòu)建,包括內(nèi)容檢索多媒體數(shù)據(jù)庫的總體結(jié)構(gòu)、一般媒體處理系統(tǒng)、面向?qū)ο蠖嗝襟w數(shù)據(jù)庫存儲管理系統(tǒng)、媒體特征提取系統(tǒng)、檢索引擎、用戶查詢接口等方面的理論建構(gòu)。多媒體數(shù)據(jù)庫層次結(jié)構(gòu)具有:媒體支持層、存取與存儲數(shù)據(jù)模型層、概念數(shù)據(jù)模型層、多媒體用戶接口層等四個層次;基于內(nèi)容檢索應(yīng)用系統(tǒng)的體系結(jié)構(gòu)建構(gòu),包括插入子系統(tǒng)、特征提取子系統(tǒng)、數(shù)據(jù)庫、查詢子系統(tǒng)等。圖像對象的創(chuàng)建內(nèi)容,包括圖像區(qū)域的分割和特征提取,如顏色特征、形狀特征與紋理特征的提取。在內(nèi)容檢索視頻處理技術(shù)方面做到鏡頭的切換和鏡頭內(nèi)的運動;視頻處理技術(shù)包括鏡頭邊界的檢測、代表幀的選取、特征提取和視頻聚類等??傊嗝襟w數(shù)據(jù)庫系統(tǒng)構(gòu)建與內(nèi)容檢索理論知識研究,有助于大學生多媒體數(shù)據(jù)庫信息的查詢。
(曾子力/碩士,??诮?jīng)濟學院網(wǎng)絡(luò)學院講師)