蔣一明,李 鵬,林清源
(國(guó)家知識(shí)產(chǎn)權(quán)局專利局 專利審查協(xié)作北京中心,北京 100190)
責(zé)任編輯:任健男
數(shù)字視頻技術(shù)在通信、計(jì)算機(jī)以及廣播電視等領(lǐng)域的廣泛應(yīng)用大力推動(dòng)了視頻編碼技術(shù)的快速發(fā)展,由運(yùn)動(dòng)圖像專家組MPEG和國(guó)際電信聯(lián)盟的視頻編碼專家組VCEG分別制定的MPEG-x和H.26x兩個(gè)系列的視頻編碼標(biāo)準(zhǔn)構(gòu)成目前視頻編碼技術(shù)領(lǐng)域的主流編碼協(xié)議。隨著編碼標(biāo)準(zhǔn)在技術(shù)領(lǐng)域的產(chǎn)業(yè)化實(shí)現(xiàn),屬于標(biāo)準(zhǔn)組織成員的各大企業(yè),紛紛加大自己的專利申請(qǐng)量,以形成自身的專利戰(zhàn)略部署,使得涉及視頻編碼技術(shù)的專利申請(qǐng)量近年來(lái)增長(zhǎng)迅速。本文就涉及視頻編碼技術(shù)的專利進(jìn)行統(tǒng)計(jì)分析,介紹該領(lǐng)域?qū)@夹g(shù)的現(xiàn)狀,分析該領(lǐng)域?qū)@夹g(shù)的發(fā)展趨勢(shì)。
視頻信號(hào)數(shù)字化之后所面臨的一個(gè)問(wèn)題,是巨大的數(shù)據(jù)量給存儲(chǔ)和傳輸帶來(lái)的壓力,單純用擴(kuò)大存儲(chǔ)容量、增加通信信道的帶寬的辦法是不現(xiàn)實(shí)的,而視頻編碼技術(shù)是個(gè)行之有效的方法;以壓縮編碼的形式存儲(chǔ)、傳輸,既節(jié)約了存儲(chǔ)空間,又提高了通信信道的傳輸效率,同時(shí)也可使計(jì)算機(jī)實(shí)時(shí)處理視頻信息,保證播放出高質(zhì)量的視頻節(jié)目[1]。
視頻圖像數(shù)據(jù)存在著極強(qiáng)的相關(guān)性,與靜態(tài)圖像相比不僅在空間上存在冗余,而且在時(shí)間上存在冗余。視頻編碼技術(shù)就是將視頻圖像數(shù)據(jù)中的冗余信息去除,以減少表示視頻圖像所需的數(shù)據(jù)量,進(jìn)而在保證重建圖像質(zhì)量一定的前提下,以盡量少的比特?cái)?shù)表征視頻信息。
目前,常用的國(guó)際視頻編碼標(biāo)準(zhǔn)有:由運(yùn)動(dòng)圖像專家組MPEG開(kāi)發(fā)的MPEG-4,以及由國(guó)際電信聯(lián)盟的視頻編碼專家組VCEG聯(lián)合MPEG共同開(kāi)發(fā)的H.264/AVC[2]。其中,MPEG-4標(biāo)準(zhǔn)提出了基于內(nèi)容的交互方式,允許用戶根據(jù)系統(tǒng)能力和信道帶寬進(jìn)行分級(jí)解碼,同每一個(gè)視頻對(duì)象進(jìn)行交互;而H.264/AVC標(biāo)準(zhǔn)主要采取幀間預(yù)測(cè)編碼和幀間變換編碼的混合編碼方式,采用可變尺寸的運(yùn)動(dòng)估計(jì)、4×4塊的整數(shù)變換、統(tǒng)一的可變長(zhǎng)編碼表等技術(shù),具有更高的數(shù)據(jù)壓縮比和更好的信道適應(yīng)性。
根據(jù)視頻編碼的主要技術(shù)特征,選用視頻、電視、圖像、編碼、壓縮、解碼、解壓縮、編解碼等關(guān)鍵詞,將檢索時(shí)間限定在2000年以后,在中國(guó)專利數(shù)據(jù)庫(kù)中獲得己經(jīng)公開(kāi)的專利申請(qǐng),統(tǒng)計(jì)其申請(qǐng)數(shù)量隨年代的變化情況結(jié)果如圖1所示。
從圖1可以看到,視頻編碼領(lǐng)域的專利申請(qǐng)量總體上呈現(xiàn)逐年上升的趨勢(shì),尤其是從2005年開(kāi)始,增長(zhǎng)速度明顯加快,當(dāng)年申請(qǐng)1072件,是上一年申請(qǐng)量的1.25倍,可見(jiàn)當(dāng)年的視頻編碼技術(shù)正處于迅速發(fā)展時(shí)期,隨后基本上每年的申請(qǐng)量也都在此基礎(chǔ)上繼續(xù)增長(zhǎng),2009年的申請(qǐng)量1480件達(dá)到了歷年來(lái)的峰值。
對(duì)提交涉及視頻編碼技術(shù)專利的申請(qǐng)人所屬國(guó)家進(jìn)行統(tǒng)計(jì)可見(jiàn),在中國(guó)申請(qǐng)專利保護(hù)的申請(qǐng)人以國(guó)內(nèi)申請(qǐng)人為主,其專利數(shù)量約占全部專利的46.5%,其次分別是日本、韓國(guó)、美國(guó)、法國(guó)、荷蘭等,其分布百分比情況如圖2所示。這與中國(guó)在近幾年對(duì)視頻編碼技術(shù)的需求迅猛增加密不可分,對(duì)技術(shù)的需求強(qiáng)有力地推動(dòng)著中國(guó)申請(qǐng)人注重技術(shù)創(chuàng)新,注重保護(hù)發(fā)明創(chuàng)造,增強(qiáng)企業(yè)的核心競(jìng)爭(zhēng)力。
從視頻編碼器的構(gòu)成來(lái)看,視頻編碼包括如下關(guān)鍵技術(shù):DCT變換、量化、熵編碼和運(yùn)動(dòng)估計(jì)與補(bǔ)償?shù)取拿嫦蚓W(wǎng)絡(luò)的應(yīng)用前景來(lái)看,視頻編碼技術(shù)主要包括轉(zhuǎn)碼、可伸縮編碼等。各技術(shù)主題在全球范圍內(nèi)的專利申請(qǐng)量比較如圖3所示。
從統(tǒng)計(jì)數(shù)據(jù)不難發(fā)現(xiàn),涉及運(yùn)動(dòng)估計(jì)與補(bǔ)償和可伸縮編碼的專利申請(qǐng)量遠(yuǎn)遠(yuǎn)高于其他編碼技術(shù)的專利申請(qǐng)數(shù)量。
從視頻編碼技術(shù)領(lǐng)域來(lái)看:1)作為編碼過(guò)程中運(yùn)算量最大的部分,運(yùn)動(dòng)估計(jì)與補(bǔ)償在整個(gè)視頻壓縮系統(tǒng)中具有極其重要的作用,其執(zhí)行速度決定了編碼的效率,并在一定程度上決定了整個(gè)視頻壓縮編碼系統(tǒng)的性能和效率[3];2)在當(dāng)前的視頻會(huì)議、視頻點(diǎn)播等面向網(wǎng)絡(luò)流媒體的應(yīng)用環(huán)境下,要求視頻編碼器能夠提供具有不同速率、不同質(zhì)量的視頻信息,能夠?qū)崿F(xiàn)特定使用環(huán)境下的最優(yōu)編碼,使得編碼后的碼流可以靈活的適應(yīng)不同網(wǎng)絡(luò)用戶的需求,因此可伸縮編碼的重要性更加凸顯[4]??梢?jiàn),運(yùn)動(dòng)估計(jì)與補(bǔ)償和可伸縮編碼作為視頻編碼技術(shù)領(lǐng)域的核心內(nèi)容,一直是本領(lǐng)域技術(shù)人員致力于改進(jìn)的重要方面。
據(jù)統(tǒng)計(jì),視頻編碼領(lǐng)域的專利申請(qǐng)人中,擁有專利申請(qǐng)較多的外國(guó)申請(qǐng)人包括:三星、松下、湯姆遜、索尼、樂(lè)金、飛利浦、諾基亞等,這些申請(qǐng)人主要集中在日本、韓國(guó)、荷蘭、芬蘭等國(guó),且多為國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門ITU-T的成員;國(guó)內(nèi)申請(qǐng)人主要分為兩大主體:以華為、中興等為代表的通信公司,和以清華大學(xué)、浙江大學(xué)為代表的高等院校。這些主要專利申請(qǐng)人在中國(guó)申請(qǐng)的專利數(shù)量如圖4所示。下面將通過(guò)分析三星電子株式會(huì)社、華為技術(shù)有限公司、諾基亞公司以及索尼公司近年來(lái)的相關(guān)專利申請(qǐng)情況,探尋上述4家公司的專利申請(qǐng)?zhí)攸c(diǎn)。
韓國(guó)三星電子株式會(huì)社作為國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T)的成員,在視頻編碼技術(shù)領(lǐng)域的研究處于世界領(lǐng)先水平,其在中國(guó)申請(qǐng)的專利申請(qǐng)量位居各主要申請(qǐng)人之首,其中,2006年的申請(qǐng)量達(dá)到峰值150件,雖然近兩年申請(qǐng)量呈現(xiàn)下降趨勢(shì),但總體上仍然保持較高水平。
此外,三星電子株式會(huì)社的申請(qǐng)內(nèi)容主要涉及運(yùn)動(dòng)估計(jì)與補(bǔ)償算法的改進(jìn),包括運(yùn)動(dòng)矢量精細(xì)化、亞像素運(yùn)動(dòng)估計(jì)與補(bǔ)償、幀內(nèi)預(yù)測(cè)模式選擇等。下面給出3件三星電子株式會(huì)社專利申請(qǐng)的實(shí)例。
CN101009831A涉及運(yùn)動(dòng)估計(jì)與補(bǔ)償中的運(yùn)動(dòng)矢量精細(xì)化,在現(xiàn)有技術(shù)的基礎(chǔ)上,根據(jù)用于運(yùn)動(dòng)估計(jì)的當(dāng)前塊的運(yùn)動(dòng)向量以及相鄰于當(dāng)前塊的至少一個(gè)相鄰塊的運(yùn)動(dòng)向量來(lái)設(shè)置預(yù)定大小的搜索范圍,并通過(guò)針對(duì)基于當(dāng)前塊的所述搜索范圍應(yīng)用塊匹配算法來(lái)估計(jì)當(dāng)前塊的最終運(yùn)動(dòng)矢量,從而使用精確的運(yùn)動(dòng)矢量進(jìn)行運(yùn)動(dòng)估計(jì)與補(bǔ)償。
CN101401437A涉及運(yùn)動(dòng)畫(huà)面編碼中預(yù)測(cè)模式的選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,基于預(yù)定圖像的特征選擇被確定為對(duì)于當(dāng)前圖像的每個(gè)色彩分量的塊最優(yōu)的預(yù)測(cè)模式,并根據(jù)選擇的預(yù)測(cè)模式產(chǎn)生當(dāng)前圖像的預(yù)測(cè)圖像,從而提高運(yùn)動(dòng)畫(huà)面的編碼效率。
CN101641960A涉及亞像素運(yùn)動(dòng)估計(jì)與補(bǔ)償,通過(guò)產(chǎn)生用于多個(gè)塊中的每一個(gè)的內(nèi)插濾波器并且執(zhí)行運(yùn)動(dòng)預(yù)測(cè)補(bǔ)償,能夠減小運(yùn)動(dòng)補(bǔ)償值與原始圖像數(shù)據(jù)之間的差值,從而減小了殘差數(shù)據(jù)的大小并且增加了圖像壓縮效率。
華為技術(shù)有限公司作為世界著名的通信公司,其在視頻編碼領(lǐng)域的研究雖然起步較晚,但其申請(qǐng)量卻在2006年開(kāi)始呈現(xiàn)快速上升趨勢(shì),其中,2008年的申請(qǐng)量達(dá)到峰值72件。由此也可以看出,華為技術(shù)有限公司在視頻編碼技術(shù)方面的發(fā)展速度之快。
此外,華為技術(shù)有限公司的申請(qǐng)內(nèi)容主要涉及運(yùn)動(dòng)估計(jì)與補(bǔ)償算法的改進(jìn),包括幀間預(yù)測(cè)編碼、多參考幀選擇、多視點(diǎn)圖像和立體視頻編碼等,其解決的技術(shù)問(wèn)題包括減少預(yù)測(cè)誤差、提高編碼效率、以及立體視頻的分級(jí)編碼。下面給出3件華為技術(shù)有限公司專利申請(qǐng)的實(shí)例。
CN101420609A涉及立體視頻的分級(jí)編碼方法,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過(guò)提取第一層預(yù)測(cè)信息和若干層預(yù)測(cè)信息增量,并進(jìn)行增強(qiáng)層編碼,實(shí)現(xiàn)了對(duì)立體視頻的分級(jí)編碼,滿足了連接在不同網(wǎng)絡(luò)下各種立體顯示設(shè)備不同顯示級(jí)別的立體視頻顯示需求;且由于對(duì)若干層預(yù)測(cè)信息增量進(jìn)行增強(qiáng)層編碼,減小了網(wǎng)絡(luò)傳輸帶寬,提高了傳輸效率。
CN101557514A涉及運(yùn)動(dòng)估計(jì)與補(bǔ)償過(guò)程中的多參考幀選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過(guò)計(jì)算當(dāng)前編碼塊的模板區(qū)域與多個(gè)參考幀中的多個(gè)匹配模板的失真,獲取多個(gè)匹配模板所對(duì)應(yīng)編碼塊的多個(gè)假設(shè)預(yù)測(cè)值,并根據(jù)該多個(gè)假設(shè)預(yù)測(cè)值計(jì)算當(dāng)前編碼塊的模板匹配預(yù)測(cè)值,從而提高了預(yù)測(cè)編碼系統(tǒng)的預(yù)測(cè)性能,提高了編碼效率。
CN101873500A涉及一種幀間預(yù)測(cè)編碼方法,其充分利用了幀間的內(nèi)容相關(guān)性來(lái)進(jìn)行編碼宏塊的劃分,提高了宏塊劃分的準(zhǔn)確性,從而減少了預(yù)測(cè)誤差,提高了宏塊的幀間運(yùn)動(dòng)估計(jì)值的精確性。
諾基亞公司作為國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門(ITU-T)的成員,在視頻編碼技術(shù)領(lǐng)域的研究起步較早,其專利申請(qǐng)內(nèi)容主要涉及可伸縮編碼算法的改進(jìn),包括時(shí)間可伸縮編碼、空間可伸縮編碼、以及質(zhì)量可伸縮編碼(例如精細(xì)粒度可伸縮編碼)。此外,其專利申請(qǐng)內(nèi)容還涉及多視點(diǎn)圖像和立體視頻編碼算法的改進(jìn)。下面給出2件諾基亞公司專利申請(qǐng)的實(shí)例。
CN101180884A涉及用于視頻數(shù)據(jù)的有效精細(xì)粒度伸縮(FGS)編碼方法,在現(xiàn)有技術(shù)的基礎(chǔ)上,取消了FGS條帶必須與其“基本層圖像”中對(duì)應(yīng)條帶覆蓋相同空間區(qū)域的約束,使得FGS條帶覆蓋更為重要的感興趣區(qū)域,并且以高于不重要區(qū)域的質(zhì)量被編碼。
CN101558652A涉及對(duì)多視點(diǎn)視頻編碼應(yīng)用單循環(huán)解碼,其中,對(duì)于N個(gè)編碼的視點(diǎn),只在需要時(shí)對(duì)其中將要顯示的M個(gè)視點(diǎn)進(jìn)行完全解碼并將其存儲(chǔ)在緩沖器中,而其他視點(diǎn)只是部分解碼或者簡(jiǎn)單地解析,從而極大地降低了設(shè)備的復(fù)雜度,降低了設(shè)備成本。
在視頻通信領(lǐng)域處于領(lǐng)先地位的索尼公司,長(zhǎng)期致力于視頻編碼算法的研究,其在中國(guó)申請(qǐng)的涉及視頻編碼技術(shù)的專利申請(qǐng)量雖然在2006年至2007年出現(xiàn)了小幅下滑,卻在2008年至2010年呈現(xiàn)強(qiáng)勢(shì)反彈,其中,2008年47件,2009年52件,2010年83件。從上述數(shù)據(jù)可以看出,索尼公司在視頻編碼領(lǐng)域的研究至今仍然處于高速發(fā)展時(shí)期。下面給出1件索尼公司專利申請(qǐng)的實(shí)例。
CN101345876A涉及最佳預(yù)測(cè)模式的選擇,在現(xiàn)有技術(shù)的基礎(chǔ)上,通過(guò)從在不同預(yù)測(cè)值生成單元中檢測(cè)到的最佳預(yù)測(cè)模式中檢測(cè)適合于進(jìn)行幀內(nèi)預(yù)測(cè)的預(yù)測(cè)模式來(lái)進(jìn)行編碼處理,降低了選擇最佳預(yù)測(cè)模式所需的計(jì)算復(fù)雜性。
綜上所述,涉及視頻編碼技術(shù)的專利申請(qǐng)的數(shù)量多且仍呈現(xiàn)逐年上升的趨勢(shì),其包含的關(guān)鍵技術(shù)分支廣。下面簡(jiǎn)要分析視頻編碼領(lǐng)域今后的專利發(fā)展方向,包括以下2個(gè)方面:
1)可伸縮視頻編碼。隨著計(jì)算機(jī)網(wǎng)絡(luò)的不斷發(fā)展和應(yīng)用需求的多樣化,對(duì)于視頻編碼技術(shù)的研究不再僅僅局限于壓縮特性,而漸漸開(kāi)始向網(wǎng)絡(luò)適應(yīng)性、用戶交互性等方面轉(zhuǎn)移[5]??缮炜s視頻編碼因?yàn)榫哂辛己玫木W(wǎng)絡(luò)適應(yīng)性和靈活性,不僅特別適合網(wǎng)絡(luò)傳輸,而且應(yīng)用到視頻監(jiān)控領(lǐng)域中還能滿足監(jiān)控視頻資料的存儲(chǔ)、檢索、分析等方面的特殊需求??梢灶A(yù)見(jiàn),可伸縮視頻編碼在例如視頻監(jiān)控等產(chǎn)業(yè)上的應(yīng)用將越來(lái)越多,使其成為未來(lái)專利發(fā)展的趨勢(shì)。
2)多視點(diǎn)編碼。隨著3D立體顯示研究不斷深入,多視點(diǎn)編碼算法也在不斷成熟[6]。多視點(diǎn)編碼算法的研究會(huì)為自由視點(diǎn)電視、立體電視和沉浸感視頻會(huì)議的應(yīng)用提供技術(shù)支持。可以預(yù)見(jiàn),隨著3D電視的快速產(chǎn)業(yè)化和商業(yè)化,多視點(diǎn)編碼也將成為未來(lái)專利發(fā)展的趨勢(shì)。
[1]盧官明,宗昉.IPTV技術(shù)及應(yīng)用[M].北京:人民郵電出版社,2007.
[2]RICHARDSON I.H.264和MPEG-4視頻壓縮——新一代多媒體的視頻編碼技術(shù)[M].湖南:國(guó)防科技大學(xué)出版社,2004.
[3]朱江.基于DCT的可伸縮視頻編碼的研究[D].北京:北京郵電大學(xué),2007.
[4]魏偉.視頻壓縮編碼的運(yùn)動(dòng)估計(jì)與補(bǔ)償技術(shù)[D].天津:天津大學(xué),2009.
[5]余和初.數(shù)字視頻編解碼技術(shù)標(biāo)準(zhǔn)及其發(fā)展趨勢(shì)[J].技術(shù)與應(yīng)用,2011(5):33-37.
[6]王一剛.數(shù)字視頻編解碼技術(shù)標(biāo)準(zhǔn)的現(xiàn)狀分析[J].信息技術(shù)與標(biāo)準(zhǔn)化,2010(7):39-42.