国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OMAP3530的數(shù)字視頻處理

2018-02-03 22:11宮曉梅
卷宗 2017年27期
關(guān)鍵詞:數(shù)字視頻開發(fā)板雙核

摘 要:本文主要研究MPEG-4算法進行移植、測試、優(yōu)化,分別針對PC機、OMAP3530 單ARM核工作、OMAP3530雙核協(xié)同工作等狀態(tài)下視頻處理性能進行測評。

關(guān)鍵詞:OMAP;MPEG-4算法視頻處理

1 引言

OMAP是一款面向多操作系統(tǒng)(包括PalmOS5.0,PocketPC2002和通信領(lǐng)域的Symbian)的高性能低功耗處理器。它集成了包括一個數(shù)字協(xié)處理器在內(nèi)的多媒體單元,并且加入和GSM/GPRS接口和藍牙無線協(xié)議等一些當(dāng)前的高級功能。由于其較低的主頻150Mhz和廣泛的支持性能,OMAP獲得了Palm公司的認(rèn)可,成為了其下Palm OS5產(chǎn)品的標(biāo)準(zhǔn)處理器。而其中的OMAP3530是TI公司推出的面向移動網(wǎng)絡(luò)多媒體信號處理的雙核處理器,片內(nèi)集成了ARM Cortex-A8和TMS320C64+處理器。

數(shù)字視頻編碼在諸如數(shù)字視頻監(jiān)控系統(tǒng)與視頻會議系統(tǒng)等眾多應(yīng)用中發(fā)揮著重要作用。本文將對以TMS320C64x DSP為基礎(chǔ)的通用視頻編碼器優(yōu)化技術(shù)進行介紹?;贒M64x的視頻編碼優(yōu)化結(jié)合了多種技術(shù),其中包括算法/系統(tǒng)優(yōu)化、存儲器緩沖優(yōu)化、EDMA及高速緩存利用率優(yōu)化等。TMS320C64x器件建立在德州儀器(TI)開發(fā)的第二代高性能VLIW架構(gòu)(VelociTI.2)基礎(chǔ)之上。該器件具有VLIW架構(gòu)、2級存儲器/高速緩存層次結(jié)構(gòu)以及EDMA引擎等關(guān)鍵特性,從而使其成為計算強度較大的視頻/影像應(yīng)用(如視頻編碼與分析)的最佳選擇之一。利用DM64x進行應(yīng)用開發(fā)時,需要全面了解其特性與開銷以實現(xiàn)最佳性能。

2 研究內(nèi)容

本設(shè)計在OMAP3530硬件平臺進行數(shù)字視頻應(yīng)用設(shè)計。主要內(nèi)容是對MPEG-4算法進行移植、測試、優(yōu)化,分別針對PC機、OMAP3530 單ARM核工作、OMAP3530雙核協(xié)同工作等狀態(tài)下視頻處理性能進行測評,其中雙核協(xié)同工作部分應(yīng)與同組同學(xué)共同設(shè)計,通過基于XDM的ARM和DSP交互驅(qū)動進行編程開發(fā)。

在完成上述基本工作的基礎(chǔ)上可進一步設(shè)計基于MPEG-4和Qtopia圖形界面的網(wǎng)絡(luò)視頻通信。開發(fā)的最終希望能夠?qū)崿F(xiàn)一個基于OMAP3530的視頻處理設(shè)備,可以高速地對視頻進行MPEG-4的編碼解碼和播放功能。

下面以TMS320C64為例在此列出其所有DSP關(guān)鍵特性:

1. 增強功能單元

TMS320C64x的8個功能單元中的VelociTI.2擴展包括加速視頻與影像應(yīng)用性能的新指令。

2. L1/L2分級存儲器結(jié)構(gòu)

16KB直接映射的L1P程序高速緩存,帶有32字節(jié)的高速緩存管線(8周期L1P高速緩存缺失損失)。

16KB雙路關(guān)聯(lián)L1D數(shù)據(jù)高速緩存,帶有64字節(jié)的高速緩存管線(6循環(huán)L1D高速緩存缺失損失)。

256KBL2統(tǒng)一映射RAM/高速緩存(靈活的RAM/緩存分配)

L2四路關(guān)聯(lián)高速緩存,帶有128字節(jié)的高速緩存管線。

3. 位優(yōu)先原則:低位優(yōu)先(Little Endian),高位優(yōu)先(Big Endian)。

4.64位外部存儲器接口(EMIF):至異步與異步存儲器的無膠合邏輯接口。

5.1024MB總的可尋址外部存儲器空間。

6.增強型直接存儲器存?。‥DMA)控制器(64個獨立通道)。

片上外設(shè)集包括:三個可配置的視頻端口,一個10/100Mbps以太網(wǎng)MAC(EMAC),一個管理數(shù)據(jù)輸入/輸出(MDIO)模塊,一個VCXO內(nèi)插控制端口(VIC)。視頻端口外設(shè)提供與通用視頻解碼器和編碼器相連的無縫接口,以支持多種視頻分辨率及標(biāo)準(zhǔn),如ITU-BT.656、BT.1120、SMPTE125M/260M/274M/296M等。

上面的功能特性對包括視頻編碼在內(nèi)的所有算法的執(zhí)行都相當(dāng)重要。二級存儲器/高速緩存分級結(jié)構(gòu)與EDMA引擎基本決定了視頻編碼器實現(xiàn)的架構(gòu)。在算法實現(xiàn)過程中,我們需要弄清一些有關(guān)存儲器/高速緩存層次結(jié)構(gòu)以及EDMA引擎的基本概念。如果代碼大于L1P,就可能發(fā)生L1P高速緩存缺失,CPU停止運行至到讀取到所需代碼。類似地,如果數(shù)據(jù)與L1D不符,就會出現(xiàn)L1D高速緩存缺失并且CPU停止運行。所有的L1P與L1D缺失問題均由L2高速緩存/SRAM來解決。如果代碼與數(shù)據(jù)的大小均大于L2高速緩存的容量,那么就可能出現(xiàn)L2高速緩存缺失。與L1P/L1D高速緩存缺失損失相比,L2缺失損失通常更嚴(yán)重,因為L2高速緩存需要與速度較低的片外存儲器相互傳遞數(shù)據(jù)/代碼。

確保視頻編碼器最佳性能的兩大重要因素是進行有利于高速緩存的程序分區(qū)(program partitioning)以及數(shù)據(jù)傳輸處理(如減少L1/L2缺失)。盡管L2 SRAM可用于解決L1D/L1P缺失問題,我們通常還是更傾向于采用EDMA來傳輸L2 SRAM與片外存儲器之間的代碼/數(shù)據(jù),因為EDMA的傳輸效率通常高于L2高速緩存。

3 實現(xiàn)方法及預(yù)期目標(biāo)

圖1給出了通用視頻編碼算法結(jié)構(gòu)圖,MPEG2、H.263及MPEG4等許多視頻編碼標(biāo)準(zhǔn)都可從該算法結(jié)構(gòu)圖衍生而來。在圖1中,DCT與量化(Q)去除了視頻的空間冗余;運動估計(ME)降低了視頻的時間冗余;VLC進行熵編碼(entropycoding),以將數(shù)據(jù)有效地進行分組。

通常,視頻編碼器的實現(xiàn)是以宏模塊(MB)為基礎(chǔ)。這就是說,只有在當(dāng)前MB完成所有處理步驟后,視頻編碼器才讀取下一個MB。這種靠直覺進行操作的方法存在兩大缺點:

1.視頻編碼器的整體代碼尺寸通常大于L1P。在每個MB讀取階段,代碼都需要在L1P和L2P之間進行交換,這會造成嚴(yán)重的高速緩存缺失問題。endprint

2.用EDMA從外部視頻幀存儲器向內(nèi)部存儲器傳輸小塊數(shù)據(jù)(如一個MB)的效率不高。

為了避免造成大量高速緩存缺失損失和CPU停止響應(yīng)問題,我們可將算法分為三個小循環(huán)/模塊,每部分都能在L1P中容下。每個循環(huán)中每次同時操作M個宏模塊(MB串),而不是只操作一個宏模塊。M是宏模塊串的大小,只受可用L1D大小的限制。M越大,就能獲得的越高的EDMA數(shù)據(jù)吞吐量性能。

正如上面強調(diào)指出的那樣,每次都讀取M個宏模塊,一起經(jīng)過三個環(huán)路中的一個來處理。舉例來說,在宏模塊編碼循環(huán)中,如果將M個宏模塊讀入內(nèi)部存儲器,那么將對其進行DCT轉(zhuǎn)換、量化以及熵編碼。只有當(dāng)宏模塊編碼環(huán)路結(jié)束時,這一組宏模塊才離開L1D。相應(yīng)的程序包括DCT、量化以及VLC內(nèi)核,其會在所有M個宏模塊在L1P中完全處理之后才脫離該環(huán)路。EDMA引擎驅(qū)動的乒乓存儲器緩沖方案有助于減少執(zhí)行一組宏模塊時環(huán)路初始的設(shè)置時間,同時還可確保最小化的CPU停止周期,這是由于傳輸與處理并行進行的原因。

當(dāng)測試通過時將所編好的程序進行從PC機向OMAP3530嵌入式開發(fā)板的移植工作。這里需要先對OMAP3530嵌入式開發(fā)板有一個熟悉的過程,對于該開發(fā)板有一個基本的掌握。然后將程序移植入OMAP3530嵌入式開發(fā)板中以進行調(diào)試與運行測試。

最后,將程序進行修改,以實現(xiàn)OMAP3530雙核協(xié)同工作等狀態(tài)下視頻處理。

這里面的重點有兩個,首先是MPEG-4算法的研究,如果沒有對MPEG-4編碼、解碼算法應(yīng)用方法的正確理解是無法完成測速任務(wù)的,更不可能完成實現(xiàn)雙核協(xié)同工作的任務(wù)。另一個是OMAP3530嵌入式開發(fā)板在使用前的原理理解還有對配置與應(yīng)用的掌握。這一步走的好壞與否輕則將直接影響到開發(fā)的進度,重則影響到最后一項結(jié)果的實現(xiàn)。

參考文獻

[1]徐鵬,鄒浩斌.達芬奇技術(shù)簡化數(shù)字視頻設(shè)計:[博士論文].廣州:華南理工大學(xué),2006

[2]周軍,徐衛(wèi),劉廣存,蔡慶安.基于達芬奇技術(shù)的H.264視頻編碼器的實現(xiàn):[博士論文].廣州:華南理工大學(xué),2007

[3]趙勇,袁譽樂,丁銳.DAVINC技術(shù)原理與應(yīng)用指南[M].南京:東南大學(xué)出版社,2008:93-121

[4]鐘玉啄王琪賀玉文.基于對象的多媒體數(shù)據(jù)壓縮編碼國際標(biāo)準(zhǔn)MPEG-4及其校驗?zāi)P蚚M].北京:科學(xué)出版社,2000

作者簡介

宮曉梅(1976-),女,內(nèi)蒙古赤峰,漢族,碩士,副教授,研究方向:計算機信息技術(shù),通信技術(shù)。endprint

猜你喜歡
數(shù)字視頻開發(fā)板雙核
全球金融“F20”在此召開!橫瀝進入“雙核”時代
數(shù)字視頻水印技術(shù)淺析
Microchip最新推出兩款PIC32 Curiosity開發(fā)板
淺析單片機開發(fā)板的設(shè)計與制作
新型夾心雙核配和物[Zn2(ABTC)(phen)2(H2O)6·2H2O]的合成及其熒光性能
基于多尺度互信息量的數(shù)字視頻幀篡改檢測
數(shù)字視頻矩陣平臺與全數(shù)字視頻監(jiān)控系統(tǒng)整合方案研究
基于ONVIF的高速公路異構(gòu)數(shù)字視頻聯(lián)網(wǎng)監(jiān)控
Mouser為您呈上開發(fā)關(guān)鍵之STMicroelectronics Nucleo開發(fā)板
Arduino和Atmel發(fā)布Arduino Zero開發(fā)板