□劉海蘭 李海彬 李榮瑋 黎朗
淺談視頻文件幀頻轉(zhuǎn)換的一些方法及常見問題
□劉海蘭 李海彬 李榮瑋 黎朗
國內(nèi)電視的播出幀頻是25幀/秒,但很多攝錄設(shè)備并不按此幀頻進行拍攝,要將這些視頻在電視上播出,必須進行幀頻轉(zhuǎn)換。本文主要闡述幀頻轉(zhuǎn)換的一些技術(shù)要點和注意事項,并針對幀頻轉(zhuǎn)換的一些方法進行重點介紹和分析。
幀頻;電視制式;采樣時間
在使用非編系統(tǒng)制作電視節(jié)目時,常常會遇到不同攝錄設(shè)備產(chǎn)生的視頻文件,既有記者使用專業(yè)攝像機拍攝的視頻,也有通過相機、手機拍攝的視頻,但在節(jié)目制作中,一些電腦上播放流暢的視頻,經(jīng)過非編軟件處理后在電視機上播出時,畫面卻出現(xiàn)抖動,這是怎么回事呢?較大的可能是原始視頻的幀頻與電視播出的幀頻不同造成的。
在模擬電視時代,電視分為NTSC、PAL、SECAM三大制式。
(一)NTSC制式電視的分辨率為720×480,幀頻為每秒29.97幀(一般簡化為30幀),場頻為每秒60場,這種制式的色度信號調(diào)制特點為平衡正交調(diào)幅制,即包括了平衡調(diào)制和正交調(diào)制兩種。
(二)PAL制式電視的分辨率為720×576,幀頻為每秒25幀,場頻為每秒50場,它對同時傳送的兩個色差信號中的一個色差信號采用逐行倒相,另一個色差信號進行正交調(diào)制方式,是中國目前使用的制式。
(三)SECAM制式電視的分辨率為720×576,幀頻為每秒25幀,場頻為每秒50場,在信號傳輸過程中,亮度信號每行傳送,而兩個色差信號則逐行依次傳送。
幀頻(frame rate)是指每秒鐘放映或顯示的幀或圖像的數(shù)量。因為以前的電視機使用顯像管來成像,所以三大制式都采用隔行掃描的方式,即將1幀畫面分為奇數(shù)場和偶數(shù)場來顯像,因而場頻是幀頻的一倍。
由于三大制式之間的參數(shù)不同,在使用錄像機進行電視節(jié)目的編輯時,不同制式的錄像帶是不能互相兼容的,制式間的轉(zhuǎn)換也需要專門的設(shè)備,一般很少進行轉(zhuǎn)換。
在數(shù)字電視時代,電視制式被漸漸忽略了,至少在節(jié)目制作域中,它已經(jīng)被淡化了。因為電視素材的來源,已不僅僅是用專業(yè)的攝像機來錄制的視頻,手機、照相機、攝像頭等設(shè)備都可以錄制視頻并以文件的方式存儲,這些文件是沒有制式之說的。
但是視頻的幀頻對于電視的播出仍然是重要的,因為國內(nèi)各電視臺的節(jié)目播出,標清采用PAL制,高清采用1080 50i,其幀頻都是25幀/秒,在使用非編軟件制作電視節(jié)目時,無論原始視頻的幀頻是多少,最終必須轉(zhuǎn)換為25幀/秒,而幀頻的轉(zhuǎn)換可能會影響最終的節(jié)目成像質(zhì)量。
人眼視覺惰性的活動閾值是每秒24次,即每秒鐘連續(xù)顯示24幅以上的不同靜止畫面時人眼就會感覺圖像是連續(xù)運動的而不會把它們分辨為一幅幅靜止畫面。
在拍攝電視時,視頻的錄制并不是連續(xù)的,而是每隔一個固定的時間拍攝一幀畫面并記錄下來,播放時再按拍攝的速度進行重放,由于相鄰兩幀畫面的間隔時間很短,人眼看來就是連續(xù)的了。
根據(jù)設(shè)置的幀頻,可以確定每秒記錄幾幀畫面,以及相鄰兩幀畫面的采樣間隔時間,它與幀頻的計算公式為:采樣間隔時間=1000毫秒÷幀頻。當幀頻為25幀/秒時,1000÷25=40毫秒,30幀/秒時約等于33.33毫秒,50幀/秒時等于20毫秒,每幀畫面的時間戳將按這個間隔遞增。
拍攝時使用的幀頻越高,記錄的畫面就越多,圖象細節(jié)也會更豐富。在一些體育賽事的轉(zhuǎn)播中,經(jīng)常會使用高速攝像機以電視幀頻兩倍以上的速度錄制視頻信號,再將錄制幀頻轉(zhuǎn)換為電視的播出幀頻;而在慢動作重放時,這些在正常播出時沒有用到的畫面發(fā)揮了很大的作用,它讓我們看到的慢動作過程是連貫的而不是卡頓的。
看到這里,你可能會有一種感覺,就是從高的幀頻轉(zhuǎn)為低的幀頻是沒有損失的,就像將一張4000×2250像素的照片,縮小到1920×1080像素,放到1280×720的顯示器里觀看,圖片的質(zhì)量并不會降低。那幀頻從高向低轉(zhuǎn)換,是否也是這樣的?這個需要看情況而定。圖1是25幀/秒分別與30幀/秒、50幀/秒的采樣時間對比。
從圖1可以知道,除原點(即0ms)外,25幀/秒與30幀/秒每秒鐘內(nèi)對畫面進行采樣的時間點位是不相同的;而50幀/秒采樣畫面的時間點,會與25幀/秒的出現(xiàn)重合周期。
當采用播出幀頻的倍頻錄制視頻時,如50幀/秒,將其幀頻降為25幀/秒,只需將50幀/秒的畫面每兩幀抽取1幀,即可降為25幀/秒,視頻的連續(xù)性基本不會有任何的影響,音頻也不會不同步,這就是為什么高速攝像機采用多倍頻進行記錄的原因。
而如果是反過來將25幀/秒提升至50幀/秒時也很方便,將25幀畫面每幀寫入2次即可,雖然畫質(zhì)沒有提高,但不會出現(xiàn)任何問題。
圖1 視頻采樣記錄時間
但將幀頻從30幀/秒轉(zhuǎn)至25幀/秒,或者反方向轉(zhuǎn)換時,就沒有這么幸運了,由于兩者的采樣間隔時間不成整數(shù)倍關(guān)系,無論如何處理,都會對視頻的連續(xù)性和視音頻的同步產(chǎn)生些許影響。
國內(nèi)電視制式的幀頻是25幀/秒,而手機、相機拍攝時常用的幀頻是30幀/秒,一方面拍攝者可能不清楚幀頻對電視播出的影響,另一方面某些手機、相機不支持以25幀/秒拍攝,因此幀頻從30幀/秒降為25幀/秒是比較常見的,下面介紹幾種降低幀頻的方法。
(一)丟棄部分幀并重組視頻
這種方法常見于轉(zhuǎn)碼軟件,轉(zhuǎn)換時將每秒30幀的圖像,每隔數(shù)幀丟棄1幀,將剩下的25幀重新組成1秒的視頻,圖2是轉(zhuǎn)碼軟件FFMPEG降幀頻后每秒保留的原幀畫面。
圖2 FFMPEG降幀頻后的畫面分解
降幀頻后,每秒內(nèi)的30幀畫面,其中的第5、11、17、23、29幀被抽走并丟棄,不再出現(xiàn)在新組成的視頻中,并且除了第1幀外,其它各幀的采樣時間也發(fā)生了變化,如表1所示。
表1降頻前、后采樣時間及偏差值
從表1可知,新組成的各幀畫面,采樣時間最慢的是滯后原視頻畫面約21ms,最快的是超前6ms,即有些畫面出來得慢了,有些又出來得快了,加上丟棄了5幀,畫面的
連續(xù)性較差,并且視音頻會產(chǎn)生輕微的不同步。
(二)相鄰兩幀做透明疊加融合
這種方法多見于非編軟件,如Edius、大洋非編軟件等,它們的做法是將相鄰的兩幀進行一個類似于半透明的過渡處理,圖3是Edius降幀頻后重新生成的畫面。
從圖3可知,相鄰的兩幀畫面按不同的透明比例進行疊加融合,并重新渲染為新的一幀畫面,從某種意義上來說,這里沒有丟棄任何一幀畫面,因此畫面的連續(xù)性可以得到保證,但是又產(chǎn)生一個新的問題,即融合后的畫面可能會產(chǎn)生少許的重影、模糊、拖尾。
圖3 Edius降幀頻后的視頻分解圖
這種方式處理的視頻,其各幀的采樣時間已不好估算,無法計算出轉(zhuǎn)換后各幀的超前和滯后情況,但視音頻輕微不同步現(xiàn)象仍然不可避免。
(三)降速變換
這種方法有點像慢放,即將原來每秒鐘播放30幀改為播放25幀,但后面的5幀并不丟棄,而是放到下一秒鐘,原來1秒鐘的視頻變成了1秒加200毫秒,由于每秒鐘的視頻變慢了,因此音頻也要作相應的調(diào)整,這樣才能保證聲畫同步。由于轉(zhuǎn)換工序復雜,并且視頻明顯變慢,這種方法并不常見,僅在一些特殊情況下使用。
綜上,在原始幀頻與播出幀頻不存在倍頻關(guān)系的條件下,無論采用上述的何種處理方式,在降低幀頻后,畫面都會產(chǎn)生一定的失真。
提高幀頻的方法與降低幀頻的差不多,基本上就是其逆運算過程。
(一)按比例重復插幀:根據(jù)源幀頻與目標幀頻的差值,每隔數(shù)幀向目標視頻插入一幀,如15幀/秒提高至25幀/秒時,平均每1.66幀插入相鄰的1幀。
(二)某兩相鄰幀疊加產(chǎn)生第3幀:原幀畫面不變,根據(jù)轉(zhuǎn)換幀頻的比例,某兩幀畫面按不同的透明度疊加產(chǎn)生新的第3幀。
(三)全部相鄰幀疊加產(chǎn)生多幀:全部畫面重新渲染,相鄰兩幀按不同的透明度產(chǎn)生多幀。
當幀頻低于人眼視覺惰性的活動閾值時,由于原始畫面的細節(jié)丟失嚴重,無論通過何種方式,基本上無法提高畫面質(zhì)量。
當視頻的錄制幀頻與電視幀頻不是整數(shù)倍關(guān)系時,是一個比較難以處理的情況,轉(zhuǎn)換后的視頻肯定會有一些失真。文中談及的幾種轉(zhuǎn)換方法,并未提及何種方法更優(yōu),這需要根據(jù)視頻畫面的構(gòu)成而定。我們要做的是,將轉(zhuǎn)換失真降到最低點,在有條件的情況下,盡可能采用幾種方法做轉(zhuǎn)換,在完成的視頻文件中挑選一個效果最好的。
(作者單位:廣西電視臺新聞中心)