.視頻壓縮名字解釋:
1、有損和無損壓縮:在視頻壓縮中有損(Lossy )和無損(Lossless)的概念與靜態(tài)圖像中基本類似。無損壓縮也即壓縮前和解壓縮后的數(shù)據(jù)完全一致。有損壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復(fù)。丟失的數(shù)據(jù)率與壓縮比有關(guān),壓縮比越小,丟失的數(shù)據(jù)越多,解壓縮后的效果一般越差。此外,某些有損壓縮算法采用多次重復(fù)壓縮的方式,這樣還會引起額外的數(shù)據(jù)丟失。
2 、幀內(nèi)和幀間壓縮:幀內(nèi)(Intraframe)壓縮也稱為空間壓縮(Spatial compression)。當壓縮一幀圖像時,僅考慮本幀的數(shù)據(jù)而不考慮相鄰幀之間的冗余信息,這實際上與靜態(tài)圖像壓縮類似。幀內(nèi)壓縮一般達不到很高的壓縮。采用幀間(Interframe)壓縮是基于許多視頻或動畫的連續(xù)前后兩幀具有很大的相關(guān)性,或者說前后兩幀信息變化很小的特點。也即連續(xù)的視頻其相鄰幀之間具有冗余信息,根據(jù)這一特性,壓縮相鄰幀之間的冗余量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(Temporal
compression),它通過比較時間軸上不同幀之間的數(shù)據(jù)進行壓縮。幀間壓縮一般是無損的。
3 對稱和不對稱編碼:對稱性(symmetric)是壓縮編碼的一個關(guān)鍵特征。對稱意味著壓縮和解壓縮占用相同的計算處理能力和時間,對稱算法適合于實時壓縮和傳送視頻,如視頻會議應(yīng)用就以采用對稱的壓縮編碼算法為好。不對稱或非對稱意味著壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。
4、 影響數(shù)字視頻質(zhì)量的因素:
在多媒體數(shù)字視頻中有五個重要的技術(shù)參數(shù)將最終影響視頻圖像的質(zhì)量,它們分別為幀速、分辨率、顏色數(shù)、壓縮比和關(guān)鍵幀。
(1)幀速:常用的有25幀/秒(PAL)、30幀/秒(NTSC)。幀速越高,數(shù)據(jù)量越大,質(zhì)量越好。
(2)分辨率:視頻分辨率越大,數(shù)據(jù)量越大,質(zhì)量越好。這里要注意區(qū)分視頻分辨率和視頻顯示分辨率(顯示的像素點數(shù))。
(3)顏色數(shù):指視頻中最多能使用的顏色數(shù)。顏色位數(shù)越多,色彩越逼真,數(shù)據(jù)量也越大。
(4)壓縮比:壓縮比較小時對圖像質(zhì)量不會有太大影響,而超過一定倍數(shù)后,將會明顯看出圖像質(zhì)量下降,而且壓縮比越大在回放時花費在解壓的時間越長。
(5)關(guān)鍵幀:視頻數(shù)據(jù)具有很強的幀間相關(guān)性,動態(tài)視頻壓縮正是利用幀間相關(guān)性的特點,通過前后兩個關(guān)鍵幀動態(tài)合成中間的視頻幀。因此對于含有頻繁運動的視頻圖像序列,關(guān)鍵幀數(shù)少就會出現(xiàn)圖像不穩(wěn)定的現(xiàn)象。
MPEG視頻壓縮編碼后包括三種元素:I幀(I-frames)、P幀(P-frames)和B幀(B-frames)。在MPEG編碼的過程中,部分視頻幀序列壓縮成為I幀;部分壓縮成P幀;還有部分壓縮成B幀。I幀法是幀內(nèi)壓縮法,也稱為“關(guān)鍵幀”壓縮法。I幀法是基于離散余弦變換DCT( Discrete Cosine Transform )的壓縮技術(shù),這種算法與JPEG壓縮算法類似。采用I幀壓縮可達到1/6的壓縮比而無明顯的壓縮痕跡。
在保證圖像質(zhì)量的前提下實現(xiàn)高壓縮的壓縮算法,僅靠幀內(nèi)壓縮是不能實現(xiàn)的,MPEG采用了幀間和幀內(nèi)相結(jié)合的壓縮算法。 P幀法是一種前向預(yù)測算法,它考慮相鄰幀之間的相同信息或數(shù)據(jù),也即考慮運動的特性進行幀間壓縮。P幀法是根據(jù)本幀與相鄰的前一幀(I幀或P幀)的不同點來壓縮本幀數(shù)據(jù)。采取P幀和I幀聯(lián)合壓縮的方法可達到更高的壓縮且無明顯的壓縮痕跡。
然而,只有采用B幀壓縮才能達到200:1的高壓縮。B幀法是雙向預(yù)測的幀間壓縮算法。當把一幀壓縮成B幀時,它根據(jù)相鄰的前一幀、本幀以及后一幀數(shù)據(jù)的不同點來壓縮本幀,也即僅記錄本幀與前后幀的差值。B幀數(shù)據(jù)只有I幀數(shù)據(jù)的百分之十五、P幀數(shù)據(jù)的百分之五十以下。
MPEG標準采用類似4:2:2的采用格式,壓縮后亮度信號的分辨率為352×240,兩個色度信號分辨率均為176×120,這兩種不同分辨率信息的幀率都是每秒30幀。其編碼的基本方法是在單位時間內(nèi),首先采集并壓縮第一幀的圖像為I幀。然后對于其后的各幀,在對單幀圖像進行有效壓縮的基礎(chǔ)上,只存儲其相對于前后幀發(fā)生變化的部分。幀間壓縮的過程中也常間隔采用幀內(nèi)壓縮法,由于幀內(nèi)(關(guān)鍵幀)的壓縮不基于前一幀,一般每隔15幀設(shè)一關(guān)鍵幀,這樣可以減少相關(guān)前一幀壓縮的誤差積累。MPEG編碼器首先要決定壓縮當前幀為I幀或P幀或B幀,然后采用相應(yīng)的算法對其進行壓縮。一個視頻序列經(jīng)MPEG全編碼壓縮后可能的格式為:IBBPBBPBBPBBPBBIBBPBBPBBPBBPBBI......
壓縮成B幀或P幀要比壓縮成I幀需要多得多的計算處理時間。有的編碼器不具備B幀甚至P幀的壓縮功能,顯然其壓縮效果不會很好。
.視頻壓縮技術(shù)
一、視頻編碼的基本原理:
視頻圖像數(shù)據(jù)有極強的相關(guān)性,也就是說有大量的冗余信息。其中冗余信息可分為空域冗余信息和時域冗余信息。壓縮技術(shù)就是將數(shù)據(jù)中的冗余信息去掉(去除數(shù)據(jù)之間的相關(guān)性),壓縮技術(shù)包含幀內(nèi)圖像數(shù)據(jù)壓縮技術(shù)、幀間圖像數(shù)據(jù)壓縮技術(shù)和熵編碼壓縮技術(shù)。
去時域冗余信息
使用幀間編碼技術(shù)可去除時域冗余信息,它包括以下三部分:
- 運動補償
運動補償是通過先前的局部圖像來預(yù)測、補償當前的局部圖像,它是減少幀序列冗余信息的有效方法。
- 運動表示
不同區(qū)域的圖像需要使用不同的運動矢量來描述運動信息。運動矢量通過熵編碼進行壓縮。
- 運動估計
運動估計是從視頻序列中抽取運動信息的一整套技術(shù)。
注:通用的壓縮標準都使用基于塊的運動估計和運動補償。
去空域冗余信息
主要使用幀間編碼技術(shù)和熵編碼技術(shù):
- 變換編碼
幀內(nèi)圖像和預(yù)測差分信號都有很高的空域冗余信息。變換編碼將空域信號變換到另一正交矢量空間,使其相關(guān)性下降,數(shù)據(jù)冗余度減小。
- 量化編碼
經(jīng)過變換編碼后,產(chǎn)生一批變換系數(shù),對這些系數(shù)進行量化,使編碼器的輸出達到一定的位率。這一過程導(dǎo)致精度的降低。
- 熵編碼
熵編碼是無損編碼。它對變換、量化后得到的系數(shù)和運動信息,進行進一步的壓縮。
視頻編碼的基本框架(圖)
國際音視頻壓縮標準發(fā)展歷程
H.261
H.261標準是為ISDN設(shè)計,主要針對實時編碼和解碼設(shè)計,壓縮和解壓縮的信號延時不超過150ms,碼率px64kbps(p=1~30)。
H.261標準主要采用運動補償?shù)膸g預(yù)測、DCT變換、自適應(yīng)量化、熵編碼等壓縮技術(shù)。 只有I幀和P幀,沒有B幀,運動估計精度只精確到像素級。支持兩種圖像掃描格式:QCIF和CIF。
H.263
H.263標準是甚低碼率的圖像編碼國際標準,它一方面以H.261為基礎(chǔ),以混合編碼為核心,其基本原理框圖和H.261十分相似,原始數(shù)據(jù)和碼流組織也相似;另一方面,H.263也吸收了MPEG等其它一些國際標準中有效、合理的部分,如:半像素精度的運動估計、PB幀預(yù)測等,使它性能優(yōu)于H.261。
H.263使用的位率可小于64Kb/s,且傳輸比特率可不固定(變碼率)。H.263支持多種分辨率: SQCIF(128x96)、 QCIF、CIF、4CIF、16CIF。
與H.261和H.263相關(guān)的國際標準
與H.261有關(guān)的國際標準
H.320:窄帶可視電話系統(tǒng)和終端設(shè)備;
H.221:視聽電信業(yè)務(wù)中64~1 920Kb/s信道的幀結(jié)構(gòu);
H.230:視聽系統(tǒng)的幀同步控制和指示信號;
H.242:使用直到2Mb/s數(shù)字信道的視聽終端的系統(tǒng)。
與H.263有關(guān)的國際標準
H.324:甚低碼率多媒體通信終端設(shè)備;
H.223:甚低碼率多媒體通信復(fù)合協(xié)議;
H.245:多媒體通信控制協(xié)議;
G.723.1.1:傳輸速率為5.3Kb/s和6.3Kb/s的語音編碼器。
JPEG
國際標準化組織于1986年成立了JPEG(Joint Photographic Expert Group)聯(lián)合圖片專家小組,主要致力于制定連續(xù)色調(diào)、多級灰度、靜態(tài)圖像的數(shù)字圖像壓縮編碼標準。常用的基于離散余弦變換(DCT)的編碼方法,是JPEG算法的核心內(nèi)容。
MPEG-1/2
MPEG-1標準用于數(shù)字存儲體上活動圖像及其伴音的編碼,其數(shù)碼率為1.5Mb/s。 MPEG-1的視頻原理框圖和H.261的相似。
MPEG-1視頻壓縮技術(shù)的特點:1. 隨機存??;2. 快速正向/逆向搜索;3 .逆向重播;4. 視聽同步;5. 容錯性;6. 編/解碼延遲。MPEG-1視頻壓縮策略:為了提高壓縮比,幀內(nèi)/幀間圖像數(shù)據(jù)壓縮技術(shù)必須同時使用。幀內(nèi)壓縮算法與JPEG壓縮算法大致相同,采用基于DCT的變換編碼技術(shù),用以減少空域冗余信息。幀間壓縮算法,采用預(yù)測法和插補法。預(yù)測誤差可在通過DCT變換編碼處理,進一步壓縮。幀間編碼技術(shù)可減少時間軸方向的冗余信息。
MPEG-2被稱為“21世紀的電視標準”,它在MPEG-1的基礎(chǔ)上作了許多重要的擴展和改進,但基本算法和MPEG-1相同。
MPEG-4
MPEG-4標準并非是MPEG-2的替代品,它著眼于不同的應(yīng)用領(lǐng)域。MPEG-4的制定初衷主要針對視頻會議、可視電話超低比特率壓縮(小于64Kb/s)的需求。在制定過程中,MPEG組織深深感受到人們對媒體信息,特別是對視頻信息的需求由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索和操作。
MPEG-4與前面提到的JPEG、MPEG-1/2有很大的不同,它為多媒體數(shù)據(jù)壓縮編碼提供了更為廣闊的平臺,它定義的是一種格式、一種框架,而不是具體算法,它希望建立一種更自由的通信與開發(fā)環(huán)境。于是MPEG-4新的目標就是定義為:支持多種多媒體的應(yīng)用,特別是多媒體信息基于內(nèi)容的檢索和訪問,可根據(jù)不同的應(yīng)用需求,現(xiàn)場配置解碼器。編碼系統(tǒng)也是開放的,可隨時加入新的有效的算法模塊。應(yīng)用范圍包括實時視聽通信、多媒體通信、遠地監(jiān)測/監(jiān)視、VOD、家庭購物/娛樂等。
JVT:新一代的視頻壓縮標準
JVT是由ISO/IEC MPEG和ITU-T VCEG成立的聯(lián)合視頻工作組(Joint Video Team),致力于新一代數(shù)字視頻壓縮標準的制定。
JVT標準在ISO/IEC中的正式名稱為:MPEG-4 AVC(part10)標準;在ITU-T中的名稱:H.264(早期被稱為H.26L)
H264/AVC
H264集中了以往標準的優(yōu)點,并吸收了以往標準制定中積累的經(jīng)驗, 采用簡潔設(shè)計,使它比MPEG4更容易推廣。H.264創(chuàng)造性了多參考幀、多塊類型、整數(shù)變換、幀內(nèi)預(yù)測等新的壓縮技術(shù),使用了更精細的分象素運動矢量(1/4、1/8)和新一代的環(huán)路濾波器,使得壓縮性能大大提高,系統(tǒng)更加完善。
H.264主要有以下幾大優(yōu)點:
- 高效壓縮:與H.263+和MPEG4 SP相比,減小50%比特率
- 延時約束方面有很好的柔韌性
- 容錯能力
- 編/解碼的復(fù)雜性可伸縮性
- 解碼全部細節(jié):沒有不匹配
- 高質(zhì)量應(yīng)用
- 網(wǎng)絡(luò)友善
二、監(jiān)控中的視頻編碼技術(shù):
目前監(jiān)控中主要采用MJPEG、MPEG1/2、MPEG4(SP/ASP)、H.264/AVC等幾種視頻編碼技術(shù)。對于最終用戶來言他最為關(guān)心的主要有:清晰度、存儲量(帶寬)、穩(wěn)定性還有價格。采用不同的壓縮技術(shù),將很大程度影響以上幾大要素。
MJPEG
MJPEG(Motion JPEG)壓縮技術(shù),主要是基于靜態(tài)視頻壓縮發(fā)展起來的技術(shù),它的主要特點是基本不考慮視頻流中不同幀之間的變化,只單獨對某一幀進行壓縮。
MJPEG壓縮技術(shù)可以獲取清晰度很高的視頻圖像,可以動態(tài)調(diào)整幀率、分辨率。但由于沒有考慮到幀間變化,造成大量冗余信息被重復(fù)存儲,因此單幀視頻的占用空間較大,目前流行的MJPEG技術(shù)最好的也只能做到3K字節(jié)/幀,通常要8~20K!
MPEG-1/2
MPEG-1標準主要針對SIF標準分辨率(NTSC制為352X240;PAL制為352X288)的圖像進行壓縮. 壓縮位率主要目標為1.5Mb/s.較MJPEG技術(shù),MPEG1在實時壓縮、每幀數(shù)據(jù)量、處理速度上有顯著的提高。但MPEG1也有較多不利地方:存儲容量還是過大、清晰度不夠高和網(wǎng)絡(luò)傳輸困難。
MPEG-2 在MPEG-1基礎(chǔ)上進行了擴充和提升,和MPEG-1向下兼容,主要針對存儲媒體、數(shù)字電視、高清晰等應(yīng)用領(lǐng)域,分辨率為:低(352x288),中(720x480),次高(1440x1080),高(1920x1080)。MPEG-2視頻相對MPEG-1提升了分辨率,滿足了用戶高清晰的要求,但由于壓縮性能沒有多少提高,使得存儲容量還是太大,也不適和網(wǎng)絡(luò)傳輸。
MPEG-4
MPEG-4視頻壓縮算法相對于MPEG-1/2在低比特率壓縮上有著顯著提高,在CIF(352*288)或者更高清晰度(768*576)情況下的視頻壓縮,無論從清晰度還是從存儲量上都比MPEG1具有更大的優(yōu)勢,也更適合網(wǎng)絡(luò)傳輸。另外MPEG-4可以方便地動態(tài)調(diào)整幀率、比特率,以降低存儲量。
MPEG-4由于系統(tǒng)設(shè)計過于復(fù)雜,使得MPEG-4難以完全實現(xiàn)并且兼容,很難在視頻會議、可視電話等領(lǐng)域?qū)崿F(xiàn),這一點有點偏離原來地初衷。另外對于中國企業(yè)來說還要面臨高昂的專利費問題,目前規(guī)定:
- 每臺解碼設(shè)備需要交給MPEG-LA 0.25美元
- 編碼/解碼設(shè)備還需要按時間交費(4美分/天=1.2美元/月 =14.4美元/年)
H.264/AVC
H.264集中了以往標準的優(yōu)點,在許多領(lǐng)域都得到突破性進展,使得它獲得比以往標準好得多整體性能:
- 和H.263+和MPEG-4 SP相比最多可節(jié)省50%的碼率,使存儲容量大大降低;
- H.264在不同分辨率、不同碼率下都能提供較高的視頻質(zhì)量;
- 采用“網(wǎng)絡(luò)友善”的結(jié)構(gòu)和語法,使其更有利于網(wǎng)絡(luò)傳輸。
H.264采用簡潔設(shè)計,使它比MPEG4更容易推廣,更容易在視頻會議、視頻電話中實現(xiàn),更容易實現(xiàn)互連互通,可以簡便地和G.729等低比特率語音壓縮組成一個完整的系統(tǒng)。
MPEG LA吸收MPEG-4的高昂專利費而使它難以推廣的教訓,MPEG LA制定了以下低廉的H.264收費標準:H.264廣播時基本不收費;產(chǎn)品中嵌入H.264編/解碼器時,年產(chǎn)量10萬臺以下不收取費,超過10萬臺每臺收取0.2美元,超過500萬臺每臺收取0.1美元。低廉的專利費使得中國H.264監(jiān)控產(chǎn)品更容易走向世界。
監(jiān)控中視頻編碼分辨率的選擇
目前監(jiān)控行業(yè)中主要使用以下分辨率:SQCIF、QCIF、CIF、4CIF。
SQCIF和QCIF的優(yōu)點是存儲量低,可以在窄帶中使用,使用這種分辨率的產(chǎn)品價格低廉;缺點是圖像質(zhì)量往往很差、不被用戶所接受。
CIF是目前監(jiān)控行業(yè)的主流分辨率,它的優(yōu)點是存儲量較低,能在普通寬帶網(wǎng)絡(luò)中傳輸,價格也相對低廉,它的圖像質(zhì)量較好,被大部分用戶所接受。缺點是圖像質(zhì)量不能滿足高清晰的要求。
4CIF是標清分辨率,它的優(yōu)點是圖像清晰。缺點是存儲量高,網(wǎng)絡(luò)傳輸帶寬要求很高,價格也較高。
分辨率新的選擇-528x384
2CIF(704x288)已被部分產(chǎn)品采用,用來解決CIF清晰度不夠高和4CIF存儲量高、價格高昂的缺點。但由于704x288只是水平分辨率的提升,圖像質(zhì)量提高不是特別明顯。
經(jīng)過測試,我們發(fā)現(xiàn)另外一種2CIF分辨率528x384,比704x288能更好解決CIF、4CIF的問題。特別是在512Kbps-1Mbps碼率之間,能獲得穩(wěn)定的高質(zhì)量圖像,滿足用戶較高圖像質(zhì)量的要求。目前這一分辨率已被許多網(wǎng)絡(luò)多媒體廣播所采用,被廣大用戶所接受。比如杭州網(wǎng)通網(wǎng)上影院是采用512x384分辨率,在768k下能穩(wěn)定地獲得近似DVD的圖像質(zhì)量。
監(jiān)控中實現(xiàn)視頻編碼的最佳方式
目前視頻編碼正處于一個技術(shù)日新月異的時期,視頻編碼的壓縮性能在不斷得到提升。
在監(jiān)控中主要使用ASCI和DSP兩種方案。由于ASIC芯片的設(shè)計、生產(chǎn)周期過長,使它已跟不上視頻編碼的發(fā)展速度。而DSP芯片,由于它的通用設(shè)計,使它能實現(xiàn)各種視頻編碼算法,并且可以及時更新視頻編碼器,緊跟視頻編碼的發(fā)展速度。另外使用DSP芯片可以比ASIC更靈活的配置編碼器,使編碼器達到最佳性能。
??低暜a(chǎn)品目前達到的技術(shù)水準
海康威視產(chǎn)品采用最先進的H.264視頻壓縮算法和高性能的DSP處理器。
強大的H.264視頻壓縮引擎使產(chǎn)品獲得極高的壓縮比、高質(zhì)量的圖像質(zhì)量和良好的網(wǎng)絡(luò)傳輸性能。高性能的DSP處理器能靈活的配置視頻編/解碼器:動態(tài)設(shè)置分辨率、幀率、碼率、圖像質(zhì)量等;可以雙碼流輸出,達到本地存儲和網(wǎng)絡(luò)傳輸分別處理的功能。
使用TM130X DSP的產(chǎn)品,單個芯片能實時壓縮一路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。
使用DM642 DSP的產(chǎn)品,單個芯片能實時壓縮4路以下分辨率的視頻:SQCIF、QCIF、CIF、2CIF(PAL:704x288或528x384)。單個芯片能實時壓縮2路4CIF視頻。
電視節(jié)目制作數(shù)字網(wǎng)絡(luò)化已成為大家關(guān)心的熱點,其中重要的技術(shù)之一是數(shù)字視頻壓縮。運動圖像專家組(MPEG)是ISO/IEC的一個工作組,負責開發(fā)運動圖像、聲頻及其混合信息的壓縮、解壓縮、處理和編碼表示方面的國際標準。MPEG已經(jīng)制定了MPEG-1、MPEG-2和MPEG-4標準。MPEG-1和MPEG-2已廣泛應(yīng)用在多媒體工業(yè),例如數(shù)字電視、CD、視頻點播、歸檔、因特網(wǎng)上的音樂等等。MPEG-4主要用于64 kb/s以下的低速率音視頻編碼,以使用于窄帶多媒體通信等領(lǐng)域。MPEG目前正在制定MPEG-7和MPEG-21。但M-JPEG、MPEG-2和DV三大壓縮技術(shù)已占據(jù)著當今視頻壓縮技術(shù)的主要地位,呈現(xiàn)互不替代,激烈競爭,共同發(fā)展的狀態(tài)。
M-JPEG和DV均采用幀內(nèi)壓縮方式,壓縮效率要比MPEG-2低。在低碼率的時候,MPEG-2可以提供比M-JPEG高的壓縮比而保持較好的圖像質(zhì)量;在要求高圖像質(zhì)量的時候(比如節(jié)目編輯和后期制作),MPEG-2與M-JPEG、DV的輸出碼率差別要小得多。電視臺業(yè)務(wù)的多樣性要求壓縮標準能提供多種碼率。可變碼率(VBR)特性對電視臺有效利用資源非常重要。MPEG-2可以通過改變GOP結(jié)構(gòu)和DCT及霍夫曼編碼的參數(shù)來調(diào)整輸出碼率;M-JPEG可以通過改變DCT及霍夫曼編碼參數(shù)調(diào)節(jié)壓縮比;DV格式因其應(yīng)用特點,沒有提供VBR。M-JPEG發(fā)展較早,在非線性視頻編輯方面應(yīng)用多年,軟、硬件技術(shù)成熟,成本低廉,以目前硬件平臺而言,平均比MPEG-2平臺便宜5000美元左右。目前,M-JPEG、DV和MPEG-2三個標準各有長處,設(shè)備都獲得了廣泛使用。日本和北美大多用DV格式進行后期制作;EBU在1999年的D84、D85技術(shù)聲明中推薦電視臺在演播室使用50
Mb/s的純I幀4:2:2P MPEG-2;而中國在廣泛使用M-JPEG的同時熱烈討論MPEG-2 IBP格式的編輯。
下面針對現(xiàn)今在電視臺數(shù)字化網(wǎng)絡(luò)中主要應(yīng)用的兩種視頻壓縮技術(shù),即M-JPEG和MPEG-2做一下對比。最后對MPEG-7作簡單概述。
M-JPEG是針對活動圖像而優(yōu)化的JPEG壓縮而稱。而JPEG是針對一幀圖像DCT變換來對圖像數(shù)據(jù)進行壓縮,通過對電視數(shù)字信號(4:2:2數(shù)據(jù))的每一幀進行JPEG壓縮。由于電視編輯、特技制作均需要以幀為基本單位,所以對以幀為單元進行壓縮(幀內(nèi)壓縮)的M-JPEG格式被成功地用于數(shù)字視頻系統(tǒng),特別是數(shù)字非線性節(jié)目編輯系統(tǒng)。目前我國非線性編輯系統(tǒng)大都采用4:1 M-JPEG壓縮,被認為是可以接受的廣播級水平。當PAL制4:2:2數(shù)字信號采用4:1壓縮時,其數(shù)據(jù)率是5 MB/s(40M b/s), 每小時視頻節(jié)目占用18
GB存儲空間。由于M-JPEG是幀內(nèi)壓縮方式,可以提供精確到幀的隨機存取訪問,不附帶任何的訪問延遲,能夠?qū)崿F(xiàn)精確到幀的節(jié)目編輯。 所謂MPEG-2壓縮是根據(jù)運動圖像相鄰幀之間有一定的相似性原則,通過運動預(yù)測,參考前一幀圖像與這一幀圖像的相似情況,去掉與前一幀相似的冗余數(shù)據(jù),而只記錄這一幀與上一幀不同的數(shù)據(jù),從而大大提高了視頻數(shù)據(jù)的壓縮效率,這種壓縮方法也稱為幀相關(guān)壓縮。因為采用運動預(yù)測幀相關(guān)的壓縮方式,針對視頻壓縮有很好的效果,在獲得廣播級數(shù)字視頻質(zhì)量的前提下,可以實現(xiàn)20:1的壓縮效率,數(shù)據(jù)率可降至1
MB/s(8M b/s),一小時視頻節(jié)目占用3.6 GB空間。數(shù)據(jù)存儲空間利用率高,網(wǎng)絡(luò)傳輸效率是M-JPEG系統(tǒng)的5倍以上。這給基于MPEG-2壓縮視頻的存儲、傳輸、編輯、播出帶來極大的好處,在存儲方面可以大大節(jié)約存儲體成本,并能引入各種類型的存儲介質(zhì),如硬盤、光盤、數(shù)據(jù)磁帶以及存儲器芯片等。
但由于MPEG-2格式只有一個完整的幀,即I幀,所以在電視需要幀精確地進行剪接時會帶來一定的困難,需要硬件板卡或軟件系統(tǒng)的支持。MPEG-2在壓縮方面有幀內(nèi)壓縮和幀間壓縮兩種方式,使用三種類型的圖像,即I幀、P幀和B幀。I幀使用幀內(nèi)壓縮,不使用運動補償,提供中等壓縮比。由于I幀不依賴其它幀,所以是隨機存取的入點,同時是解碼的基準幀。P幀根據(jù)前面的I幀或P幀進行預(yù)測,使用運動補償算法進行壓縮,壓縮比要比I幀高。P幀是對B幀和后繼P幀進行解碼的基準幀。它本身有誤差,會造成誤差傳播。B幀是基于內(nèi)插重建的幀,它基于前后兩個IP幀或PP幀,不傳播誤差。它使用雙向預(yù)測進行壓縮,提供更高的壓縮比。目前各硬件板卡廠商正在抓緊開發(fā),以解決基于MPEG-2的IBP幀編輯,目前國內(nèi)很多公司如奧維迅、索貝、大洋已經(jīng)用軟件解決了IBP幀精確編輯的問題,使MPEG-2格式應(yīng)用到電視節(jié)目的制作、傳輸、存儲、播出,構(gòu)架全電視臺的數(shù)字化網(wǎng)絡(luò)系統(tǒng)成為可能。
1996年10月,運動圖像專家組開始著手一項新的研究課題來解決多媒體內(nèi)容描述的問題,即多媒體內(nèi)容描述接口(簡稱MPEG-7)。MPEG-7將擴大現(xiàn)今在識別內(nèi)容方面存在的能力限制,將包括更多的數(shù)據(jù)類型。MPEG-7的目標是支持多種音頻和視覺的描述,包括自由文本、N維時空結(jié)構(gòu)、統(tǒng)計信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對于視覺信息,描述將包括顏色、視覺對象、紋理、草圖、形狀、體積、空間關(guān)系、運動及變形等。
MPEG-7的目標是根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對信息的需求。以視覺內(nèi)容為例,較低抽象層將包括形狀、尺寸、紋理、顏色、運動(軌道)和位置的描述。對于音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。MPEG-7的目標是支持數(shù)據(jù)管理的靈活性、數(shù)據(jù)資源的全球化和互操作性。
對于未來的多媒體服務(wù),必須將內(nèi)容的表示和描述共同來考慮,也就是說,許多涉及內(nèi)容表示的服務(wù)必須要首先處理內(nèi)容描述。利用MPEG-7 描述可用的音視信息,大家就能快速找到我們想要的信息,可以更加自由的與多媒體內(nèi)容交互及重新使用音視信息的內(nèi)容,或以新的方式將這些內(nèi)容的某些成分結(jié)合起來使用。
編解碼技術(shù)在過去十年中不斷改進。最新的編解碼技術(shù)(H.264/AVC與VC-1)代表著第三代視頻壓縮技術(shù)。為具體應(yīng)用選擇正確的編解碼器并優(yōu)化其實時實施仍然是一項巨大的挑戰(zhàn),最佳的設(shè)計必須權(quán)衡壓縮效率及可用的計算能力。 ……
視頻壓縮是所有令人振奮的、新型視頻產(chǎn)品的重要動力。為具體應(yīng)用選擇正確的編解碼器并優(yōu)化其實時處理仍然是一項巨大的挑戰(zhàn)。最佳的設(shè)計必須權(quán)衡壓縮效率及可用的計算能力。此外,如何在計算能力有限的情況下獲得最佳壓縮效率也是一門大學問。
數(shù)字視頻的主要挑戰(zhàn)在于原始或未壓縮的視頻需要存儲或傳輸大量數(shù)據(jù)。例如,標準清晰度的 NTSC 視頻的數(shù)字化一般是每秒 30 幀速率,采用 4:2:2 YCrCb 及 720×480,其要求超過 165Mbps 的數(shù)據(jù)速率。保存 90 分鐘的視頻需要 110GB 空間,或者說超過標準 DVD-R 存儲容量的 25 倍。即使是視頻流應(yīng)用中常用的低分辨率視頻(如CIF:352×288 4:2:0、30 幀/秒)也需要超過 36.5Mbps 的數(shù)據(jù)速率,這是 ADSL 或 3G 無線等寬帶網(wǎng)絡(luò)速度的許多倍。目前的寬帶網(wǎng)可提供
1~10Mbps 的持續(xù)傳輸能力,顯然數(shù)字視頻的存儲或傳輸需要采用壓縮技術(shù)。
視頻壓縮的目的是對數(shù)字視頻進行編碼——在保持視頻質(zhì)量的同時占用盡可能少的空間。編解碼技術(shù)理論依據(jù)為信息理論的數(shù)學原理。不過,開發(fā)實用的編解碼技術(shù)需要藝術(shù)性的精心考慮。
壓縮權(quán)衡
在選擇數(shù)字視頻系統(tǒng)的編解碼技術(shù)時需要考慮諸多因素。主要因素包括應(yīng)用的視頻質(zhì)量要求、傳輸通道或存儲介質(zhì)所處的環(huán)境(速度、時延、錯誤特征)以及源內(nèi)容的格式。同樣重要的還有預(yù)期分辨率、目標比特率、色彩深度、每秒幀數(shù)以及內(nèi)容和顯示是逐行掃描還是隔行掃描。壓縮通常需要在應(yīng)用的視頻質(zhì)量要求與其他需求之間做出取舍。首先,用途是存儲還是單播、多播、雙向通信或廣播?對于存儲應(yīng)用,到底有多少可用的存儲容量以及存儲時間需要多久?對于存儲之外的應(yīng)用,最高比特率是多少?對于雙向視頻通信,時延容差或容許的端到端系統(tǒng)延遲是多少?如果不是雙向通信,內(nèi)容需要在脫機狀態(tài)提前完成編碼還是需要實時編碼?網(wǎng)絡(luò)或存儲介質(zhì)的容錯能力如何?根據(jù)基本目標應(yīng)用,不同壓縮標準以不同方式處理這些問題的權(quán)衡。
另一方面是需要權(quán)衡編解碼實時處理的成本。如 H.264/AVC 或 WMV9/VC-1等能夠?qū)崿F(xiàn)較高壓縮比的新算法需要更高的處理能力,這會影響編解碼器件的成本、系統(tǒng)功耗以及系統(tǒng)內(nèi)存。
……
標準對編解碼技術(shù)的普及至關(guān)重要。出于規(guī)模經(jīng)濟原因,用戶根據(jù)可承受的標準尋找相應(yīng)產(chǎn)品。由于能夠保障廠商之間的互操作性,業(yè)界樂意在標準方面進行投資。而由于自己的內(nèi)容可以獲得較長的生命周期及廣泛的需求,內(nèi)容提供商也對標準青睞有加。盡管幾乎所有視頻標準都是針對少數(shù)特定應(yīng)用的,但是在能夠適用的情況下,它們在其他應(yīng)用中也能發(fā)揮優(yōu)勢。
為了實現(xiàn)更好的壓縮及獲得新的市場機遇,ITU與 MPEG 一直在不斷發(fā)展壓縮技術(shù)和開發(fā)新標準。中國最近開發(fā)了一種稱為 AVS 的國家視頻編碼標準,我們在后面也會做一介紹。目前正在開發(fā)的標準包括 ITU/MPEG 聯(lián)合可擴展視頻編碼 (Joint Scalable Video Coding)(對 H264/ AVC 的修訂)和MPEG 多視角視頻編碼 (Multi-view Video Coding)。另外,為了滿足新的應(yīng)用需求,現(xiàn)有標準也在不斷發(fā)展。例如,H.264 最近定義了一種稱為高精度拓展 (Fidelity
Range Extensions) 的新模式,以滿足新的市場需求,如專業(yè)數(shù)字編輯、HD-DVD 與無損編碼等。
…………視頻壓縮正在市場中催生數(shù)量日益增長的數(shù)字視頻產(chǎn)品。采用數(shù)字視頻壓縮技術(shù)的終端設(shè)備范圍廣泛,從電池驅(qū)動的便攜設(shè)備到高性能基礎(chǔ)設(shè)備。
數(shù)字視頻的最佳處理器解決方案取決于具體的目標應(yīng)用。TI 擁有可支持多種標準并滿足主要設(shè)計及系統(tǒng)約束需求的各種 DSP。TI的解決方案范圍廣泛,其中包括低功耗 C5000 DSP與移動OMAP 應(yīng)用處理器、高性能C6000 DSP 與視頻優(yōu)化的高性能 DM64x 和 DM644x 數(shù)字媒體處理器。
德州儀器 (TI) 的DM 列處理器專門針對高端視頻系統(tǒng)的需求而設(shè)計。該系列的最新處理器是功能強大的 DM6446[15],其采用了TI的達芬奇 (DaVinci)技術(shù)[16]。DM6446的雙內(nèi)核架構(gòu)兼具DSP和RISC技術(shù)優(yōu)勢,集成了時鐘頻率達594MHz 的c64x+ DSP內(nèi)核與ARM926EJ-S內(nèi)核。新一代c64x+ DSP 是 TMS320C6000(tm) DSP 平臺中性能最高的定 DSP,并建立在TI開發(fā)的第二代高性能高級VLIW架構(gòu)的增強版之上。c64x+與前代C6000 DSP平臺代碼兼容。DM644x等可編程數(shù)字媒體處理器可以支持所有的現(xiàn)有業(yè)界標準以及采用單個可編程數(shù)字媒體處理器的專有視頻格式。DM6446
還具有片上內(nèi)存,包括一個2級高速緩存和眾多具有視頻專用功能的外設(shè)。DM6446 還包含一種視頻/影像協(xié)處理器 (VICP),用于減輕相關(guān)算法(如:JPEG、H.264、MPEG4 與 VC-1)的 DSP 內(nèi)核繁重的視頻與影像處理負擔,從而使更多的 DSP MIPS能夠用于視頻后處理或者其他并行運行等功能。
壓縮標準規(guī)定需要的語法與可用的工具,不過許多算法結(jié)果取決于具體實施情況。主要變量包括:比特率控制算法、單通道與多通道編碼、I/B/P 幀比率、運動搜索范圍、運動搜索算法、以及選用的個別工具與模式。這種靈活性允許我們在計算負載和改進質(zhì)量之間做出不同取舍。顯然所有編碼器都可以采用或高或低的頻率實現(xiàn)不同的視頻質(zhì)量水平。
越來越多的視頻壓縮標準可以針對具體最終應(yīng)用提供越來越高的壓縮效率和越來越豐富的工具。另外,向網(wǎng)絡(luò)化連接發(fā)展的趨勢意味著許多產(chǎn)品越來越需要支持多種標準。多種標準和專有算法的流行也使我們難以選擇單個標準,尤其是在硬件決策經(jīng)常超前于產(chǎn)品部署的情況下。不僅如此,每個視頻編碼算法都提供豐富的工具與功能選擇,以平衡壓縮效率的復(fù)雜性。工具和功能的選擇是與特定應(yīng)用和用例息息相關(guān)的重復(fù)過程。由于必須支持的編解碼器數(shù)量的增多以及針對具體解決方案和應(yīng)用而對編解碼器進行優(yōu)化的選擇范圍更為廣泛,因此在數(shù)字視頻系統(tǒng)中采用靈活的媒體處理器是大勢所趨。DM6446等數(shù)字媒體處理器可充分滿足性能處理需求同時架構(gòu)靈活,從而能夠快速把新標準實施推向市場,其中包括:H.264、AVS
與 WMV9。我們可以在標準定義階段實施算法并且保持軟件算法與工具的更新,從而緊隨標準大大小小的修改并且滿足應(yīng)用不斷變化的質(zhì)量需求。
.視頻壓縮標準
一、 視頻壓縮標準介紹:
視頻編碼標準主要由ITU-T和ISO/IEC開發(fā)。前者已經(jīng)發(fā)布了視頻會議標準H.261、 H.262、H.263,并且準備進行遠期編碼標準H.263L的開發(fā),以期望獲得更大的編碼效率。ISO/IEC的標準系列是大家熟悉的MPEG家族。包括:
(1)MPEG-1(1988~1992),可以提供最高達1.5Mbps的數(shù)字視頻,只支持逐行掃描;
(2)MPEG-2(1990~1994),支持的帶寬范圍從2Mbps到超過20Mbps,MPEG-2后向兼容MPEG-1,但增加了對隔行掃描的支持,并有更大的伸縮性和靈活性;
(3)MPEG-4(1994~1998),支持逐行掃描和隔行掃描,是基于視頻對象的編碼標準,通過對象識別提供了空間的可伸縮性;
(4)MPEG-7(1996~2000),是多媒體內(nèi)容描述接口,與前述標準集中在音頻/視頻內(nèi)容的編碼和表示不同,它集中在對多媒體內(nèi)容的描述。
除了上述通用標準外,還存在很多專用格式,比較流行的有:C-Cube的M-JPEG、Intel的IVI(tm)(Indeo Video Interactive)、Apple的QuickTime(tm)、Microsoft的 Media Player(tm)和RealNetworks的RealPlayer(tm)。
二 數(shù)字視頻傳輸 :
根據(jù)承載網(wǎng)絡(luò)的變化和視頻服務(wù)的區(qū)別,可以將數(shù)字視頻的傳輸分為四類:數(shù)字電視、寬帶視頻通信、Internet視頻流通信、蜂窩移動視頻通信。
雖然這四種通信體系下對視頻通信的協(xié)議和服務(wù)有不同的要求,但對于實時應(yīng)用下述幾點是必須滿足的:(1)傳輸必須限制在一定時限內(nèi)完成;(2)必須對端到端的抖動建議限制;(3)必須有相應(yīng)的同步機制;(4)在分組網(wǎng)絡(luò)中應(yīng)當有較高的優(yōu)先級。
1 數(shù)字電視廣播
歐洲走在了全球DVB開發(fā)最前面,將其采納為數(shù)字電視DTV的標準;在美國,ATSC采用了HDTV;在亞太地區(qū),日本采用了基于DVB和ATSC的ISDB-T,澳大利亞采用了DVB,韓國則采用了ATSC標準,我國也在制定數(shù)字電視的標準,并進行了現(xiàn)場試驗。下面我們以歐洲的DTV標準為主分別介紹DTV系統(tǒng)規(guī)范和傳輸技術(shù)。
a.DTV系統(tǒng)規(guī)范
根據(jù)傳輸系統(tǒng)的不同,DTV系統(tǒng)分為三類:陸基系統(tǒng) DTV-T、衛(wèi)星系統(tǒng) DTV-S、有線系統(tǒng) DTV-C。這三類DTV系統(tǒng)雖然各有不同,但也有公共的特性,MPEG-2視頻和音頻編碼系統(tǒng)是所有DTV系統(tǒng)的基礎(chǔ)。系統(tǒng)采用MPEG-2將數(shù)據(jù)壓縮并組裝成分組,稱為凈荷。對凈荷采用Reed-Solomon前向糾錯編碼,降低信號傳輸中引入的誤碼。
衛(wèi)星系統(tǒng)采用單載波信號,采用外部編碼的同時,內(nèi)部加入了打孔卷積編碼,從而又增加了一層誤碼糾錯能力,根據(jù)帶寬的變化和采用的特定設(shè)備,編碼數(shù)據(jù)是可調(diào)整的,信號采用QPSK方式調(diào)制。
陸基系統(tǒng)聯(lián)合使用碼正交頻分復(fù)用 COFDM或者QPSK或QAM進行射頻調(diào)制,采用了和衛(wèi)星系統(tǒng)相似的打孔卷積編碼。
有線系統(tǒng)采用了QAM調(diào)制方案,不需要附加的內(nèi)部編碼來降低誤碼,系統(tǒng)優(yōu)化采用64-QAM。
b. DTV系統(tǒng)傳輸結(jié)構(gòu)
DTV系統(tǒng)廣播和接收的基本結(jié)構(gòu)由三個子系統(tǒng)構(gòu)成:
(1)信源編碼和壓縮子系統(tǒng),通過ADC接受模擬視頻和音頻信號并將其轉(zhuǎn)換成數(shù)字比特流,然后通過MPEG-2進行壓縮,并加入控制和輔助數(shù)據(jù);
(2)服務(wù)復(fù)用和傳遞子系統(tǒng),復(fù)用將視頻和音頻及輔助數(shù)據(jù)流聯(lián)合構(gòu)成長188字節(jié)的分組,并加上標記,分組構(gòu)成單個數(shù)據(jù)流,采用MPEG-2傳遞系統(tǒng)語法控制這些復(fù)用任務(wù);
(3)傳輸子系統(tǒng),包括對復(fù)用數(shù)據(jù)流的信道編碼和調(diào)制。
2 寬帶視頻通信
這里討論的寬帶視頻通信主要是指基于寬帶核心網(wǎng)絡(luò)和寬帶接入技術(shù)的MPEG-2視頻通信。為了滿足實時視頻通信對帶寬的需求,核心網(wǎng)絡(luò)通常采用寬帶光纖網(wǎng)絡(luò),可以是ATM或者基于MPLS的寬帶IP與ATM的結(jié)合,最后一公里的寬帶接入的方法有光纖到戶、光纖到樓雙絞線到戶及ADSL,最近也提出了寬帶無線接入技術(shù)。通常,來自多個鏈路的數(shù)據(jù)業(yè)務(wù)在數(shù)字用戶線路接入復(fù)用器(DSLAM)匯總。DSLAM將ATM業(yè)務(wù)路由到家中的ADSL接收器單元,同時,濾掉低頻段的舊電話業(yè)務(wù)POTS 。在MPEG-2視頻的情形下,ATM邊界設(shè)備減輕信元的時延抖動的能力至關(guān)重要。ATM必須應(yīng)付數(shù)據(jù)傳輸?shù)男枰⑻峁┕芾砻總€視頻流的功能,特別要滿足按序提取視頻分組的要求。為了補償網(wǎng)絡(luò)傳輸延時,ATM網(wǎng)絡(luò)邊界設(shè)備必須精心設(shè)計以處理MPEG交換和抖動管理。本地MPEG-2視頻流通過數(shù)字視頻廣播異步串行接口傳輸。ATM邊界設(shè)備將MPEG-2多節(jié)目傳輸流(MPTS)或單節(jié)目傳輸流(SPTS)拆解到節(jié)目層并最終到分組標記(PID)層。在PID層,不同的節(jié)目流可以重新排序并復(fù)用進另外的MPTS。在ATM邊界接收端,另外的邊界設(shè)備管理ATM信元流,并重構(gòu)SPTS或MPTS。本地的服務(wù)分布網(wǎng)絡(luò)負責在本地的UTP網(wǎng)絡(luò)分發(fā)視頻內(nèi)容。功能強大的MPEG-2壓縮算法結(jié)合智能的ATM邊界設(shè)備允許最后接入利用DSL技術(shù)作為視頻分發(fā)的接入機制。(未完待續(xù))
3、相關(guān)信息:
1.前言
數(shù)字視頻產(chǎn)品需求近些年出現(xiàn)猛增。主流應(yīng)用包括視頻通信、安全監(jiān)控與工業(yè)自動化,而最熱門的要算娛樂應(yīng)用,如 DVD、HDTV、衛(wèi)星電視、高清 (HD) 機頂盒、因特網(wǎng)視頻流、數(shù)碼相機與 HD 攝像機、視頻光盤庫 (video jukebox)、高端顯示器(LCD、等離子顯示器、DLP)以及個人攝像機等。眾多精彩的新應(yīng)用目前也處于設(shè)計或前期部署中,例如針對家庭與手持設(shè)備及地面/衛(wèi)星標準(DVB-T、DVB-H、DMB)的高清 DVD(藍光/HD-DVD)和數(shù)字視頻廣播、高清視頻電話、數(shù)碼相機以及 IP
機頂盒。由于手持終端計算能力的提高以及電池技術(shù)與高速無線連接的發(fā)展,最終產(chǎn)品的移動性與集成性也在不斷提高。
視頻壓縮是所有令人振奮的、新型視頻產(chǎn)品的重要動力。壓縮-解壓(編解碼)算法可以實現(xiàn)數(shù)字視頻的存儲與傳輸。典型的編解碼器要么采用行業(yè)標準,如 MPEG2、MPEG4、H.264/AVC 與 AVS,要么采用專有算法,如 On2、Real Video、Nancy與Windows Media Video (WMV) 等。WMV 是個例外——它最初是微軟公司的專有算法,而現(xiàn)在則以 VC-1 的新名稱在業(yè)界實現(xiàn)了標準化。編解碼技術(shù)在過去十年中不斷改進。最新的編解碼技術(shù)(H.264/AVC 與 VC-1)代表著第三代視頻壓縮技術(shù)。這兩種編解碼技術(shù)利用如可編程
DSP 與ASIC 等低成本 IC 的處理能力,都能夠達到極高的壓縮比。不過,為具體應(yīng)用選擇正確的編解碼器并優(yōu)化其實時處理仍然是一項巨大的挑戰(zhàn)。最佳的設(shè)計必須權(quán)衡壓縮效率及可用的計算能力。此外,如何在計算能力有限的情況下獲得最佳壓縮效率也是一門大學問。
在本文中,我們首先概述視頻編碼的主要概念,同時介紹傳統(tǒng)壓縮標準。然后我們重點介紹其中包括 H.264/AVC、WMV9/VC-1與AVS 等在內(nèi)的最新編解碼技術(shù)的功能,此外,還將深入探討壓縮能力與復(fù)雜性之間的權(quán)衡。最后,討論市場中可能會影響主流視頻編解碼器未來的實時處理與主要趨勢。
數(shù)字視頻的主要挑戰(zhàn)在于原始或未壓縮的視頻需要存儲或傳輸大量數(shù)據(jù)。例如,標準清晰度的 NTSC 視頻的數(shù)字化一般是每秒 30 幀速率,采用 4:2:2 YcrCb 及 720(480,其要求超過 165Mbps 的數(shù)據(jù)速率。保存 90 分鐘的視頻需要 110GB 空間,或者說超過標準 DVD-R 存儲容量的 25 倍。即使是視頻流應(yīng)用中常用的低分辨率視頻(如:CIF:352x288 4:2:0、30 幀/秒)也需要超過 36.5Mbps 的數(shù)據(jù)速率,這是 ADSL 或 3G 無線等寬帶網(wǎng)絡(luò)速度的許多倍。目前的寬帶網(wǎng)可提供
1~10Mbps 的持續(xù)傳輸能力。顯然數(shù)字視頻的存儲或傳輸需要采用壓縮技術(shù)。
視頻壓縮的目的是對數(shù)字視頻進行編碼——在保持視頻質(zhì)量的同時占用盡可能少的空間。編解碼技術(shù)理論依據(jù)為信息理論的數(shù)學原理。不過,開發(fā)實用的編解碼技術(shù)需要藝術(shù)性的精心考慮。
4. 壓縮權(quán)衡
在選擇數(shù)字視頻系統(tǒng)的編解碼技術(shù)時需要考慮諸多因素。主要因素包括應(yīng)用的視頻質(zhì)量要求、傳輸通道或存儲介質(zhì)所處的環(huán)境(速度、時延、錯誤特征)以及源內(nèi)容的格式。同樣重要的還有預(yù)期分辨率、目標比特率、色彩深度、每秒幀數(shù)以及內(nèi)容和顯示是逐行掃描還是隔行掃描。壓縮通常需要在應(yīng)用的視頻質(zhì)量要求與其他需求之間做出取舍。首先,用途是存儲還是單播、多播、雙向通信或廣播?對于存儲應(yīng)用,到底有多少可用的存儲容量以及存儲時間需要多久?對于存儲之外的應(yīng)用,最高比特率是多少?對于雙向視頻通信,時延容差或容許的端到端系統(tǒng)延遲是多少?如果不是雙向通信,內(nèi)容需要在脫機狀態(tài)提前完成編碼還是需要實時編碼?網(wǎng)絡(luò)或存儲介質(zhì)的容錯能力如何?根據(jù)基本目標應(yīng)用,不同壓縮標準以不同方式處理這些問題的權(quán)衡。
另一方面是需要權(quán)衡編解碼實時處理的成本。如 H.264/AVC 或 WMV9/VC-1等能夠?qū)崿F(xiàn)較高壓縮比的新算法需要更高的處理能力,這會影響編解碼器件的成本、系統(tǒng)功耗以及系統(tǒng)內(nèi)存。
5. 標準化機構(gòu)
在視頻編解碼技術(shù)定義方面有兩大標準機構(gòu)。國際電信聯(lián)盟 (ITU) 致力于電信應(yīng)用,已經(jīng)開發(fā)了用于低比特率視頻電話的 H.26x 標準,其中包括 H.261、H.262、H.263 與 H.264;國際標準化組織 (ISO) 主要針對消費類應(yīng)用,已經(jīng)針對運動圖像壓縮定義了 MPEG 標準。MPEG 標準包括 MPEG1、MPEG2 與 MPEG4。圖 1 說明了視頻編解碼標準的發(fā)展歷程。
MPEG 與 ISO 根據(jù)基本目標應(yīng)用往往做出稍有不同的取舍。有時它們也會開展合作,如:聯(lián)合視頻小組 (JVT),該小組定義了 H.264 編解碼技術(shù),這種技術(shù)在 MPEG 系列中又被稱為 MPEG4-Part 10 或 MPEG4 高級視頻編解碼 (AVC)。我們在本文中將這種聯(lián)合標準稱為 H.264/AVC。同樣,H.262 對應(yīng) MPEG2,而 H.263 基本規(guī)范類 (Baseline Profile) 技術(shù)在原理方面與 MPEG4 簡單類 (Simple Profile) 編解碼技術(shù)存在較多重復(fù)。
標準對編解碼技術(shù)的普及至關(guān)重要。出于規(guī)模經(jīng)濟原因,用戶根據(jù)可承受的標準尋找相應(yīng)產(chǎn)品。由于能夠保障廠商之間的互操作性,業(yè)界樂意在標準方面進行投資。而由于自己的內(nèi)容可以獲得較長的生命周期及廣泛的需求,內(nèi)容提供商也對標準青睞有加。盡管幾乎所有視頻標準都是針對少數(shù)特定應(yīng)用的,但是在能夠適用的情況下,它們在其他應(yīng)用中也能發(fā)揮優(yōu)勢。
圖1:ITU 與 MPEG 標準的發(fā)展歷程 [10]
為了實現(xiàn)更好的壓縮及獲得新的市場機遇,ITU 與 MPEG 一直在不斷發(fā)展壓縮技術(shù)和開發(fā)新標準。中國最近開發(fā)了一種稱為 AVS 的國家視頻編碼標準,我們在后面也會做一介紹。目前正在開發(fā)的標準包括 ITU/MPEG 聯(lián)合可擴展視頻編碼 (Joint Scalable Video Coding)(對 H264/ AVC 的修訂)和MPEG 多視角視頻編碼 (Multi-view Video Coding)。另外,為了滿足新的應(yīng)用需求,現(xiàn)有標準也在不斷發(fā)展。例如,H.264 最近定義了一種稱為高精度拓展 (Fidelity
Range Extensions) 的新模式,以滿足新的市場需求,如專業(yè)數(shù)字編輯、HD-DVD 與無損編碼等。
除了 ITU 與 ISO 開發(fā)的行業(yè)標準以外,還出現(xiàn)了幾種專用于因特網(wǎng)流媒體應(yīng)用、廣受歡迎的專有解決方案,其中包括 Real Networks Real Video (RV10)、Microsoft Windows Media Video 9 (WMV9) 系列、ON2 VP6 以及 Nancy。由于這些格式在內(nèi)容中得到了廣泛應(yīng)用,因此專有編解碼技術(shù)可以成為業(yè)界標準。2003 年 9 月,微軟公司向電影與電視工程師學會 (SMPTE) 提議在該機構(gòu)的支持下實現(xiàn) WMV9 位流與語法的標準化。該提議得到了采納,現(xiàn)在
WMV9 已經(jīng)被 SMPTE 作為 VC-1 實現(xiàn)標準化。
6. 視頻編碼原理
我們感興趣的所有視頻標準都采用基于模塊的處理方式。每個宏模塊一般包含 4 個 8(8 的光度塊和 2 個 8(8 的色度塊(4:2:0 色度格式)。視頻編碼基于運動補償預(yù)測(MC),變換與量化及熵編碼。圖 2 說明的是一種典型的、基于運動補償?shù)囊曨l編解碼技術(shù)。在運動補償中,通過預(yù)測與最新編碼的("參考")視頻幀處于同一區(qū)域的視頻幀中各宏模塊的像素來實現(xiàn)壓縮。例如,背景區(qū)域通常在各幀之間保持不變,因此不需要在每個幀中重新傳輸。運動估計 (ME) 是確定當前幀——即與它最相似的參考幀的 16(16 區(qū)域中每個
MB 的過程。ME 通常是視頻壓縮中最消耗性能的功能。有關(guān)當前幀中各模塊最相似區(qū)域相對位置的信息("運動矢量")被發(fā)送至解碼器。
MC 之后的殘差部分分為 8(8 的模塊,各模塊綜合利用變換編碼、量化編碼與可變長度編碼技術(shù)進行編碼。變換編碼(如:離散余弦變換或 DCT)利用殘差信號中的空間冗余。量化編碼可以消除感知冗余 (perceptual redundancy) 并且降低編碼殘差信號所需要的數(shù)據(jù)量??勺冮L度編碼利用殘差系數(shù)的統(tǒng)計性質(zhì)。通過 MC 進行的冗余消除過程在解碼器中以相反過程進行,來自參考幀的預(yù)測數(shù)據(jù)與編碼后的殘差數(shù)據(jù)結(jié)合在一起產(chǎn)生對原始視頻幀的再現(xiàn)。
圖 2:標準運動補償視頻編碼
在視頻編解碼器中,單個幀可以采用三個模式中的一個進行編碼 —— 即 I、P 或 B 幀模式(見圖 3)。幾個稱為 Intra (I) 的幀單獨編碼,無需參考任何其他幀(無運動補償)。某些幀可以利用 MC 編碼,以前一個幀為參考(前向預(yù)測)。這些幀稱為預(yù)測幀 (P)。
B 幀或雙向預(yù)測幀通過之前的幀以及當前幀的后續(xù)幀進行預(yù)測。B 幀的優(yōu)勢是能夠匹配堵塞在采用前向預(yù)測的上一幀中的背景區(qū)域。雙向預(yù)測通過平衡前向及后向預(yù)測可以降低噪聲。在編碼器中采用這種功能會要求更多處理量,因為必須同時針對前向及后向預(yù)測執(zhí)行 ME,而這會明顯使運動估計計算需求加倍。為了保存兩個參考幀,編碼器與解碼器都需要更多內(nèi)存。B 幀工具需要更復(fù)雜的數(shù)據(jù)流,因為相對采集及顯示順序而言,幀不按順序解碼。這個特點會增加時延,因此不適合實時性較高的應(yīng)用。B 幀不用于預(yù)測,因此可以針對某些應(yīng)用進行取舍。例如,在低幀速應(yīng)用中可以跳過它們而不會影響隨后
I 與 P 幀的解碼。
圖3:I、P 與 B 幀間預(yù)測圖示
7. 傳統(tǒng)視頻編碼標準
H.261
ITU 編制的 H.261[2] 標準是第一個主流視頻壓縮標準。它主要針對雙工視頻會議應(yīng)用,是為支持 40kpbs~2Mbps 的 ISDN 網(wǎng)絡(luò)而設(shè)計的。H.261 支持 352(288 (CIF) 及 176(144 (QCIF) 分辨率,色度分辨率二次采樣為 4:2:0。由于可視電話需要同步實時編解碼,因此復(fù)雜性設(shè)計得較低。由于主要用于對延遲敏感的雙向視頻,因此 H.261 僅允許采用 I 與 P 幀,而不允許 B 幀。
H.261 采用基于塊的 DCT 進行殘差信號的變換編碼。DCT 把像素的每個 8(8 塊映射到頻域,產(chǎn)生 64 個頻率成分(第一個系數(shù)稱為 DC,其他的稱為 AC)。為了量化 DCT 系數(shù),H.261 在所有 AC 系數(shù)中采用固定的線性量化。量化后的系數(shù)進行行程編碼,其可以按非零系數(shù)描述量化的頻率,后面跟隨一串零系數(shù),在最后一個非零值之后以塊代碼結(jié)束。最后,可變長度編碼 (Huffman) 將運行級別對 (run-level pair) 轉(zhuǎn)換成可變長度編碼 (VLC),其比特長度已針對典型概率分布進行過優(yōu)化。
基于標準塊的編碼最終產(chǎn)生模塊化視頻。H.261 標準利用環(huán)路濾波避免這種現(xiàn)象。在模塊邊緣采用的簡單 2D FIR 濾波器用于平滑參考幀中的量化效應(yīng)。必須同時在編碼器及解碼器中精確地對每個比特應(yīng)用上述濾波。
MPEG-1
MPEG-1[3] 是 ISO 開發(fā)的第一個視頻壓縮算法。主要應(yīng)用是數(shù)字媒體上動態(tài)圖像與音頻的存儲與檢索,如速率為 1.15Mbps、采用 SIF 分辨率(352(240 - 29.97fps 或者 352(288 - 25 fps)的VCD。MPEG-1 與 H.261 相似,不過編碼器一般需要更高的性能,以便支持電影內(nèi)容的較高運動性而不是典型的可視電話功能。
與 H.261 相比,MPEG1 允許采用 B 幀。另外它還采用自適應(yīng)感知量化,也就是說,對每個頻段采用單獨的量化比例因子(或等步長),以便優(yōu)化人們的視覺感受。MPEG-1 僅支持逐行視頻,因此新標準——MPEG2 已經(jīng)開始做出努力,同時支持分辨率及比特率更高的逐行與隔行視頻。
MPEG-2/H.262
MPEG-2[4] 專門針對數(shù)字電視而開發(fā),很快成為了迄今最成功的視頻壓縮標準。MPEG-2 既能夠滿足標準逐行視頻的需求(其中視頻序列由一系列按一定時間間隔采集的幀構(gòu)成),又能夠滿足電視領(lǐng)域常用的隔行視頻的需求。隔行視頻交替采集及顯示圖像中兩組交替的像素(每組稱為一個場)。這種方式尤其適合電視顯示器的物理特性。MPEG2 支持標準的電視分辨率,其中包括:針對美國和日本采用的 NTSC 制式隔行 720(480 分辨率,每秒 60 場,以及歐洲和其他國家采用的PAL 制式的 720(576 分辨率,每秒
50 場。
MPEG-2 建立在 MPEG-1 基礎(chǔ)之上,并具備擴展功能,能支持隔行視頻及更寬的運動補償范圍。由于高分辨率視頻是非常重要的應(yīng)用,因此 MPEG-2 支持的搜索范圍遠遠大于 MPEG-1。與之前的標準相比,它顯著提高了運動估計的性能要求,并充分利用更寬搜索范圍與更高分辨率優(yōu)勢的編碼器需要比 H.261 和 MPEG-1 高得多的處理能力。MPEG2 中的隔行編碼工具包含優(yōu)化運動補償?shù)哪芰Γ瑫r支持基于場和基于幀的預(yù)測,而且同時支持基于場和基于幀的 DCT/IDCT。MPEG-2 在 30:1 左右的壓縮比時運行良好。MPEG-2
在 4-8Mbps 時達到的質(zhì)量適合消費類視頻應(yīng)用,因此它很快在許多應(yīng)用中得到普及,如:數(shù)字衛(wèi)星電視、數(shù)字有線電視、DVD 以及后來的高清電視等。
另外,MPEG-2 增加了分級視頻編碼工具,以支持多層視頻編碼,即:時域分級、空域分級、SNR 分級以及數(shù)據(jù)分割。盡管 MPEG-2 中針對分級視頻應(yīng)用定義了相關(guān)類別 (profile),不過支持單層編碼的主類 (Main Profile) 是當今大眾市場中得到廣泛應(yīng)用的唯一 MPEG-2 類。MPEG-2 通常稱為 MPEG-2 主類。
MPEG-2 解碼最初對于通用處理器及 DSP 具有很高的處理要求。優(yōu)化的固定功能 MPEG-2 解碼器開發(fā)已問世,由于使用量較高,成本已逐漸降低。MPEG2 證明低成本芯片解決方案的供應(yīng)是視頻編解碼標準成功和普及的關(guān)鍵。
H.263
H.263[5] 在 H.261 之后得到開發(fā),主要是為了以更低的比特率實現(xiàn)更高的質(zhì)量。其主要目標之一是基于普通 28.8Kbps 電話調(diào)制解調(diào)器的視頻。目標分辨率是 SQCIF (128(96)~CIF (352(288)。其基本原理與 H.261 大同小異。
H.263 的運動矢量在兩個方向上允許是 1/2 的倍數(shù)(“半像素”),參考圖像以數(shù)字方式內(nèi)插到更高的分辨率。這種方法可以提高 MC 精度及壓縮比。MV 可采用更大的范圍。為不同方案提供許多新的選項,包括:
* 4 個運動矢量——每個塊采用一個運動矢量,而非整個 MB 采用單個運動矢量。
* 3D VLC:Huffman 編碼——將塊結(jié)束 (EOB) 指示符與每個運行級別對結(jié)合在一起。這種功能主要用于低比特率,這時大多時候只有一、兩個編碼系數(shù)。
盡管存在這些功能,但是仍然很難在普通電話線上實現(xiàn)理想的視頻質(zhì)量,而且目前基于標準調(diào)制解調(diào)器的可視電話仍然是一個難題。不過,由于 H.263 一般情況下可提供優(yōu)于 H.261 的效率,它成為了電視會議首選的算法,但是,為了兼容舊系統(tǒng),仍然需要支持 H.261。H.263 逐漸發(fā)展成為了 H.263+,其增加了可選的附件,為提高壓縮并實現(xiàn)分組網(wǎng)的魯棒性提供支持。H.263 及其附件構(gòu)成了 MPEG-4 中許多編碼工具的核心。
MPEG-4
MPEG-4[6] 由 ISO 提出,以延續(xù) MPEG-2 的成功。一些早期的目標包括:提高容錯能力以支持無線網(wǎng)、對低比特率應(yīng)用進行更好的支持、實現(xiàn)各種新工具以支持圖形對象及視頻之間的融合。大部分圖形功能并未在產(chǎn)品中受到重視,相關(guān)實施主要集中在改善低比特率壓縮及提高容錯性上。.
MPEG-4 簡化類 (SP) 以H.263為基礎(chǔ),為改善壓縮增加了新的工具,包括:
* 無限制的運動矢量:支持對象部分超出幀邊界時的預(yù)測。
* 可變塊大小運動補償:可以在 16(16 或 8(8 粒度下進行運動補償。
* 上下文自適應(yīng)幀內(nèi) DCT DC/AC 預(yù)測:可以通過當前塊的左右相鄰塊預(yù)測 DC/AC DCT 系數(shù)。
* 擴展量化 AC 系數(shù)的動態(tài)范圍,支持高清視頻:從 H.263 的 [-127:127] 到 [-2047, 2047]。
增加了容錯功能,以支持丟包情況下的恢復(fù),包括:
* 片斷重同步 (Slice Resynchronization):在圖像內(nèi)建立片斷 (slice),以便在出現(xiàn)錯誤后更快速的進行重新同步。與 MPEG-2 數(shù)據(jù)包大小不同,MPEG4 數(shù)據(jù)包大小與用于描述 MB 的比特數(shù)量脫離了聯(lián)系。因此,不管每個 MB 的信息量多少,都可以在位流中按相同間隔進行重新同步。
* 數(shù)據(jù)分割:這種模式允許利用唯一的運動邊界標記將視頻數(shù)據(jù)包中的數(shù)據(jù)分割成運動部分和 DCT 數(shù)據(jù)部分。這樣就可以實現(xiàn)對運動矢量數(shù)據(jù)更嚴格的檢查。如果出現(xiàn)錯誤,我們可以更清楚地了解錯誤之處,從而避免在發(fā)現(xiàn)錯誤情況下拋棄所有運動數(shù)據(jù)。
* 可逆 VLC:VLC 編碼表允許后向及前向解碼。在遇到錯誤時,可以在下一個slice進行同步,或者開始編碼并且返回到出現(xiàn)錯誤之處。
* 新預(yù)測 (NEWPRED):主要用于在實時應(yīng)用中實現(xiàn)快速錯誤恢復(fù),這些應(yīng)用中的解碼器在出現(xiàn)丟包情況下采用逆向通道向解碼器請求補充信息。
MPEG-4 高級簡化類 (ASP) 以簡化類為基礎(chǔ),增加了與 MPEG-2 類似的 B 幀及隔行工具(用于Level 4 及以上級別)。另外它還增加了四分之一像素運動補償及用于全局運動補償?shù)倪x項。MPEG-4 高級簡化類比簡化類的處理性能要求更高,而且復(fù)雜性與編碼效率都高于 MPEG-2。
MPEG-4 最初用于因特網(wǎng)數(shù)據(jù)流,例如,已經(jīng)被 Apple 的 QuickTime 播放器采用。MPEG-4 簡化類目前在移動數(shù)據(jù)流中得到廣泛應(yīng)用。MPEG-4 ASP 是已經(jīng)流行的專有 DivX 編解碼器的基石。
工具與壓縮增益
當我們查看 H.261、MPEG1、MPEG2 與 H.263 視頻編解碼技術(shù)中引入的功能時,明顯可以發(fā)現(xiàn)幾種基本技巧提供了大部分壓縮增益。圖 4 說明這些技巧及其相關(guān)效果。與 4 個運動矢量以及四分之一像素運動補償?shù)裙ぞ呦啾?,運動補償(整數(shù)像素與半像素)的效果顯然更為突出。
圖 4:基本技巧的效果:1) 無 MC;2) 增加 Skip 模式構(gòu)成 CR 編碼器;3) 僅允許零 MV;4) 允許整數(shù)像素 MC;5) 允許半像素 MC;6) 允許 4-MV;7) 允許四分之一像素MC。如欲了解有關(guān)詳細說明,敬請參見 [7]。
7. H.264/ MPEG4-AVC
視頻編碼技術(shù)在過去幾年最重要的發(fā)展之一是由 ITU 和 ISO/IEC 的聯(lián)合視頻小組 (JVT) 開發(fā)了 H.264/MPEG-4 AVC[8] 標準。在發(fā)展過程中,業(yè)界為這種新標準取了許多不同的名稱。ITU 在 1997 年開始利用重要的新編碼工具處理 H.26L(長期),結(jié)果令人鼓舞,于是 ISO 決定聯(lián)手 ITU 組建 JVT 并采用一個通用的標準。因此,大家有時會聽到有人將這項標準稱為 JVT,盡管它并非正式名稱。ITU 在 2003 年 5 月批準了新的 H.264 標準。ISO 在 2003
年 10 月以 MPEG-4 Part 10、高級視頻編碼或 AVC 的名稱批準了該標準。
H.264/AVC 在壓縮效率方面取得了巨大突破,一般情況下達到 MPEG-2 及 MPEG-4 簡化類壓縮效率的大約 2 倍。在 JVT 進行的正式測試中 [9],H.264 在 85 個測試案例中有 78% 的案例實現(xiàn) 1.5 倍以上的編碼效率提高,77% 的案例中達到 2 倍以上,部分案例甚至高達 4 倍。H.264 實現(xiàn)的改進創(chuàng)造了新的市場機遇,如:
* 600Kbps 的 VHS 品質(zhì)視頻??梢酝ㄟ^ ADSL 線路實現(xiàn)視頻點播。
* 高清晰電影無需新的激光頭即可適應(yīng)普通 DVD。
H.264 標準化時支持三個類別:基本類、主類及擴展類。后來一項稱為高保真范圍擴展 (FRExt) 的修訂引入了稱為高級類的 4 個附加類。在初期主要是基本類和主類引起了大家的興趣。基本類降低了計算及系統(tǒng)內(nèi)存需求,而且針對低時延進行了優(yōu)化。由于 B 幀的內(nèi)在時延以及 CABAC 的計算復(fù)雜性,因此它不包括這兩者?;绢惙浅_m合可視電話應(yīng)用以及其他需要低成本實時編碼的應(yīng)用。
主類提供的壓縮效率最高,但其要求的處理能力也比基本類高許多,因此使其難以用于低成本實時編碼和低時延應(yīng)用。廣播與內(nèi)容存儲應(yīng)用對主類最感興趣,它們是為了盡可能以最低的比特率獲得最高的視頻質(zhì)量。
盡管 H.264 采用與舊標準相同的主要編碼功能,不過它還具有許多與舊標準不同的新功能,它們一起實現(xiàn)了編碼效率的提高。圖 5 的編碼器框圖總結(jié)了其主要差別,概述如下:
幀內(nèi)預(yù)測與編碼:H.264 采用空域幀內(nèi)預(yù)測技術(shù)來預(yù)測相鄰塊鄰近像素的 Intra-MB 中的像素。它對預(yù)測殘差信號和預(yù)測模式進行編碼,而不是編碼塊中的實際像素。這樣可以顯著提高幀內(nèi)編碼效率。
幀間預(yù)測與編碼:H.264 中的幀間編碼采用了舊標準的主要功能,同時也增加了靈活性及可操作性,包括適用于多種功能的幾種塊大小選項,如:運動補償、四分之一像素運動補償、多參考幀、通用 (generalized) 雙向預(yù)測和自適應(yīng)環(huán)路去塊。
可變矢量塊大?。涸试S采用不同塊大小執(zhí)行運動補償。可以為小至 4(4 的塊傳輸單個運動矢量,因此在雙向預(yù)測情況下可以為單個 MB 傳輸多達 32 個運動矢量。另外還支持 16(8、8(16、8(8、8(4 和 4(8 的塊大小。降低塊大小可以提高運動細節(jié)的處理能力,因而提高主觀質(zhì)量感受,包括消除較大的塊化失真。
四分之一像素運動估計:通過允許半像素和四分之一像素運動矢量分辨率可以改善運動補償。
多參考幀預(yù)測:16 個不同的參考幀可以用于幀間編碼,從而可以改善視頻質(zhì)量的主觀感受并提高編碼效率。提供多個參考幀還有助于提高 H.264 位流的容錯能力。值得注意的是,這種特性會增加編碼器與解碼器的內(nèi)存需求,因為必須在內(nèi)存中保存多個參考幀。
幾種視頻壓縮標準簡介
MJPEG
MJPEG 是指 Motion JPEG,即動態(tài)JPEG,按照25幀/秒速度使用JPEG 算法壓縮視頻信號,完成動態(tài)視頻的壓縮。是由JPEG專家組制訂的,其圖像格式是對每一幀進行壓縮,通??蛇_到6:1的壓縮率,但這個比率相對來說仍然不足。就像每一幀都是獨立的圖像一樣。MJPEG圖象流的單元就是一幀一幀的JPEG畫片。因為每幀都可任意存取,所以MJPEG常被用于視頻編輯系統(tǒng)。動態(tài)JPEG能產(chǎn)生高質(zhì)量、全屏、全運動的視頻,但是,它需要依賴附加的硬件。而且,由于MJPEG不是一個標準化的格式,各廠家都有自己版本的MJPEG,雙方的文件無法互相識別。
MJPEG的優(yōu)點是畫質(zhì)還比較清晰,缺點是壓縮率低,占用帶寬很大。一般單路占用帶寬2M左右。
H.263
H.263 視頻編碼標準是專為中高質(zhì)量運動圖像壓縮所設(shè)計的低碼率圖像壓縮標準。H.263 采用運動視頻編碼中常見的編碼方法,將編碼過程分為幀內(nèi)編碼和幀間編碼兩個部分。埃幀內(nèi)用改進的DCT 變換并量化,在幀間采用1/2 象素運動矢量預(yù)測補償技術(shù),使運動補償更加精確,量化后適用改進的變長編碼表(VLC)地量化數(shù)據(jù)進行熵編碼,得到最終的編碼系數(shù)。
H.263標準壓縮率較高,CIF格式全實時模式下單路占用帶寬一般在幾百左右,具體占用帶寬視畫面運動量多少而不同。缺點是畫質(zhì)相對差一些,占用帶寬隨畫面運動的復(fù)雜度而大幅變化。
MPEG-1
VCD標準。
制定于1992年,為工業(yè)級標準而設(shè)計,可適用于不同帶寬的設(shè)備,如CD-ROM,Video-CD、CD-i。它用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的編碼,經(jīng)過MPEG-1標準壓縮后,視頻數(shù)據(jù)壓縮率為1/100~1/200,影視圖像的分辯率為360×240×30(NTSC制)或360×288×25(PAL制),它的質(zhì)量要比家用錄像系統(tǒng)(VHS-Video Home System)的質(zhì)量略高。音頻壓縮率為1/6.5,聲音接近于CD-DA的質(zhì)量。MPEG-1允許超過70分鐘的高質(zhì)量的視頻和音頻存儲在一張CD-ROM盤上。VCD采用的就是MPEG-1的標準,該標準是一個面向家庭電視質(zhì)量級的視頻、音頻壓縮標準。MPEG-1的編碼速率最高可達4-5Mbits/sec,但隨著速率的提高,其解碼后的圖象質(zhì)量有所降低。MPEG-1也被用于數(shù)字電話網(wǎng)絡(luò)上的視頻傳輸,如非對稱數(shù)字用戶線路(ADSL),視頻點播(VOD),以及教育網(wǎng)絡(luò)等。同時,MPEG-1也可被用做記錄媒體或是在INTERNET上傳輸音頻。MPEG1標準占用的網(wǎng)絡(luò)帶寬在1.5M左右。
MPEG-2
DVD標準。
制定于1994年,設(shè)計目標是高級工業(yè)標準的圖象質(zhì)量以及更高的傳輸率,主要針對高清晰度電視(HDTV)的需要,傳輸速率在3-10Mbits/sec間,與MPEG-1兼容,適用于1.5~60Mbps甚至更高的編碼范圍。分辯率為720×480×30(NTSC制)或720×576×25(PAL制)。影視圖像的質(zhì)量是廣播級的質(zhì)量,聲音也是接近于CD-DA的質(zhì)量。MPEG-2是家用視頻制式(VHS)錄像帶分辯率的兩倍。MPEG-2的音頻編碼可提供左右中及兩個環(huán)繞聲道,以及一個加重低音聲道,和多達7個伴音聲道(DVD可有8種語言配音的原因)。由于MPEG-2在設(shè)計時的巧妙處理,使得大多數(shù)MPEG-2解碼器也可播放MPEG-1格式的數(shù)據(jù),如VCD。除了做為DVD的指定標準外,MPEG-2還可用于為廣播,有線電視網(wǎng),電纜網(wǎng)絡(luò)以及多級多點的直播
(Direct Broadcast Satellite) 提供廣播級的數(shù)字視頻。MPEG-2的另一特點是,其可提供一個較廣的范圍改變壓縮比,以適應(yīng)不同畫面質(zhì)量,存儲容量,以及帶寬的要求。對于最終用戶來說,由于現(xiàn)存電視機分辨率限制,MPEG-2所帶來的高清晰度畫面質(zhì)量(如DVD畫面)在電視上效果并不明顯,到是其音頻特性(如加重低音,多伴音聲道等)更引人注目。
MPEG-2的畫質(zhì)質(zhì)量最好,但同時占用帶寬也非常大,在4M~15M之間,不太適于遠程傳輸。
MPEG-4
如果說,MPEG-1“文件小,但質(zhì)量差”;而MPEG-2則“質(zhì)量好,但更占空間”的話,那么MPEG-4則很好的結(jié)合了前兩者的優(yōu)點。它于1998年10月定案,在1999年1月成為一個國際性標準,隨后為擴展用途又進行了第二版的開發(fā),于1999年底結(jié)束。MPEG-4是超低碼率運動圖像和語言的壓縮標準,它不僅是針對一定比特率下的視頻、音頻編碼,更加注重多媒體系統(tǒng)的交互性和靈活性。MPEG-4標準主要應(yīng)用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic
News)等,其傳輸速率要求較低,在4800-64Kbits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術(shù),壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖象質(zhì)量。與MPEG-1和MPEG-2相比,MPEG-4為多媒體數(shù)據(jù)壓縮提供了一個更為廣闊的平臺。它更多定義的是一種格式、一種架構(gòu),而不是具體的算法。它可以將各種各樣的多媒體技術(shù)充分用進來,包括壓縮本身的一些工具、算法,也包括圖像合成、語音合成等技術(shù)。 MPEG-4的特點是其更適于交互AV服務(wù)以及遠程監(jiān)控。MPEG-4是第一個使你由被動變?yōu)橹鲃?不再只是觀看,允許你加入其中,即有交互性)的動態(tài)圖象標準;它的另一個特點是其綜合性;從根源上說,MPEG-4試圖將自然物體與人造物體相溶合(視覺效果意義上的)。MPEG-4的設(shè)計目標還有更廣的適應(yīng)性和可擴展性。
MPEG4標準的占用帶寬可調(diào),占用帶寬與圖像的清晰度成正比。以目前的技術(shù),一般占用帶寬大致在幾百K左右。
|