小男孩‘自慰网亚洲一区二区,亚洲一级在线播放毛片,亚洲中文字幕av每天更新,黄aⅴ永久免费无码,91成人午夜在线精品,色网站免费在线观看,亚洲欧洲wwwww在线观看

分享

編解碼學(xué)習(xí)筆記(四):Mpeg系列——Mpeg 4

 shaobin0604@163.com 2011-08-09

在上次對MPEG-2的學(xué)習(xí)整理中,有一個(gè)疑惑,雙聲道理解,就是左右立體聲,但是5.1聲道是什么?我們經(jīng)??吹蕉疟?.1聲道的說法。“0.1”聲道具體指什么?今天去wiki查了一下,相關(guān)內(nèi)容也整理入我們的學(xué)習(xí)筆記。本文檔資料來源:

5.1聲道

  使用杜比數(shù)字技術(shù)下,最標(biāo)準(zhǔn)常用的是5.1聲道設(shè)置,但杜比數(shù)字容許一系列不同聲道的選擇。全部可供選擇的聲道如下列所示:

  • 單聲道(中央)
  • 雙聲道立體聲(左、右),選擇性地交叉應(yīng)用杜比環(huán)回
  • 三聲道立體聲(左、中、右)
  • 雙聲道立體聲加單環(huán)回(左、右、環(huán)回)
  • 三聲道立體聲加單環(huán)回(左、中、右、環(huán)回)
  • 四聲道環(huán)回立體聲(左前、右前、左后、右后)
  • 五聲道環(huán)回立體聲(左前、中、右前、左后、右后)

  以上所有這些設(shè)置可選擇性地使用低頻效果和杜比數(shù)字EX矩陣編碼中加入附 加后環(huán)繞聲道。杜比編碼技術(shù)是向下兼容的,很多杜比播放器/解碼器均備有向下混音作用是發(fā)布不同聲道至可供使用的揚(yáng)聲器。這包括一些功能例如聲音數(shù)據(jù)通過 前揚(yáng)聲器播放(如適用),和當(dāng)中央揚(yáng)聲器不適用時(shí)發(fā)布中央頻道至左或右揚(yáng)聲器?;虍?dāng)用戶只有2.0喇叭時(shí),杜比解碼器能把多聲道信號混音編碼為 2.0立體聲。

  在5.1, 7.1 或其他等文字中,'.1'指的是低頻LFE聲道。

  其實(shí)5.1聲道就是使用5個(gè)喇叭和1個(gè)超低音揚(yáng)聲器來實(shí)現(xiàn)一種身臨其境的 音樂播放方式,它是由杜比公司開發(fā)的,所以叫做“杜比5.1聲道”。在5.1聲道系統(tǒng)里采用左(L)、中(C)、右(R)、左后(LS)、右后(RS)五 個(gè)方向輸出聲音,使人產(chǎn)生猶如身臨音樂廳的感覺。五個(gè)聲道相互獨(dú)立,其中“.1” 聲道,則是一個(gè)專門設(shè)計(jì)的超低音聲道。正是因?yàn)榍昂笞笥叶加欣龋跃蜁?huì)產(chǎn)生被音樂包圍的真實(shí)感。如右圖所示。

MPEG-4

總體介紹

  MPEG-4是一套用于音頻、視頻信息的壓縮編碼標(biāo)準(zhǔn), 由國際標(biāo)準(zhǔn)化組織(ISO) 和國際電工委員會(huì)(IEC)下屬的“動(dòng)態(tài)影像專家組”(Moving Picture Experts Group,即MPEG) 制定,第一版在1998年10月通過,第二版在1999年12月通過。MPEG-4格式的主要用途在於網(wǎng)上流媒體、光碟、 語音傳送(視訊電話),以及電視廣播。MPEG-4作為ISO/IEC 14496正式發(fā)布。ISO/IEC 14496-Coding of audio-visual object (AV對象編碼)。

  為了應(yīng)對網(wǎng)絡(luò)傳輸?shù)拳h(huán)境,傳統(tǒng)的 MPEG-1/2 已經(jīng)不能適應(yīng),所以促使了 MPEG-4 的誕生。 與 MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是其更適于交互AV服務(wù)以及遠(yuǎn)程監(jiān)控。MPEG-4是第一個(gè)使你由被動(dòng)變?yōu)橹鲃?dòng)(不再只是觀看,允許 你加入其中,即有交互性)的動(dòng)態(tài)圖像標(biāo)準(zhǔn),它的另一個(gè)特點(diǎn)是其綜合性。從根源上說,MPEG-4試圖將自然物體與人造物體相溶合 (視覺效果意義上的)。MPEG-4的設(shè)計(jì)目標(biāo)還有更廣的適應(yīng)性和更靈活的可擴(kuò)展性。 MPEG-4 采用了一系列新技術(shù),來滿足在低帶寬下傳輸較高視頻質(zhì)量的需求。DivX,XviD,MS MPEG4 都是采用的 MPEG-4 視頻編碼,除了在 DVDRip 上面的應(yīng)用,3GPP 現(xiàn)在也接納了 MPEG-4 作為視頻編碼方案。

  最初MPEG-4的主要目的是用于低比特率下的視頻通信,但是作為一個(gè)多媒體的編碼標(biāo)準(zhǔn),它的范圍最后得到了擴(kuò)展。在技術(shù)方面MPEG-4允許不同的軟件/硬件開發(fā)商創(chuàng)建多媒體對象來提供更好的適應(yīng)性、靈活性,為數(shù)字電視,動(dòng)態(tài)圖像,互聯(lián)網(wǎng)等業(yè)務(wù)提供更好的質(zhì)量。

  MPEG-4提供范圍從每秒幾k比特到每秒數(shù)十兆比特的,它具有下面功能:

  • 改善MPEG-2的編碼效率
    • MPEG-4基于更高的編碼效率。同已有的或即將形成的其它標(biāo)準(zhǔn)相比,在相 同的比特率下,它基于更高的視覺聽覺質(zhì)量,這就使得在低帶寬的信道上傳送視頻、音頻成為可能。同時(shí)MPEG-4還能對同時(shí)發(fā)生的數(shù)據(jù)流進(jìn)行編碼。一個(gè)場景 的多視角或多聲道數(shù)據(jù)流可以高效、同步地合成為最終數(shù)據(jù)流。這可用于虛擬三維游戲、三維電影、飛行仿真練習(xí)等。
  • 提供混合媒體數(shù)據(jù)(視頻,音頻,語音)的編碼能力
  • 差錯(cuò)容忍使得內(nèi)容穩(wěn)定傳輸。
    • 當(dāng)在傳輸有誤碼或丟包現(xiàn)象時(shí),MPEG4受到的影響很小,并且能迅速恢復(fù)。
  • 提供受眾視聽場景的互動(dòng)能力,MPEG-4終端用戶提供不同的對象支持各種互動(dòng)要求。
    • MPEG-4提供了基于內(nèi)容的多媒體數(shù)據(jù)訪問工具,如索引、超級鏈接、上 傳、下載、刪除等。利用這些工具,用戶可以方便地從多媒體數(shù)據(jù)庫中有選擇地獲取自己所需的與對象有關(guān)的內(nèi)容,并提供了內(nèi)容的操作和位流編輯功能,可應(yīng)用于 交互式家庭購物,淡入淡出的數(shù)字化效果等。MPEG-4提供了高效的自然或合成的多媒體數(shù)據(jù)編碼方法。它可以把自然場景或?qū)ο蠼M合起來成為合成的多媒體數(shù) 據(jù)。
  • MPEG-4對傳輸數(shù)據(jù)網(wǎng)是透明的,它可以兼容各種網(wǎng)絡(luò)。
    • MPEG-4提供了易出錯(cuò)環(huán)境的魯棒性,來保證其在許多無線和有線網(wǎng)絡(luò)以及存儲(chǔ)介質(zhì)中的應(yīng)用,此外,MPEG-4還支持基于內(nèi)容的的可分級性,即把內(nèi)容、質(zhì)量、復(fù)雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同帶寬,不同存儲(chǔ)容量的傳輸信道和接收端。
    • 這些特點(diǎn)無疑會(huì)加速多媒體應(yīng)用的發(fā)展,從中受益的應(yīng)用領(lǐng)域有:因特網(wǎng)多媒體 應(yīng)用;廣播電視;交互式視頻游戲;實(shí)時(shí)可視通信;交互式存儲(chǔ)媒體應(yīng)用;演播室技術(shù)及電視后期制作;采用面部動(dòng)畫技術(shù)的虛擬會(huì)議;多媒體郵件;移動(dòng)通信條件 下的多媒體應(yīng)用;遠(yuǎn)程視頻監(jiān)控;通過ATM網(wǎng)絡(luò)等進(jìn)行的遠(yuǎn)程數(shù)據(jù)庫業(yè)務(wù)等。

MPEG-4視頻編碼核心思想

  在MPEG-4制定之前,MPEG-1、MPEG-2、H.261、 H.263都是采用第一代壓縮編碼技術(shù),著眼于圖像信號的統(tǒng)計(jì)特性來設(shè)計(jì)編碼器,屬于波形編碼的范疇。第一代壓縮編碼方案把視頻序列按時(shí)間先后分為一系列 幀,每一幀圖像又分成宏塊以進(jìn)行運(yùn)動(dòng)補(bǔ)償和編碼,這種編碼方案存在以下缺陷:

  • 將圖像固定地分成相同大小的塊,在高壓縮比的情況下會(huì)出現(xiàn)嚴(yán)重的塊效應(yīng),即馬賽克效應(yīng);
  • 不能對圖像內(nèi)容進(jìn)行訪問、編輯和回放等操作;
  • 未充分利用人類視覺系統(tǒng)(HVS,Human Visual System)的特性。

  MPEG-4則代表了基于模型/對象的第二代壓縮編碼技術(shù),它充分利用了人眼視覺特性,抓住了圖像信息傳輸?shù)谋举|(zhì),從輪廓、紋理思路出發(fā),支持基于視覺內(nèi)容的交互功能,這適應(yīng)了多媒體信息的應(yīng)用由播放型轉(zhuǎn)向基于內(nèi)容的訪問、檢索及操作的發(fā)展趨勢。

  AV對象(AVO,Audio Visual Object)是MPEG-4為支持基于內(nèi)容編碼而提出的重要概念。對象是指在一個(gè)場景中能夠訪問和操縱的實(shí)體,對象的劃分可根據(jù)其獨(dú)特的紋理、運(yùn)動(dòng)、形 狀、模型和高層語義為依據(jù)。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個(gè)個(gè)視聽場景(AV場景),這些 不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內(nèi)容的表示單元,其基本單位是原始AV對象,它可以是自然的或合成的聲音、圖像。原 始AV對象具有高效編碼、高效存儲(chǔ)與傳輸以及可交互操作的特性,它又可進(jìn)一步組成復(fù)合AV對象。因此MPEG-4標(biāo)準(zhǔn)的基本內(nèi)容就是對AV對象進(jìn)行高效編 碼、組織、存儲(chǔ)與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術(shù)。

  MPEG-4實(shí)現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運(yùn)動(dòng)對象從背景中分離出來,然后針對不同對象采用相應(yīng)編碼方法,以實(shí)現(xiàn)高效壓縮。因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼的關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點(diǎn)和難點(diǎn)。

  MPEG-4不僅可提供高壓縮率,同時(shí)也可實(shí)現(xiàn)更好的多媒體內(nèi)容互動(dòng)性及全方位的存取性,它采用開放的編碼系統(tǒng),可隨時(shí)加入新的編碼算法模塊,同時(shí)也可根據(jù)不同應(yīng)用需求現(xiàn)場配置解碼器,以支持多種多媒體應(yīng)用。

MPEG-4各部分

  MPEG-4由一系列的子標(biāo)準(zhǔn)組成,被稱為部,包括以下的部分。對于媒體編解碼,重點(diǎn)關(guān)注Part2, Part 3, Part 10。  

第一部(ISO/IEC 14496-1):系統(tǒng)

  描述視訊和音訊的同步以及混合方式(Multiplexing,簡寫為MUX)。定義了 MP4 容器格式, 支持類似 DVD 菜單這樣的直觀和互動(dòng)特性等。

第二部(ISO/IEC 14496-2):視頻

  定義了一個(gè)對各種視覺信息(包括視訊、靜止紋理、計(jì)算機(jī)合成圖形等等)的 編解碼器。對視訊部分來說,眾多”Profiles”中很常用的一種是Advanced Simple Profile (ASP),例如XviD編碼就 屬于MPEG-4 Part 2。包括 3ivx, DivX4/Project Mayo, DivX 5, Envivio, ffmpeg/ffds, mpegable, Nero Digital, QuickTime, Sorenson, XviD 等常見的視頻格式, 需要注意的是 Divx 3.11, MS MPEG-4, RV9/10, VP6, WMV9 并不屬于標(biāo)準(zhǔn)的 MPEG-4 標(biāo)準(zhǔn)。

第三部(ISO/IEC 14496-3):音頻

  定義了一個(gè)對各種音訊信號進(jìn)行編碼的編解碼器的集合。包括高級音訊編碼 (Advanced Audio Coding,縮寫為AAC) 的若干變形和其他一些音頻/語音編碼工具。即 AAC 音頻標(biāo)準(zhǔn), 包括 LC AAC, HE AAC 等, 支持 5.1 聲道編碼, 可以用更低的碼率實(shí)現(xiàn)更好的效果 (相對于 MP3, OGG 等) 。

第四部(ISO/IEC 14496-4):一致性

  定義了對本標(biāo)準(zhǔn)其他的部分進(jìn)行一致性測試的程序。

第五部(ISO/IEC 14496-5):參考軟件

  提供了用于演示功能和說明本標(biāo)準(zhǔn)其他部分功能的軟件。

第六部(ISO/IEC 14496-6):多媒體傳輸集成框架

  即DMIF:Delivery Multimedia Integration Framework

第七部(ISO/IEC 14496-7):優(yōu)化的參考軟件

  提供了對實(shí)現(xiàn)進(jìn)行優(yōu)化的例子(這裡的實(shí)現(xiàn)指的是第五部分)。

第八部(ISO/IEC 14496-8):在IP網(wǎng)絡(luò)上傳輸

  定義了在IP網(wǎng)絡(luò)上傳輸MPEG-4內(nèi)容的方式。

第九部(ISO/IEC 14496-9):參考硬件

  提供了用于演示怎樣在硬件上實(shí)現(xiàn)本標(biāo)準(zhǔn)其他部分功能的硬件設(shè)計(jì)方案。

第十部(ISO/IEC 14496-10):進(jìn)階視頻編碼,也即ITU H.264,常寫為H.264/AVC

  或稱高級視頻編碼(Advanced Video Coding,縮寫為AVC):定義了一個(gè)視頻編解碼器(codec),AVC和XviD都屬于MPEG-4編碼,但由于AVC屬于MPEG-4 Part 10,在技術(shù)特性上比屬于MPEG-4 Part2的XviD要先進(jìn)。另外從技術(shù)上講,它和ITU-T H.264標(biāo)準(zhǔn)是一致的,故全稱為MPEG-4 AVC/H.264。

第十一部(ISO/IEC 14496-11):場景描述和應(yīng)用引擎

  可用于多種profile(包括2D和3D版本)的互交互媒體。修訂了 MPEG-4 Part 1:2001以及Part1的兩個(gè)修訂方案。它定義了應(yīng)用引擎(交付,生命周期,格式,可下載Java字節(jié)代碼應(yīng)用程序的行為),二進(jìn)制場景格式 (BIFS:Binary Format for Scene),可擴(kuò)展MPEG-4文本格式(一種使用XML描述MPEG-4多媒體內(nèi)容的文本格式)系統(tǒng)level表述。也就是MPEG-4 Part21中的BIFS,XMT,MPEG-J。

第十二部(ISO/IEC 14496-12):基于ISO的媒體文件格式

  定義了一個(gè)存儲(chǔ)媒體內(nèi)容的文件格式。

第十三部(ISO/IEC 14496-13):IP

  知識(shí)產(chǎn)權(quán)管理和保護(hù)(IPMP for Intellectual Property Management and Protection)拓展。

第十四部(ISO/IEC 14496-14):MPEG-4文件格式

  定義了基于第十二部分的用于存儲(chǔ)MPEG-4內(nèi)容的視訊檔案格式。

第十五部(ISO/IEC 14496-15):AVC文件格式

  定義了基于第十二部分的用于存儲(chǔ)第十部分的視頻內(nèi)容的文件格式。

第十六部(ISO/IEC 14496-16):動(dòng)畫框架擴(kuò)展

  動(dòng)畫框架擴(kuò)展(AFX : Animation Framework eXtension)。

第十七部(ISO/IEC 14496-17):同步文本字幕格式

  尚未完成-2005年1月達(dá)成”最終委員會(huì)草案”,F(xiàn)CD: Final Committee Draft。

第十八部(ISO/IEC 14496-18):字體壓縮和流式傳輸(針對公開字體格式)。

第十九部(ISO/IEC 14496-19):綜合用材質(zhì)流(Synthesized Texture Stream)。

第二十部(ISO/IEC 14496-20):簡單場景表示

  LASeR for Lightweight Scene Representation,尚未完成-2005年1月達(dá)成”最終委員會(huì)草案”,F(xiàn)CD for Final Committee Draft。

第二十一部(ISO/IEC 14496-21):用于描繪(Rendering)的MPEG-J拓展

  尚未完成-2005年1月達(dá)成“委員會(huì)草案”,CD for Committee Draft)。

Profile和Level

  MPEG-4提供大量的編碼方式和豐富的設(shè)置。 和MPEG-2一樣,應(yīng)用一般不可能支持MPEG-4全集,通過profile和 level來描述子集。這些子集,通過“profile”來表明解碼器要求,為了避免計(jì)算的復(fù)雜,每個(gè)profile都有一個(gè)或者多個(gè)“level”。 profile和level的有效組合使得編碼生成器只需實(shí)現(xiàn)標(biāo)準(zhǔn)中所需的子集,同時(shí)保持與其他MPEG-4設(shè)備的互通。(解碼支持范圍通常比編碼支持范 圍大),檢查其他MPEG-4設(shè)備是否符合標(biāo)準(zhǔn),即一致性測試。

  對于H.264/AVC(也就是MPEG-4 Part 4)提供下面的profile:

Feature support in particular profiles

Feature CBP BP XP MP HiP Hi10P Hi422P Hi444PP
I and P slices Yes Yes Yes Yes Yes Yes Yes Yes
B slices No No Yes Yes Yes Yes Yes Yes
SI and SP slices No No Yes No No No No No
Flexible  macroblock ordering (FMO) No Yes Yes No No No No No
Arbitrary slice ordering (ASO) No Yes Yes No No No No No
Redundant slices (RS) No Yes Yes No No No No No
Data partitioning No No Yes No No No No No
Interlaced coding (PicAFF, MBAFF) No No Yes Yes Yes Yes Yes Yes
Multiple reference frames Yes Yes Yes Yes Yes Yes Yes Yes
In-loop deblocking filter Yes Yes Yes Yes Yes Yes Yes Yes
CAVLC entropy coding Yes Yes Yes Yes Yes Yes Yes Yes
CABAC entropy coding No No No Yes Yes Yes Yes Yes
8×8 vs. 4×4 transform adaptivity No No No No Yes Yes Yes Yes
Quantization scaling matrices No No No No Yes Yes Yes Yes
Separate Cb and Cr QP control No No No No Yes Yes Yes Yes
Monochrome (4:0:0) No No No No Yes Yes Yes Yes
Chroma formats 4:2:0 4:2:0 4:2:0 4:2:0 4:2:0 4:2:0 4:2:0/4:2:2 4:2:0/4:2:2/4:4:4
Sample depths (bits) 8 8 8 8 8 8 to 10 8 to 10 8 to 14
Separate color plane coding No No No No No No No Yes
Predictive lossless coding No No No No No No No Yes

  level用來表明一個(gè)profile的解碼器的性能要求的范圍,例如最 大圖片分配了,幀頻,比特率等等。對于解碼器,一個(gè)指定的level要求可以對該level以及低于該level的碼流進(jìn)行解碼。(A decoder that conforms to a given level is required to be capable of decoding all bitstreams that are encoded for that level and for all lower levels. 來源:http://en./wiki/H.264/MPEG-4_AVC

Levels with maximum property values

Level Max macroblocks Max video bit rate (VCL) Examples for high resolution @
frame rate
(max stored frames)
per second per frame BP, XP, MP
(kbit/s)
HiP
(kbit/s)
Hi10P
(kbit/s)
Hi422P, Hi444PP
(kbit/s)
1 1,485 99 64 80 192 256 128×96@30.9 (8)
176×144@15.0 (4)
1b 1,485 99 128 160 384 512 128×96@30.9 (8)
176×144@15.0 (4)
1.1 3,000 396 192 240 576 768 176×144@30.3 (9)
320×240@10.0 (3)
352×288@7.5 (2)
1.2 6,000 396 384 480 1,152 1,536 320×240@20.0 (7)
352×288@15.2 (6)
1.3 11,880 396 768 960 2,304 3,072 320×240@36.0 (7)
352×288@30.0 (6)
2 11,880 396 2,000 2,500 6,000 8,000 320×240@36.0 (7)
352×288@30.0 (6)
2.1 19,800 792 4,000 5,000 12,000 16,000 352×480@30.0 (7)
352×576@25.0 (6)
2.2 20,250 1,620 4,000 5,000 12,000 16,000 352×480@30.7(10)
352×576@25.6 (7)
720×480@15.0 (6)
720×576@12.5 (5)
3 40,500 1,620 10,000 12,500 30,000 40,000 352×480@61.4 (12)
352×576@51.1 (10)
720×480@30.0 (6)
720×576@25.0 (5)
3.1 108,000 3,600 14,000 17,500 42,000 56,000 720×480@80.0 (13)
720×576@66.7 (11)
1280×720@30.0 (5)
3.2 216,000 5,120 20,000 25,000 60,000 80,000 1,280×720@60.0 (5)
1,280×1,024@42.2 (4)
4 245,760 8,192 20,000 25,000 60,000 80,000 1,280×720@68.3 (9)
1,920×1,080@30.1 (4)
2,048×1,024@30.0 (4)
4.1 245,760 8,192 50,000 62,500 150,000 200,000 1,280×720@68.3 (9)
1,920×1,080@30.1 (4)
2,048×1,024@30.0 (4)
4.2 522,240 8,704 50,000 62,500 150,000 200,000 1,920×1,080@64.0 (4)
2,048×1,080@60.0 (4)
5 589,824 22,080 135,000 168,750 405,000 540,000 1,920×1,080@72.3 (13)
2,048×1,024@72.0 (13)
2,048×1,080@67.8 (12)
2,560×1,920@30.7 (5)
3,680×1,536@26.7 (5)
5.1 983,040 36,864 240,000 300,000 720,000 960,000 1,920×1,080@120.5 (16)
4,096×2,048@30.0 (5)
4,096×2,304@26.7 (5)

 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多