文章數量 25
MPEG特點及應用
作者:佚名
MPEG的全稱是運動圖像專家組(Moving Picture Experts Group)的簡稱。這個名字本來的含義是指一個研究視頻和音頻編碼標準的小組,是專門制定多媒體領域內的國際標準的一個組織。現在我們所說的MPEG泛指又該小組制定的一系列視頻編碼標準。該小組於1988年組成,至今已經制定了MPEG-1、MPEG-2、MPEG-4、MPEG-7等多個標準,MPEG-21正在制定中。MPEG是ISO和IEC的工作組,它的官方頭銜為:第一技術委員會第二十九子委員會第十一號工作組,英文頭銜為ISO/IEC JTC1/SC29 WG11。MPEG包括MPEG視頻、MPEG音頻和MPEG系統(視音頻同步)3個部分。
MPEG的全稱是運動圖像專家組(Moving Picture Experts Group)的簡稱。這個名字本來的含義是指一個研究視頻和音頻編碼標準的小組,是專門制定多媒體領域內的國際標準的一個組織。現在我們所說的MPEG泛指又該小組制定的一系列視頻編碼標準。該小組於1988年組成,至今已經制定了MPEG-1、MPEG-2、MPEG-4、MPEG-7等多個標準,MPEG-21正在制定中。MPEG是ISO和IEC的工作組,它的官方頭銜為:第一技術委員會第二十九子委員會第十一號工作組,英文頭銜為ISO/IEC JTC1/SC29 WG11。MPEG包括MPEG視頻、MPEG音頻和MPEG系統(視音頻同步)3個部分。
一、MPEG編碼標準
MPEG壓縮標準是針對運動圖像而設計的、基本方法是——在單位時間內採集並保存第一幀信息,然後就只存儲其餘幀相對第一幀發生變化的部分,以達到壓縮的目的。MPEG壓縮標準可實現幀之間的壓縮,其平均壓縮比可達50︰ 1,壓縮率比較高,且又有統一的格式,兼容性好。
在多媒體數據壓縮標準中,較多採用MPEG系列標準,包括MPEG-1、MPEG-2、MPEG-4、MPEG-7等。MPEG-1(ISO/IEC 11172)是MPEG組織於1992年提出的第一個具有廣泛影響的多媒體國際標準。MPEG-1標準的正式名稱為「基於數字存儲媒體運動圖像和聲音的壓縮標準」,可見,MPEG-1著眼於解決多媒體的存儲問題。由於MPEG-1的成功制定,以VCD和MP3為代表的MPEG-1產品在世界範圍內迅速普及。繼成功制定MPEG-1之後,MPEG組織於1996年推出解決多媒體傳輸問題的MPEG-2標準。MPEG-2的正式名稱為「通用的圖像和聲音壓縮標準」。MPEG-2標準最為引人注目的產品是數字電視機頂盒與DVD。此後,MPEG並沒有停止前進的步伐,於1999年1月公佈了ISO的MPEG-4(視頻和音頻對象的壓縮)標準的第一版,隨後又於1999年12月公佈了此標準的第二版。MPEG-4的正式ISO命名為ISO/IEC14496。MPEG-4於1991年5月首次提出,1993年7月正式啟動,於1999年1月成為國際標準,經歷了長達6年的研究與討論。
二、MPEG編碼技術特點
1.MPEG-1是第一個官方的視頻音頻壓縮標準。用於傳輸1.5Mbps數據傳輸率的數字存儲媒體運動圖像及其伴音的編碼,經過MPEG-1標準壓縮後,視頻數據壓縮率為1/100~1/200,音頻壓縮率為1/6.5。MPEG-1提供每秒30幀352*240分辨率的圖像,當使用合適的壓縮技術時,具有接近家用視頻制式(VHS)錄像帶的質量。 MPEG-1允許超過70分鐘的高質量的視頻和音頻存儲在一張CD-ROM盤上。VCD採用的就是MPEG-1的標準,該標準是一個面向家庭電視質量級的視頻、音頻壓縮標準。其中的音頻壓縮的第三級(MPEG-1 Layer3)簡稱MP3,成為比較流行的音頻壓縮格式。
為了追求高的壓縮效率,去除圖像序列的時間冗余度,同時滿足多媒體等應用所必須的隨機存取要求,MPEG-1視頻把圖像編碼分成I幀、P幀、B幀和D幀共4種類型。I幀為幀內編碼幀(intra coded frame),編碼時採用類似JPEG的幀內DCT編碼,I幀的壓縮率是幾種編碼類型中最低的。P幀為預測編碼幀(predictive coded rame),採用前向運動補償預測和誤差的DCT編碼,由其前面的I或P幀進行預測。B幀為雙向預測編碼幀(bi-directionally predictive coded frame),採用雙向運動補償預測和誤差的DCT編碼,由前面和後面的I或P幀進行預測,所以B幀的壓縮效率最高。D幀為直流編碼幀(DC coded frame),只包含每個塊的直流份量。MPEG-1採用運動補償支除圖像序列時間軸上的冗余度,可使對P幀和B幀圖像的壓縮倍數比I幀提高很多。
2.MPEG-2是廣播質量的視頻、音頻和傳輸協議。主要針對高清晰度電視(HDTV)的需要,傳輸速率為10Mbps,與MPEG-1兼容,適用於1.5-60Mbps甚至更高的編碼範圍。 MPEG-2有每秒30幀704*480的分辨率,是MPEG-1播放速度的4倍。它適用於高要求的廣播和娛樂應用程序,如:DSS衛星廣播和DVD光盤技術,MPEG-2是家用視頻制式(VHS)錄像帶分辨率的2倍。
MPEG組織1995年推出的MPEG-2標準是在MPEG-1標準基礎上的進一步擴展和改進,主要是針對數字視頻廣播、高清晰度電視和數字視盤等制定的4~9Mbit/s運動圖像及其伴音的編碼標準,MPEG-2是數字電視機頂盒與DVD等產品的基礎。MPEG-2系統要求必須與MPEG-l系統向下兼容,因此其語法的最大特點在於兼容性好並可擴展。MPEG-2的目標與MPEG-1相同,仍然是提高壓縮比,改善音頻、視頻質量,採用的核心技術還是分塊DCT和幀間運動補償預測技術。MPEG-2視頻允許數據速率高達100Mbit/s,支持隔行掃瞄視頻格式和許多高級性能。考慮到視頻信號隔行掃瞄的特點,MPEG-2專門設置了「按幀編碼」和「按場編碼」兩種模式,並相應地對運動補償和DCT方法進行了擴展,從而顯著地提高了壓縮編碼的效率。考慮到標準的通用性,增大了重要的參數值,允許有更大的畫面格式、比特率和運動矢量長度。除此之外,MPEG-2視頻壓縮編碼還進行了以下擴展:
(1)輸入/輸出圖像彩色份量之比可以是4︰2︰0,4︰2:2,4︰4︰4。
(2)輸入/輸出圖像格式不限定。
(3)可以直接對隔行掃瞄視頻信號進行處理。
(4)在空間分辨率、時間分辨率、信噪比方面的可分級性適合於不同用途的解碼圖像要求,並可給出傳輸上不同等級的優先級。
(5)碼流結構的可分級性,比如頭部信息、運動矢量等部分可以給予較高的優先級,而對於DCT係數的高頻份量部分則給予較低的優先級。
(6)輸出碼率可以是恆定的也可以是變化的, 以適應同步和異步傳輸。
(1)輸入/輸出圖像彩色份量之比可以是4︰2︰0,4︰2:2,4︰4︰4。
(2)輸入/輸出圖像格式不限定。
(3)可以直接對隔行掃瞄視頻信號進行處理。
(4)在空間分辨率、時間分辨率、信噪比方面的可分級性適合於不同用途的解碼圖像要求,並可給出傳輸上不同等級的優先級。
(5)碼流結構的可分級性,比如頭部信息、運動矢量等部分可以給予較高的優先級,而對於DCT係數的高頻份量部分則給予較低的優先級。
(6)輸出碼率可以是恆定的也可以是變化的, 以適應同步和異步傳輸。
MPEG-2視頻是一系列的系統,每一個系統具有安排好的共性和兼容程度。它允許對四種源格式或者級別進行編碼,從簡單清晰度(CIF格式)到完全的高清晰度電視HDTV(High Definition Television)。除了源格式的這種靈活性外,MPEG-2還規定了分辨率從低到高的4級5類共11種單獨的技術規範,同一種類不同級別間的圖像分辨率和編碼速率相差甚遠。
3.MPEG-3 是ISO/IEC 最初為HDTV 開發的編碼和壓縮標準。MPEG-3要求傳輸速率在20Mbits/sec~40Mbits/sec間,但這將使畫面有輕度扭曲。但由於MPEG-2的高速發展,MPEG-3的功能已被淘汰,其原來的工作由MPEG-2小組承擔。
4.MPEG-4是2003年發佈的視頻壓縮標準,主要是擴展MPEG-1、MPEG-2等標準以支援視頻/音頻物件(video/audio "objects")的編碼、3D內容、低位元率編碼(low bitrate encoding)和數位版權管理 (Digital Rights Management)。採用超低碼率運動圖像和語言的壓縮標準用於傳輸速率低於64kbps的實時圖像傳輸,它不僅可覆蓋低頻帶,也向高頻帶發展。較之前兩個標準而言,MPEG-4為多媒體數據壓縮提供了—個更為廣闊的平台。它更多定義的是一種格式、一種架構,而不是具體的算法。它可以將各種各樣的多媒體技術充分用進來,包括壓縮本身的一些工具、算法,也包括圖像合成、語音合成等技術。MPEG-4從其提出之日起就引起了人們的廣泛關注,雖然不是每個人都清楚它的具體目標,但卻都對它寄予了很大的希望。MPEG-4的最大創新在於賦予用戶針對應用建立系統的能力,而不是僅僅使用面向應用的固定標準。此外,MPEG-4將集成盡可能多的數據類型,例如自然的和合成的數據,以實現各種傳輸媒體都支持的內容交互的表達方法。借助於MPEG-4,我們第一次有可能建立個性化的視聽系統。
MPEG-4專家組深入分析了AV領域中電視(television)、計算機(computer)、通信(communication)以及其交叉融合的發展趨勢後,認為MPEG-4應該提供用於通信的新方式,其核心是基於內容(content-based)的AV信息存儲、處理與操作,支持交互性、高壓縮比以及通用存儲性等功能。同時在其結構上應具有適應性與可擴展性,以適應硬、軟件技術的不斷發展,便於及時融合新的技術。
相對於MPEG的前兩個壓縮標準,MPEG-4已不再是一個單純的視頻音頻編解碼標準,它將內容與交互性作為核心,從而為多媒體提供了一個更為廣闊的平台。它更多定義的是一種格式和框架,而不是具體的算法,這樣人們可以在系統中加入許多新的算法。除了一些壓縮工具和算法外,各種各樣的多媒體技術如圖像分析與合成、計算機視覺、語音合成等也可以充分應用於編碼中。
5.MPEG-7標準的正式名稱叫「多媒體描述接口」(Multimedia Content Description Interface),並於2001年11月發佈。MPEG制定這個標準的主要目的,是為了解決多媒體內容的檢索問題。通過這個標準,MPEG希望對以各種形式存儲的多媒體結構有一個合理的描述,通過這個描述,用戶可以方便地根據內容訪問多媒體信息。在MPEG-7體系下,用戶可以更加自由地訪問媒體。比如,用戶可以在眾多的新聞節目中尋找自己關心的新聞,可以跳過不想看的內容而直接按自己的意願收看精彩的射門集錦;在互聯網上,用戶鍵入若干關鍵詞就可以在網上找到自己需要的克林頓的演講、貝多芬的交響樂等;甚至用戶只需出示一張成龍的照片或哼一首音樂的旋律,都可以找到自己所需要的多媒體材料。所有這些,都取決於MPEG-7中對各種多媒體內容的描述。
這些描述符與指定的多媒體對象的內容緊密聯繫,採用提取對像特徵的方法為實現基於內容和語義的準確檢索提供接口。在此基礎上,MPEG-7定義了一種描述定義語言(DDL,Description Definition Language)用於指定和生成描述方案,即希望提出新的視頻、音頻信息表示方式,它既不同於基於波形和基於壓縮的表示方式(如MPEG-1和MPEG-2),又不同於基於對象的表示方式(MPEG-4)。這一表示方式允許對信息的含義進行一定程度的解釋,它可以被一個設備或計算機解碼器存取。MPEG-7的目的在於提供一個標準化的核心技術,以便描述多媒環境下的視頻和音頻內容,最終使視頻和音頻搜集像文本搜集一樣簡單方便。
MPEG-7可以描述的多媒體對像範圍極其廣泛,其核心部分DDL語言將充分吸收現有的各種媒體描述語言的特點,以達到對多媒體數據的普遍適應性。MPEG-4中提出的基於對像編碼的思想將成為對多媒體數據庫中的視頻、音頻對像進行處理(包括特徵提取、壓縮編碼等)的基本手段。而MPEG-7的多媒體內容描述功能對MPEG-1、MPEG-2、MPEG-4起到性能提高和功能擴展的作用。
6.MPEG-21標準也於2000年6月啟動。MPEG-21的正式名稱叫「多媒體框架」。新標準MPEG-21是一個支持通過異構網絡和設備,使用戶透明方便地使用多媒體資源的標準,其目的是建立一個交互的多媒體對象,實現多種業務模型,包括對版權和交易的自動管理,對內容使用者隱私的尊重等。MPEG-21給我們提供了一種以高效、透明和可互操作的方式,在用戶間實現交換、接入、消費、貿易和控制DI( the Digital Item)的解決方案。而且,對於UMA,MPEG-21包含了對DI適應的技術,這使得UMA(universal multimedia access)可以與服務器、網絡和終端處的媒體源相適應,其具體內容正在制訂過程中。
總之,隨著MPEG組織的不斷努力,多媒體信息技術的日趨成熟,廣大用戶會日益感受到新技術和新標準給大家帶來的種種方便和實惠。



