新一代視頻壓縮技術 H.265 解析

jopen 10年前發布 | 24K 次閱讀 H.265

筆者下載高清電影的時候,如果看到編碼格式采用H.264,相對來說就會覺得比較放心,因為采用這種編碼格式的畫面質量不錯。然而這類電影文件體積非常 大,以我國目前的網絡狀況,下載一部收藏級的高清電影實在需要無比的耐心。也許有人認為去視頻網站看高清不就行了,但在挑剔的影迷眼里,在線視頻遠遠達不 到高清的標準。不過這種情況也許會有所改變了,因為旨在有限帶寬下傳輸更高質量視頻的H.265標準,現已加入視頻編碼之中。

H.265又稱為HEVC(High Efficieny Video Coding),是國際標準化組織和國際電聯組織聯合制定的新一代視頻壓縮標準,主要面向高清數字電視以及視頻編解碼系統的應用。去年8月,愛立信公司推 出了首款H.265編碼解碼器,6個月后國際電聯(ITU)就正式批準通過了該標準。H.265的目標是編碼效率比H.264提高50%,即在同等圖像質 量條件下,目標碼率下降到H.264的50%,帶寬也只需原來的一半。這就意味著我們的移動設備將能夠直接在線播放全高清(1080p)視頻。而 H.265標準也同時支持從SQICF(128×96)到8K超高清(8192×4320)不同的視頻應用。

在了解H.265的優點之前,我們不妨先回顧一下H.264。

關于H.264

H.264是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態圖像專家組(MPEG)聯合組成的聯合視頻組(JVT,Joint Video

Team)提出的高度壓縮數字視頻編解碼器標準。H.264是藍光的編解碼標準之一,所有的藍光播放器都必須能解碼H.264。它也被廣泛使用于各種高精 度視頻的錄制、壓縮和發布。更重要的是,蘋果公司當初拋棄了Adobe的VP6編碼,選擇了H.264,讓這個標準隨著無數的iPad和iPhone走入 了千家萬戶,最終成為了高清時代視頻編碼領域的絕對霸主。

H.264在邏輯上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網絡抽象層(NAL:Network Abstraction Layer)負責以網絡所要求的恰當的方式對數據進行打包和傳送。

VCL層數據即編碼處理的輸出,它表示被壓縮編碼后的視頻數據序列。H.264采用DCT變換編碼加D PCM差分編碼的混合編碼結構,還增加了如多模式運動估計、幀內預測、多幀預測、基于內容的變長編碼、4×4二維整數變換等新的編碼方式,提高了編碼效 率。NAL則負責使用下層網絡的分段格式來封裝或映射數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。NAL支持視頻在電路交換信道上 的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。H.264包含了用于差錯消除的工具,便于壓縮視頻在容易誤碼、丟包的環 境中傳輸,提高了容錯性能。

總結起來,H.264較過去的壓縮標準,具有以下特點:

更高的編碼效率:在同等圖像質量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG- 4的1.5~2倍。一部120分鐘的全高清電影可以壓縮到20G B左右,同時畫面質量優于MPEG-2格式。相對而言更利于傳播和存儲。

更好的網絡適應能力:H.264可以工作在實時通信應用(如視頻會議)低延時模式下,也可以工作在沒有延時的視頻存儲或視頻流服務器中,并且很好地解決了網絡傳輸丟包的問題。

當然,H.264的性能改進是以增加編解碼計算的復雜性為代價而獲得的,因此一些“老爺機”播放MPEG-2高清視頻可能無壓力,但播放H.264的視頻就會相當吃力。不過現在即便是平板電腦都已經支持H.264硬解碼了。

H.264的局限性

每個高清愛好者都和H.264有過一段美好的過去,但是H.264終究不能永遠陪你看風景。因為現在的數字視頻正在朝著以下“變態”方向發展:

1、更高的清晰度:720p已經過時,1080p也顯出老態,4K、8K的視頻正在向我們走來;

2、更高的幀率:連影院都不滿足24fps的幀率,彼得·杰克遜拍攝《霍比特人》就采用了48fps幀率。而數字視頻更是朝著60fps、120fps甚至240fps的應用場景升級;

3、更高的壓縮率:清晰的畫面和有限的帶寬及存儲空間之間永遠是矛盾的。因此,在有限的帶寬和存儲空間下獲得最佳視頻效果,是高清領域所有相關人員的不懈追求。

面對這3個“變態”條件,如果我們一直執H.264之手不放,就會出現一些問題:

數的爆發式增長,會導致用于編碼宏塊的預測模式、運動矢量、參考幀索引和量化級等宏塊級參數信息所占用的碼字過多,導致用于編碼殘差部分的碼字減少。

2、由于分辨率提高,單個宏塊所表示的圖像內容的信息大大減少,導致相鄰的4×4或8×8塊進行整數變換后,低頻系數的相似程度大大提高,繼而出現大量的冗余。

3、由于分辨率提高,表示同一個運動的運動矢量的幅值將大幅增加,H.264中用來對運動矢量進行預測以及編碼的方法壓縮率將逐漸降低。

4、H.264的一些關鍵算法例如采用CAVLC和CABAC兩種基于上下文的熵編碼、去塊濾波等都要求串行編碼,并行度比較低。而現在的GPU、DSP、FPGA、ASIC等并行化程度都非常高。H.264的這種串行化特征越來越成為制約運算性能的瓶頸。

H.265,就是為了解決這些問題而來的。

H.265解析

H.265/HEVC的編碼架構大致上和H.264/AVC的架構相似,也包含幀內預測、幀間預測、轉換、量化、去區塊濾波器、熵編碼等模塊。為了提高高 清視頻的壓縮編碼效率,H.265提出了超大尺寸四叉樹編碼架構,并采用編碼單元(Coding Unit,CU)、預測單元(Predic tUnit,PU)和轉換單元(Transform Unit,TU)三個基本單元執行整個編碼過程。在此混合編碼框架下,H.265進行了大量的技術創新,例如:基于大尺寸四叉樹塊的分割結構和殘差編碼結 構、多角度幀內預測技術、運動估計融合技術、高精度運動補償技術、自適應環路濾波技術以及基于語義的熵編碼技術。

CU類似于H.264/AVC中的宏塊。H.264中每個宏塊大小都是固定的16×16像素,而H.265的CU可以選擇從最小8×8到最大64×64像 素。以圖4為例,圖中細節不多的區域(如車體的紅色部分和地面的灰色部分)劃分的CU大而少,編碼后的數據較少;而細節多的地方劃分的CU較小而多,編碼 后的數據較多,這樣就對圖像進行了有重點的編碼,提高了編碼效率。

PU是進行預測的基本單元。H.265使用PU來實現對每一個CU單元的預測過程。PU尺寸受限于其所屬的CU,可以是例如64×64像素的方塊,也可以 是例如64×32像素的矩形。還有一種新的不對稱運動分割預測(Asymmetric Motion Partition,AMP)方案,即將編碼單元分為兩個尺寸大小不一致的預測塊。這種預測方式考慮了大尺寸可能的紋理分布,可以有效提高大尺寸塊的預測 效率。

T U是進行變換和量化的基本單元。H.265突破了原有的變換尺寸限制,可支持4×4至32×32的編碼變換,以TU為基本單元進行變換和量化。為提高大尺寸編碼單元的編碼效率,DCT變換同樣采用四叉樹型的變換結構。

CP、PU、TU這三個單元的分離,使得變換、預測和編碼各個處理環節更加靈活,也有利于各環節的劃分更加符合視頻圖像的紋理特征,有利于各個單元更優化的完成各自的功能。

H.265的幀間、幀內預測的基本框架與H.264基本相同:采用相鄰塊重構像素對當前塊進行幀內預測,從相鄰塊的運動矢量中選擇預測運動矢量,支持多參 考幀預測等。但H.265的幀內預測模式支持33種方向(H.264只支持8種),并提供了更好的運動補償處理和矢量預測方法。同時,為了適應當前并行化 程度非常高的芯片架構,H.265引入了很多并行運算的優化思路,以提高編碼解碼效率。

反復的質量比較測試已經表明,在相同的圖像質量下,通過H.265編碼的視頻將比H.264編碼的視頻體積減少40%左右。同時,在碼率減少一半多的情況下,H.265編碼視頻的質量還能與H.264編碼視頻近似甚至更好。這一結論雖然帶有主觀性,但也非常鼓舞人心。

目前的H. 265標準共有三種模式:Main、Main 10和Main Still Picture。Main模式支持8bit色深(即紅綠藍三色各有256個色度,共1670萬色),Main 10模式支持10bit色深,將會用于超高清電視(UHDTV)上。

H.265對高清發展的影響

低碼率帶來高畫質,這是H.265最大的優勢。我們現在能夠估計到它對未來數字視頻的發展有以下影響:

讓高清視頻監控成為現實:高清視頻在安防監控中正在普及,但也帶來了存儲成本與空間的急劇上升。與現在正在使用的H.264編碼技術相比,H.265的高壓縮率能夠節省一半左右的存儲空間,從而顯著降低了視頻的存儲成本。

讓4K超高清電視走得更快:目前4K超高清電視產品已經不少,一些產品的價格已經低至四五千元。對于很多家庭而言購買起來并無太大壓力,但4K片源難 找,4K電視看普通節目完全是高射炮打蚊子。隨著H.265相關軟硬件的成熟,當一張藍光光盤就能容納一部4K影片的時候,才是這些4K超高清電視真正發 揮作用的時候。

讓高清電視節目更加普及:目前有線電視系統中,采用的還是較早的MPEG-2標準,連H.264都沒達到。原因就是受傳輸網絡帶寬的總體局限,另外 H.264編碼也需要繳納授權費。而H.265在確保畫質的同時更加有利于傳輸,同樣的內容,H.265可以減少70%~80%左右的帶寬消耗。這一點也 許最終可以說服那些頑固的廣播電視公司放棄MPEG-2,采用H.265在現有帶寬條件下輕松傳播全高清1080p電視節目。而出于節省帶寬的目的,衛星 電視公司也許會更加積極。

讓隨時隨地觀看高清視頻成為可能:隨著移動設備的發展,人們需要隨時隨地都能更便捷地獲取所需內容與服務。LTE等4G技術顯著提高了視頻業務的商用可行 性。移動終端顯示屏的ppi及分辨率都越來越高,加之H.265的高壓縮率特性,將進一步促使高清甚至超高清視頻在4G網絡下流暢傳輸的普及。

此外,現在視頻網站所謂的“高清”是遠遠達不到高清標準的。以筆者手里的《變形金剛3:月黑之時》為例,這是采用x.264格式將藍光原盤重新打包后的全 高清版本,片長2小時34分鐘,平均碼率為17.5Mb/s,文件個頭達到18.9GB。這種電影要想在線直接觀看,網絡帶寬就必須大于其平均碼率。以現 在的網絡條件,這幾乎是不可能的任務。

筆者在迅雷看看網站上找了到《變形金剛3》高清版,通過網頁直接播放。由于不能直接獲得影片的媒體信息,筆者于是估算了一下。網站要求欣賞高清視頻的帶寬 必須達到4Mb以上。4Mb帶寬意味著網速最高不超過500KB/s。在線視頻播放過程就是邊下載邊播放,要想畫面流暢,視頻文件體積必須小于當前帶寬的 下載極限。《變形金剛3》片長154分鐘,在4Mb帶寬下,滿打滿算可以下載4.7GB的文件。相應的,其平均碼率自然也低于4Mb/s。18.9GB的 全高清版都相差甚遠。因此,這并不是真正的高清視頻。

目前,迅雷看看客戶端推出了H.265的體驗版,里面同樣有《變形金剛3》。通過查看媒體信息可知,視頻文件為2.55GB,平均碼率2362kb/s。 主觀感受其畫面質量超過了網頁播放的高清版的水平,但與18.9GB的高清版仍有較大差距,畢竟碼率差了7倍多。但是這至少給出一個信號:如果采用 4Mb/s左右的碼率進行H.265編碼,畫面質量差距將會大大縮小。

H.265背后的問題

H.265的前途看起來一片光明,但眼下還有一些問題必須解決。現在包括平板電視和高清播放機在內的設備都可以解碼H.264編碼文件,而H.265屬于 新技術,使用H.265編碼的視頻文件名為hm10,其圖像質量和計算復雜性與H.264相比提升了好幾倍,需要專門的軟硬件來予以相應的支持。目前很多 播放器還不能播放H.265視頻。同時,H.265編碼還涉及到授權費問題,如果商用化就必須繳納相應的授權費用,那么這筆費用由廠商還是消費者來承擔?

除了價錢之外,消費者關心的另一個問題就是什么時候能買到相關產品。在硬件方面,筆者相信AMD、英偉達等顯卡廠商多半會最先站出來支持H.265。但是 在移動設備領域,一些CPU強大到可以對H.265進行軟解碼的手機、MP4等產品,也許會被迅速包裝成“支持H.265視頻解碼”來忽悠消費者。

但這種支持意味著電量的高速消耗(因為運算量太大),而且也并非真正的支持,所以請大家不要看到“H.265”就急著撲上去。

今后,H.265標準將會成為超高清電視(UHDTV)的4K和8K分辨率的選擇。但這些視頻內容應該怎樣傳送?采用哪些標準?索尼等媒體巨頭正在絞盡腦 汁。藍光光盤協會(The Blu-ray Disc Association)也正在研究讓現有藍光標準支持4K分辨率視頻的方法。理論上H.265可以讓藍光光盤容納4K電影,但卻需要制造全新的播放器才 能播放,對于廠商和消費者而言這都不是件好事。

盡管有這樣那樣的阻礙,但我們仍應該對H.265持謹慎樂觀的態度。有一點是肯定的,H. 265在同等的內容質量上會顯著減少帶寬消耗。我們談了很多年的高清廣播電視以及4K視頻的網絡播放的普及,在H.265的輔助下也許將不再有那么多困難。

X.264是一個開源項目,基于H.264編碼技術的、面向業余市場的免費編碼格式,是H.264的子集,只能實現H.264的部分功能。X.264多用于網絡上流傳的重壓縮的視頻內容。</p> via MacX

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!