新一代視頻編碼H.265技術特點分析

發布時間:2016-01-26本文出處: 本站

一、應用背景

 在數字視頻應用產業鏈快速發展的今天,視頻應用不斷向高清晰度、高幀率、高壓縮率的方向發展,當前目前在用的主流視頻壓縮標準H.264(AVC)的局限性不斷凸顯。由此導致了新一代視頻壓縮標準H.265 (HEVC)的誕生。

 從應用的角度上看,視頻應用的發展方向是:

 1)高清晰度(Higher Definition):數字視頻應用格式從720 P向1080 P升級,部分應用領域甚至出現了4K x 2K、8K x 4K的數字視頻格式;

 2)高幀率(Higher frame rate ):數字視頻幀率正在從30 fps向60fps、120fps的應用場景升級;

 3)高壓縮率(Higher Compression rate ):傳輸帶寬和存儲空間一直是視頻應用中最為關鍵的資源,需要借助於高壓縮率減小有限帶寬、存儲空間與應用體驗之間的矛盾。

 基於以上的技術與應用發展趨勢,繼續采用H.264編碼的局限性是:

 1)由於分辨率的提高,帶來的宏塊數量的爆發式增長會導致用於編碼宏塊的預測模式、運動矢量、參考幀索引和量化級等宏塊級參數信息所占用的碼字過多,而用於編碼殘差部分的碼字明顯減少。

 2)分辨率的提高使得單個宏塊所含有的圖像內容信息大大減少,這將導致相鄰的4 x 4或8 x 8塊變換後的低頻係數相似程度極大的提高,出現大量的冗餘。

 3)分辨率的提高使得表示同一個運動的運動矢量幅值大大增加。H.264采用單個運動矢量預測值,對運動矢量差編碼使用的是哥倫布指數編碼,該編碼方式的特點是數值越小使用的比特數越少。也就是說,運動矢量幅值的增加將降低H.264中用來對運動矢量的預測及編碼方法的壓縮率。

 4)H.264中采用的CAVLC和CABAC兩種基於上下文的熵編碼方法和自適應算術編碼中采用的deblock濾波等都要求串行編碼,並行度比較低。針對GPU/DSP/FPGA/ASIC等並行化程度非常高的CPU,H.264的這種串行化處理越來越成為製約運算性能的瓶頸。

 為了應對以上應用與技術問題,2010年1月,ITU-T VCEG(Video Coding Experts Group) 和ISO/IEC MPEG(Moving Picture Experts Group)聯合成立JCT-VC(Joint Collaborative Team on Video Coding)了聯合組織,統一製定下一代編碼標準HEVC(High Efficiency Video Coding)。該標準已於2013年1月由ITU-T 正式頒布為H.265標準。

二、HEVC(H.265)新技術特點

 作為新一代視頻編碼標準,H.265仍然屬於預測加變換的混合編碼框架。然而,相對於H.264,H.265 在很多技術方麵有了革命性的變化,主要的技術特點是:

 1)靈活的編碼結構

 在H.265中,對宏塊的大小定義從H.264的16x16擴展到了64x64,以便於高分辨率視頻的壓縮。同時采用了更加靈活的編碼結構,以提高編碼效率,采用了包括編碼單元(Coding Unit)、預測單元(Predict Unit)和變換單元(Transform Unit)。如圖1所示:

圖1  編碼單元(CU)、預測單元(PU)、變換單元(CU)

 其中,編碼單元類似於H.264/AVC中的宏塊概念,用於編碼過程;預測單元是進行預測的基本單元,變換單元是進行變換和量化的基本單元。這三種單元的分離,使得變換、預測和編碼等處理環節更加靈活,有利於各環節的劃分更加符合視頻圖像的紋理特征,有利於各個單元更優化的完成各自的功能。

 2) 靈活的塊結構----RQT(Residual Quad-tree Transform)

 RQT是一種自適應變換技術,這種思想是對H.264/AVC中ABT(Adaptive Block-size Transform)技術的延伸和擴展。對於幀間編碼來說,它允許變換塊的大小根據運動補償塊的大小進行自適應的調整。對於幀內編碼來說,允許變換塊的大小根據幀內預測殘差的特性進行自適應的調整。大塊的變換相對於小塊的變換能夠提供更好的能量集中效果,並能在量化後保存更多的圖像細節,副作用是使得量化後帶來更多的振鈴效應。因此,根據當前塊信號的特性,自適應的選擇變換塊大小,如圖2所示,可以在能量集中、細節保留與圖像的振鈴效應三者之間進行最優的折中。


圖2 靈活的塊結構示意圖

 3)采樣點自適應偏移(Sample Adaptive Offset)

 SAO在編解碼環路內,位於Deblock之後,通過對重建圖像的分類,對每一類圖像像素值加減一個偏移,目的是減小失真,從而提高壓縮率。

采用SAO後,平均可以減少2%~6%的碼流,而編碼器和解碼器的性能消耗僅僅增加了約2%。

 4)自適應環路濾波(Adaptive Loop Filter)

 ALF在編解碼環路內,位於Deblock和SAO之後,用於恢複重建圖像,以使得重建圖像與原始圖像之間的均方差最小。ALF的係數是以幀級計算和傳輸的,可以整幀應用ALF,也可以對於基於塊或基於量化樹的部分區域進行ALF。如果是基於部分區域的ALF,還必須傳遞指示區域信息的附加信息。

 5)並行化設計

 當前主流的處理芯片架構已經從單核逐漸向多核並行方向發展,因此為了適應並行化程度非常高的芯片實現,H265引入了很多並行運算的優化思路,主要包括以下幾個方麵:

 (1)Tile(圖塊):如圖3所示,用垂直和水平的邊界將圖像劃分為一些行和列,劃分出的矩形區域為一個Tile,每一個Tile包含整數個數的LCU(Largest Coding Unit)。Tile之間可以互相獨立,以此實現並行處理。


圖3 Tile劃分示意圖

 (2)Entropy slice(熵片):Entropy Slice允許在一個slice內部再切分成多個Entropy Slice,每個Entropy Slice可以獨立的編碼和解碼,以提高編解碼器的並行處理能力。


圖4 每一個slice可以劃分為多個Entropy Slice

 (3)Wavefront Parallel Processing(波前並行處理):前一行的第二個LCU處理完畢,即對當前行的第一個LCU的熵編碼概率狀態參數進行初始化,如圖5所示。目的是提高編解碼器的並行處理能力。


圖5 Wavefront Parallel Processing示意圖

 6)H.264中已有特性的改進

 相對於H.264,H.265標準算法的複雜性有了大幅提升,以此獲得較好的壓縮性能。H.265在很多特性上都做了較大的改進,如表1。

 表1 H.264和H.265關鍵特性對比:


三、 H.265技術的應用前景

 H.265標準是在H.264標準的基礎上發展起來的,結合H.264在視頻應用領域的主流地位可以預見H.265標準在今後將有著廣泛的應用前景。

 隨著芯片處理能力越來越強,算法複雜性對應用的影響是越來越小。相反,在算法實時應用以及IPTV應用中,業務的不斷擴展和需求的增加使得有限的帶寬資源逐漸成為瓶頸,高壓縮率的編碼是解決這一難題的有效技術手段,這也為H.265在IP流媒體服務領域的應用奠定了堅實的基礎。

 對於視頻監控應用來說,傳輸帶寬、存儲容量和計算複雜度一直是方案設計時需要反複權衡的關鍵問題。當聯網模式、多核芯片和集中存儲方案大規模應用後,網絡帶寬的瓶頸的問題愈加凸顯,提高視頻壓縮性能的需求日益迫切。

 從目前來看,H.265標準應用推廣的快慢,與專利方麵的鬆動有著緊密的關係。如果擁有H.265重要專利的企業(三星、高通、聯發科等)在一定的程度上願意將其專利加入到MPEG LA的專利池中,采取少收費或部分收費的方式,則在市場的應用將很快的推廣普及。相反地,各應用廠家,尤其是與上述企業存在業務競爭者,很可能采取審慎的態度,最終影響其普及。



網站設計:銳狐網絡 Copyright © 2010 - 2019 Whayer.cn.All Rights Reserved.       蜀ICP備09028657號