H.265(HEVC)深度解析(上)

来源 :信息化视听 | 被引量 : 0次 | 上传用户:jiwei5520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  带宽危机,H.265救驾
  数字视频的超高清潮流奔腾向前,帧率从30fps向60fps、120fps甚至240fps进发,与此同时,物理媒介日薄西山,内容正通过有形无形的网络在世界各个角落的终端设备上传递。高度密集的数据给带宽和存储带来巨大挑战,当前主流的H.264开始不敷应用,而新一代视频编码标准H.265似乎成为了数字4K时代的“救世主”。
  H.265又称为HEVC(全称High Efficiency Video Coding,高效率视频编码,本文统称为H.265),是ITU-T H.264/MPEG-4 AVC标准的继任者。2004年由ISO/IEC Moving Picture Experts Group(MPEG)和ITU-T Video Coding Experts Group(VCEG)作为ISO/IEC 23008-2 MPEG-H Part 2或称作ITU-T H.265开始制定。第一版的HEVC/H.265视频压缩标准在2013年4月13日被接受为国际电信联盟(ITU-T)的正式标准。
  理论上H.265比H.264效率提高30-50%(尤其是在更高的分辨率情形下),但真的只是这么简单吗?
  H.265的改变
  H.265重新利用了H.264中定义的很多概念。两者都是基于块的视频编码技术,所以它们有着相同的根源和相近的编码方式,包括:
  1、以宏块来划分图片,并最终以块来细分。
  2、使用帧内压缩技术减少空间冗余。
  3、使用帧内压缩技术减少时间冗余(运动估计和补偿)。
  4、使用转换和量化来进行残留数据压缩。
  5、使用熵编码减少残留和运动矢量传输和信号发送中的最后冗余。
  事实上,视频编解码从MPEG-1诞生至今都没有根本性改进,H.265也只是H.264在一些关键性能上的更强进化以及简单化。
  那么问题来了,H.265到底强在哪里?
  和H.264一样,H.265也可以根据带宽需求进行调节。但你是想在普通互联网上传输4K内容,还是要实现最好的图像质量,就要厘清“更多的压缩”和“更好的压缩”这两个概念。如果只是更多的压缩,4K和超高清不一定要保证比今天的1080p或HD做到更好的图片质量。根据压缩数量的多少,流媒体4K有可能看起来比现在的1080p蓝光更糟糕,因为1080p蓝光相比在线流媒体会有更多的带宽留给视频。更好的压缩则意味着更聪明的压缩,面对同样的原始素材,更好的压缩会以更好的方式,在不牺牲质量的情况下令数据量减少。更多的压缩很容易,而更好的压缩需要更多的思考和更好的技术,通过更智能的算法来处理图像,在维持质量的同时保持更低的比特率,这正是H.265所要做的。
  如何实现更好的压缩,举例来讲,我们通常会发现在很多的图像素材里,如视像会议或者电影的很多场景中,每一帧上的大部分内容并没有改变太多,视像会议中一般只有讲话者的头在动(甚至只有嘴唇在动),而背景一般是不动的,在这种情况下,我们的做法不是对每一帧的每一个像素编码,而是对最初的帧编码,然后仅对发生改变的部分进行编码。
  H.265正从以下几个方面向着“更好的压缩”迈进。
  图像分区
  H.265将图像划分为“编码树单元(coding tree Unit,CTU)”,而不是像H.264那样的16×16的宏块。根据不同的编码设置,编码树单元的尺寸可以被设置为64×64或有限的32×32或16×16。很多研究都显示更大的编码树单元可以提供更高的压缩效率(同样也需要更高的编码速度)。每个编码树单元可以被递归分割,利用四叉树结构,分割为32×32、16×16、8×8的子区域,下图就是一个64×64编码树单元的分区示例。每个图像进一步被区分为特殊的树编码块组,称之为切割(Slices)和拼贴(Tiles)。编码树单元是H.264的基本编码单位,如同H.264的宏块。编码树单元可向下分为编码单元(Coding Unit,CU)、预测单元(Prediction Unit,PU)及转换单元(Transform Unit,TU)。
  每个编码树单元内包含1个亮度与2个色度编码树块,以及记录额外信息的语法元素。一般来说影片大多是以YUV 4:2:0色彩采样进行压缩,因此以16×16的编码树单元为例,其中会包含1个16×16的亮度编码树区块,以及2个8×8的色度编码树区块。
  转换尺寸
  每个编码单元可以四叉树的方式递归分割为转换单元。与H.264主要以4×4转换,偶尔以8×8转换所不同的是,H.265有若干种转换尺寸:32×32、16×16、8×8和4×4。从数学的角度来看,更大的转换单元可以更好地编码静态信号,而更小的转换单元可以更好地编码更小的“脉冲”信号。
  预测单元
  在转换和量化之前,首先是预测阶段(包括帧内预测和帧间预测)。
  一个编码单元可以使用以下八种预测模式中的一种进行预测。
  即使一个编码单元包含一个、两个或四个预测单元,也可以使用专门的帧间或帧内预测技术对其进行预测,此外内编码的编码单元只能使用2N×2N或N×N的平方划分。间编码的编码单元可以使用平方和非对称的方式划分。
  帧内预测:H.265有35个不同的帧内预测模式(包括9个AVC里已有的),包括DC模式、平面(Planar)模式和33个方向的模式。帧内预测可以遵循转换单元的分割树,所以预测模式可以应用于4×4、8×8、16×16和32×32的转换单元。
  帧间预测:针对运动向量预测,H.265有两个参考表:L0和L1。每一个都拥有16个参照项,但是唯一图片的最大数量是8。H.265运动估计要比H.264更加复杂。它使用列表索引,有两个主要的预测模式:合并和高级运动向量。
  在编码的过程,预测单元是进行预测的基本单元,转换单元是进行转换和量化的基本单元。这三个单元的分离,使得转换、预测和编码各个处理环节更加灵活。
  去块化
  与H.264在4×4块上实现去块化所不同的是,HEVC的只能在8×8网格上实现去块。这就能允许去块的并行处理(没有滤波器重叠)。首先去块的是画面里的所有垂直边缘,紧接着是所有水平边缘。与H.264采用一样的滤波器。采样点自适应偏移
  去块之后还有第二个可选的滤波器,叫做采样点自适应偏移。它类似于去块滤波器,应用在预测循环里,结果存储在参考帧列表里。这个滤波器的目标是修订错误预测、编码漂移等,并应用自适应进行偏移。
  并行处理
  由于HEVC的解码要比AVC复杂很多,所以一些技术已经允许实现并行解码。最重要的为拼贴和波前。图像被分成树编码单元的矩形网格(Tiles)。当前芯片架构已经从单核性能逐渐往多核并行方向发展,因此为了适应并行化程度非常高的芯片实现,H.265引入了很多并行运算的优化思路。
  总而言之,HEVC将传统基于块的视频编码模式推向更高的效率水平,总结一下就是:
  -可变量的尺寸转换(从4×4到32×32)。
  -四叉树结构的预测区域(从64×64到4×4)。
  -基于候选清单的运动向量预测。
  -多种帧内预测模式。
  -更精准的运动补偿滤波器。
  -优化的去块、采样点自适应偏移滤波器等。
其他文献
武汉,简称汉,湖北省省会,中国中部地区中心城市,地处中国中心,江汉平原东部,是国家15个副省级城市之一,同时也是全国两型社会建设综合配套改革试验区。公安部自2003年起组织实施城市报警与监控试点建设。2005年武汉市成为22个试点城市之一。  2009年底,为落实“平安城市”建设,武汉市公安局规划在全市组织建设22.5万个监控点,其中一类监控点5000个,用于覆盖主城区出城道口、跨江大桥、隧道、主
期刊
本期,我们走访了中国声光视讯芒协联合会(以下简称芒协)总会副会长、深圳分会会长杨德全先生,对于这个低调而接地气的行业联盟有了更全面的认识。  InfoAV China:“芒协”是一个什么组织?  杨德全:中国声光视讯芒协联合会,是中国声光视讯行业一群志同道合的行业资深人士,在一起共同见证和分享快乐的过程中,发起成立的一个行业联盟。目前,已经从北京发展到了全国10多个省份,形成了以总会为核心的多个地
期刊
移动互联  在全球掀起移动办公的浪潮冲击下,UC已经成为工作潮流,每个企业都在追求将各种场所转变为高效率协作中心,适应各种类型会议环境对高质量语音、视频和内容协作解决放案的需求。以期透过工作型态转变,协助企业以更高效的方式沟通,提升营运效率、活化组织创新。  随时随地、随心所欲工作,这已经成为人们工作方式中很自然的一种态度,对设备的移动性要求也就越来越高。今年展会上,理光的小型视频会议系统P350
期刊
最近几年的CES展会上,OLED频频以高调的姿态出现,不管是主打4K,还是主打曲面,抑或是主打4K+曲面,采用OLED技术的面板与电视,都以自发光、超薄轻便、柔性可弯曲、可透明、亮度高、色彩丰富、分辨率高等特别优势受到人们的关注与青睐。作为展会展出,OLED就这样被展览了十多年,并被普遍认为是优于LCD的平板显示技术。  尽管如此,经过了这么多年热炒的OLED技术,仍然远未成气候,应用市场仍少见其
期刊
如今在探讨视频监控发展趋势的众多文章和专家论述中,高清化、智能化和网络化被公认今后的必然方向。高清和网络化很好理解,那么智能化的核心是什么呢?答案是视频分析。  视频分析让视频监控插上了智能的翅膀,在以往没有视频分析功能的传统视频监控系统中,录像数据无法被有效地分类存储,最多只是打上时间标签,因此数据查找非常耗时且很难有效获得需求信息。同时传统监控是一种被动监控,仅能起到录像的工作,在异常、突发事
期刊
在安防领域,视频监控先后经历了模拟化、数字化和网络化的发展阶段,视频监控的产品、技术与系统在这些阶段也各自呈现出不同的功能与特点。值得一提的是,2011年国家发改委出台的《产业结构调整指导目录(2011年本)》中提及“城市智能视觉监控、视频分析及视频辅助刑事侦察技术设备”,不仅为视频监控指明了智能化发展方向,同时对视频监控高端技术的智能化发展也起到了极大的推动作用。  此后,高清智能化监控便不断被
期刊
来自55个国家的300多名媒体记者,15家企业——又再成就一次成功的IFA全球新闻发布会,为将于9月在柏林开幕的全球消费电子行业的盛事——IFA 2015奠定良好的基础,并定下新一届展会科技创新、物联网融合的大主题。  今年的IFA全球新闻发布会重归马耳他,囊括了全球几乎所有著名消费电子权威传媒,而在参展和发表演讲的公司里面也包括了微软、博世、飞利浦、根德、TP Vision、三星和西门子等多家著
期刊
物联网  物联网是InfoComm 2015展会的一个重要主题,包括三星、快思聪、Harman、思科等主流厂商高管都视物联网为行业热门。在展馆门口,甚至还有无人驾驶系统和无人机展蓬。专家预期无人飞机将会在现场活动中大展身手,例如用于定向麦克风进行音频采集,也有越来越多的无人机应用开始涉及视频领域。  物联网包含了大量传感器,隐私问题是物联网的症结之一。但很多客户仍希望使用物联网技术专门追踪人的活动
期刊
假装我有Apple Watch  因为苹果的名气、苹果表的诱惑实在太大,宣传手段实在逆天的缘故,对于Apple Watch渴求情绪很早就激荡在世界各地形形色色的人们当中。早在Apple Watch在苹果零售店上架前半个月,有能力购买和没能力购买的“苹果粉”都希望能有“比周围的人们更早”拿到货或试戴的机会。在这样的背景之下,一款名为AR Watch的App应运而生了,即便买不到,即便买不起,也能极大
期刊
关键编码特征比较  H.265所面临的挑战  与之前从H.261到H.264的其他标准相比,H.265的显著改善不仅表现在帧间压缩领域,还表现在帧内压缩方面。由于可变量的尺寸转换,H.265在块压缩方面有很大的改善,但是增加压缩效率的同时也带来了一些新挑战。  困难的场景  视频编码是一个复杂的问题,对于内容的依赖性很高。众所周知,有静态背景和高亮的低动态场景可以比高动态、黑场的图片进行更多的压缩
期刊