基于CPU+GPU混合平台的HEVC并行解码器

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:jx34343
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
HEVC(High Efficiency Video Coding)视频编码标准于2013年1月正式成为最新一代的国际视频编码标准,它的成功发布将视频压缩效率进一步提高,促进了视频技术的发展。与上一代编码标准H.264相比,HEVC标准能够在保证视频质量的前提下,将视频压缩率提高为原来的两倍。但是,这种压缩率的大幅度提升是以复杂度的增加为代价的,这也在很大程度上增加了编/解码器的实现难度,特别是在解码器方面,码流复杂度的提升会直接影响解码时间,降低视频播放速度,制约HEVC标准的实际应用。为了减少计算复杂度的增加对HEVC解码器效率的影响,本文设计了一种基于CPU+GPU混合平台的HEVC并行解码框架,通过CPU与GPU之间良好的信息传递和有效配合来高效地完成解码任务。在这一解码框架中,我们将计算复杂度较高的图像重构部分,包括帧内/帧间解码环节,反量化、反变换环节,去块滤波(DF)环节以及样点自适应补偿(SAO)环节,用GPU进行并行处理。通过设计高效的并行算法充分利用GPU的众核特性,并行完成图像重构任务,大幅度提高图像重构环节的速度;而对于上下文依赖关系较强的码流解析和熵解码环节,则用CPU进行串行处理。进一步,在本文的解码框架中,CPU共设置了 4个线程进行并行处理,分别为主线程,从线程1,从线程2和从线程3,其中主线程负责整体的线程调度和与GPU的信息交流,从线程1负责码流解析过程,从线程2负责熵解码过程,从线程3负责视频播放。而GPU负责整个图像重构部分,通过CPU与GPU的有效配合实现码流解析,熵解码,图像重构以及视频播放四者的并行,成功的将解码一帧视频的时间减小到四个环节中耗时最长的一个环节的运行时间,从而极大地提高解码器的运行速度。本文利用CUDA(ComputeUnified DeviceArchitecture)语言实现了所提出的各个并行算法以及整个并行解码框架,并采用大量的不同分辨率的视频码流对该并行解码器进行了测试。实验结果表明,本文所设计的HEVC并行解码器能够显著地提高解码速度,且设计的各个并行算法性能良好。当利用CPU Intel Core TM 17-7700和GPU GTX1080解码超高清(3840×2160)视频时,该并行解码器的整体加速比可以达到75倍以上,解码重构的帧率可以达到55帧/秒以上,能够在保证视频恢复质量的条件下,大幅度提高解码速度,能够实现高清视频乃至超高清视频的实时解码重构。
其他文献
显著性检测是许多图像处理过程的预过程,它广泛应用于图像分割、目标追踪以及行人再识别等领域。本文提出了两种显著目标检测算法,它们融合了底层以及高层的特征,并结合了自
高等教育发展与收入差距扩大是目前我国发展中两种非常显著的现象。随着经济的发展,中国对外开放程度提高,教育对收入差距的影响越来越大。本文主要就高等教育扩张与收入差距
二十国集团领导人峰会是全球主要发达国家和发展中国家就金融经济合作举行的最高领导峰会,每年举行两次。近年来,各方面的成就让世界有目共睹,中国的进步得到了世界各国的关
随着我国市场经济的发展和法治环境的变化,行政审判制度暴露出的各种弊端使行政审判庭面临着越来越大的压力,行政审判不仅存在“立案难”“审判难”“执行难”的痼疾,在独立
在弹道导弹中,捷联惯导系统(SINS)的导航精度是随时间的推移而发散的,不能够独立的完成导航任务,针对这一问题,本文展开了对捷联惯导系统和天文导航系统的位置组合导航系统的
为了处理复杂的计算问题,学者们多年来一直从大自然中汲取灵感来找到解决方法。优化在许多自然演化过程中占据了重要地位,如达尔文进化过程。几百万年来,每个物种都不得不进
随着信息技术的持续进步,人们每天会接触到大量的图像,其形式和内容越来越多样化,色彩越来越丰富。可计算图像美感的研究目的是利用计算机模拟人类视觉系统与审美思维,对图像
在心血管诊断方面,心电图准确的自动分析、诊断的作用极为突出,运用心电分析软件,医生可获得更为清晰的图形,进而提升诊断工作的准确性,这在临床诊断中起着重要价值。通过对
非小细胞肺癌(Non-small cell lung cancer,NSCLC)是最常见的恶性肿瘤之一,其发病率和死亡率均居我国城市居民恶性肿瘤之首。表皮生长因子受体酪氨酸激酶抑制剂(epidermal gr
机器视觉检测技术具有非接触性、精度高等特点,已经广泛应用于各个行业。在石油化工行业中,对轴套等金属零件普遍存在一定的腐蚀性。因此在使用前需涂一定厚度的防腐层。目前