基于OpenCL的高清视频实时去雾与H.264解码并行加速研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:freeskykq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年中,多媒体处理受到了极大的关注,消费者对高清晰度多媒体内容特别是高清视频和图像的创建和处理的需求也越来越大。然而,由于高清晰度多媒体内容中包含了大量的数据,处理和分析他们需要我们具备高性能计算能力。随着CPU+GPU异构计算环境的普及和OpenCL异构并行计算的兴起,利用GPU的大规模并行计算能力可以产生几个数量级的性能提升。因此,本文进行了基于OpenCL的高清视频实时去雾与H.264视频解码并行加速研究,具体如下:1)目前,基于单幅图像的去雾算法的研究重点大多集中在算法复杂度和图像的去雾效果上,对算法进行并行加速的研究还很有限。由于高清视频的分辨率比普通视频高出很多,这使得高清视频实时去雾的计算量非常巨大,需要更快的去雾速度。在本文中,我们基于一种单幅图像去雾算法(FHRUSI算法)提出了面向高清视频实时去雾的OpenCL并行实现和优化。首先我们实现了该算法的CPU串行版本,接下来根据串行版本提出了对应的基本OpenCL并行程序,我们根据嵌入式系统硬件平台的特点和算法本身的特点进行了优化设计。我们的优化工作充分利用了 AMD GPU的存储器层次结构,在降低内存访问延迟的同时提高了算法的并行度,大大减少了 FHRUSI去雾算法的执行时间。最后,我们将OpenCL并行优化版本作为独立的模块移植到开源多媒体框架FFMPEG中进行视频去雾实验。结果表明,我们可以以实时速率(每秒超过41帧)处理1080p(1920×1080)高清视频,并且高清晰度视频的去雾效果良好。优化后程序的执行速度提高了 4.8倍以上。2)在本文中,我们提出了基于开源多媒体框架FFMPEG的H.264逆离散余弦变换IDCT算法的OpenCL并行实现和优化。首先,我们将IDCT从宏块解码的循环中分离了出来并根据块大小把它的核心代码改写为两个在GPU上执行的OpenCL内核函数。其次,将IDCT计算任务从CPU端卸载到GPU端会带来额外的开销(内存拷贝和OpenCL运行时)。因此,我们对上述OpenCL程序进行了进一步的优化,包括CPU-GPU通信优化、本地内存优化以及进一步的优化。实验结果显示优化的GPU内核相比在CPU上执行的SIMD版本取得了显著的加速,然而,当考虑到内存拷贝和OpenCL运行时开销时,我们的实现并没有在应用层获得性能加速。
其他文献
疫病自古就与人类相伴,和战争一样破坏人类的祥和,且被帝国主义利用,成为改变人类社会历史的另类力量.中学历史教材中应增加抗疫史话,让学生认识疫病的起源和危害及对世界的
患者男,51岁,因“反复上腹部疼痛不适3年,加重15天”就诊。无高血压、胰腺炎及外伤史。查体:腹软,无压痛及反跳痛,腹部未扪及异常肿块。超声检查:左上腹脾门区探及大小约10.0
在“大众创业,万众创新”的时代背景下,应用型本科院校需要转变教育教学观念,注重学生实践能力和创新创业能力的培养。因此,本文以广州工商学院为例,从创新创业的视角出发,结合当前
结合工程实例,提出在危险废物及医疗废物焚烧车间具有爆炸危险的场所中,应严格划分爆炸危险区域,选择合适的防爆型电力设备,并对电力线路采取相应的防爆、接地措施。
本土知识数字化是保存和利用本土知识的有效方式。本土知识数字化处理措施包括对本土知识的收集、选择、描述、存储、传播等各方面。在本土知识数字化处理过程中,其中的技术
在全民医保的号角吹响后,我国医保的覆盖面进入了一个快速扩大的时期。然而,翻开全民医保这枚硬币的另一面,包括医保管理体制和医保付费方式等问题上变革探索的迟缓,却影响着医改
为了解花后高温和干旱双重胁迫对小麦的效应,以石麦15为材料,于花后15d到21d进行高温(34~36℃)和干旱(土壤含水量为田间持水量的40%~45%)处理,研究了高温和干旱胁迫对小麦旗叶光
为了将线结构光视觉测量原理应用于零件二维轮廓的同时检测,文中使用了十字线激光器作为结构光投射器,它将在空间中形成相互垂直的两个光平面,配置一个CCD相机就组成了一个十
文章从丰富信息技术的教学内容、激发学生的学习兴趣与学习热情、营造一定的教学氛围与自主学习情境、优化教学方法与激发学生的主观能动性等方面,探讨信息技术课程教学中培
气候变暖是21世纪制约人类社会发展的主要因素,为应对气候变暖的挑战,世界各发达国家纷纷出台自己的减排政策,中国也已经作出到2020将单位GDP能耗降低40%~45%的承诺。实现这