基于GPU的AVS2高速并行运动估计算法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:lw8312188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
AVS2是继AVS1之后推出的具有我国自主知识产权的新一代视频编码标准,通过四叉树编码单元灵活划分方式、新的编码技术等在保证图像质量的情况下编码效率相比H.264/AVC提高了一倍,编码能力与HEVC相当,但是在场景编码方式上,编码效率达到了H.264/AVC的4倍,付出的代价是编码复杂度的大幅度提升,使得在目前的硬件平台很难实现高清超高清视频的实时编码。另一方面随着信息技术的不断发展GPU在海量数据并行处理和内存带宽上的优势越来越明显,NVIDIA推出的CUDA编程模型使得GPU的通用开发应用更加简单灵活。本文在详细研究了AVS2和CUDA编程模型和原理的基础上主要针对AVS2编码中耗时较长的帧间运动估计部分进行优化包括:帧间运动估计预搜索、整像素搜索、子像素运动搜索,具体研究工作主要体现在以下几个方面:1)在帧间运动估计的预搜索过程中,利用快速搜索算法对当前最大编码单元块进行运动估计,每个线程计算一个4x4块大小的绝对误差和(SAD),并进行线程块归约合并求得预搜索运动向量。2)在整像素运动搜素中,采用映射表算法代替编码单元块的大型数据结构,并采用类积分图算法原理,对每个4x4块大小的绝对误差和(SAD)进行的预测单元块的合并,并充分使用共享内存和纹理内存存储当前帧和参考帧数据、合理利用共享内存、局部变量、指令优化、CUDA函数调用等优化方法提高数据读写速度,减少线程同步次数,提高线程利用率,增加内核函数并发次数,减少分支语句等,从而优化了并行速度。3)在子像素搜索过程中充分利用编码单元的层次划分进行并行化设计,对每层编码单元进行预测模式循环,并继承整像素搜索过程的优化方案进行算法优化。实验仿真表明,进行优化后的AVS2视频编码在相比较在CPU端的运行速度加速性能上有明显提升,本文优化方案有一定的研究意义和实用价值。
其他文献
互联网进入了"移动"的时代,人们的大量活动从PC端向移动端转移,营销也不例外。传统的品牌营销过于保守,已经不足以吸引人们的眼球,只有融合当代受众的触媒习惯,寻求传播方式的
财政支出(Finance Expenditure),亦称公共支出(public expenditure)或政府支出,是指政府为了履行其职能而支出一切费用的总和。财政支出是政府活动的一个方面,它直接反映着
警民关系:并不轻松的话题王南生,刘方全专门工作与群众路线相结合,一直是我们公安机关的特色和优良传统。警民关系的好坏直接影响公安机关开展群众工作的深度和广度,也影响公安工
期刊
<正> 主动句和被动句表达的意思基本相同。它们在语法方面的区别在于:主动句中主语表示行为的主体,被动句中主语表示行为的客体。二者在修辞上的区别在于:主动句强调行为的主
目的探讨脑瘫患儿的康复护理方法。方法选取32例脑瘫患儿,随机分为观察组和对照组,各16例。观察组采用综合康复护理,对照组采用常规护理干预。对比两组临床护理效果。结果观
随着我国经济快速发展与电网建设的迫切需要,电力系统的基建施工现场呈现出点多、面广、多为野外作业、管理难度大等特点,而加强项目施工现场的监控与管理也将提上工作日程。
优秀班风建设是文明班级建设的核心,是优秀校风、学风的具体体现,是为学生提供良好学习环境的必然要求。优秀班风作为一种无形的精神力量,发挥着任何管理机构和规章制度都无
研究目的:2015年国务院牵头出台《中国足球改革总体方案》,将校园足球上升为国家战略,足球成为国家重点扶持体育项目。4年来我国在推进足球普及、扩大足球人口等方面取得了巨
研究背景:法国青少年足球培养体系及对我国的启示作为一支传统的欧洲足球强队,法国足球国家队长期位于国际足联排名的前列。近几年法国足球更是出现了95后人才井喷的现象,法
Q:儿子选轩今年4岁,最近晚上经常不肯睡觉,看电视、玩电脑小游戏,早上不愿起床,喊醒后赖在被窝里不肯穿衣服,强行拉他起床后乱发脾气、不愿去幼儿园。我该怎么办?(逸轩妈妈)