帧级自适应的运动矢量精度预测

来源 :第十一届和谐人机环境联合会议 | 被引量 : 0次 | 上传用户:terzaghi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在视频编码中,对每个编码块会在参考帧中寻找一个相似块作为预测来提升编码性能,并用运动矢量来标识两者间的相对位置.主流的视频编码标准中,运动矢量都被限定为固定的精度,一般是1/4像素精度.但事实上最佳的运动矢量精度是不确定的,而是与视频内容息息相关.本文提出了一个根据视频内容来对每帧的运动矢量精度进行自适应调整的算法.本文通过预测残差的能量与运动矢量精度之间的函数关系,并结合率失真优化函数分析了影响最佳运动矢量精度的主要因素,包括运动大小、帧间噪声、纹理复杂度和量化参数.结合理论分析和实验数据,提出了自适应运动矢量精度算法并在参考软件中进行了测试,实验结果显示提出的算法可获得平均2.2%的BD-Rate性能增益.
其他文献
基于稀疏表示的L1跟踪方法近年来在视觉跟踪中获得了较大的成功.但其直接使用视额序列各帧内的像素值对模板和目标候选进行表示,而没有考虑到各图像块内部的深度特征信息.发现,在固定摄像头的视频监控场景中,通常可以找到一块区域,该区域中目标物体具有清晰、易于分辨的表观.本文在各视频场景内事先选定一块可以清晰分辨目标表观的参考区域用以构造训练样本,并构建了一个两路对称且权值共享的深度卷积神经网络.该深度网络
本文对现行开关滤波算法在脉冲噪声检测时间、检测精准度和恢复策略上存在的问题进行理论分析,提出一种递进的脉冲噪声检测算法(PIND),使噪声图像能够获得更好的恢复效果.首先,确定脉冲噪声与真实像素之间的灰度值界线b1和b2,根据这个界线区分出疑似点和真实点;然后,将噪声点从疑似点中寻找出来并判断噪声类型,存储在决策表G中;最后,根据决策表G中存储的噪声类型信息采用三种不同的恢复策略滤除噪声.对len
为了提高图像超分辨率算法对数据奇异点的鲁棒性,提出一种基于K均值聚类和支持向量数据描述的图像超分辨率重建算法.提出的算法分为训练和测试部分:在训练部分,首先在K均值聚类基础上用支持向量数据描述去除每类数据的奇异点,然后用主成分分析训练小波域近似子带和细节子带字典.在测试部分,首先根据同一场景高低分辨率图像近似子带相似这一现象,将待重建低分辨率测试图像的近似子带作为相应高分辨率测试图像的近似子带,然
本文提出了一种基于光流估计的海上运动视频去抖算法.首先引入平滑性约束,采用层次化块匹配方法计算基于层次块的光流,快速计算海上运动视频的近似光流场;然后利用基于光流估计的能量函数优化,实现海上运动视频的高效去抖动.实验表明,本文提出的算法在处理海上运动视频抖动上的有效性和高效率,可以用于海上运动视频的去抖.
根据移动实时视频通信的特点,同时结合手机电量的有限性,针对手机端的视频编码,在本文中构造了一个QoE计算模型,它为用户提供两个维度进行选择和调节.一方面,应该有效地使用计算资源,并减少计算复杂度,以提供一个高质量的视频;另一方面,也需要考虑时长的问题,使用户可以自由选择.实验结果论证了算法的有效性以及QoE计算模型的实用性,并为用户提供较好的用户体验.通过本文所提出的算法,不仅可以有效地利用计算资
为了解决显示适配过程中显著物体部分扭曲的问题,本文提出了一种保留完整显著物体的图像显示适配方法.首先,采用显著性融合和传播的方法生成显著性图;其次,结合输入图像和显著性图,采用自适应三阈值方法实现显著物体分割;再次,以此为基础,生成输入图像的曲边网格表示;最后,通过对不同网格的非均匀缩放,生成符合目标尺寸的适配结果.实验结果表明,该方法有助于提高显示适配过程中对显著物体处理的一致性,可以有效地减少
在计算机视觉和计算美学领域中人们越来越关注如何自动评价和判断图片的美感品质,这补充和完善了原有对照片只有主观美感品质评价,在美学人工智能及模式识别之间建立了桥梁.本文选取风景、夜景、静物、建筑、动物和植物6类景物照片,研究照片美感品质的客观评价方法.采用图像显著度求取算法,确定照片显著区域,提出了41种反映照片颜色、纹理、结构等特点的特征,并使用支持向量机、Adaboost、随机森林等4种分类器进
随着社交网络服务的快速发展,理解网络用户之间潜在影响力的传播过程成为热点研究问题.现有关于影响力传播的研究工作主要集中在给定的静态社交网络中找出最有影响力的用户子集,而忽略了社交网络中的内容信息.本文提出一种融合了内容信息和动态时间网络特性的影响力传播模型InfoIBP(Influence propagation on Indian Buffet Process),把网络中有影响力用户看作是一种潜
在移动新闻视频推送中,用户是否接受推送的内容,不但取决于内容本身,还受用户所处上下文(包括用户收看的时间、所处位置以及所用设备)影响.这种上下文对用户接受推送的影响尚未被仔细研究.本文将通过数据驱动的方法,利用大量真实移动新闻视频推送服务中新闻推送和新闻浏览的记录(包括16天4000万条访问日志),研究包括时间、位置、设备等上下文信息对用户接受新闻推送的影响.本文给出的发现包括:1)时间的周期性和
本文提出了基于人类视觉感知的视频表示及深度学习的视频异常事件检测模型.人眼对视频中异常事件的反应是相当敏感的,并且能够快速定位异常事件区域,所以基于人类视觉感知的异常事件检测在理论上是可行的.一般而言,视觉神经冲动主要有两条传输路径,本文在对这两条传输路径进行研究的基础上,提出容易被两条路径所传递的视频特征表示,然后通过仿真人脑学习过程的深度学习方法对视频的特征表示进行深度挖掘,获得特征进一步的抽