一种针对第二代视频压缩标准的运动对象提取和跟踪算法

来源 :第十四届全国图象图形学学术会议 | 被引量 : 0次 | 上传用户:gaolch011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对第二代视频压缩标准,研究了在压缩域中提取和跟踪运动对象的算法.本算法首先对运动矢量场进行一种低复杂度的向量中值滤波,接着考察运动对象的时间相关性,并舍弃相关性较小的对象.然后对帧内编码块进行合适的处理,最后对运动对象进行跟踪,并通过"预测"技术来处理假丢失的运动对象.实验表明,本算法能比较准确地提取和跟踪压缩视频中的运动对象.
其他文献
设计了一种用于印制电路板(PCB)光学自动检测系统中的图像配准算法.该算法利用采集到的PCB彩色图像,计算其彩色梯度值,从而得到图像中的边缘,再利用Hausdorff距离测度将边缘图像与标准图像(reference image)比较,得到待测图与标准图坐标的一一对应关系,进而确定仿射变换参数,实现图像的配准.该方法避免了极为耗时的自相关计算,并且有着十分理想的定位精度,是一种切实可行的工程化方法.
高分辨率遥感图像的变化检测存在四个难点:类间可分性低、对配准误差和视角变化鲁棒性差、计算量大以及"变化"具有歧义性,本文针对这些问题提出了一种基于尺度传播的多尺度变化检测新方法.利用尺度传播,该方法进行由粗到精、逐层加细的多尺度变化检测;为了减弱"变化"的歧义性,在多尺度变化检测中引入了机器学习算法,从而可以提取符合用户需求的"最优"的变化.与传统的方法相比,本文的方法精度更高,对噪声和视角变化更
针对复杂背景下的字符图像因光照不均、目标字符信息微弱及淹没、目标字符的方位随条件改变而变化等各种条件下字符识别的新方法进行了研究.首先对原图像进行去模糊处理,然后采用基于多次分类和投影特征判定的方法进行字符区域定位以及字符排列方向的判定,利用变步长搜索法对字符进行先粗后精方法切分字符,运用改进的模板匹配与结构特征识别相结合的方法达到对字符进行快速准确识别的目的.实验结果表明,本文所提出的方法对复杂
影视作为当今世界最主要的传播手段,CG影像以其视听综合、时空综合、艺术与技术综合的绝对优势而引人瞩目,成为其中的重要组成部分,也使记录片的发展展现出越发诱人的生命活力.
为了解决内容分发网的可扩展性和流媒体直播的服务质量问题,本文为内容分发网中的流媒体商播服务提出了一个分层的对等网辅助架构.对等网辅助有两层含义:1)一个构建在内容分发网的数据中心之上的对等覆盖网,以加速流媒体在服务器问的传输;2)由边缘服务器引导的对等网扩展的用户区域,以提供可扩展的流媒体服务.根据该架构设计的系统已经实现并部署在商用内容分发网中.实际应用性能证明该架构能够在保证流媒体直播高服务质
二维医学图像的三维可视化就是运用计算机图形学和图像处理技术,将运用医学影像设备所获得的二维医学图像数据(如MRI,CT等),在三维空间上重建出立体的三维图像.它是科学计算可视化技术的一个重要应用领域.本文主要介绍基于可视化工具包VTK来实现医学图像三维重构的可视化系统.重点是三维医学图像的重构算法以及虚拟内窥镜技术中所涉及到的医学数据可视化理论.可将该可视化软件系统用于临床治疗、医学教育或医学研究
本文给出了一个具有视觉跟踪的中英文语音动画系统的实现过程.该文介绍了该系统的设计过程以及所需的技术,包括可视音素、三维人头模型的制作与显示、语音与动画的同步、动画的平滑自然的过渡、眼睛的跟踪与随机眨眼、与外部程序接口的设计等.该语音动画系统具有人脸表情真实自然等特点,在普通PC机上能够产生高质量的语音动画.
根据当前仿真技术的发展以及塔台管制员训练系统的实际需求,分析了塔台训练仿真系统的组成和特点.提出了HLA框架下,采用Vega Prime进行视景渲染和驱动,快速进行塔台训练仿真系统的设计方法.最后实现了塔台管制训练系统,并给出了效果图.
本文基于OpenGL构建了符合人体运动规律的虚拟手的显示模型,通过三维图形学技术和骨骼蒙皮技术解决了皮肤表面变形问题,利用数据手套获取手各关节运动数据,根据关节运动限制对所获取数据进行处理,实现了虚拟现实系统中基于虚拟手的人机交互性.
形状是含有高层语义信息的视觉特征,在基于内容的图像检索及图像识别中具有重要的应用价值.有很多种描述子可以描述图像的形状特征,傅立叶描述子可以把二维的图像轮廓信息简化成一维问题进行处理,应用非常广泛.然而自然图像的形状特征通常是杂乱的,有噪声的,提出了一种图像预处理方法,得到净化的形状图像,通过实验研究傅立叶描述予算法提取形状特征的效果.