视频运动对象分割及码率分配与控制技术研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:sophia_deng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今社会人们对信息的需求成为信息技术发展的主要动力,作为最重要的信息形式—视频信息及其处理技术取得了长足的进步。视频信息数据量巨大,给存储和实时传输带来极大的困难,已成为妨碍数字视频技术应用的主要瓶颈,因此需要研究视频数据高效表征及其码率控制技术。对数字视频高效表征,人们进行了大量研究,先后推出了两代编码技术。以MPEG-1、MPEG-2等为代表的第一代视频编码技术,考虑去除帧内以及帧间冗余,采用块的方式进行编码。其最大缺点是没有考虑视频场景的内容构成。多媒体通信与网络综合服务的应用中,需要对信息内容进行操作和交互式控制,因此,人们提出了第二代压缩编码技术,MPEG-4是其中的代表。它先将视频场景分割成若干区域,每一个区域对应着一个语义上有意义的视频对象,然后根据各个视频对象的特征对不同的视频对象采用不同的编码方法。这种基于对象的视频编码技术不仅能大大提高编码效率,而且支持用户对视频数据按内容操作。第二代编码技术需要将视频图像分割为视频对象。这就要求研究视频图像中各种视频对象的运动、纹理、形状以及信息量等特征。按内容对视频场景进行描述和码率控制是基于对象编码和交互式操作的关键和基础,具有重要的理论意义和应用价值;而在现有标准中又没有关于视频对象自动生成和码率控制的具体规定,所以这方面是前沿研究的热点课题。视频图像的帧间运动是全局运动、局部运动或它们共同构成,其中前景目标在全局运动估计中被称为外点。若将外点处的局部运动矢量参与全局运动矢量估算,将影响全局运动估计的复杂度和准确度,外点区域在视频场景中所占区域较大的时候,容易发生这种情况;因此,外点的消除对于准确的全局运动估计非常重要。现有的外点消除通常用统计方法实现,也有基于光流方程的时/空域梯度比来去除外点的方法,但误差很大,效果不好。本文根据视频图像中外点有聚集成块的属性,采用亚采样、边缘特征图像块匹配的预分析方法来去除外点。该方法能去除较大面积外点区域,并可以根据预分析的结果针对不同的图像使用不同的全局运动模型,从而提高全局运动矢量估计的准确度。估算全局运动变化参数时,人们通常采用的方法可以划分为基于空域像素点<WP=8>灰度的方法、基于空域视频特征的方法和基于变换域的方法三大类。在这些方法中,基于空域视频特征的方法,有更好的普适性、抗噪声能力、运动估计精度和特征描述简便性等优点。本文中提出使用多个直线段空域特征进行全局运动估计的方法。在去除视频图像序列中外点区域的基础上,通过提取和比较参考图像与当前图像中的多个直线段视频特征来估计出全局运动矢量参数。该方法能够估计出全局运动的平移、旋转参数,同时算法复杂度较低和估计精度较高。当前一般采用邻帧差分法或光流场法进行运动检测,前者的主要缺点在于不易准确确定运动目标轮廓;后者运算复杂,极易受噪声干扰影响。上述方法在复杂背景或多运动目标的场景下,检测效果都不好。为此,本文提出一种改进的三帧双差分算法,该方法利用多个差分图像来区分不同帧中的运动目标信息,并根据差分图像灰度统计特性自适应地选择二值化门限,从而检测出运动变化区域。本文的方法有较强的自适应性、通用性和抗噪声干扰能力,能够有效地检测和分割出运动目标区域。全局运动补偿后的差分图像由残留噪声区域和运动变化区域组成;运动变化区域的检测,就是划分运动变化区域和残留噪声区域。从数字图像的数据比特结构出发,将图像划分为多个比特层,各比特层包含的视觉信息和噪声是各不相同的。据此,本文提出了一种各比特层预分类,然后进行与合并的技术,能明显地滤除噪声、纹理等干扰,检测出运动图像变化区域。基于比特层分类的技术还可以用于视频图像数据压缩、加密等。由于第二代视频编码压缩技术提出了视频对象的概念,引出了同时对多个视频对象进行编码的码率控制问题。本文在研究传统码率控制方法的基础上,根据率-失真理论,建立了视频对象间码率分配原则,并提出相应的码率控制算法,从而实现了保证信源QoS(率-失真)下,有限带宽(总码率)按视频对象的高效分配。上述各个研究点都进行了相应的PC仿真,并获得了好的结果,本论文所研究的理论和技术对于视频图像序列中目标检测、识别与分割技术,对于视频图像序列基于内容的数据压缩与编码码率控制有有重要的理论和实用参考价值。
其他文献
可认证性和机密性是信息安全的两大中心需求,而签密能在同一个逻辑步内实现加密和数字签名两项密码功能,是同时实现可认证性和机密性的高效密码技术,因此成为信息安全的核心技术
肾小管上皮细胞(renal tubular epithelial cell,RTEC)损伤是各种急慢性肾病的病理特点,肾脏受缺氧、中毒、细胞炎性反应因子、血浆蛋白或葡萄糖等因素作用后,RTEC活化、增生、凋
农村小学的客观条件和特殊性,不均衡的教育资源直接导致了有一定比例农村小学语文学困生存在于每个班级。我以江西省抚州市崇仁县县巴山镇第二小学某班为例,分析当前农村小学
本文在未知混沌动力学系统方程和信号的先验知识、只具有观测时间序列条件下,从混沌所具有的一些特性出发,利用现代信号处理理论,系统地研究了混沌中信号的盲提取方法。其主
诺基亚企图多管齐下解决零增长的难题。既在内部重组组织结构,又在外部整合产业链;既注重于未来新产品的开发,也不放松对低价手机市场的进攻。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
卫星移动通信,是实现全球个人通信的一个重要组成部分,鉴于短数据通信在国内军用、民用市场上的巨大需求,并结合CDMA技术特点,我们建议了一个基于低轨道微小卫星技术、以短数据通
目的探讨葡萄球菌感染状况及耐药性,为临床合理使用抗菌药物提供科学依据。方法回顾性分析2006年1月至2008年12月临床标本中分离的970株葡萄球菌感染分布及耐药性变化。结果
随着城市化建设进程的加快,对城市建设用地进行有效管理已成为亟待解决的问题。基于GIS技术,从征地拆迁用地分类入手,设计融空间数据与属性数据于一体的存储机制,并以此设计
港珠澳大桥西人工岛钢圆筒及副格围护结构振沉完成后,为确保其整体稳定性,采用定点、接力、分层抛填的方案对钢圆筒及副格内回填砂施工,有效控制了钢圆筒围护结构在回填砂施