多视角视频运动和视差估计与编码的研究

来源 :同济大学电子与信息工程学院 同济大学 | 被引量 : 0次 | 上传用户:afraidboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,人们已不满足于单摄像机拍摄的传统视频,而是需要具有更加灵活性和更好交互性的多视角视频。多视角视频由位于不同视角的多个摄像机同时拍摄得到,播放时这些不同视角拍摄的图像均会被传送到用户终端,用户可以根据喜好选择不同的视角进行观看。由于多视角视频会产生大量数据,而运动估计和视差估计作为提高数据压缩效率的有效方法成为需要解决的关键问题之一。 本文针对多视角视频的特点,研究如何利用有效的运动估计算法使其使用于视差估计,并结合运动补偿时域滤波和视差补偿视角滤波等技术对全局视差估计方法进行编码分析。 首先,对传统的基于块匹配的运动估计算法和相位相关全局运动估计算法进行分析。针对多视角视频中相机的拍摄位置以及全局视差场的特点,采用改进搜索范围和多参考峰值等方法,通过仿真试验验证改进现有运动和视差估计方法对多视角视频的适用性。 其次,基于对传统方法的改进,本文提出了全局透视视差估计方法。文中采用了仿射和透视两种视差模式进行比较。使用相位相关方法代替传统的三步搜索方法用作初始估计,确保梯度下降的收敛性。使用低通外插方法用于边界填充。在全局视差估计的基础上,针对前景物体的运动和视差特点,通过对全局补偿差图的分析,使用局部视差重估计方法以提高视差估计的准确性。通过试验比较和分析了采用仿射和透视两种模式的全局视差估计方法以及传统的相位相关全局方法。 然后,在运动补偿时域滤波和视差补偿视角滤波基础上构建了基于小波提升机制的多视角视频编码框架,对本文所提出的全局视差估计方法的编码结果进行了分析和比较。 最后,总结了本文的研究工作,并展望了未来的工作方向。
其他文献
过去的三十年,人们见证了Internet与移动通信的飞速发展。计算机和互联网技术的发展让地球村不再是幻想,而移动通信的应用与普及则让人们对随时随地通信更加期待。基于IEEE 802
跳频扩频多址(FH-SSMA)通信系统由于其在频率分集和有效对抗远近效应方面的优势一直受到广泛关注,而同频道干扰(CCI)是限制其性能的主要因素。同频干扰消除算法能在接收端有效
随着数字多媒体信息技术的迅速发展,视频压缩技术对数字电视、可视电话、无线视频等视频通信服务中起着举足轻重的作用。现阶段用于视频压缩编码的最新标准有MPEG-4、H.264及
GIF图像是当前网络上非常流行的一种图片格式。对于这种图片的保护就显得非常重要,但是当前还没有一种很好的算法能同时实现对GIF图像的版权认证和完整性保护。针对以上情况,
利用1995年~2014年石油工业上中游投资数据对石油工业上中游投资进行协整分析,发现石油工业上游投资和中游投资之间存在长期的正向均衡关系,误差修正模型的结果表明石油工业
随着工业自动化的快速发展,动力传动系统在航天航空、舰船、核电、汽车等行业中发挥着至关重要的作用。现代传动设备高速化、自动化、复杂化和精密化的程度越来越高,一方面大大的提高了生产效率,另一方面对设备安全性的依赖也越来越强。机械传动设备中,通过齿轮耦合带动设备运行,由于材料、设计不合理等原因,齿轮用了一段时间可能会出现损伤或断裂,从而引发的重大灾难事故时有发生。对机械传动设备的齿轮形变规律的研究,有利
民用航空产业大发展使得传统民用航空通信系统容量逐步趋于饱和,建立一个空天地一体化的未来航空通信系统已是大势所趋。航空移动通信系统收发端飞行器处于运动状态,在三维立
本文在简要分析高校使命定位历史变迁规律的基础上,从现代市场营销理论视角分析经济新常态下目前我国高校使命定位问题,并指出其历史局限性,然后根据现代市场营销原则,结合经
随着信息化技术的蓬勃发展,人们每天都会获得大量的多媒体信息,如何有效而快速地检索、存储这些信息,给传统的数据检索以及数据存储技术提出了极大挑战。在多媒体数字视频中,
移动Ad Hoc网络(Mobile Ad Hoc Networks,MANETS)组网方便、快捷,不受时间和空间限制,既可应用于救援、会议、战场、探险、远距离或危险环境中的目标监控等场合,还可用于末端