【摘 要】
:
近两年来,计算机多媒体领域发展迅速,从3D电影的流行到虚拟现实(VR)的火爆,无一不表明了人们在蓬勃发展的大娱乐时代对于视觉感官享受的不断追求。立体视频通过同时向人的左
论文部分内容阅读
近两年来,计算机多媒体领域发展迅速,从3D电影的流行到虚拟现实(VR)的火爆,无一不表明了人们在蓬勃发展的大娱乐时代对于视觉感官享受的不断追求。立体视频通过同时向人的左右眼输入左右两路不同的视频,模拟人在场景中左右两眼看到的不同景象,给人带来沉浸的3D体验。伴随着3D电影行业和虚拟现实技术的迅猛发展,通过普通的2D视频转制生成可以观看的立体视频,可以提供更多的视频内容源,引起了越来越广泛的关注。立体视频生成是通过给定的平面视频,生成虚拟视点的视频,两路视频叠加从而给人带来视觉冲击效果。在众多的虚拟视点生成算法中,基于深度图像的虚拟视点生成(Depth Image Based Rendering)是目前主流的技术途径。它主要包含两个部分,首先是场景的深度信息估计,然后基于估计得到的深度信息进行虚拟视点的映射重建。根据以上思路,本文提出两种立体视频生成的方法。一种是传统的先通过算法进行图像的深度估计得到深度信息,再通过视点合成算法合成虚拟视点图像,最终生成立体视频;另外一种是基于卷积神经网络深度学习技术,通过设计卷积神经网络结构,端到端的直接从一路图像生成虚拟视点图像,从而合成立体视频。针对传统的虚拟视点合成技术途径中的深度信息估计和视点合成两部分,本文分别提出了不同的解决方法以增强其视点合成图像质量。针对深度信息估计部分,本文提出了基于级联随机森林的深度图像超分辨率模型;针对视差图像优化,分别提出了基于显著性原理的视差非线性变换和基于运动信息的RGBD时域视差图像优化方法;针对视点合成中的图像空洞问题,本文基于一致性哈希算法,提出了基于一致性哈希的多尺度图像修补方法。针对端到端的直接从一路视频生成虚拟视点视频的深度学习框架,本文提出了像素级输出的卷积神经网络模型StereoFCN。最终实验证明,本文提出的两种技术途径都可以获取高质量的立体视频,带来良好的3D体验效果。
其他文献
二十年前计算机网络刚刚兴起,十年后已成为人们生活中的一部分,今天人们已经离不开互联网这一虚拟并且开放的平台。近年来,随着网络社交模式的转变,贴吧的交流形式已不能满足
近年来,政府部门环保力度加大,环保要求日益严格,小型火电厂被迫关停或淘汰落后产能,生产经营受到严重制约。作为小型热电企业的TSWP热电厂面临着前所未有的生产经营困难,生
安全协议,是以密码学为基础的信息交换协议。由于安全目标本身的复杂性、协议运行环境的复杂性以及攻击者模型的复杂性等多方面的原因,有必要借助形式化的分析方法或工具来完
社会秩序作为社会健康运行和持续发展的保障,其运行状态直接影响到社会个体的生存和发展。因此,自人类产生以来,和谐的社会秩序就成为无数思想家、政治家永恒探究和追求的主
移动医疗APP在近几年兴起,和医院就诊服务形成一定的配合关系,人们逐渐开始摆脱过去的低效就诊模式,就诊体验也得到了一定提升。但目前对该领域的研究过于注重功能上的堆砌而
近年来,数字水印技术已经广泛应用于数字产品知识产权保护领域,随着数字视频水印技术的发展,该技术己成为视频版权保护和内容认证的重要手段。本文拓展了水印技术的应用领域,
变形监测是对被监测的变形体进行测量,以确定其空间位置及内部结构随时间变化的特征。GNSS变形监测因其全天候自动化监测的优势,已经成为该领域最主要的技术手段。通过GNSS变
太赫兹THz时域光谱技术是当前太赫兹应用领域的研究热点之一,其在太赫兹光谱成像和样品光学参数测定等方面的应用中起着重要的作用。THz-TDS实验中水汽分子在THz波段的共振吸
新课程改革强调引导学生建立解决复杂问题的思维框架,并通过适当的方式外显学生的思维过程。优质的问题能够激活思维,而将一个个独立的问题相互连接,构成一条符合学生认知发展规律的问题链,能够促进学生进行深层次的学习。然而,当前问题链设计仍存在一些不足之处,例如问题之间缺乏逻辑性,且不能有效激发学生的认知冲突和深层次思考。SOLO分类理论是一种质性评价方法,在教学实践中运用该理论,可外显学生的思维过程,有利
随着移动智能终端的普及、无线通信网络的发展,移动商务在人们的生活、工作、学习中发挥着越来越重要的作用。然而,移动商务在给人们的生活带来便利的同时,也面临多种安全威