【摘 要】
:
随着3D技术在日常生活的普及,3D游戏、3D电影等成为人们日常生活中的重要娱乐项目。然而人眼长时间观看某些3D影像后会出现眼睛疲惫、头疼、注意力难以集中等生理不舒适症状。其中垂直视差是观看者产生视觉疲劳的重要因素之一。因此在实际应用中,拍摄后3D影像都需要经过后期处理来进行校正。传统外极线校正的方法对3D影像的左右视图施加投影变化,使对应的外极线处于同一水平线,从而实现垂直视差的消除。然而传统无相
论文部分内容阅读
随着3D技术在日常生活的普及,3D游戏、3D电影等成为人们日常生活中的重要娱乐项目。然而人眼长时间观看某些3D影像后会出现眼睛疲惫、头疼、注意力难以集中等生理不舒适症状。其中垂直视差是观看者产生视觉疲劳的重要因素之一。因此在实际应用中,拍摄后3D影像都需要经过后期处理来进行校正。传统外极线校正的方法对3D影像的左右视图施加投影变化,使对应的外极线处于同一水平线,从而实现垂直视差的消除。然而传统无相机参数的外极线校正方法对相机基础矩阵估计精度要求高,可能出现严重的畸变,通过投影变换校正的影像需要裁剪,造成分辨率损失。而传统的基于视点合成进行立体校正的方法流程较为复杂,涉及多个计算机视觉领域的相关问题,因此面对较为复杂立体场景其效果较差,缺乏进一步的研究改进。本文提出了基于视差估计和图像修复网络的视点合成技术进行立体图像校正。本文首先设计了未校正立体图像视差估计网络,实现相机参数未知下立体图像的水平和垂直视差估计。随后基于估计的视差结果通过像素映射合成待修补的虚拟右视图。针对修补后图像和原始左右视图之间存在较强的相关性,本文提出了基于参考视图的图像修复网络,利用指导模块,获取左右视图中的语义信息,引导图像空洞的修补。最终合成的虚拟右视图和原始左视图构成校正后的立体图像。通过提出的这两个新型网络,本文的视点合成方法在Movie数据集上将平均垂直视差误差降为0.521px,在主观图像质量评估中获得了3.5以上的平均得分,其中70%的图像优于其他对比算法的结果。对于立体视频的校正,本文提出了一种基于时空融合的立体视频帧合成方法对立体视频进行校正,期望进一步提升校正后立体视频的画面质量。该方法保持立体视频的左视点视频序列不变,合成校正后的右视点视频序列。本文首先提出了视差和光流同步估计网络。该网络同时实现了视差估计和光流估计两个功能,以避免设计两个网络增加整体方法的复杂度。随后,通过简单的几何关系转换,生成各原始视频帧和待合成的校正后右视点视频帧之间的几何对应关系。最后本文提出的时空融合的立体视频帧合成网络,融合了时空维度信息,生成校正后的右视点视频序列。最终本文的立体视频帧合成方法在Movie数据集上合成视频帧的PSNR为43.76,SSIM为0.9987,校正结果的平均垂直视差误差降为0.526px,垂直视差大于1px的像素比例仅4.13%,成功实现了更高画面质量的视频校正效果。
其他文献
水声传感网络(Underwater Acoustic Sensor Networks,UWASNs)是探索、观测及利用海洋的重要基础设施,媒体接入控制(Medium Access Control,MAC)协议是其中的关键技术之一。MAC协议负责分配信道资源,保证网络节点尽可能合理地共享信道。论文以数据收集为应用场景,研究水声传感网络的MAC协议。针对现有协议存在多应用适应或分区域服务质量(Qual
用户的用水类型是供水企业对用户用水收费的重要标准。用户用水类型标签作为供水企业对用户定价的关键凭证,在用户的用水类型申报、供水企业的运营减负及利润保障上起着极为重要的作用。然而随着供水产业改革以及用户规模扩大,用户用水标签错标、标签无法随用户用水性质自动更新等问题日益加剧。供水企业客户基数大、用户长期流动、变动频繁,同时运营资金投入少、人工维护困难等问题使大数据量下用水用户标签的更新和清洗难以实现
鱼类及其相关产品是人类饮食食谱上蛋白质的重要来源之一,渔业的健康发展与人们的生活密切相关。优良的鱼种资源是渔业可以持续健康和快速发展的基础,育种和优选是渔业养殖过程的关键环节。鱼苗的优选除了依靠一些生化指标外,鱼苗的表型数据也是鱼种优选的重要参考指标。目前鱼育种的研究机构多采用人工测量方法获取鱼苗的表型数据,这个过程费时费力且易出错,同时难以获得全面的表型数据。为了帮助研究人员快速准确的测定鱼苗的
敏捷成像卫星具有较强的姿态机动能力,相比于普通成像卫星具备沿俯仰轴侧摆的能力,对于地面观测目标可产生更长的可观测时间窗口。随着敏捷成像卫星应用领域的不断扩大和用户任务需求的不断增加,如何对输入的用户任务序列进行规划,制定出合理有效的任务执行序列,充分发挥敏捷成像卫星的运行效率,对实现敏捷成像卫星在轨运行的自主化、智能化具有重要的意义。本文围绕敏捷成像卫星任务规划问题,建立了带有时间窗口约束的敏捷卫
近年来,由于计算机算力的快速发展,深度学习(Deep Learning,DL)算法已经成功地应用于各式各样的场景中。其中,卷积神经网络(Convolutional Neural Network,CNN)的提出使得图像领域的许多复杂问题得到了解决,例如图像分类、图像分割等问题。然而,对于一个分类任务而言,一个模型在某个数据集上表现出色并不代表其在其他数据集上表现同样出色。随着数据量的急剧增长,神经网
近年来,智能手机相机已经成为人们日常生活的必备工具之一,获取高质量的照片也逐渐成为了人们追求的目标。然而,在诸如夜晚或者照明昏暗的低照度场景下,相机捕获到的图像往往存在噪声大、对比度低,细节和色彩大量丢失的问题。这不仅会严重影响人眼的视觉效果,还会影响很多计算机视觉相关的应用,如人脸识别和安防监控。本文的研究目的是针对低照度图像进行去噪和对比度增强算法的研究。基于深度学习算法和一些经典的低照度图像
随着无线网络的应用、芯片集成度的提高与计算能力的增强、以及信号处理技术的进步,基于无线传感网络(Wireless Sensor Network,WSN)的分布式信息处理技术受到学者与产业界的关注,成为了研究热点。分布式自适应算法因结构简单且易于实现的特性,被广泛地应用于解决分布式参数估计的问题。分布式自适应网络是由一组具有数据处理和通信能力传感器节点组成,通过自适应算法和节点间协作进行目标参数的估
随着人工智能和传感器技术的发展,移动机器人在仓储物流、家庭服务、教育科研等领域的应用越来越广泛,室内定位与路径规划技术是移动机器人应用于具体领域的重要基础。对于空间相对较小的室内场景,基于麦克纳姆轮的移动机器人可以全方向无约束地运动,具有良好的机动性和灵活性。因此,本文研究麦克纳姆轮结构移动机器人的室内定位和路径规划对移动机器人在室内场景下的应用具有重要的意义。本文的主要工作如下:首先搭建了麦克纳
语音交流是人类沟通交流最有效的方式之一。多说话人场景下噪声、混响和多声源之间的混叠,使得对多语音源的混合信号进行声源定位和语音分离变得更具有挑战性。本文针对小尺度麦克风阵列,对含有多个语音源的远场语音信号进行定位和分离研究。为了提升小尺度麦克风阵列上的语音信号定位性能,提出基于卷积神经网络(Convolu-tional Neural Network,CNN)的多语音源到达角(Direction o
随着水声通信技术的不断发展和水声通信设备、水下移动平台的日益成熟,移动水声传感器网络在水下信息感知与传输中承担了越来越重要的角色。凭借着水下移动平台的机动性,移动水声传感器网络能够实现对海洋环境的大范围实时观测,为重点海区的长期水下监测和安全时效预警提供保障。移动水声传感器网络不仅要考虑水声通信有限带宽、长时延和低速率等特性,同时还需要承担移动节点带来的网络结构和通信链路质量的动态变化。因此,需要