面向多视点视频编码的深度虚拟参考帧生成技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户：margaretclouis

【摘要】

：

【作者】

：

张宗千

【机构】

：

天津大学

【出处】

：

天津大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多视点视频作为一种典型的3D视频表现形式,能够给用户带来身临其境的立体感和交互性,在自由立体显示以及6Do F系统等方面具有广阔的应用前景。然而,多视点视频的数据量远远大于传统彩色视频,给视频的存储和传输带来巨大的挑战。为此,3D-HEVC编码标准引入了多种视点间预测编码技术,利用视点间相关性来消除多视点视频的视点间冗余,有效地减少了数据量。为了进一步提高多视点视频编码的压缩效率,本文研究基于深度虚拟参考帧生成的多视点视频编码方法,旨在利用卷积神经网络生成虚拟参考帧,为视点间预测编码提供高质量参考,从而提高多视点视频的编码效率。本文提出了一种基于视差引导的深度虚拟参考帧生成方法。根据多视点视频的视点间相关性,构建了基于视差引导的生成网络PGG-Net,用于转换相邻视点之间的视差关系并生成高质量的虚拟参考帧。首先,设计了多级感受野模块以扩大感受野并提取多尺度深层特征。然后,采用视差注意力融合模块转换视差关系并对特征进行融合,进而重建高质量虚拟参考帧。最后,将所提方法集成到3DHEVC编码平台,将生成的虚拟参考帧添加到参考图片列表。实验结果表明,该方法能够有效地提高多视点视频的编码效率。本文还提出了一种基于视点合成的深度虚拟参考帧生成方法。从视点合成的角度出发,构建了基于视点合成的参考帧生成网络VSG-Net,以更加准确地学习和利用视差关系并生成更高质量的虚拟参考帧。首先,依据视点合成思想设计了基于视点合成的对齐模块,通过学习视差关系获得视差图,并根据视差图对视点间参考帧进行视差偏移,使其与时域参考帧对齐。然后,利用融合重建模块提取时域参考帧与偏移后的视点间参考帧之间的互补信息,并重建出高质量的虚拟参考帧。实验结果表明,该方法能够进一步提升多视点视频的编码效率。

其他文献

基于多重嵌套密集连接网络的单幅图像去雾

在雾霾等天气条件下采集到的图像存在颜色失真、细节模糊、对比度低等问题,严重影响和限制户外计算机视觉系统发挥作用。因此,研究图像去雾具有重要的理论意义和应用价值。论文对基于物理模型的方法和基于深度学习的方法进行研究,并提出两种去雾新思路,主要工作如下:针对雾天图像对比度低、颜色失真等问题,论文提出一种基于中通道补偿的单幅图像去雾方法。为使去雾图像保持更多细节,将图像分解为纹理层和结构层,对含有大部分

学位

固定-移动混合水声传感器网络能量高效路由机制研究

近年来,随着人类对海洋资源探索的不断深入,水声传感器网络（UASN）逐渐成为了研究热点。为了保障水下节点收集到的数据能够有效的传递给目的节点,设计一个高效、可靠的路由协议是十分必要的。然而,考虑到UASN中网络拓扑不确定性、节点能量有限性以及水声信道环境的复杂性,水声传感器网络路由过程中存在端到端延时长、路径不稳定以及路由空洞等问题。本文针对UASN中的网络寿命短以及路由空洞等问题,分别从设计静态

学位

基于卷积网络的双目感知立体图像质量评价研究

当前,立体图像技术不断发展,各种立体图像或视频应用丰富着我们的日常生活。然而立体图像在采集、传输或处理等过程中,可能会受到各种失真的影响,导致图像质量下降,影响用户体验。因此,对立体图像进行质量评估具有重要的现实意义。目前,基于卷积神经网络的立体图像质量评价方法具有出色的评估性能和更强的竞争力。由于立体图像双视图构成的独特性,双目感知过程成为评估图像质量的重要因素。因此,本文利用卷积神经网络挖掘双

学位

基于数据增强与图卷积的视频显著性检测算法研究

随着视频数据的爆炸式增长,在保证主要信息的前提下简化信息提取过程成为了研究热点。人类的视觉注意机制不仅能够提取图像、视频等视觉媒介的重要数据信息,而且可为基于深度学习的计算机视觉问题提供解释性,故利用计算机模拟视觉注意机制的视频显著性检测算法被大量提出,但是缺少足够大且密集标注的视频数据的问题限制了视频显著性检测任务的发展。因此,本文提出了基于数据增强和图卷积网络的视频显著性检测算法,解决视频显著

学位

基于深度学习的RGB-D显著性目标检测研究

在面对复杂的自然场景时,人类视觉系统具有快速搜索并定位感兴趣目标的能力。通过将视觉注意力机制引入到视觉信息处理任务中,可以优化计算资源,使视觉信息的处理更符合人眼视觉特征。显著性目标检测旨在自动识别不同场景中的显著性区域,已广泛地应用于图像分割、重定向、检索、编码及分类等任务。近年来,使用彩色图进行显著性目标检测成为较普遍的方式。而实际上,人类视觉系统具有感知场景中深度信息的能力,因此深度信息可以

学位

基于卷积神经网络的无参考立体图像质量评价方法研究

二十一世纪以来,立体成像技术深入影响着人们的生活。但是每一种立体图像处理技术都不可避免的导致图像降质,使人们在观看图像时产生心理和生理上的不舒适感,因此,如何根据立体图像的特点,设计更加符合人类视觉感知的立体图像质量评价模型,已成为立体成像研究领域的关键课题之一。近年来,以卷积神经网络为代表的深度学习在很多领域都得到了广泛应用。因此,论文以卷积神经网络为基础,构建一类有效的无参考立体图像质量评价算

学位

迷幻蘑菇

＜正＞瞧,一只饥肠辘辘的昆虫发现了一朵好吃的蘑菇,高兴得不得了,赶快向蘑菇爬去。但是,到了蘑菇边上,它却感到自己一点都不饿,又心满意足地走开了。咦,这是为什么呢?长期以来,科学家一直被"迷幻蘑菇之谜"困扰。这些"迷幻蘑菇"可能拥有了通过改变天敌昆虫感觉来保护自己的能力。它们能够产生裸头草碱,这种物质可以起到致幻作用,使昆虫失去饥饿感,从而逃过一劫。裸头草碱对昆虫有效,同样也能干扰人类大脑的神经递质

期刊

基于卷积神经网络的多尺度交通标志检测

私家车的普及在一定程度上提高了交通事故发生率,辅助驾驶系统可以减轻驾驶员的压力,保障安全驾驶。交通标志检测在辅助驾驶系统中属于核心任务。在车辆行驶过程中,交通标志由远及近,在图像中表现为由小变大,具有较大的尺度变化范围。现有的目标检测方法往往不能兼顾不同尺度目标的检测性能,尤其是对小目标的检测精确率较低。基于以上背景,本论文研究交通标志检测过程中出现的多尺度问题,主要有以下4点贡献:第一、为了解决

学位

水声传感器网络可靠帧同步检测与媒体接入控制协议

水声传感器网络（Underwater Acoustic Sensor Networks,UASNs）在水下数据收集、灾害预警、辅助导航等方面应用广泛,已成为热门研究课题。然而,由于水声信道的复杂性,UASNs面临长传输延时、低可用带宽、节点能量受限等挑战。这些困难导致数据包丢失、数据包重传次数增多,增大了网络能耗、降低了网络性能。因此,减少数据包丢失的次数,降低节点能耗成为迫切需求。针对上述问题:

学位

高职院校学生社团的育人功能及其实践路径研究——以临夏现代职业学院为例

学生社团建设是丰富高职教育业余生活的重要方式,也是高职院校学生进行社会实践、实现自我成长并完成个人蜕变的关键平台。积极组织学生参加社团活动,有助于学生在开展多类型的活动中,坚定信念、端正品行,提升个人的综合素养。基于此,以高职院校学生社团活动为研究切入点,在讨论开展社团活动必要性的同时,剖析学生社团育人功能的实现路径,旨在为广大高职院校学生创设参与实践活动的条件,为其接受德育与素质教育创造机会,从

期刊

面向多视点视频编码的深度虚拟参考帧生成技术研究

与本文相关的学术论文