基于深度学习的3D视频多域联合预测编码研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:FXH_590590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
3D视频在2D视频的基础上增加了视点数目和深度数据,其数据量要远大于2D视频,给视频的存储和传输带来了巨大的挑战。因此,如何实现高效的3D视频压缩编码具有重要的理论研究意义和实际应用价值。近年来,随着人工智能技术的发展,深度学习在视频处理领域得到了有效应用,为3D视频压缩编码提供了新的发展思路。为了进一步提高3D视频编码效率,本文借助于深度学习技术,利用3D视频的空域、时域和视点域相关性,开展了基于深度学习的3D视频多域联合预测编码研究。本文提出了一种基于深度学习的时空联合预测编码方法。3D视频具有丰富的时域和空域相关性,为有效去除3D视频数据的时空域冗余,设计了时空联合预测编码方法,综合利用时空域相关性,并借助卷积神经网络的学习能力,获取时空联合预测。首先,依据对3D视频内容时空域相关性的分析,基于帧间预测块和空域重构块获取时空参考信息、构建时空参考块。然后,构建了时空联合预测网络,融合时空域参考信息,获得时空联合预测结果。最后,将提出的方法集成至3D-HEVC编码平台。实验结果表明,所提出的方法可以有效提升3D视频的编码效率。本文进一步提出了一种基于深度学习的多域联合预测编码方法。3D视频不仅具有时空域相关性,还包含丰富的视点域相关性。为进一步去除冗余,在结合时空域相关性和视点域相关性的基础上,通过卷积神经网络利用多域参考信息,获得多域联合预测。首先,针对3D视频丰富的多域相关性,提出一种分级多域预测机制,以实现对多域参考信息的获取和有效融合。然后,构建了基于多尺度融合的多域联合预测网络,充分利用时空预测信息和视点合成预测信息,获得多域联合预测结果。实验结果表明,所提出的方法能够进一步提升3D视频的编码效率。
其他文献
在教学管理中教师要充分尊重学生的主体地位,要主动将班级的管理权下放,这样才能更好地提升学生的实践和创造能力。在初中阶段,教师可以鼓励学生进行自主管理,从而提高学生的自主管理能力,进而在教学活动中更好地发挥学生的主观能动性。本文对初中学生自主管理的重要意义和建立自主管理模式进行了分析与讨论。
期刊
随着深度学习等技术的不断发展,人们希望人工智能成果能够应用在教室内以提高学生的上课效率,而人脸识别系统是多数教室内智能应用的基础。虽然现阶段人脸识别模型在数据集上可以达到很高的准确率,但在实际的教室场景下由于学生的面部姿态问题,人脸图像模糊问题以及人脸遮挡问题导致人脸识别系统的准确率较低。同时,现阶段教室人脸识别系统大多停留于理论阶段,很少有实际的应用。因此,本文针对教室内人脸姿态问题、人脸模糊和
学位
报纸
<正>为保障实验动物的福利,不断提升动物实验研究水平,并获得国际学术界同行的认可,根据国际和中国实验动物有关法规和标准,在实验动物麻醉方法中,鉴于水合氯醛原属于镇静、催眠及抗惊厥药,作为麻醉剂效果较差,刺激性强、毒副作用较大,存在干扰实验结果,并且有悖实验动物福利伦理审查原则等问题,美国兽医协会(American Veterinary Medical Associaon,简称AVMA)已宣布不允许
期刊
随着三维模型检索、3D打印等技术的快速发展,三维模型被广泛应用于互联网、机械加工制造等领域。然而在现实生活中三维模型的获取难度较大,大量的模型数据掌握在设计人员及专业的应用方,这也限制了三维模型的大面积应用。但是,随着视觉采集设备的发展和普及,相对三维模型而言,二维图像更容易获取。因此,如何通过二维图像信息重建或者检索三维模型开始获得越来越多科研人员的关注和精力投入其中。本文着力于解决三维模型特征
学位
点云是雷达扫描所得到的一系列点的坐标的集合。由于点云环境表达精准且包含丰富的三维地理信息,点云目标感知被广泛应用于自动驾驶汽车中准确环境感知任务。近些年来,随着深度学习的不断突破和三维点云数据的可及性,基于神经网络的点云目标感知算法取得了极大发展。利用神经网络从非结构化的点云数据中提取高语义、鲁棒的特征是点云目标感知算法的研究重点。针对现有点云目标感知算法中下采样方法仅利用点云地理信息的问题,本文
学位
<正>我国正在进入老龄化社会,老年人中心血管疾病患者人数也在不断增加,给社会和家庭造成的负担越来越严重[1]。研究证明运动能力的下降会使老年人失能的风险增加,降低老年人的生活质量[2]。找到改善老年人心血管功能和运动能力的手段,对预防老年人心血管疾病发生和改善老年人生活质量具有重要意义。目前,运动干预越来越受到研究人员的重点关注,运动干预已经成为治疗老年人心血管疾病的有效方法[3]。研究发现,
期刊
音频场景识别旨在用计算机分析音频信号所处的环境信息,具有重要的研究意义。音频场景识别方法对输入的声学特征表示进行特征提取,并利用得到的声学特征分类场景类型。随着大数据技术和高性能处理器的发展,基于深度学习的音频场景识别方法通过监督学习策略,解决了传统方法对高维多分类复杂关系建模的难题。然而,现有的方法在实际应用时仍面临算法针对性不强、训练数据量不足、计算复杂度过高和模型可解释性差等问题。因此,本文
学位
雾天采集到的图像存在对比度下降和色彩偏移等问题,降质图像会严重影响计算机视觉系统的处理性能,图像去雾研究具有重要的理论意义和现实意义。本文深入研究基于深度学习的去雾方法,并针对现有端到端去雾网络存在去雾不彻底、细节模糊以及颜色失真等问题提出两种去雾新方法,主要工作如下:针对现有去雾网络对图像特征提取不完整、网络模型泛化能力不足等问题,本文基于卷积神经网络设计了一种基于内容特征和风格特征融合的去雾网
学位
<正>陕西省宝鸡市城市管理执法局以建设法治政府和法治城管为目标,以法治建设反馈问题整改和示范创建为抓手,扎实推进依法行政、文明执法,取得积极成效。2022年,宝鸡市城市管理执法局被宝鸡市司法局评为法治建设优秀单位。深入学习习近平法治思想
期刊