基于长短时记忆网络的H.266帧内预测算法优化

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:luck1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高清、超高清视频应用的快速推广,视频传输与存储所需要的数据量越来越大。在即将发布的H.266编码标准中应用了大量新工具,大幅度提高了视频的压缩率,但该标准仍然存在较大的提升空间。考虑到深度学习在海量数据表达方面的巨大优势,论文重点研究了长短时记忆(Long Short-Term Memory,简称LSTM)网络用于优化H.266帧内预测过程的问题,提出了两种改进的帧内预测优化算法。主要工作和创新点如下:(1)针对H.266编码器帧内预测过程存在较大预测残差的问题,论文提出了一种基于LSTM网络的帧内模式优化算法。对于角度预测中的水平模式和垂直模式,论文训练了一种LSTM网络模型,利用该模型对帧内预测残差进行二次预测,补偿标准模型中帧内模式的预测结果,减小最终的预测残差。论文对LSTM网络的深度与尺寸进行了讨论,利用统计方式优化了网络参数。实验结果表明,与H.266标准参考模型VTM 2.0相比,论文提出的方案可以平均降低0.34%的BD-rate。(2)针对尺寸较大的编码块中,标准模型对远离参考线的像素预测能力不佳的问题,论文提出了一种基于LSTM网络的多参考线帧内预测改进算法,通过增加当前编码块的其他邻近参考线,将基于单参考线的预测方式改进为基于多参考线的预测方式,为帧内预测提供了更丰富的上下文,并通过LSTM网络对远离参考线的预测块中的右下方区域的残差进行了补偿,提高了帧内预测的精度。实验结果表明,与H.266标准参考模型VTM 2.0相比,该方案平均可以降低0.18%的BD-rate。
其他文献
铝合金在汽车行业等领域具有重大应用价值,对实现车辆轻量化、提高能源利用效率具有重要意义。基于亚快速凝固技术(冷却速率102–103℃/s)的双辊铸轧可以进一步提升铝合金的综
目的:头颈部鳞癌占全身恶性肿瘤的第六位,是头颈部最常见的恶性肿瘤。区域性淋巴结转移的特性是导致头颈鳞癌患者预后不良的主要原因之一。详细的阐明头颈鳞癌细胞侵袭转移分
在火力发电等工业控制领域的历史数据中蕴含了有价值的控制规律,可用于指导设备运行优化。但由于控制系统结构复杂,难以进行控制参数分析和优化,因此可将可视分析技术引入复
未来城市里健康将成为各行业的中心话题,2020年新冠疫情影响之下,让我们再次聚焦到如何提升公众的自主健康意识。随着我国“全民健身计划”进入第二期工程,以及十九大会议上提出的“将健康融入所有政策”的健康城市策略背景下,运动以其本身广泛的联结性,促使运动文化成为城市发展的重要研究议题,在此过程中设计创新开始发挥重要作用。本文的主要研究脉络与内容如下:(1)分析运动融于城市的过程。从运动人群的角度,论述
学位
近几年我国中央农村工作会议都强调要提高农业生产效率、促进农民增收。蚕桑产业作为我国传统优势产业,对促进农民增收具有重大意义。然而随着“东桑西移”的推进,东部地区蚕
历史上,传染病曾多次造成大规模的死亡,严重阻碍了社会进步发展。为了研究其传播机理,学者们提出了传染病模型来描述传染病的传播过程。同时由于谣言的扩散与传染病蔓延相似,
在制造业蓬勃发展时期,为提升企业自身在全球化市场中的竞争力,很多制造业公司提出了利用计算机和互联网技术打造数字化工厂的目标。由于近年来数控设备类型多样、复杂程度越
俄国十月革命的胜利,标志着人类社会历史上第一个社会主义国家的建立,打破了资本主义世界体系的链条。新生的俄国苏维埃政权国际上遭到帝国主义的封锁,国内经济文化发展落后
色彩是我们体验环境产生感受的基本要素。在这个日益丰富的彩色世界中,单色的设计传达出“把颜色的单一使用作为主动的选择,而非被动的”新观念。在室内设计领域中,单色因长期单调的用色方式被人们误以为表现力单一,又因数不清的颜色选择,使人们将室内色彩研究的重心放在在复色多彩的搭配效果上,单色的设计研究被忽略。本文将回归和聚焦于“单色”,以全新的色彩研究角度与设计的思考方式展开色彩的艺术研究。一方面是对单色艺
学位
近年来,我国储蓄过高消费不足的问题已经制约着经济的健康发展。而商业保险作为社会保障体系的重要支柱,能有效降低居民对未来的不确定性,释放居民家庭在教育、住房等方面的