基于卷积神经网络的多尺度特征表示的压缩图像和视频后处理滤波器研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:p54188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数字化多媒体技术发展迅速,用户对数字化的图像和视频的需求量呈爆炸式增长。但是图像和视频的信息量相比于文本十分巨大,传输和存储需要大量的网络带宽和存储空间,因此需要对其进行数据压缩。目前,大多数的国际通用图像和视频压缩标准采用基于分块的DCT变化压缩编码技术。尽管这种技术可以提供相对接近原图的图像和视频,但其不可避免的会产生压缩伪影,包括块效应,带状效应和振铃效应。这些压缩伪影不仅影响用户的主观视觉效果,而且不利于后续的计算机视觉任务。随着电子设备的计算能力大幅提升,深度学习由于其强大的映射学习能力,在计算机视觉任务正扮演着越来越重要的角色,基于深度学习的图像和视频处理方法也越来越多。因此,本文以提高数字图像和视频的主观视觉质量和客观评价指标为目的,结合深度学习的方法,对JPEG压缩图像去块效应和视频压缩后处理两种情况进行深入的研究和分析。本文的主要工作如下:提出了一种基于离散小波变换的卷积神经网络方法用于对压缩图像进行小波子带自适应去块。首先,我们在对输入图像进行离散小波变换(DWT)之后进行子带自适应处理,对于低频子带(LL),我们使用简单有效的浅层CNN来恢复图像的低频分量;而对于高频子带(LH、HL和HH),我们使用多核卷积来捕获多尺度特征并恢复图像中稀疏的高频部分。然后,我们使用由空洞卷积和普通卷积组成的混合卷积构成增强网络,来扩大网络的感受野,同时引入通道注意力和空间注意力机制来调整不同子带通道和空间坐标的权重。在Classic5和LIVE1数据集上进行的各种实验表明所提出的方法成功地恢复了JPEG压缩图像中的锐利边缘和清晰纹理,同时消除了诸如块效应和带状效应等压缩伪影。此外,在视觉质量和客观指标方面,所提出的方法在压缩伪影去除方面实现了较好的性能表现。提出了一种基于卷积神经网络的多尺度特征表示的压缩视频后处理滤波器。因为离散小波变换可以将图像分解为多频率和多角度的子带,有助于分析视频压缩过程中伪影,因此我们将DWT与CNN结合,并构建了两个子网络:阶梯式子带网络(SLSB)和混合增强网络(ME)。SLSB将被分解成不同频率的小波子带的输入视频帧送入对应的Res2Net Group(R2NG),按照从高频到低频,从低信息量到高信息量的顺序逐步重建小波子带,我们还在R2NG引入了空间和通道注意力机制,可以自适应的增强重要的特征。ME使用由空洞卷积和普通卷积组成的混合卷积来扩大网络的感受野,增强网络的映射学习能力,进一步提高重建质量。实验结果表明,提出的后处理滤波器在常见测试条件(CTC)的三种模式(RA,AI,LDP)下有较好的主观视觉质量和客观评价性能。
其他文献
随着互联网的迅速发展,越来越多的传统销售行业开始转向互联网营销模式。客户群体也从之前的小范围转向了更大的群体,对于商家来说,面对未知的群体,客户需求难以预测,因此商品销量趋势也变得难以掌控。商品销量预测对于电商企业来说意义重大,精准预测有助于采销人员制定出更加合理的采购方案,从而改善商品销量不稳定导致的供需不均衡问题。因此,商品销量预测在采购方案的制定中显得尤为重要。尽管时间序列预测具有广泛的现实
学位
属性网络是一类特殊的复杂网络,能为数据分析人员提供网络的拓扑结构信息和研究对象的属性信息,以便于挖掘潜藏在网络中的系统底层逻辑。社团结构是属性网络的重要模式,能聚类网络中不同性质的节点,优化网络的资源配置,为发现复杂网络的底层逻辑提供重要察觉。属性网路聚类算法旨在利用网络分析与数学建模的方法,从属性网络中提取社团结构,挖掘复杂系统的潜在特征。针对属性网络聚类算法,本文设计了两种不同的机器学习模型,
学位
随着大数据与云计算技术的快速发展,越来越多企业与个人通过将数据托管给云服务提供商来降低数据计算与管理成本。尽管云计算模式为用户带来众多便利,但这种方式导致了数据所有权与管理权的分离,数据外包存在隐私泄漏风险。为保护云存储数据隐私,用户一般将数据加密后上传,但该方法限制了用户对数据的管理能力,如检索、去重等。因此,如何对密文进行高效查询成为云计算安全领域研究热点之一。对称可搜索加密技术能使用户在密文
学位
分布式数据库采用数据分片的方式,将数据分布在不同的服务器或者数据中心上,以获得分布式的存储和查询能力。Shared-Nothing架构是分布式数据库实现一种架构,集群中每个节点都有独立的硬件环境(Hardware Context),用户可以通过简单地增加节点以获得更高的存储容量和吞吐能力。分布式哈希连接(Dist-HJ)是分布式数据库中两表连接操作的一个重要实现,传统的Dist-HJ采用哈希重分布
学位
随着金融环境的不断变化,传统金融管理方式遭遇强烈竞争,在新的金融形势下,银行绩效考核体系之于银行发展的重要性与日俱增。合理运用绩效考核体系可以帮助公司挖掘问题,分配利益,达成预期目标,从而促进公司成长。合理的绩效考核体系是企业管理者与员工的纽带,科学地将两者联系起来,可以使得管理者与员工积极投入工作以提高客户满意度,从而提高公司整体效益。此外,公司客户经理在绩效考核体系中扮演着重要的角色,因此,对
学位
金融科技的发展促使了传统银行业在产品和客户服务、销售渠道、IT系统及数字化几个方面不断深入探索。到2020年,银行业已经有近30%的营收受到直接影响。因此,响应时代发展,寻求新的产品及营销策略成为商业银行促转型和谋发展的必由之路。进入应用阶段时无可避免地与一群天然生长在互联网和新兴事物下的群体发生联系,这就是本文中提到的年轻客户群体,简称年轻客群。移动支付尤其是手机支付的诞生与发展,使得这个群体对
学位
环状铁氧体是一种广泛应用于扬声器、拾音器、微波炉、电视等电子产品中的非金属磁性材料,其生产过程中会产生掉块、直裂、圈裂、杂质、粘膜、油污等缺陷,严重影响产品质量。目前主要通过人工观察进行质检,检测效率低、成本高。论文设计了一种基于机器视觉的环状铁氧体外观缺陷检测分拣系统,旨在减轻质检工人的劳动强度,提高质检效率,降低生产成本。根据环状铁氧体的滚动特性和磨床立式滚出工件的特点,论文设计了借助工件重力
学位
如今,立体匹配和图像压缩是计算机视觉中的关键研究问题,并且由于对自动驾驶汽车和场景理解的巨大需求而备受关注。跨光谱立体匹配是克服多光谱图像对之间的光谱间隙和估计视差图的一个非常具有挑战性的问题。此外,图像压缩是影响后续计算机视觉任务的基础研究领域,其主要目的是通过编码器将未压缩的图像压缩成比特流,以实现高效的存储和传输。在本论文中,我们研究了基于深度学习的跨光谱立体匹配和学习图像压缩。本文的主要工
学位
在室内自主定位领域,虽然目前已经有多种定位方式可供选择,但视觉SLAM因其成本低、可视化强、理论成熟等优势而备受欢迎,活跃在各种应用场合,极具潜力的移动机器人市场更是催生了各种令人惊羡的视觉SLAM算法。其中,ORB_SLAM2算法在基于特征点法的一类视觉SLAM算法中,具有里程碑意义。本文以ORB_SLAM2算法为理论基础,对室内自主定位方法进行探索和研究。首先,为了使视觉SLAM算法在图像发生
学位
传统机器人由于结构限制难以在狭窄非结构化环境执行预设任务,而连续体机器人相对于传统机器人其构型拥有无限冗余特性。无限冗余特性使得连续体机器人在拥塞的环境中有着极佳的柔顺适应性,其柔顺特性使其在狭窄拥塞的非结构化环境中彰显出广阔的应用前景。但无限冗余特性也给连续体机器人建模、跟踪控制带来了巨大挑战。本文以多段连续体机器人为研究对象,通过仿真与实验对其运动学和跟踪控制展开相关研究,主要工作如下:为了描
学位