【摘 要】
:
随着显示器硬件制造水平的提高以及人们对显示器视觉质量需求的提升,数字显示器已经逐渐可以显示具有高比特深度的高动态范围内容,以提供更多、更细致的颜色表示,提高图像显示的视觉质量。然而,受限于图像采集设备,大多数图像视频以低比特深度形式存储。当这些低比特深度图像经过简单处理后直接在高比特深度显示器上显示时,图像的颜色平滑渐变区域会有明显的伪轮廓,降低了视觉质量。因此,研究合适的图像比特深度增强算法具有
论文部分内容阅读
随着显示器硬件制造水平的提高以及人们对显示器视觉质量需求的提升,数字显示器已经逐渐可以显示具有高比特深度的高动态范围内容,以提供更多、更细致的颜色表示,提高图像显示的视觉质量。然而,受限于图像采集设备,大多数图像视频以低比特深度形式存储。当这些低比特深度图像经过简单处理后直接在高比特深度显示器上显示时,图像的颜色平滑渐变区域会有明显的伪轮廓,降低了视觉质量。因此,研究合适的图像比特深度增强算法具有重要的研究价值。本文基于深度学习对图像比特深度增强算法进行研究,主要的研究内容和创新成果如下:
1)本文首次提出了一种基于深度神经网络的端到端的图像重建算法,并在模型中引入跳跃连接,结合网络的低层和高层特征,抑制了训练过程中的梯度消失问题,以恢复更高质量的高比特深度图像。算法重建高比特深度图像的主观效果超出传统算法,峰值信噪比超出传统算法约0.4dB。
2)针对深度神经网络的特征融合问题,本文提出串联各层特征的网络结构,将低层网络中的细节特征直接传递到高层。相较于前面算法采用的相加跳跃连接的融合方式,该方法可以在反向传播中提供额外的稳定梯度,帮助模型收敛。另外,通过分析残差图像与高比特深度图像之间的结构关系,本算法提出重建残差图来间接恢复高比特深度图像,进一步提高算法性能。这不仅能提升高比特深度图像主观质量,且峰值信噪比超出传统算法约3.9dB。
3)神经网络在训练过程中依赖于合理的损失函数,然而简单的基于像素独立计算、或基于预训练特征的评价方式难以合理全面的衡量重建图像的质量。因此,本文提出采用鉴别网络全面评估重建图像的真实程度,并在对抗式学习中提高生成网络的有效性。实验结果证明,该算法重建图像的主观质量优于国内外传统算法,且峰值信噪比提升了约4.5dB。
其他文献
三维模型技术随着信息技术的迅猛发张取得了广泛的应用,三维模型存在于人们生活的方方面面,例如三维建模、三维重建、3D电影、三维体感游戏和三维医疗等。特别地,得益于已经在各行各业逐渐普及的三维模型拍摄设备,每天都有海量的三维模型被分享到网络平台,相应的产生了大量三维模型数据集。然而,其中只有小部分用于学术研究的数据集具有详细和相对准确的人工标注,大部分三维模型数据库,尤其是用户端三维拍摄设备获取的三维
随着摄像头的广泛铺设和互联网普及,针对室内场景的空岗判定、智慧家居和人流量统计等智能视频分析系统也快速发展,以上功能的实现都要建立在室内人员检测的基础之上。但目前对检测算法的研究主要针对室外行人,室外行人取材场景开阔,数据集中的图片大多采用平行机位拍摄,人体目标较为完整。而室内人员多是俯视拍摄,容易出现家具带来的遮挡问题,且室内人员姿态多样,致使同一个体在不同状态下也会呈现较大差异。这些原因导致主
随着计算机视觉技术的发展,三维模型在该方向的应用越来越广泛。由于三维模型的数量急剧增加,快速实现对三维模型的分类和检索是面临的一个较为棘手的问题。三维模型的表征方法有很多种,其中基于视图的图像表征方法在该领域方面有着很好的表现能力,在多个数据库和比赛中取得良好的成绩。 本文依据图像表征三维模型的方法,介绍基于全景图的三维模型表征方法,主要介绍:(1)提取三维模型的全景图表示三维模型,将网格化的三
物体检测是计算机视觉领域的基础问题之一,在自动驾驶、安全监控等领域有着广泛的应用。当前物体检测主要有两个发展方向,一是通过部署深度网络来实现检测精度的提升,不能保证实时的检测速度;二是通过设计轻量级网络提升检测速度,但检测精度相对较低。目前来看,单阶段物体检测器的检测速度尚可满足实时性的需求,但检测精度低是其相比于双阶段物体检测器的一个缺陷。与此同时,对于自动驾驶、安全监控等领域来说,视觉感知系统
数字多媒体时代的今天,各种立体图像或视频产品丰富着我们的生活,给我们带来身临其境的立体感。然而在立体图像处理过程中,创建、压缩、传输、重建、渲染和显示这些步骤都难免在原始图像上引入各种失真,导致立体图像或视频质量的下降。质量评价算法能够对立体图像或视频产品的质量进行评估。因此,建立一个准确有效的立体图像质量评价模型在数字多媒体时代显得至关重要。 本文首先提出了一种基于立体显著性的无参考立体图像质
空间谱估计作为阵列信号处理的一个重要分支,其目的是确定空间中入射源信号的来向。经典的DOA估计算法大都基于精准阵列流型,而没有考虑实际应用中不可忽略的互耦效应等因素,导致其实测性能大幅降低。因此,研究互耦情况下的测向算法具有重要的实用价值。此外,由入射源信号的统计特性,可将其分为圆信号和非圆信号。目前大多数算法默认入射源信号是圆信号,只利用其协方差非零的特点完成测向操作,导致可探测最大入射源数目少
随着5G新无线电接入技术(New Radio Access, NR)的不断发展,人们对大容量、低延时、高可靠、高速度、低功耗通信的需求更加迫切。在数字通信系统中,信道编码是5GNR的关键技术之一,而海量的信息数据传输对5G信道编码提出了更高的要求。低密度奇偶校验(Low Density Parity Check, LDPC)码作为5GNR的信道编码中数据信道的长短编码方案,将继续发挥不可或缺的作用
火灾早期,通常先有烟雾产生,随后才是火焰,因此烟雾检测能够提供比火焰更为及时的报警线索,对于确保人民群众的生命以及财产安全、推进火灾预防领域的发展意义重大。传统的烟雾检测方法通过监测空气中烟雾颗粒产生的物理变化来进行烟雾报警,比如温度、浓度等。但此类方法在时间和空间上均受到限制,从时间来说,烟雾浓度需达到一定范围才可以被传感器感知,这很可能导致最佳救援时机的错失;从空间上来说,一些开阔的室外环境也
随着互联网技术的发展,海量图像数据不断涌入,人们对从海量数据中检索有效信息的需求不断增长。同时,近年来随着手机、平板等触摸屏技术的发展,基于草图的图像检索(Sketch-based Image Retrieval, SBIR)成为一种较为直观和有效的图像检索方式。相比于其他基于内容的图像检索方式,草图作为查询输入可以更好地描述关键信息,且更为直观和简洁。因此,基于草图的图像检索引起了研究人员的广泛
目标检测是计算机视觉中的一个主要研究方向,并且有很多实际的应用,比如无人驾驶、智能医疗等。传统的目标检测算法主要基于手工提取的特征以及可训练的浅层结构。近些年来,随着深度学习技术的快速发展,越来越多的研究人员趋向于用深度学习的方法解决计算机视觉任务。由于深度学习能够提取出更深层次、更高语义级别、更加鲁棒的特征,基于深度学习的目标检测算法在该领域取得了突破性进展。但许多复杂的应用场景既对目标检测系统