基于深度学习和空频域分析的图像质量评价方法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:alxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随多媒体、网络与信息化的高速发展以及各类网络社交软件的普及,如何在浩如烟海的图像数据中筛选、评价、修复和增强图像的质量成为当下研究的热点。客观图像质量评价旨在利用数学建模和计算机理论设计出与人眼主观评价一致的算法,并以此来评价待测图像的质量。本文围绕人眼视觉系统的感知特性,探索空域结合频域视觉特性以及多层感知特性,重点研究了全参考图像质量评价方法和通用型无参考图像质量评价方法。本文的主要研究内容包括以下三个方面:(1)提出了一种基于空域结合频域分析的全参考图像质量评价方法,该方法通过空域视觉特征结合频域视觉特征来分析图像的视觉质量。首先,根据人眼视觉系统对图像的结构区域较为敏感的视觉特性,分别在空域和频域中提取图像的梯度特征和相位特征来量化图像的结构信息。其次,在频域中分析空间频率和纹理信息对视觉质量的影响。最后,通过随机森林来学习上述各个特征和人眼主观感知之间的关系,并以此建立归回模型。在公开的4个主流数据库中,大量的实验结果表明本文提出的全参考图像质量评价方法的性能优于当前主流的全参考图像质量评价方法。(2)提出了基于深度卷积神经网络的无参考图像质量评价方法。根据人眼视觉系统具有多层感知的特性,采用深度卷积神经网络GoogLeNet提取图像的低、中和高层视觉特征来模拟人眼视觉初级皮层的工作机理。然后,对各层卷积特征采取4种有效的池化策略,将池化后的特征信息输入至随机森林中进行训练,并以此建立无参考图像质量评价模型。在公开的4个主流数据库中对本文提出的无参考图像质量评价方法进行测试,实验结果证实该方法的性能总体优于现有的无参考图像质量评价方法。(3)针对传统的max-pooling和average-pooling等池化方法忽略了卷积特征各通道的权重信息,不能充分反映人眼主观感受的问题,本文提出了一种基于视觉加权的池化方法。该方法采用crow-pooling局部处理卷积特征中各通道间的权重和平面权重信息。其次,再对通道加权后的特征信息进行rmac-pooling来全局处理图像目标区域的权重信息。最后,结合传统的max-pooling和average-pooling来全局处理卷积特征中各通道的最大结构信息和平滑信息。该池化方法计算方式简单,同时以全局结合局部的方式来处理各层卷积特征,可以有效的模拟人眼视觉特性。
其他文献
晚期糖基化末端产物(Advanced Glycation End products, AGEs)是由氨基酸和还原糖发生非酶褐变反应的终期产物,可分为外源性和内源性AGEs(食品)。从食品中摄入的AGEs与糖尿病
<正>丹参及其制剂具有活血化淤、通脉养心、凉血消痈、除烦安神等功效。近20多年来,其各种制剂和剂型已经应用于临床。希望对丹参药理研究的阐述,加大对丹参的研究和开发应用
墨江哈尼族居住的是富有民族特色的土掌房。土掌房房能保暖,能御寒,既防火,又纳凉。因为哈尼族多居住在高山和半山区,空气湿度大,气候温凉,这种房屋在哈尼山区分布很广,千百
本文从政治传播视野,以政治学的研究成果"国家与市民社会良性互动"为理论基点,重新审视国家形象塑造与传播中的国家理念这一重要问题。国家理念在国家形象塑造与传播中占据着
<正>音乐剧是一门综合艺术,既给人以艺术享受,又能够反映社会生活,曾在上世纪80—90年代风靡全球。音乐剧是最自由的艺术形式,手法多样化,发展多元,极注重观念与时尚。从欧美
一般来说,人们对图像的认知,最直观的感受莫过于图像色彩的视觉冲击,映入人们眼睛的颜色直接影响着人们对图像本身的判断。对于图像的摄像、输出等设备,其保真度越高,则说明
我们要分辨一个人是谁,首先想到的是观察他的脸,因为人脸反应了他的身份、性别、年龄等生物信息。随着计算机科学技术、图形图像技术等的飞速发展,基于人脸图像的识别问题也
如何对政府新闻发人制度的效果做量化测评是我国政府发人制度实施以来面临的个重要议题和问题。本文力图紧扣我国政府新闻发人制度实施的现实与传播语境,在定量与定性研究相
本文从类型、疑问词与疑问语气的对应关系、疑问的层级性和疑问句的语用价值等方面对《世说新语》中的疑问句作了全方位的讨论,分析了该书使用疑问句的特点,提出了“疑问的层级
随着企业生态系统理论的发展,作为企业生态系统价值结构的价值网络也备受关注。本文从物理学的万有引力视角出发,在分析价值网络成员企业间的共生关系基础上,提出共生引力概