融合启发式图像区域关系与深度神经网络的图像美学质量评估与裁剪

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:Hotcoolman
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算美学是通过计算机方法构建人类审美感知的模型,量化现实物体的美感程度。随着人们对美的追求愈来愈强烈与计算美学在日常生活领域的潜在实际价值,计算美学逐渐成为研究者们的热门研究课题。研究计算美学有助于在教育领域与社会商业活动,指导学生绘画学习、帮助设计师判断海报元素美观程度、辅助摄影师对当前取景画面进行美学质量评价与裁剪等,为观看图像的人们提供更好的视觉享受。所以,研究计算美学与实现性能优异、可落地应用的图像美学模型具有商业价值与人文价值。其中,图像美学质量评估与图像自动裁剪是计算美学的两大研究方向。图像美学质量评估(Image Aesthetic Quality Assessment)是具有挑战性的计算机视觉技术,其研究内容是让计算机模拟人类视觉感官对现实中的各类图像(如风光、人像、动物等)进行审美,准确量化图像美学质量。图像自动裁剪(Image Automatic Cropping)旨在通过逐渐从图像周围的边缘进行切割,去除多余部分从而达到重新构图的目的,用于提高图像美学质量的常用图像编辑方式。为了解决目前图像美学质量评估方法中的部分局限性,例如均化评估、未引入多物体间的位置关联等。本文提出新的基于图卷积神经网络的图像美学质量评估框架,名为G-AANet。本文设计的G-AANet包含三个模块:深度图像卷积特征提取网络、图卷积网络、美学质量分数分布匹配。深度图像卷积特征提取网络,由多层次多样式卷积层组合而成,用于提取图像局部特征与全局特征。图卷积网络对图像各区域信息进行运算,输出预图像美学质量分数分布,考虑了图像中各区域关联性。美学质量分数分布匹配模块,用于解决均化评估的问题。本文设计的G-AANet在大型图像美学质量评估数据集AVA上训练与测试,取得优异的实验结果。以往的大多数方法的裁剪过程产生并运算大量无用的候选框,不仅消耗大量算力与时间,也容易出现最佳裁剪框不在候选框内的问题。为了解决这两个问题,本文受到人类现实生活中裁剪图像过程的启发,将裁剪图像过程看作马尔科夫序列决策问题。本文提出一个基于深度强化学习算法(名为Advantage Actor-Critic(A2C))的简单轻量级框架,名为LA2C。LA2C包含智能体、图像裁剪环境、推出存储。LA2C方法模拟人类裁剪图像过程,根据当前裁剪图像下一次裁剪动作的判断,对图像进行多次裁剪动作,实现实时级、高效、合理的自动裁剪。本文提出的LA2C方法在公开的Flickr裁剪数据集(FCD)上进行评估和实验,IoU指标结果表明,与以往的自动裁剪工具相比,本文的方法以更少的裁剪步骤和时间达到了优异的性能。本文的两个工作在计算美学领域中,可应用在美学教学、摄影、设计等领域,推动了计算美学中图像美学质量评估与图像自动裁剪的发展,具有实用意义和社会价值。
其他文献
本文以“比德迈耶尔”时期文化背景为视角对舒伯特艺术歌曲进行解读,以“比德迈耶尔风格”和舒伯特艺术歌曲为切入点,研究二者之间的关系。“比德迈耶尔”是用来形容从1815到1848年德国的一个文化派别,它产生于特定的历史时期,既无先例也无法重复。了解这个时代对我们研究该时期舒伯特艺术歌曲有着重要意义。弗朗茨·舒伯特是世界音乐史上最伟大的作曲家之一,他即继承了古典主义音乐,又开拓了浪漫主义音乐的先河。为我
学位
本文的研究主题是社会信任框架下个体经济组织的竞争力。个体经济是社会主义市场经济的重要组成部分,为我国社会主义市场经济注入了强劲活力。现有研究虽然关注到社会资本在个体经济组织经营过程中的支持作用,但鲜有关注社会资本如何作用于竞争场域下的个体经济组织互动。因此,本文选取个体经济组织中较有代表性的个体户为研究对象,从信任资本的角度,关注在同样的区位、价格条件下,个体户在同行竞争中如何确立经营优势?本文采
学位
本文以激发学龄前儿童钢琴学习的兴趣为出发点,着重研究南希·菲伯尔、兰德尔·菲伯尔所编创的《我的钢琴第一课》(MY FIRST PIANO)钢琴启蒙教材。文章主体共分为四大部分,第一部分对研究对象进行相关概念的界定;第二部分对武汉市钢琴启蒙教材使用情况的现状进行调查,并且从教材、教师、学生三个方面分析调查结果;第三部分从音乐理论、弹奏技巧、听觉效果三个方面探究《我的钢琴第一课》的“趣味性”;第四部分
学位
近些年,随着教育信息化的蓬勃发展,人们的教育需求正从标准化教学向个性化学习发展,个性化学习也成为了研究的热点。通过在线学习平台,能够帮助学习者初步实现个性化学习。而对试题的知识点标注,为学习者的学习路径生成、个性化诊断报告和推荐个性化的学习资源提供了支持。因此,需要分析知识点和试题资源之间的知识关联性,对试题资源进行知识点标注,从而为学习者的个性化学习保驾护航。传统的专家标注准确度虽有保证但实现效
学位
回顾和审视我国的对外传播史,对外传播的水平一直受制于国家实力的影响,直到二十世纪八九十年代才有所起色,而且长期存在着带有宣传色彩、正面报道为主的问题。此次新冠疫情中,中美关系紧张,美国采取错误的对华政策,使我国面临着更加艰难的国际处境。在此背景下,中国的外交转变姿态,强势回应西方的种种“污名”,而对外传播却还存在着发声传不开、国外受众不相信的问题。西方国家污名化我国已久。无论是几百年前的“黄祸论”
学位
近年来,以班宇、双雪涛、郑执为代表的一批东北籍青年作家作为新兴文学力量吸引了学界的广泛关注。班宇凭借《逍遥游》《冬泳》等一系列风格鲜明的短篇小说不仅赢得了不同美学立场的批评家的赞誉,而且与近年来当代社会的思想动向紧密勾连,在文学圈外收获了不少读者,成为颇具影响的一个文化现象。然而,目前研究中流行的“新东北作家群”阐释框架,因将班宇与双雪涛、郑执等青年东北籍作家捏合成一个整体,模糊了班宇自身的独特性
学位
草图着色是指从给定的缺乏足够语义和纹理信息的草图或线条图生成相应的彩色图像。在人工智能时代,草图着色技术得到了飞速的发展并取得了很好的效果,广泛的应用在教育、影视创作等场景中。但由于草图和彩色图之间巨大的差异性,当前的用户交互式草图着色方法依然存在边界溢出、水彩伪影以及着色效率较低等问题。因此,研究用户交互式草图着色方法,使其更好的运用到实际应用中有着重要的研究意义。针对当前用户交互式草图着色方法
学位
叶圣陶一直以教育家、出版家身份的身份为人所熟知,对他文艺作品的研究也较多集中于小说创作和理论创作,而事实上,叶圣陶一生坚持创作旧体诗词,无论是从数量上还是质量上来看,都值得引起重视。本文旨在探讨叶圣陶旧体诗词创作论,立足于具体的文本创作,从审美和人生经历方面研究其长期创作旧体诗词的动因,并结合传记研究等方法,归纳叶圣陶不同题材类型的诗词体现出的共性艺术风格。本论文主要分为三个方面:第一部分研究叶圣
学位
在教育互联网+飞速发展的时代,各类在线学习平台层出不穷,各种教育领域需求任务应运而生,例如自动解答,自动阅卷,试题推荐等,所有这些任务中的一个基础性的任务是对互联网上不断产生的试题进行知识点自动标注。当前已有的自动标注方法主要采用传统的机器学习和深度学习方法。基于传统机器学习的方法忽略了文本中词语之间的前后联系,通过统计的方式提取文本特征,其受人为主观影响较大,不适合用来解决互联网上试题数量不断增
学位
太阳能电池作为常见的一种光电转化装置,因其可以存储和利用太阳光能量,可以在一定程度上缓解不可再生能源不足的问题,所以受到了研究人员的广泛关注。现阶段商业化使用的以单晶硅作为材料的无机太阳能电池,虽然光电转化率达到了21%,但是生产成本高、环境污染严重、产品合格率低,因此科学家们将目光转移到了易于大规模生产且生产成本较低的有机太阳能电池上。但是有机太阳能电池也存在不足:一是有机太阳能电池的光电转化率
学位