深度学习图像质量评估算法在文本合成图像工作中优化作用的研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:tony569257
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像生成指计算机通过人工智能领域的相关算法,自主产生和真实图片相近的生成图片。其在计算机视觉领域有着重要的地位,主要用于计算机辅助设计、图像编辑、艺术设计、信息转换等领域。然而,目前多数生成图像的实际使用并不普遍,这主要是因为生成图像的质量较低,与真实图片比有较大的差距,特别是在复杂图片的生成任务中,这个缺陷会进一步放大,这使得生成图片难以投入实际的使用。为了进一步提升生成图片的质量,一套合理的质量评估方法是不可少的,其能够在模型训练过程和结果优化中起到作用。传统针对生成图片的质量评估体系均建立在大量图片的统计特征分析,这些评估方法不能细化到单幅图片,只能对图像的整体情况做一个粗略的评估,这样的评估结果不管在模型训练过程中还是在结果的优化中,作用都是有限的。为了解决这个问题,本文在调查了图像质量评估领域的相关理论后,提出了一系列针对单幅生成图像质量的评估算法。这些方法能够显著提高生成图片的质量,从而让这些图片更能够投入到实际的使用中。文本合成图像是生成图像的重要应用之一,因为文本包含的信息相对较少,其生成图片的质量不尽人意,本文以该领域的生成图片为典例,研究图像质量评估算法在生成图像质量的优化作用。具体工作如下:第一,本文提出了一套有监督的深度学习方法,我们自己制作了一个针对生成鸟类质量评估的数据集,之后基于改进后神经网络模型提出了一个生成图片质量评估的算法。第二,本文设计了实验,以第一个工作为例,说明了有监督学习在生成图片质量评估领域的局限性。第三,本文分别使用了无监督学习和半监督学习两种策略设计模型,以较小的代价实现了功能较强的生成图片质量评估算法。本文从有监督学习到无监督学习,以文本合成图像领域中的生成图像为样例,对单幅生成图质量评估做了一些探索,并将图像质量评估算法用到生成图片的质量优化中。从实验结果来看,我们设计的三个图像质量评估算法在客观指标上比传统方法更有优势,主观上也与人类对图像质量的感知一致。我们选择了一些文本合成图像工作,并用我们的评价算法优化这些生成图片,优化后在质量上均有了显著的提升。除此之外,本文还贡献了一个针对鸟类图像质量评估的数据集,并通过一系列的实验验证了数据集的合理性。从这个领域来看,本文通过有监督学习过渡到了无监督学习,通过实验验证了有监督学习中存在的局限性,提出生成图像质量评估研究重点应该放在如何在数据集受限的情况下高效地训练模型。
其他文献
中国和乌国交往历史悠久,随着一带一路倡议的有效实施,两国经贸合作的规模与深度持续扩大。文章从现阶段中乌两国经贸合作态势出发,详细探讨了两国经贸合作的规模、结构以及合作模式,全面的总结了目前中乌两国经贸合作的问题,并据此深入剖析了相关问题产生的原因,最后在充分借鉴代表性国家双边经贸合作模式的先进做法后,文章提出了促进中乌经济合作的对策建议。按照此研究思路,文章取得了以下研究结论:第一、2012年-2
学位
卷积神经网络(Convolutional neural network,CNN)已经在许多领域展示了其先进的性能。然而,这些CNN经常包含超过百万的参数量并且需要上亿次浮点数运算,如此庞大的的计算量和参数量对于现有的智能设备来说是负担不起的。这个问题严重的阻碍了神经网络的实际应用。在本文中,提出了一种两阶段模型压缩和加速(twostage model compression,简称TSCA)方法来解
学位
新发展理念是新时代我国不断发展的指挥棒,创新是新发展理念的重要要素,创新能力的提升是我国经济增长的助推剂,也是我国综合实力增强与国际地位提升的重要保障。在创新的时代,高新技术企业是具有较强代表性的企业,可以助推我国创新升级与转型。高新技术企业的发展与投资活动息息相关,在进行投资活动时,高新技术企业普遍有巨额资金需求,而企业的自有资金很难满足投资需要,在投资过程中承受着巨大的融资约束压力。为减轻高新
学位
第七次全国人口普查数据显示中国60岁及以上人口比重比2010年上升了5.44%,达到18.70%,老龄化问题成为全社会关注的焦点。“十四五”规划明确提出“要完善养老服务体系”,可以预见未来养老服务市场前景广阔。然而,目前养老服务体系中的老年公寓项目发展不尽如人意,巨大的市场发展空间并未掀起老年公寓项目的开发热潮。究其原因,老年公寓项目的投资建设营运是一个漫长、复杂、多变的动态过程,从价值评估的视角
学位
复杂网络可视化旨在将复杂网络转化为直观的图形,并加以相应的可视交互技术,以帮助用户理解、分析和探索复杂网络,在各个学科、领域都有着广泛的应用。其中,网络布局算法是可视化的基础,其布局结果直接影响着可视化的质量,也影响着用户对网络结构的理解。网络数据规模的增加给布局效率和布局质量都带来了挑战,在面对规模较大的网络时,现有算法的布局难以兼顾网络的整体结构和局部细节。为此,本文从复杂网络社团结构出发,基
学位
中国和吉国的合作近年来突飞猛进,随着网络技术的进步与发展,跨境电商逐步发展为中吉两国开展经贸合作的一种重要方式。文章以中吉两国贸易中跨境电商的发展研究为例,搜集中吉两国经贸合作相关数据,对中吉两国经贸合作、跨境电商合作现阶段的情况进行探讨,深入剖析当前中吉两国跨境电商合作的发展问题,并对两国跨境电商发展的前景进行预判分析。通过研究,文章总结了以下结论:第一、在双边经贸合作上,中吉两国的合作成效不断
学位
当前,夜间经济正在快速发展,我国国务院办公厅于2019年8月底发布了《关于加快发展流通促进商业消费的意见》[1],文件指出我国要加快夜间经济的建设和发展,以此发展活跃的夜间市场,这是对我国夜间经济既往发展情况以及当前国情现实的综合考量提出的重要意见,对于夜间经济在我国的发展以及推动经济整体发展具有重要的促进作用。四川省省政府于2020年4月初发布了《四川省商务厅关于做好激发消费潜力稳定经济增长工作
学位
近年来,随着多款商用级头戴式显示器的推出,沉浸式技术的应用研究有了快速的发展。在沉浸式环境下,可以提供与真实环境相似的交互体验,增加使用者的临场感与沉浸感。沉浸式技术拥有直观的立体显示效果和三维交互方式,与游戏、工业设计、考古、医学、电影等领域的三维虚拟场景高度契合,得到了广泛的应用。三维流场亦是沉浸式技术应用的一个重要领域。在流场可视化过程中,经常需要对三维参数进行配置,如流线布种,区域剪切等。
学位
人群计数旨在估计出视频或图像中的人数,在公共安全预防、产品投放等方面有着广泛应用。随着深度学习的发展,使用卷积神经网络对人群计数进行研究可以有效提升人群计数的准确度。然而在现实生活的复杂场景中,人群计数算法面临着许多挑战,如人群的尺度变化、复杂背景等。捕获多尺度特征并减弱背景干扰是降低人群计数误差的关键。因此,本文在详细分析基于深度学习的人群计数算法的基础上,对人群计数算法中的网络结构与损失函数部
学位
交通轨迹是交通工具在时间区间内的空间移动路径,反应交通工具的时空特征。探索交通轨迹数据是分析轨迹数据特征的重要步骤。交通轨迹数据是一种时空数据,具有数据量大、时间跨度长的特点,这使得现有的交通轨迹数据探索方法技术门槛高。交通的随机性使得交通轨迹充满不确定性,这将不利于交通轨迹数据的进一步利用。可视化通过直观的视觉通道传达交通轨迹信息,具有直观高效的特点。因此,通过可视化研究交通轨迹不确定性相关问题
学位