基于GAN的两阶段图像生成方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gexuefeng1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习在计算机视觉领域的表现十分亮眼,基于深度学习的方法能够处理很多图像相关的问题,比如图像生成、图像修复等。生成式对抗网络作为深度学习中的一种重要方法,能够生成高质量的图像,用于扩充数据集、图像分类等。虽然生成式对抗网络的表现十分优秀,但是其存在着许多问题,如训练不稳定、模式崩溃等,需要进一步的改进优化。首先,本文提出了一种基于生成式对抗网络的两阶段图像生成方法,提升生成式对抗网络的图像生成能力。第一阶段为特征生成阶段,先训练一个特征捕获网络,用于捕获图像的特征;其次训练一个生成式对抗网络来拟合图像特征。第二阶段为图像生成阶段,将第一阶段训练好的特征生成器加入到一个新的生成式对抗网络中,让输入的随机噪声先经过特征生成器后传输到图像生成器进而生成图像。其次,为了优化本文的方法,对第一阶段特征的维度、特征捕获网络的选取进行了探索。基于CIFAR-10数据集上的实验结果显示,特征维度对模型生成能力影响细微;第一阶段特征捕获网络的分类准确率越高,能够提升整体模型的图像生成能力。在最终的模型中,采用128维的特征,以及基于Res Net-110的分类网络。然后,为了验证模型在不同数据集上的泛化能力,分别在MNIST、Fashion MNIST和CIFAR-10数据集上进行实验。实验结果均显示,使用两阶段图像生成方法的模型比对应的基础模型,生成的图像质量更高。特别是,在CIFAR-10数据集上,使用本文方法的模型将基础模型的IS分数从8.12提升到8.37;将FID分数从22.4降低到15.85。最后,针对生成式对抗网络中常见的模式崩溃问题,本文进行了2D-ring和2Dgrid实验。实验结果显示,本文方法能够提升模型的生成模式数量、生成高质量样本比例和降低反向KL散度,改善模式崩溃问题。
其他文献
系统日志记录了计算机系统执行的关键操作和状态,为诊断和维护系统的运行情况提供了丰富的信息。当某些错误发生导致系统异常时,日志中也会有相应异常记录,系统开发人员与运维人员可以根据日志监控系统剖析系统的异常行为与错误。在系统日志中进行快速而又准确的异常检测、异常定位和异常修复,有助于及时消除隐患和排除故障,对于系统管理人员至关重要,引起了众多研究者的关注。随着系统和应用程序逐渐发展得多样复杂,每时每刻
学位
模糊限制语作为一种有效的语用策略,在日常交际中发挥着重要的作用。近年来学界对模糊限制语的研究方兴未艾,模糊限制语研究的内容及视角得到了不断的拓宽和丰富,然而顺应论视角下法庭层面的话语研究并不多见,对被告话语的关注度仍然不够,且普遍缺少法官对被告使用模糊限制语的回应策略分析。因此,本研究采用Verschueren的顺应论为理论框架,基于Prince等人的分类原则,运用定性与定量相结合的研究方法,对民
学位
新型冠状病毒病(COVID-19)是一种大流行病,传播速度极快,对人体的伤害很大。世界各国都爆发了新冠肺炎疫情,目前已导致全球600多万人死亡,感染人数超过4.58亿(截至2022年3月14日),严重影响了人们的生活。快速且准确地诊断出新冠肺炎感染是控制疫情蔓延的关键。为了快速高效地检测出COVID-19,降低COVID-19对人类生存的威胁,本文首次提出了基于强化学习的COVID-19诊断检测框
学位
话语分析倾向于研究社会或外部世界与话语之间的相互作用。认知语言学则关注相对微观的层面,能够拓展语篇分析研究,并为语篇分析提供了认知理据。立场是语言使用者所表达的立场,反映了他/她对所传达的事件和所描述的命题的态度和评价。同时,所有的立场话语资源又是语言使用者不同程度的主观性的指标,即说/写主体对所传达信息的承诺程度。本研究旨在从认知语言学角度探讨报纸社论立场和主观性话语表达的分布模式和策略。报纸媒
学位
目的 调查宫颈癌患者健康促进生活方式的现状,分析其影响因素,探讨与自我管理效能感的相关性,以期为临床宫颈癌患者的健康促进干预提供依据。方法 采用便利抽样法,选取2019年6月—2020年6月南昌大学第一附属医院妇产科收治的宫颈癌患者120例,采用自行设计的一般资料量表、中文版癌症自我管理效能感量表(SUPHH)及健康促进生活方式量表Ⅱ(HPLP-Ⅱ)进行问卷调查,回收有效问卷110份,对结果进行分
期刊
目的:观察首荟通便胶囊治疗功能性便秘的临床疗效。方法:将40例功能性便秘患者随机分成两组,治疗组口服首荟通便胶囊2粒,每日3次;对照组口服枸橼酸莫沙必利片5mg,每日3次,疗程均为2周。结果:治疗后两组患者的临床症状积分均较治疗前明显改善(P<0.05);治疗组总体疗效与对照组比较有统计学意义(P<0.05);两组均未发现明显不良反应。结论:应用首荟通便胶囊治疗功能性便秘总体疗效优于枸橼酸莫沙必利
会议
面向开放域的问答任务要求问答系统通过检索知识文档库,找到问题相关性段落,把问题和段落输入阅读理解模型后预测出问题答案。和限定域问答相比,开放域问答中问题查询内容没有约束,知识主题更加广泛,如何准确检索到和问题匹配的文本段落是预测出正确答案的关键。现有研究方法对语义模糊性问题的澄清能力不足,难以从中提取到关键特征,导致段落检索效果不佳,最终影响答案预测准确率。因此,研究检索模型对开放域问答有着重要意
学位
近年来,自监督学习因其简单且有效在深度学习领域大放异彩。自监督学习只通过无标记数据集,通过构造代理任务生成伪标签来训练深度卷积神经网络,解决了大规模标记数据集难以获取的问题。传统的自监督学习要求深度卷积神经网络使用外部代理任务(即基于图像或视频的任务)来编码高级语义视觉表示。本文提出了卷积神经网络内部的特征变换也可以看作是监督信号来构造自监督任务,称为内部代理任务。并且这种任务可以用于监督学习的增
学位
随着大数据时代的到来,数据成为重要的生产要素,数据规模也越来越大。云存储的出现减轻了用户的数据存储压力。然而,云存储无法保障外包数据的机密性,且云服务提供商本身是不完全可靠的,存储和查询服务质量会受到经济利益等因素的影响。可搜索加密技术通过构建密文检索方案保障了数据存储的安全,区块链则能够确保数据查询的正确执行,增强云服务的可信性,二者结合,能够有效解决云存储的安全性问题。在实际应用中,外包数据需
学位
新冠肺炎疫情影响全球已达两年之久,对社会和人们生活造成了颠覆性的影响,涉及到了整个社会的方方面面。语言作为人们赖以交流思想的主要媒介也难免因此而产生变化。大量新闻媒体一直以来都保持着对疫情的高度关注,也因此产生了大量可供语言研究者分析的新闻语料。这些语料相比社交平台语料而言,语言更加规范且能从多角度描述疫情和社会生活的关系,是很好的分析素材。本研究从认知语言学的视角出发,试图应用框架语义学和构式语
学位