【摘 要】
:
随着互联网技术的蓬勃发展,网络上存储的信息也越来越丰富。人们每天都会接触到海量的视觉信息,但通过搜索引擎很难搜索到自己真正需要的图像。文本生成图像系统允许用户通过输入文本描述信息,自动生成与之相符的图像并返回给用户。这样的搜索方式能更好地响应人类个性化品味的需求。2014年,生成对抗网络横空出世,开启了图像生成领域的新篇章。文本生成图像任务也受到越来越多研究人员的关注,其最大的挑战是生成真实、多样
论文部分内容阅读
随着互联网技术的蓬勃发展,网络上存储的信息也越来越丰富。人们每天都会接触到海量的视觉信息,但通过搜索引擎很难搜索到自己真正需要的图像。文本生成图像系统允许用户通过输入文本描述信息,自动生成与之相符的图像并返回给用户。这样的搜索方式能更好地响应人类个性化品味的需求。2014年,生成对抗网络横空出世,开启了图像生成领域的新篇章。文本生成图像任务也受到越来越多研究人员的关注,其最大的挑战是生成真实、多样,且与文本语义一致的图像。近几年,文本生成图像的技术不断更新,但是生成的结果依然不尽如人意,仍有很大的改进空间。针对文本生成图像中的挑战和问题,本文主要研究成果如下:(1)针对现有的文本生成图像算法所生成的图像往往具有模糊不清、全局结构扭曲、细节语义不一致的问题,本文提出了一种新型的基于双注意力生成对抗网络的文本生成高分辨率图像算法。该算法包括两个核心的网络模块:基于双注意力模型的视觉特征重构网络,通过关注相关词语和不同视觉区域的特征来增强局部细节和全局结构;基于倒置残差结构的亚像素特征重构网络,通过扩宽残差结构中间层的视觉特征表达容量,提高非线性表达能力。此外,为了稳定生成对抗网络的训练,该算法在生成网络和判别网络中同时引入了谱归一化技术。在多个数据集上的实验结果表明,该算法能够生成更加多样的、真实的样本。(2)单个全局判别网络因过度强调某些有偏差的局部特征会导致图像整体失真。因此,本文提出了一种新型的基于图像质量感知的文本生成高质量图像算法,通过自监督学习方式来提高图像生成质量。在辅助任务中,本文提出了一个基于图像质量感知的排序网络,该网络采用孪生网络结构,对自主构造的不同程度的失真图像进行质量排序评估;在基于生成对抗网络的文本生成图像模型训练过程中,本文引入了一个新的感知排序损失函数,来优化生成网络生成图像的质量。在多个数据集上的实验结果表明,该算法能够生成质量更高、更真实的样本。(3)基于以上研究,本文设计并实现了基于文本语义的高分辨率图像生成系统,跨越“语义鸿沟”,实现个性化图像定制。该系统采用B/S架构实现,具有完备的图像定制、丰富的可视化和完善的交互功能。
其他文献
根据世界卫生组织的调查发现,糖尿病已成为仅次于心血管疾病和肿瘤疾病的第三大杀手。糖尿病主要通过有创进行检测诊断,检测过程易给患者带来生理及心理上的痛苦,且伤口会因保护措施不到位而受到感染。无创血糖测量技术因具有无创伤、无感染和可实时监控等特点而成为近年来热门的研究课题。基于能量代谢守恒法研制的血糖仪可以用于糖尿病的检测识别,该类血糖仪有操作简单和无创伤等特点,能够实现对患有糖尿病人群的血糖水平进行
本文以医药连锁店凤林连锁药店为研究对象,通过研究发现其在营销状况中存在的问题,为其制定更有针对性的营销策略。因此,本文运用国内外的市场营销相关理论对药店的市场环境进行分析,提出了适合本连锁药店市场环境的营销战略,在战略的指导下提出了若干有利于其树立品牌形象的营销策略。随着医药零售行业激烈的多业态竞争,医药零售品同质化严重,如何进一步扩大市场,扩大市场份额,形成凤林连锁药店品牌优势,是亟需解决的问题
随着深度学习的不断发展,自然语言处理技术逐渐被应用到各个领域,如信息抽取、机器翻译、问答系统等。其中,文本复述任务使用基于深度学习的NLP技术,可以为生成出来的文本赋予多样性和创造性。其任务目标是让机器使用不同的措辞、表达,将原先的文本复述出来,该过程需要最大程度地保留原文本中的核心语义,并且生成语句的通顺度要尽可能高。本文提出了一种基于深度学习的文本复述系统,可以学习数据样本之间的多样性及语句流
随着经济全球化的发展,金融机构突破了传统的业务范围,将业务实现了多元化从而形成金融控股公司。在这样的背景下,我国理论界与实务界对金融控股公司的运行与监管产生展开了热烈的讨论,要求放松分业经营限制的呼声与将金融控股公司纳入法律监管的诉求此起彼伏。通过观察英国、日本、美国等国家金融控股公司发展历史路径,可以发现,这些国家金融控股监管体制的改变几乎无一例外是以法律制度改革为起点,金融集团化伴随着金融法律
人类的情感是复杂而多样的,主要通过面部表情、手势、声音等情感表征来传递情感。在当今人工智能发展与虚拟应用场景下,通过计算机来识别、理解及表达情感的“情感计算”研究
近年来,随着经济快速发展,中小企业融资难题日渐突出。中小企业由于规模小、经营不规范、财务不透明、破产率高等原因很难获得银行融资。小额贷款公司填补了金融机构的空白,缓解了中小企业融资难的问题。本论文是站在小额贷款公司的角度进行研究的。论文中,信贷可获性表示获得小额贷款公司信贷的难易程度,而中小企业的授信额度是指小额贷款公司在中小企业可获得贷款的情况下,给予他的最大贷款金额。本文通过收集202家广州企
本研究是开展“适合的教育”的一项探索,在了解学生学习风格的基础上,寻找与之相匹配的教师教学方式,探究二者的匹配性对学生学习的影响,并关注学业情绪在这一影响中的调节作用,其中,教师教学方式在本研究中具体是指教师情绪表达的方式。共分为两个子研究,研究一采用问卷法和实验法,对山东某实验中学的191名初一学生进行实验研究和问卷调查,实验采用2(教师情绪表达:激情型、平静型)×3(学生学习风格:理智型、情绪
酚醛泡沫作为第三代保温材料,具有阻燃性好、无毒低烟、热稳定性好等特性,被广泛应用在建筑、石油化工设备、电器管道、交通工具等领域。但酚醛泡沫材料具有脆性大韧性低等缺
随着我国经济的快速发展,物质生产水平得到极大提升,与其相适应人们对生活品质的追求也逐渐提高。对高品质生活尤其是对优质绿色的农产品的不断追求,其体现在商品经济社会即是消费结构的变化和升级,而消费结构又是对现实的人的需求的最直接体现,由此可以看出,我国农产品的供给与需求出现割裂,农业供给侧结构性改革应运而生。此次改革的目的表面来看是改革农业生产现状以此适应需求结构的变化,实际上,是通过对影响农业生产力
氧化锆作为一种具有高硬度,高强度,高韧性,高耐磨性和高耐化学腐蚀性等物理和化学性能的材料,在陶瓷方面有非常大的应用与研究潜力。氧化锆(ZrO_2)存在三种结构多态性:单斜相(m)、四方相(t)和立方向(c)。随着温度的升高或加入适当的掺杂剂,可以发生从单斜向四方再向立方的相变。在室温条件下,可以用多种不同的掺杂价来稳定ZrO_2的高温四方相或立方相。三种氧化锆多晶型与不同的掺杂剂共同作用,形成了具