图注意力网络的场景图到图像生成模型

来源 :中国图象图形学报 | 被引量 : 5次 | 上传用户:zhangyanmin2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的目前文本到图像的生成模型仅在具有单个对象的图像数据集上表现良好,当一幅图像涉及多个对象和关系时,生成的图像就会变得混乱。已有的解决方案是将文本描述转换为更能表示图像中场景关系的场景图结构,然后利用场景图生成图像,但是现有的场景图到图像的生成模型最终生成的图像不够清晰,对象细节不足。为此,提出一种基于图注意力网络的场景图到图像的生成模型,生成更高质量的图像。方法模型由提取场景图特征的图注意力网络、合成场景布局的对象布局网络、将场景布局转换为生成图像的级联细化网络以及提高生成图像质量的鉴别器网络组成
其他文献
法学教学方法一直是法学教育界重点关注的话题,从信息学这个新的视角进行探讨会得出一些新的见解。法学教学其实是一个法学信息传递的过程,基于法学信息具有专业性、逻辑性、私
【摘 要】在当前社会条件下做好班主任工作确实存在着不少困难,但身为班主任又不得不做且还要来做好这个工作,因为做好班主任工作是学校、社会和时代的需求。  【关键词】情操 一视同仁 为人师表 一丝不苟 自强不息 情感管理    班主任是一个班級的管理者和组织者,一个班級班风的好与坏、学风的浓与否、集体凝聚力的强与弱等都和班主任工作息息相关。可以说在班級管理中,班主任起着不可估量的作
目的细粒度图像检索是当前细粒度图像分析和视觉领域的热点问题。以鞋类图像为例,传统方法仅提取其粗粒度特征且缺少关键的语义属性,难以区分部件间的细微差异,不能有效用于细粒度检索。针对鞋类图像检索大多基于简单款式导致检索效率不高的问题,提出一种结合部件检测和语义网络的细粒度鞋类图像检索方法。方法结合标注后的鞋类图像训练集对输入的待检鞋类图像进行部件检测;基于部件检测后的鞋类图像和定义的语义属性训练语义网
在新经济时代,以网络经济为代表的信息产业得到迅猛发展,由此引发了波及全球的触网风暴。网络时代的到来,使人力资源管理出现了一些新变化和新面貌,认清网络时代人力资源管理
中国是一个发展中国家,实现全面建设小康社会的难点、重点在农村。发展农业机械化是全面建设小康社会的有效途经。实现农村小康,又是推进农业机械化的重要手段[1]。2004年6月十
资源即一切可以利用的事物,包括物质的与非物质的、有形和无形的。资源整合,就是对这一切事物进行梳理、归纳、重组,实现最佳配置,从而达到最佳效果。由于“资源”队伍的壮大
高效、科学、和谐的财务管理可以对企业的资金进行合理的筹资、投资、营运及分配,控制经营风险、提高经济收益。本文针对当前中小企业财务管理存在的问题,提出了相应的解决对
本报北京3月20日电(记者杨亮)财政部最新公布的2012年预算安排显示,2012年教育支出3781.32亿元,增长16.4%。2012年,全国财政将在统筹兼顾的基础上集中财力办几件保障和改善民生的大事,其中的“亮点”是加大教育投入力度,确保实现国家财政性教育经费支出占国内生产总值4%的目标。  ——落实促进学前教育发展的一系列政策措施,重点支持中西部地区和东部困难地区,补助150亿元。  ——安排
白细胞介素(IL)-14又称人高分子B细胞生长因子,主要由滤泡树突状细胞和活化的T细胞产生,并特异性地作用于激活后的B淋巴细胞及恶性B淋巴细胞,使之分化增殖.IL-14不仅是调节B细胞功能的重要细胞因子,其受体也是B细胞上的重要功能分子,并且与某些B细胞性肿瘤和自身免疫性疾病密切相关.IL-14-α由IL-14外显子3-10基因编码.研究表明,原发性和继发性干燥综合征患者表达高水平的IL-14-α
目的图像描述结果的准确合理性体现在模型对信息处理的两个方面,即视觉模块对特征信息提取的丰富程度和语言模块对描述复杂场景句子的处理能力。然而现有图像描述模型仅使用一个编码器对图像进行特征提取,容易造成特征信息丢失,进而无法全面理解输入图像的语义。运用RNN(recurrent neural network)或LSTM(long short-term memory)在对句子建模时容易忽略句子的基本层次