复杂场景图像合成算法研究

来源 :江西理工大学 | 被引量 : 0次 | 上传用户:ly2mm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算能力的提升,计算机视觉相关技术发展迅速。图像合成技术作为重要其中一个重要分支,同样发展迅速。本文深入研究了图像合成相关技术,介绍传统模型和基于深度学习的图像合成模型实现原理,并总结归纳各自的优势和不足。同时以复杂场景图像生成为主要研究对象,介绍了基于不同条件的图像合成方法实现,以及它们在各自领域的应用和已经取得的成果,并重点介绍了它们在实现包含多个前景对象的复杂场景图像生成任务上的优势和不足。以此为基础,提出了两种适用于复杂场景图像生成的创新模型,改进了原有方法的部分局限性,有效地提升了图像生成质量。主要研究内容如下:提出一种基于图注意力网络的场景图到图像的生成模型,解决包含多个对象的复杂场景图像的合成问题,以及复杂场景图中多个对象之间信息传播问题。整个模型基于生成对抗网络实现,通过7种方位信息构建前景对象的场景图,然后利用图注意力网络实现前景对象之间的信息传播,保证生成图像的空间结构信息。同时利用深度网络预测每一个对象的场景布局,包括对象的形状以及在图像中的边界框,并通过这些对象场景布局合并成一个粗糙的图像场景布局,用于表达最终合成图像整体结构。最终利用级联细化网络,将图像场景布局转化为合成图像。为了确保生成图像和真实图像在语义上更加相似,本文方法同时采用特征匹配的方式计算损失函数。提出一种基于文本描述和空间布局的合成图像的算法,结合了基于文本描述和基于空间布局两种图像合成模型的优势,同时将文本描述和空间布局作为输入条件来生成图像。这样做的原因在于,基于文本描述的图像合成方法无法区分实例对象以及它们之间的关系,而基于空间布局的图像合成方法以对象标签作为预测实例对象的初始输入,输入关键信息不足导致生成对象细粒度不高。而同时利用文本信息和对象标签信息来对空间布局进行填充,即能保证生成图像具有和输入一致的空间结构,同时保证生成实例对象具有丰富的结构信息和更高的细粒度。并且文本模型还可以利用潜在编码来控制全局图像和实例对象的风格生成,保证了生成图像的多样性。通过相关实验证明,证明了本文方法的可行性,并且和基线模型对比取得了更好生成效果。
其他文献
复杂网络的社区是一个内部关联紧密但外部关联稀疏的节点聚类,属于网络的子图。网络的社区构造帮助我们在中观层面上描述复杂网络,分析局部和整体的关系,揭示网络的关联信息和内在属性。因此,社区发现算法的研究,对于深入理解和掌握复杂网络的基本特征具有重要意义。科研人员常运用智能优化算法理论来解决复杂网络的社区发现问题。但是,这类算法种类庞杂、标准不一,而且均需要预先设定参数来控制社区划分的侧重,无法做到自动
我国目前已是世界最大的铜材生产国,但仍不是铜材生产强国,低端产能相对过剩,而高、精、尖等高端铜材产品部分仍依赖进口,难以满足我国各行业对高端铜材的需求。此外,我国数量众多的中小型铜加工企业的产品质量水平及成品率普遍较低,这也是制约我国铜加工行业发展的突出问题,而究其原因,铜加工企业产品质量问题主要是由生产工艺技术上管理粗放造成的。近年来,为实现提质增效的目标,在国家及地方政府的政策鼓励下,国内铜加
糖尿病视网膜病变、心血管疾病、高血压、动脉硬化等多种疾病对视网膜血管产生不同影响,可通过分析视网膜眼底图像中血管的长度、宽度、角度、弯曲度和分支形式等特征来诊断。人工分割视网膜血管是一项繁琐、复杂和专业性极强的工作,且分割标准主观性强。为提高医生的诊断效率和降低误诊率,需借助计算机辅助诊断系统,其核心是设计先进的分割算法,以实现快速自动化视网膜血管分割。于是,本文分别提出了两种分割算法:基于多尺度
随着新兴技术的不断涌现和持续应用,中国制造业在过去十年间发生了翻天覆地的变化,在不断适应多变的社会需求和激烈的市场竞争的过程中,制造型企业慢慢从以量取胜向着以质取胜发展。质量意识的不断提升,使得越来越多的制造型企业开始注重生产的规范化与标准化,标准作业指导书由此受到越来越多的关注。然而,标准作业指导书在规范作业程序的同时,自身的制作流程却没有实现标准化作业,这是因为许多企业重点着力于生产线的优化改
目的研究行电子输尿管软镜下钬激光碎石术治疗的肾结石患者开展手术室人性化护理干预的效果。方法选取玉山县人民医院2019年8月—2020年1月期间收治的肾结石患者56例为研究对象,均接受电子输尿管软镜下钬激光碎石术治疗,采用双盲随机法分为研究组(28例)及对照组(28例)。对照组行手术室常规护理,研究组患者在此基础上接受手术室人性化护理干预,对2组患者术后恢复情况进行比较分析。结果研究组患者术后离床及
随着GNSS等新技术的发展,大坝变形监测已经实现全天候实时动态化,传统的大坝变形预测方法不能很好地对海量的监测数据进行处理。深度学习是在神经网络的基础上对网络层数加深的优化算法,目前已经在风电、空气质量、灾害预警等领域广泛应用。相对于传统的机器学习算法,深度学习强调从海量数据中进行学习,能够解决大坝变形数据中存在的高维、冗杂以及高噪等传统机器学习算法难以处理的问题。因此,非常有必要开展基于深度学习
随着互联网技术的发展,信息技术时代逐渐过渡到数据技术时代,数据在人们的生活中充当着越来越重要的角色。面对无所不在的数据,如何从当中获取到所需的信息变得十分困难了,这就是所谓的“信息超载”问题。传统的推荐系统在一定程度上缓解了这个问题,通过分析用户的历史行为,从海量的数据中分析出用户的偏好,并把具有用户偏好的物品推荐给用户。然而在实际应用中存在数据稀疏、冷启动等问题,它会导致推荐系统准确率低、推荐单
近年来,人工智能已成为了人们生活密不可分的一部分。随着科技的不断发展与进步,计算性能的不断提高,深度学习的发展更是迅速,而生成对抗网络作为深度学习的重要组成部分,在计算机视觉领域取得了众多成就。同时,在物质生活得到满足的当今社会,越来越多的人对动漫领域产生浓厚的兴趣,而生成对抗网络在动漫领域的应用也得到了更多人的关注,如人物图像的动漫风格迁移以及动漫头像的生成等。但是在动漫头像生成方面,仍然存在两
杨梅是浙江省重要的农果经济作物,稳居果树产值第一。然而由于杨梅树大多种植在山地丘陵地区且种植分散,致使果树种植与管理耗费大量的人力物力,因此采取自动化的方法提取杨梅树株数,实现大规模、分散果园的高效管理。但是使用卫星遥感图像提取果树往往面临方法流程繁琐、人力成本高、耗时长等问题。随着计算机软硬件的发展,基于深度神经网络的目标识别方法逐渐应用于农业、交通、医疗等行业。本文提出应用深度神经网络YOLO
目标检测是计算机视觉领域的重要研究方向之一,广泛应用于工业生产中。在检测任务中,对于一张输入图片,检测算法通过学习来区分图片的前景和背景,然后从背景中分离出感兴趣的目标物体,进而判断物体所在的具体位置和所属类别。然而由于小物体面积小分辨率低,使得对于小目标的检测精度不能达到理想的效果。针对小目标检测的问题,本文基于SSD(Single Shot Multi Box Detector)模型做出改进,