融合胶囊网络的文本-图像生成对抗模型

来源 :计算机工程与应用 | 被引量 : 1次 | 上传用户:liandakj2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统文本-图像对抗模型的实现中,判别器中的卷积网络用于提取图像特征,但是卷积网络无法考虑到底层对象之间的空间关系,导致生成图像的质量较差,而胶囊网络是一种有效的解决方法。基于胶囊网络的方法对传统的文本条件式生成对抗网络模型进行了改进,将判别器中卷积网络换为胶囊网络,增强其对图像的鲁棒性。在Oxford-102和CUB数据集上的实验结果表明新模型可以有效提高生成质量,生成花卉图像的FID的数值降低了14.49%,生成鸟类的图像的FID的数值降低了9.64%。在Oxford-102和CUB两个数据集上
其他文献
近年来,基于全卷积网络的显著性物体检测方法较手工选取特征的方法已经取得了较大的进展,但针对复杂场景图像的检测仍存在一些问题需要解决。提出了一种新的基于全局特征引导的显著性物体检测模型,研究深层语义特征在多尺度多层次特征表达中的重要作用。以特征金字塔网络的编解码结构为基础,在自底而上的路径中,设计了全局特征生成模块(GGM),准确提取显著性物体的位置信息;构建了加强上下文联系的残差模块(RM),提取
矢量路网的二维图像表达旨在建立道路到图像的转化关系,对于道路交通流预测等实际问题具有重要研究价值。针对目前研究存在的空间拓扑关系丢失和图像分辨率不易确定等问题,提出了一种矢量路网的自适应二维图像表达方法。该方法能够自适应不同路网结构,在最大维持矢量路网拓扑关系的前提下,将道路路段一一映射到像素单元上,从而生成矢量路网的紧凑二维图像。选取国内外数百个城市不同类型的矢量路网对算法的性能进行验证,通过与
针对雾天车牌图像模糊、车牌识别率低的问题,给出了车牌图像色彩迁移与正则化约束去雾算法。算法主要包含色彩迁移去雾和文本修复两个模块。采用MKL(Monge-Kantorovitch Linear Colour Mapping)色彩迁移算法,恢复雾天车牌颜色信息实现去雾;利用车牌的文本像素的强度和梯度特征对车牌图像进行正则化约束,实现车牌中文本的修复。实验结果表明,无论针对合成车牌雾图还是自然车牌雾图
语义相似度计算旨在计算文本之间在语义层面的相似程度,是自然语言处理中一项重要的任务。针对现有的计算方法不能充分表示句子的语义特征的问题,提出基于Transformer编码器的语义特征抽取的模型TEAM,利用Transformer模型的上下文语义编码能力充分提取句子内的语义信息,对句子进行深层语义编码。此外,通过引入交互注意力机制,在编码两个句子时利用交互注意力机制提取两个句子之间关联的相似特征,使模型更擅长捕捉句子内部重要的语义信息,提高了模型对语义的理解和泛化能力。实验结果表明,该模型在英文和中文的语义
针对视频图像连续帧间的目标具有冗余性,采用手动标注方式耗时耗力的问题,提出一种融合检测和跟踪算法的视频目标半自动标注框架。利用手动标注的样本离线训练改进YOLO v3模型,并将该检测模型作为在线标注的检测器。在线标注时在初始帧手动确定目标位置和标签,在后续帧根据检测框与跟踪框的IOU(IntersectionOver-Union)值自动确定目标的位置,并利用跟踪器的响应输出判断目标消失,从而自动停
针对驾驶场景中目标检测卷积神经网络模型检测精度较低的问题,提出一种基于改进RefineDet网络结构的多尺度特征融合目标检测方法。在RefineDet网络结构中嵌入LFIP(Light-weight Featurized Image Pyramid,轻量级特征化的图像金字塔)网络,将LFIP网络生成的多尺度特征图与RefineDet中的ARM(Anchor Refinement Module,锚点
为了解决混合乐器音乐数据的成分识别与解析研究中,现有方法过度依赖数据标签,且往往基于单纯频域或物理特征,与乐器固有性质关联不明显、对复杂成分的敏感度不足的问题,提出了一种基于稀疏分解和多种乐器成分字典的稀疏特征提取方法,通过对稀疏系数向量进行深入分析,得到可以独立使用,具有高可解释性的稀疏音乐特征。实验结果证明,这种特征能够直观地反映乐器成分组成与音乐情绪的变化,在混合乐器成分分析和其他各类时变信号分析领域具有显著的应用价值。
结合国家政策背景及导向,分析工程监理及咨询行业新的业务市场;通过监理企业开展政府购买的监理巡查服务的案例分享,总结监理企业优势,提出监理开展这项工作的要点和注意事项,以期为监理企业开展政府购买的监理巡查服务提供参考.
针对实际应用中大量数据集缺乏精细位置标注的问题,提出了一种基于渐进对抗学习的弱监督目标定位算法。具体来说,针对数据集噪声造成训练困难的问题,引入自步学习对训练数据按由简到难的原则进行排序。在网络设计上,将弱监督目标定位网络设计为多标签分类网络,并提出了相应的对抗损失函数适应目标定位任务。为了解决现有方法往往只关注最具辨别力的部分,无法定位整个目标的问题,提出一种金字塔对抗擦除机制以此在最后的定位图
当前我国正处在城市发展高速时期,综合建筑不断涌现,这时可根据火灾实时信息自动调整疏散路径的智能消防疏散图应运而生。路径规划算法是智能消防疏散图的重点研究方向之一。针对智能消防疏散图需结合火场信息动态规划路径等问题,提出了一种改进双向蚁群算法。添加了双向搜索策略,提高了算法全局搜索能力;结合A*算法改进了初始信息素分布,减小了算法初期搜索盲目性;改进了信息素更新策略,提高了算法收敛速度;结合火场信息和转向惩罚系数对算法蒸发系数、启发函数和转移概率进行改进,降低了陷入局部最优风险,提高了算法搜索效率和路径平滑