融合双注意力与多标签的图像中文描述生成方法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:maybeen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像描述是目前图像理解领域的研究热点.针对图像中文描述句子质量不高的问题,本文提出融合双注意力与多标签的图像中文描述生成方法.本文方法首先提取输入图像的视觉特征与多标签文本,然后利用多标签文本增强解码器的隐藏状态与视觉特征的关联度,根据解码器的隐藏状态对视觉特征分配注意力权重,并将加权后的视觉特征解码为词语,最后将词语按时序输出得到中文描述句子.在图像中文描述数据集Flickr8k-CN、COCOCN上的实验表明,本文提出的模型有效地提升了描述句子质量.
其他文献
伴随人工智能等相关技术的进步,智能机器人技术得到极大提高.其软件上的日渐成熟和硬件设施的不断完善对研究和开发机器人操作系统和体系结构提出新的需求.本文针对目前广泛使用的传统机器人操作系统ROS进行介绍和分析,并对比研究了新型机器人操作系统ROCOS在系统架构方面对传统ROS的改进和优化,详细介绍了两者的组织框架,并通过仿真实验实际测试了两者框架的合理性与使用效果,对后续新型机器人操作系统的研发具有借鉴意义.
RFID盘点定位系统在高校的应用生态不容乐观,找书难的问题依然存在,系统亟需改造重构.基于我校RFID盘点定位系统,结合流通排架实操规程,采用Python、Django框架和Oracle数据库开发系统后台管理模块,对该系统的定位数据采集、数据库结构、定位计算方法进行改造.此方法在实际应用中取得了良好的效果,改进后的RFID定位系统易于管理维护,有效地解决了找书难的问题.
配网单线图是一种电气接线图,其利用规定的图形符号和设备连线对配电网进行可视化,能显著提高配网管理的效率.针对配网单线图自动生成实际需要,本文提供了一种基于主干线/分支线模型的配网单线图自动生成方法.方法首先进行了主干线分支线的创建和分支布局方向的计算;然后进行了分支初始布局和局部拉伸;最后进行了分支局部收缩和自动布线.经过验证,基于主干线分支线模型的配网单线图自动生成方法,能自动生成满足准确性、美观性等要求的单线图.
针对基于规则的可解释性模型可能出现的规则无法反映模型真实决策情况的问题,提出了一种融合机器学习和知识推理两种途径的可解释性框架.框架演进目标特征结果和推理结果,在二者相同且都较为可靠的情况下实现可解释性.目标特征结果通过机器学习模型直接得到,推理结果通过子特征分类结果结合规则进行知识推理得到,两个结果是否可靠通过计算可信度来判断.使用面向液基细胞学检查图像的融合学习与推理的某类宫颈癌细胞识别案例对框架进行验证,实验表明,该框架能够赋予模型的真实决策结果以可解释性,并在迭代过程中提升了分类精度.这帮助人们理
目的:建立放射治疗直线加速器质量保证(Quality Assurance,QA)标准化体系和数字化分析系统是提升放疗水平和质量的有效途径.方法:基于Pylinac函数库,采用Django框架和MySQL数据库结构搭建QA数字化分析系统,并通过临床测试来评价该系统的稳定性与实用性.结果:放射治疗QA数字化分析系统不仅有利于监控及回顾分析直线加速器的运行状况,而且有效减少医用直线加速器QA流程中计算分析的时间,同时该系统还有助于放疗科新入职物理师快速熟悉QA流程.结论:QA数字化分析系统在简化QA工作流程,提
深度学习全流程托管平台提供了深度学习实验任务的网页端解决方案,加速了深度学习技术在生产生活中的应用.为了解决网页端深度学习平台进行图像识别模型训练的问题,本文设计实现了面向深度学习实验任务的分布式任务执行系统.系统由资源监控、任务调度、任务执行、日志管理4大模块组成,将任务依据资源使用率等策略进行调度,采用Docker容器技术进行执行,并对产生的日志信息进行了实时收集.经过测试,分布式任务执行系统不仅保证了正常的功能需求,在可靠性、稳定性等指标上也都达到了预期的要求,将其集成到平台中可减少20%左右的训练
螺纹钢是土建工程中必不可少的建筑材料,在轧制过程中因受轧辊磨损、钢坯质量等因素影响,导致表面缺陷,如不能及时发现就会生产出大量废品,严重影响企业经济效益.本文提出一种基于深度学习的螺纹钢缺陷检测方法,通过生产现场工业相机采集螺纹钢图像,对表面缺陷进行分类标记,建立样本数据集,利用深度卷积对抗生成网络DCGAN对数据集增强.采用Faster RCNN构建螺纹钢缺陷检测模型,利用迁移学习方法实现小样本
睡眠质量是影响人体健康的因素之一,而一个高度合适的枕头能够有效地改善睡眠质量.大量研究表明,人在侧躺时所需的枕头高度应大于平躺时所需的枕头高度.本文提出了一种基于深度学习的自适应睡枕设计方案,可以识别人的睡姿,调节枕头高度,并给出了硬件平台设计、网络模型搭建和移植.由枕头内部的压力传感器和气压传感器,分别采集头部对枕头的压力和枕头气囊内的气压,生成时间序列数据帧,再通过一维卷积网络(1DCNN)和门控循环单元网络(GRU)结合的网络模型对睡姿进行识别分类,最后根据不同的分类结果调节枕头高度.
由于皮肤黑色素癌图像存在类内差异大、样本数据集小等特点,采用深度残差网络可以有效解决训练过程中过拟合问题,提高识别准确率.但是深度残差网络模型的训练参数多,时间复杂度高.为了提高训练效率,提高识别准确率,首先从理论上分析了深度残差网络模型的结构,通过修改网络结构,利用Inception结构代替残差网络中的卷积层、池化层,减少模型的训练参数数量,降低时间复杂度.在此基础上,提出了基于Inceptio
为建设更美好的市容市貌,降低运输车辆的空车率,实现源头追溯与全流程透明化管理,结合目前通用的软件开发方式与数据库技术,给出了以智能化,绿色为主的城市垃圾清运系统.该系统以北斗定位数据为基础,辅助以高德开放平台来进行设计开发.系统的开发采用基于PHP语言的ThinkPHP框架以及B/S架构设计模式,客户端采用Ajax和Web技术等方式实现数据的传输和展现.该系统旨在为用户提供车辆实时位置查询、车辆历