基于深度学习的图像描述自动生成的研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:yap1711
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网存储水平的提高和智能设备的普及,越来越多的人们习惯用拍照来记录自己的生活,每天都会有大量的图像通过智能手机,PC机等智能设备产生并在互联网上共享,图像数据出现了爆炸式的增长。计算机理解图像,对图像进行标注,可以方便管理平台对图片进行分类,也可帮助用户快速准确地检索图像,对有效地整合网络上庞大的图片资源有着重要的意义。传统的图像理解关注的是较为低层次的视觉特征,如色彩特征、纹理特征以及形状特征等。近年来,随着计算机运算能力的重大飞跃,深度学习得到了快速发展,网络上结合视觉信息与自然语言的数据也为深度神经网络学习提供了数据需求,基于深度学习实现图像描述自动生成成为了计算机图像理解的前沿和热点。本文对基于深度学习的图像描述自动生成进行了深入研究,设计了端到端的图像描述生成模型。基于深度卷积神经网络提取图像语义特征,分别用深度可分离卷积神经网络和标准卷积神经网络提取图像特征,用特征金字塔网络进行特征融合,用长短期记忆神经网络将语义特征转换为自然语言,设计并构建了端到端的图像描述自动生成模型(Feature pyramid networks-Neural Image Caption,F-NIC)。公开数据集上的测试结果表明,特征融合提升了模型的表达能力。在此基础上,引入注意力机制(Attention)改善图像特征,基于强化学习(Reinforcement learning)设计新的损失函数,形成了改进后的模型FAR-NIC。在嵌入式系统上搭建平台,实现了FAR-NIC嵌入式系统。公开数据集的评估结果可以看出,FAR-NIC系统的BLEU,ROUGE和CIDEr评分有了很大的提升,评估结果优于对比模型Soft-Attention、Hard-Attention、SCA-CNN和SCST,图像描述更加细致准确。
其他文献
水资源问题是当今影响社会、经济、安全等方面的重要因素之一,通过构建水文监测系统、水文测站等对一些水域进行水情监测,包括水位、流量、水质等水文要素。在水文测站多采用
目前,由于化石能源日益枯竭,可再生能源发电系统的研究和开发已经成为当务之急。其中,将可再生能源转化为电能注入电网是一种重要而有效的方式。并网逆变器是可再生能源并网
生物质材料作为可再生资源中的唯一碳源,同样也是碳质材料的重要前驱体,近几年来,以生物质材料为原料开发可控的高性能碳质材料已成为研究热点。自然界中的天然物质通常具有
目的探讨阻塞性睡眠呼吸暂停低通气(OSA)合并肥胖低通气(OHS)患者临床特征。方法对我院睡眠检查室2018年1月至2019年12月多导睡眠图确诊OSA患者,体重指数(BMI)>30kg/m2,完善
众所周知,控制系统总是会不可避免的受到外部干扰的影响,而这将会影响系统的稳定性和控制精度,因此考虑系统在受到外部干扰时的稳定性尤其重要。故本文结合了backstepping技
高度智能化、操作简便的数字图像处理软件在给人们日常生活带来巨大便利的同时也引发了一系列潜存的信息安全问题,急需一套可靠的数字图像取证方法来维护社会秩序和公平性。
随着科学技术的快速发展,机器人在人们日常生活中的作用逐步提高。作为移动机器人完成各种任务的关键前提,对机器人定位的精度的需求也越来越高。在现有的导航系统中,虽然以
列车定位系统的自主性、精确度以及实时性,对于保证列车安全运行具有重要意义。普遍使用的列车定位方法包括卫星定位,里程计,应答器等,但这些常用方法存在信号丢失或误差累积
近年来,城市固体废弃物填埋处理现象增多,要想防止垃圾渗滤液污染土体和地下水,防渗工作是关键。膨润土防渗毯(Geosynthetic Clay Liner)因其重量轻、厚度小、施工简便、自愈
静液传动技术(Hydrostatic Transmission,HST)因其所具有的高功率密度、能够实现无极调速等技术特点,近年来在军事车辆、公共交通及工程机械等领域得到了广泛的应用。本文针