基于深度学习的图像自动标注算法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:stuber
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉及多媒体技术的发展,越来越多的人选择以图像的方式来传达或表示信息,而图像在传达信息的时候比纯文本的描述更加直观生动,也更让人印象深刻。面对数以万计的图像信息,如何高效的对其进行标记分类、有效检索,成为图像检索领域一个亟需解决的问题。作为基于内容检索的核心技术,图像自动标注技术减少了人工干预,降低了人力成本,为图像检索和管理提供了极大的便利。随着深度学习的发展,人们使用卷积神经网络进行图像特征的提取,利用循环神经网络进行文本自然语言的处理,并将两者结合用来实现图像的语义标注,但是目前图像标注的效果仍然难以达到理想的程度,存在语义鸿沟现象。针对现有图像自动标注算法存在的问题,同时考虑人类能对图像进行准确而生动描述的原因,论文在斯坦福大学Neuraltalk的基础上,提出了一种融合语料信息的图像自动标注算法。该算法包含四个部分:第一部分是图像与语义对齐模型,第二部分是词向量训练模型,第三部分是语料融合模型,第四部分是Corpus-MRNN图像自动描述生成模型。算法通过词向量训练模型将语料库训练成词向量形式,并通过语料融合模型提取语料信息中与训练集关键词语义相似度高的词语对训练集进行扩充,从而达到利用人类语言知识丰富训练集,提高图像自动标注准确度,减小语义鸿沟的目的。同时为了在语料训练过程中最大化的保留词向量的语义信息,论文在word2vec现有模型的基础上提出了包含词序信息的Sequence词向量训练模型,该模型通过改变训练时数据的输入形式,最大化的保留语料库的词序信息,从而达到提高词向量性能的目的。最后,为了验证论文提出算法的有效性,论文以BLEU及METEOR作为评价标准,将融合CBOW模型训练的词向量的图像自动标注算法与Neuraltalk进行横向对比实验,同时与融合Sequence词序模型训练的词向量的图像自动标注算法进行纵向对比实验,实验结果证明,融合语料信息的图像自动标注算法能在一定程度上提高图像描述的准确度,减少语义鸿沟,具有可行性。
其他文献
随着我国社会经济水平的提高,人民群众的生活水平和生活质量也得到了很大程度的提高,对于住宅室内设计的要求也逐渐增高。人们都想要在舒适、安全、环境清新的室内生活,植物
适当优化土地利用方式,在一定程度上可作为城市排水的一个辅助条件,缓解城市暴雨积水问题。通过实验室模拟降雨,初步得出结论:在相同降雨强度的情况下,绿地相对于裸土而言具有较大
随着网络和数码设备的普及,各种媒体图像数据飞速增长,大量的可视化数据,如图像、音频、视频等随处可见,如何合理地组织和管理这些无标注的数据,给用户高效率的浏览和检索成
目的:观察不同剂量葡萄籽原花青素对大鼠局灶性脑缺血再灌注损伤的神经保护作用及其作用的不同途径.方法:实验于2004-10/2005-07在安徽医科大学神经生物实验室完成.取SD大鼠1
文章编号: 1005-2690(2018)07-0050-01 中图分类号: S532 文献标志码: B  摘 要:脱毒马铃薯以其自身的诸多优势,被人们广泛接受。马铃薯的产量和质量密切相关,在种植前,要对种子作脱毒处理,不断提高它的质量。在种植微型薯时,要综合考虑土壤状况和气候条件等因素,促进其生长。  关键词:脱毒马铃薯;微型薯;繁殖技术  1 脱毒马铃薯提高了单位面积的产量  1.1 种子感染
弓形虫是一种细胞内寄生性原虫,广泛寄生于多种哺乳动物的细胞内,造成组织、器官损伤。动物感染率可达10%~50%。人群感染呈世界范围分布,感染率从0.6%~94%不等。我国人群感染率在1.4%~28.59
介绍了荷兰饮用水的供给状况,地下水中砷的分布,饮用水中的砷,以及8个典型水文系统中砷的形成过程、水化学特征,分析了荷兰地下水中砷的活动过程,主要包括:吸附和阴离子交换、黄铁
期刊
应用症状自评量表( SCL-90)调查了 51例急性心肌梗死患者,并与 58例健康人对照.结果表明心肌梗死组的躯体化、强迫、人际关系、抑郁、焦虑、敌对、恐怖、偏执和精神病性等因
任何教学过程都需要师生之间的沟通与了解,而教师对学生的了解不应该只停留于课堂中学生所表现出的行为上。更重要的是要从这样的表象中去分析总结其产生的缘由,我们一方面要