基于深度增强学习的图像语句描述生成研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:fedsfdfasfdas
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语句层次描述自动生成技术是结合计算机视觉和自然语言处理两个领域的前沿研究课题,是当前人工智能领域的研究热点之一。自动生成图像语句层次文本描述需要在识别图像中物体及物体关系的基础上,利用自然语言模型自动生成句子层次的文本描述,相较于图像中对象分类与识别目的在于使用单个的离散语义描述或索引图像的局部区域或整体抽象语义,自动生成语句层次的文本描述一副图像面临着更大的技术挑战。针对目前主流方法中语言模型概率采用最大似然估计法(Maximum Likelihood Estimate,MLE)导致训练阶段损失函数和评估指标不统一,同时测试阶段易导致错误传递的问题,本文提出了一种基于深度增强学习的图像描述语句生成模型。该模型利用策略梯度方法根据评价指标优化训练阶段的目标函数,采用基于平均回报值的蒙特卡罗学习算法评估状态的回报值,通过随机梯度下降法更新网络参数,达到训练和测试阶段统一采用评价指标进行生成语句的目的,自主指导生成高回报值的图像描述语句。在上述方法基础上,融入了图像语义特征的先验信息,论文设计构建了三种不同融合方式的模型,将图像语义特征和底层视觉特征两者进行有效融合,协同生成图像的描述语句,提高生成语句的语义丰富程度,进一步提升模型性能。论文通过公开数据集验证了所提出的模型和相关算法。实验结果表明,论文所提出的方法在句子连贯性和准确率及语义丰富程度指标上均超过了以最大似然估计为目标函数训练的模型。此外,通过融合图像语义特征,模型具有高层语义信息,进一步提升了图像描述语句生成的准确率。
其他文献
<正>一、政府与市场:人类的社会实践与理论探索"放任"与"统制",构成政府与市场关系完整谱系的两极。从斯密"守夜人"式小政府,到"从摇篮到坟墓"无所不包的"父爱主义"大政府,人
本文以实际工作案例,介绍了通过培养标准化意识、制修订服务标准、建立标准体系、建立试点单位等标准化方法的运用,在促进健康体检服务业发展方面起到的积极作用。 In this
杀婴是电影《魔法圣婴》和电视剧《天龙八部》共有情节,但二者在创作目的、对待宗教的态度和揭批人性上有着较大的不同。《魔法圣婴》是借教会利用一婴儿(圣婴)躯体甚至血液牟
由于降水的不确定性和随机性,其预测精度往往难以提高。鉴于此对常用的降水量预测模型马尔科夫链进行了加权和模糊等数学方法的改进,并以晋祠泉域1956—2013年的降水资料为基
在社会主义市场经济条件下,如何评价企业的财务状况、经济效益?运用哪些指标?侧重哪些方面?财政部颁布的《财政部企业经济效益评价指标体系》开创了社会主义市场经济条件下国
4月24日外滩地王案一审裁定,其结果再度引发公众对复星集团的关注。$$ 在股票市场投资中,许多投资者希望学会股神巴菲特的投资策略或理念,但实践过程中,却很难。研究公司运作
报纸
随着网络信息技术和计算机技术的发展,我国众多的企业开始进行信息化建设,以提高企业运营管理的质量和水平。基于此,本文主要对我国企业在信息化建设中存在的网络安全管理问
为了弥补主观性评价方法的不足,以获得用户对于汽车造型设计的客观性评价,提出了一种基于眼动跟踪特征的汽车造型评价方法。以眼动热点图为基础构建车型评价指标体系,包括对
园林植物养护是有关园林绿化建设至关重要的环节,也是技术性相当强的环节。因此,在园林植物养护的过程中容易出现问题,不仅有技术层面的,也有管理层面的。基于此,针对我国园
中国作为拥有几千年历史的文明古国,历史上在各个方面对周边国家和地区都产生过重大影响。从语言角度讲,古代汉语对周边国家和地区的语言系统也产生过或多或少的影响。汉语的三