图像标题生成中的人物类名实体填充方法研究

来源 :中文信息学报 | 被引量 : 2次 | 上传用户:libolb666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于深度学习的发展和大规模图像标注数据集的出现,图像标题生成作为一种结合了计算机视觉和自然语言处理的综合任务得到了广泛关注。受到神经机器翻译任务的启发,前人将图像标题生成任务看作是一种特殊的翻译任务,即将一张图像视作源端的信息表述,通过编码解码过程,翻译为目标端的自然语言语句。因此,现有研究引入了端到端的神经网络模型,并取得了较好的生成效果。然而,图像标题生成研究依然面临许多挑战,其中最值得关注的难点之一是解决确切性文字表述的问题。一条确切的标题往往是有形且具体的表述,例如"梅西主罚点球",而目前
其他文献
采用无放射性的直接式科氏力传感器,计算机和无线通信技术,实现固井水泥浆和钻井泥浆密度、流量和压力在线高精度地自动测量,克服了以往人工称量,放射性密度计,涡轮流量计、电磁流
论述了数据库复制技术的基本概念,重点介绍了Sybase数据复制的结构和实现方法,并结合实例说明复制技术在分布式环境下的应用。
传统中文事件检测方法采用人工定义的特征表示候选触发词,耗时耗力。基于神经网络的特征学习方法在中英文事件检测任务中得到了验证。现有的基于神经网络的中文事件检测方法
介绍了一个新的材料韧性断裂特征参数VGC及相应的临界的断裂判据。根据初步拟定的测试方案。对WH530高韧性压力容器钢和7475铝合金两种材料的VGC进行了测试,测试结果表明,按照这种方法,不同测试
有效的教学是教育工作者的必然追求和永恒的主题.课堂教学的有效与否直接关系着教学质量的高低,而课堂提问则是实现教学目标的最有效的教学方法之一.有效的课堂提问因此成为
对一类石油化工生产过程中的Winer模型辨识问题,提出了一种稳态与动态相的集成辨识方法,利用稳态信息获得稳态模型的强一致性估计估计,通过神经逼近得到非线性增益的逆函数。
音乐的独特魅力给人们的生活、工作学习产生了非常深刻的影响,作为我国基础教育学科中不能缺少的一个基础学科,传统的初中音乐教育,过度的对强调老师要在教学流程中作为主要
以降低原油热输管道的运行费用为目的,分析了原油加热管道在在稳态进行过程中运动费用的主要构成,以原油热输过程中的单位热力费用与单位电力费用之和即单位能耗费用作为目标幽
由于生活的环境和文化的差异,造成了藏族学生的接受能力与原有的幼师舞蹈教学之间的矛盾,产生了认知冲突,阻碍了藏族学生学习幼师舞蹈的积极性.发挥藏族学生特有的优势和基础
面子 是最不冷静的 一种东西 很多的时候 很多的人