【摘 要】
:
指代消解作为自然语言处理的一个基础任务,目的是连接同一句子中在现实世界里有着同样意思的不同实体。指代消解是许多高级别自然语言任务如文本摘要,阅读理解,聊天机器人等的重要一步。在针对英文专利文本的抽取式摘要的任务中发现抽取到的关键句里只含有指代词的描述,而具体指代的实体出现在非关键句中,这给摘要读者带来不好的阅读体验,因此本文针对专利文本进行指代消解研究。
本研究经过查阅大量文献,没有发现专利文本领域的指代消解公开数据集,因此本研究针对专利文本中出现的高频指代现象进行了统计分析和人工检查,最后确定
论文部分内容阅读
指代消解作为自然语言处理的一个基础任务,目的是连接同一句子中在现实世界里有着同样意思的不同实体。指代消解是许多高级别自然语言任务如文本摘要,阅读理解,聊天机器人等的重要一步。在针对英文专利文本的抽取式摘要的任务中发现抽取到的关键句里只含有指代词的描述,而具体指代的实体出现在非关键句中,这给摘要读者带来不好的阅读体验,因此本文针对专利文本进行指代消解研究。
本研究经过查阅大量文献,没有发现专利文本领域的指代消解公开数据集,因此本研究针对专利文本中出现的高频指代现象进行了统计分析和人工检查,最后确定标注目标为指示代词短语和它们的指代实体,并最终构建了一个新的数据集Coref-Patent。传统的指代消解公开数据集例如CoNLL-2012中的标注实体往往是短语或者词级别,而句子级别的标注实体完全没有出现过。但是在本文构建的数据集Coref-Patent中出现大量句子级别的标注实体,这给指代消解的研究领域带来了极大的创新和挑战。
本文针对不同的指代消解模型进行了讨论,最后确定本文的基线模型使用跨度模型[36]。为了在工程环境使用和部署,本研究使用Tensorflow框架复现了该模型,并优化代码结构,打包容器镜像完成部署。线上部署模型发现:如果通过使用修改参数“最大跨度长度”的方法来匹配句子级别标注实体,会对模型输入更多的噪声跨度,模型召回率和精度会明显下降,并且计算量指数上升,需要消耗更多的GPU算力。本研究重新构建模型的输入流程并改变模型网络静态图,针对性的将句子进行处理。本文改进的句子级别跨度模型在Coref-Patent数据集上对比基线模型召回率有明显提高,最终F1分数提高6%,该模型目前已经部署在线上环境使用。
其他文献
【摘要】高中数学教育及核心素养的培养对学生今后的发展和成长具有很大的推动作用,因此本文首先对素养的内涵及数学核心素养的内容进行分析,让读者充分理解这二者所表现的具体含义,进而对高中数学核心素养所具备的主要特征进行分析,从而对高中数学的教育價值的重要性进行总结,充分体现高中教育教学对学生所具有的重要作用,为以后在教学过程当中的培养方式提起良好的警钟。 【关键词】高中数学教育教学教育价值核心素养
21世纪的竞争在于人才的竞争,而人才的竞争在于教育。江泽民同志指出:“创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。”创新教育是素质教育的核心,重视培养学生的创新意识,开发学生的创新潜能,不仅关系到教学的质量,而且关系到21世纪人才的培养。数学被称为“思维的体操”,最适合培养学生的创新意识和能力。如何在小学数学教学中挖掘创新意识、培养学生的创新能力,就成为数学教改的重要课题。综合本人的数
近年来,随着基础教育从“应试教育”向素質教育的转换,在教学中如何唤起学生的学习兴趣,把学生的注意力完全吸引到课堂中来,使学生的思维在有限的时间里达到最佳水平,让学生在快乐中学习,让学生在有限的的时间里达到最佳的学习效果,已成为现在的教师队伍正在思考的一个热点问题。下面就初中化学教学中如何做到让学生在快乐中学习谈几点自己的看法: 一、让学生体验化学实验本身的快乐,进而在快乐中学习。 我们都知道化
【摘要】小学教育是基础教育的起始阶段,更是进行良好行为习惯培养的关键时期。习惯的好坏,不但影响孩子的生活、性格、行为等,还直接关系到学习成功与否,甚至会影响孩子的将来。就此,作为一名低年级班主任,我着意把班级工作的重点落实在培养学生良好的行为习惯上,取得明显收效。 【关键词】学生幸福人生夯实基础 1、常竞赛,培养学生良好习惯的发端。 小学阶段学生由于年龄小,自控能力差,纪律涣散。对此我一开始
【摘要】针对我国高职院校的校企合作存在的诸多问题,提出了在职业院校中采用引领式教育的方案,引领式教育可以改变职业院校在校企合作中比较被动的局面,使职业教育培养的人才可以更好的面向甚至引领社会需求,最终实现职业院校与企业的“共赢”。 【关键词】高职院校校企合作引领式教育 1高职院校实行校企合作的必要性[1,2] 校企合作是一种利用学校、企业的各自优势,以市场和社会的人才需求为导向,培养应用型人
【摘要】高中数学是高中教学阶段中非常重要的学科之一,同时也是难度较大的学科之一。在新课改的推行下,高中数学经历了一系列的改革和完善,而这些改革也大大的提升的数学的教学质量,但是在提升学生的创造性思维方面仍然存在较多的欠缺。而学生的创造性思维不仅是学生学好数学的基础,同时也是现代社会对人才的需求基础,所以在高中数学教学中培养学生创造性思维显得尤为重要。本文主要对高中数学教学中培养学生的创造性思维策略
【摘要】本文拟在分析其核心概念“心理接受机制”的基础上,结合对高职院校思想政治教育心理机制研究现状的分析,探讨相关的优化措施。在具体优化措施的探讨过程中,根据高职院校思想政治的具体教学过程,从教学研究层面、教学实践层面和教学评价层面上对相关问题进行逐一阐释和说明。 【关键词】心理接受机制高职院校思想政治教育 研究新时期高职院校思想政治教育心理接受机制的优化措施及其相关问题,不仅是各高职院校进行
【摘要】宿舍是最能展现学生思想素质和交际能力的重要场所,是中职学校育人不可或缺的重要阵地。学生宿舍环境的好坏对学生的身心健康、良好人格的形成及其正确世界观、人生观和价值观的形成具有重要的意义。所以,职校学生宿舍的管理至关重要。 【关键词】人性化管理转变观念 职业教育不断发展壮大的今天,生源的多样化、复杂化,以及各种因数的影响,使学生管理工作越来越有难度。中职学生思想教育和管理是当前职业学校教育
The aim of this study is to assess and compare two clustering algorithms, namely, the Wave-cluster and Density Based Spatial Clustering of Application with Noise (DBSCAN) algorithms, for landslide susceptibility assessment in Baota District, China. Based
随着大数据与人工智能的发展,数据已成为当今最宝贵的资源之一。然而数据存在一定的获取成本,数据缺失问题更是各行各业公认的痛点。因此,数据的缺失值填补已经成为业界一个热门的研究方向。而矩阵填补作为该方向的一个具体应用,在机器学习,尤其是推荐系统领域,具有非常重要的意义。矩阵分解是目前处理矩阵恢复的一个经典的流行方法,但传统方法大部分都基于浅层的线性模型,这意味着如果数据集中存在复杂的非线性因素,往往不能奏效。而深度矩阵分解作为深度学习在该问题上的一次有效的尝试,该类方法在公共数据集上取得了优于传统矩阵分解算法