端到端实体指代消解及相关技术研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:king_caspe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
指代消解是自然语言处理领域的一项关键任务,准确无歧义的指代消解能促进对篇章语义的整体理解,对于信息抽取、自动摘要、问答系统以及机器翻译等自然语言应用有着极为重要的基础支撑作用。近年来,随着深度学习的兴起和发展,越来越多的学者和研究人员开始使用深度学习进行指代消解。深度学习模型由于其强大的拟合能力,相对于传统机器学习模型有着巨大优势。但现阶段用于指代消解的深度学习模型大多只关注文本的线性表征,而大量的研究表明结构信息对指代消解任务来说至关重要。因此,本文从结构信息的角度对中英文实体指代消解展开了以下研究:(1)先进神经网络模型的构建。本文对目前在实体指代消解任务上表现最好的神经网络进行了重新构建,对其中的耗时操作进行了改进。在使用相同设置的情况下,改进后的模型相比于原模型在训练时间与资源利用率上更具优势。在该模型的基础上,提出了以下两种结构嵌入方式。(2)提出基于压缩成分句法树的结构嵌入方式。针对原始成分句法树结点众多、结构复杂,会存在大量与实体指代消解任务无关的冗余信息的问题,提出了一种针对成分句法树的压缩算法。该方法大大减少了原始句法树中冗余结点的数量,精简了树的结构。以深度与左右兄弟数特征分别从纵向与横向表征结点的结构信息,在CoNLL 2012指代消解评测语料上验证了该结构嵌入的有效性。(3)提出基于结点表示法的结构嵌入方式。该方法使用结点序列对结构进行建模,并通过“特征补充”与“结点更新”机制完善序列表征。避免了现有模型由于自底向上递归编码成分句法树而导致的无法批量计算、效率低下的问题。另外,本文还借助结点枚举来替代原有的短语抽取策略。CoNLL 2012评测语料上的多组实验均验证了上述方法或策略的有效性。
其他文献
针对矿井定位系统中邻近节点间同时测距时产生信号干扰和冲突,造成定位精度下降和节点能量浪费的问题,提出一种按需测距调度算法。采用移动节点主动提出定位请求、锚节点动态
【摘要】在人类语言的学习过程中,地方方言是最早习得的语言,它对于其他语言的学习有着十分深刻的影响,如果母语的语言规则不符合所学习的别的语言习惯,就会对外语产生十分消极的负迁移现象。本文着重论述四川方言对英语语音学习的负迁移现象,以及针对这种现象所进行的应对策略。  【关键词】四川方言 英语语音学习 负迁移现象 应对策略  【基金项目】名称《四川方言对川语学生英语语音学习的影响及语音教学策略——基于
试论中学生德育应遵循的五个原则谷爱卿做好中学生的德育工作,必须采取多种手段、借助多种方法、综合诸多因素,形成校内外的良好的“气候”和德育氛围,才能收到较好的效果。根据
从建章建制,将档案纳入合同管理,提高档案人员的业务能力,强化档案形成过程控制等方面进行了归纳总结,供同仁们交流学习。
本文以无散的Hansen矢量波函数和算子谱理论为基础,导出了矩形地和腔体的电并矢格林函数的完备本征函数展开式,这些展开式与采用其他方法得到的结果相同,此法提供了推导正交坐标系下电
每门学科都有它特有的技能和技巧以及与学?科性质相适应的练习方法。在中学物理教学中,学生技能和技巧的培养主要在于加强实验和解题的训练。当然习题在物理教学中的意义还不仅
本文报道一种不用催化剂采用微波-碳还原法处理二氧化硫(SO2)的新方法。讨论了气体流量、反应器温度、微波功率和施加微波时间对二氧化硫和活性炭发生还原反应的影响。比较了连
针对传统PTS方法计算复杂度高的缺点,提出一种低计算复杂度PTS(LCC-PTS)方法。将2n点信号的快速傅里叶逆变换(IFFT)分成2个部分,输入信号序列通过前l个IFFT产生中间信号序列,
加强图书室建设更好服务于教学王福莲中学图书室的建设工作是中学常规建设的一个重要组成方面。不断加强图书室的建设与管理,为师生的教学活动服务,有利于提高教学质蛋和丰富师
本论文针对聚合物微结构压印成型技术研究尚不完善和模具制造困难、成本高昂等关键问题,采用超声压印方法在PET薄膜上进行微结构的复制成型方面的研究。所得研究结果初步探索