中文微观篇章主次和关系识别方法研究

来源 :苏州大学 | 被引量 : 2次 | 上传用户:glggg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着自然语言处理的研究重点逐渐从词语和句子转向篇章,侧重于理解文本整体语义的篇章分析任务正得到越来越多的关注。篇章主次识别和篇章关系识别是篇章分析中两个重要的语义理解任务,分别通过识别出篇章单元之间的语义逻辑关系和主次核性关系来帮助理解文章的语义脉络。目前,绝大多数的篇章分析研究面向英文,中文篇章分析研究还处于初级阶段。因此,本文主要针对中文篇章主次和篇章关系的识别方法展开深入研究,主要研究内容包括以下三个方面:(1)基于文本匹配方法的篇章主次识别方法针对目前大部分工作没有考虑篇章主次语言特性的问题,本文提出了一个文本匹配网络用于识别中文篇章主次。首先,通过在编码器中结合双向长短时记忆网络(Bi-LSTM)和卷积神经网络(CNN)来同时捕获全局依赖信息和局部n-gram信息;然后,通过引入三种常见的文本匹配方法,即余弦相似度、双线性模型和单层神经网络来计算单元之间的相似度和交互信息;最后,通过在篇章单元和段落之间进行语义匹配来提供额外的高层语义线索。实验结果显示本文提出模型的性能优于多个基准模型。(2)基于句子级表示的隐式篇章关系识别方法目前,神经网络方法大部分仅仅模拟了人类的单程阅读过程,而篇章关系识别依赖于对文本的深入理解。因此,本文构建了一个三层注意力网络来同时模拟人类的双向阅读和重复阅读过程。首先,通过结合自注意力模型和交互注意力模型,在文本编码阶段就考虑到论元间的语义联系;其次,利用包含外部记忆的注意力层来模拟人类的重复阅读过程,在论元对记忆的引导下生成论元的最终精炼表示。实验结果显示本文提出模型的性能超过了多个基准模型。(3)基于主题级表示的隐式篇章关系识别方法目前,大多数篇章关系识别方法依赖于论元的句子级表示,在中文上性能不佳。针对此问题,本文尝试通过引入主题信息来提供额外的高层篇章线索,提出了一个基于门控卷积网络和简化神经主题模型的隐式篇章关系识别模型。首先,通过门控卷积网络编码器学习论元的句子级表示;其次,通过无监督学习同步训练一个简化神经主题模型来推理论元的潜在主题分布,并将其作为论元的主题级表示;最后,通过因子张量网络来捕获论元在句子层面和主题层面的交互,并且通过张量分解操作降低模型的计算复杂度。实验结果显示本文提出模型的性能超过了多个基准模型。本文针对中文微观篇章主次和篇章关系识别问题,提出了有效的解决方法,取得了良好的性能,将为中文微观篇章分析的进一步研究提供借鉴。
其他文献
我国铝土矿资源主要以一水硬铝石为主,其特点为高硅、高铝、低铝硅比。但是目前随着铝土矿资源的不断开采利用,矿石品位不断下降,目前,使用拜耳法处理该类矿石能耗和成本明显
选择二十碳五烯酸(EPA)和二十二碳六烯酸(DHA)为主要研究对象,以花生四烯酸(AA)做对照,探索长链多不饱和脂肪酸(PUFAs)对高糖环境下视网膜细胞(RF/6A)生长的影响并探索其作用
生产要素是随着时代的发展而不断丰富发展的,应从大历史观把握劳动、土地、资本、知识、技术、管理和数据"七要素"体系的发展进程。推进要素市场化配置改革不仅应着眼于经济
塔里木盆地沙雅隆起油气资源十分丰富,迄今为止已先后发现了塔河油田和牙哈、英买32号、英买7号等多个油气田。随着勘探研究的进展,该区目前已有多口钻井钻遇寒武系下丘里塔
我们从20份青藏高原鼠兔肠内容物中分离了 607株细菌,鉴定为19个属。其中,166株细菌使用现有的方法无法鉴定到种。16S rDNA全长序列(1,500 bp)分析结果表明有59株细菌可能是
近些年来,伴随着互联网的飞速发展与进步,使得以互联网为载体的在线服务数量和种类大量增加。目前在线服务已经在网上订餐、电子商务、网络购物、在线招聘、在线学习等领域迅速普及并得到广泛应用。因为不同的用户具有不同的消费心理、消费背景等,所以用户使用在线服务的过程中,致使用户偏好不一致以及评价准则不一致,从而导致用户对服务之间的评分无法比较。为了帮助用户迅速地选择符合需求的在线服务,需要一种客观的在线服务
衣康酸是一种含有共轭的C=C双键和C=O双键的不饱和羧酸,由于碳碳双键的键能低于碳氧双键的键能,所以在一般条件下C=C双键比C=O双键更容易加氢,但是这两者仍存在着竞争吸附H2
作为当代苏格兰文学的重要人物,詹姆斯·罗伯特森以其小说浓厚的历史底蕴和鲜明的政治观点闻名文坛。《大地依然寂静》是他的第四部小说,讲述了 20世纪下半叶至小说撰写完成
有线电视付费频道的运营是广电公司的一项业务,但长期以来一直被人们所忽视,为盘活广电公司现有的数字资产并在自媒体时代增强整体营运能力,对付费频道进行高效的全流程化管
近年来,随着我国电子商务的快速发展,物流行业也实现了快速扩张。仓储型物流企业作为物流业的重要形态之一,在实现快速发展的同时,也暴露了其存在的问题。由于我国大部分仓储型物流企业的前身是大型国有仓储企业,在转型及发展过程中,如何适应新形势的需要是摆在这些企业面前的重要课题。特别是在大数据和智能化时代,如何转变思想观念、实现科学化管理、运用现代技术提高仓储使用效率和服务水平等,成为仓储型物流企业实现快速