基于转移的中文篇章分析研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:aa1bb1aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文篇章分析作为自然语言处理领域中一项基础任务,旨在将中文篇章平文本以树形结构表示,称作中文篇章修辞树结构。篇章修辞树有助于从整体上把握篇章行文脉络并提供结构化信息,对下游篇章级别的文本分类、文本摘要、情感分析和机器翻译等任务具有基础支撑的作用。随着汉语连接依存树结构语料(CDTB)的发布,基于中文的篇章分析研究得以开展。近年来,深度学习技术在自然语言处理领域中多项任务上取得显著成效,因此在篇章分析中基于深度学习的自动特征抽取模型逐渐取代依赖人工特征的传统机器学习方法。转移系统常用于结构解析任务,率先在句法层面结构解析任务中广泛应用,中文篇章修辞树结构解析也是一类结构解析任务,研究人员在中文上提出了基于转移的自底向上解析模型。但现有工作存在以下问题:仅基于固定转移序列构建树形结构;基本篇章单元(EDU)编码仅关注平文本信息,未有效利用结构信息增强表征;篇章粒度划分仅针对句子分割。因此,针对上述问题,本文从以下三个方面进行了相关研究:(1)完善基于转移系统的篇章解析平台。原自底向上模型采用篇章修辞树后序遍历转移序列构建树形结构,由底部局部子树信息不断向上构建更大的子树直至构建完成;本文基于篇章树的三类遍历(前序、中序和后序)方式所得转移序列,对比了在统一模型架构下,不同构建方式在各项性能指标上的具体差异,并在此基础上额外增加了修辞关系和完整篇章修辞树的性能指标。(2)提出基于多层次结构化信息的表征增强方法。该方法在词级别的篇章单元特征编码中利用图卷积网络(GCN)融入句内依存结构信息,将句法信息有效融入表征学习中。而在EDU级别的表征学习中,采取星型拓扑结构的Star-Transformer作为特征编码器,在中继结点中更新有利于结构生成的全局信息的同时,更加关注局部相邻结点对当前子单元的语义表示的重要性。(3)提出基于话题转移的联合学习模型。子话题是比句子范围更大,更粗粒度的篇章组成单元。该模型中对于构建篇章文本的粒度划分问题,利用篇章修辞树的核性信息,提出了篇章中基于规则划分子话题的策略,将自底向上的构建过程看作是篇章子话题单元的结合过程;并采取联合学习方式隐式融入该类子单元边界信息。
其他文献
双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)算法为一种常用的深度强化学习算法,其基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法改进,实现简单方便,智能体在应用场景中采取所学的确定性策略,表现相对稳定。但是,算法采取的模型架构以及运用的策略改进机制,仍存
学位
在物流、建筑、工业领域,从业者需要长时间从事体力劳动,常年的高强度负荷导致工人罹患肌肉、骨骼疾病风险急剧增加。随着中国老龄化问题加剧,如何延长工人的职业寿命并减轻职业病发生率成为亟待解决的社会课题。研究证明,助力外骨骼可以提高穿戴者的运动能力,减少人体肌肉、骨骼受力,从而降低工人肌肉、骨骼疾病发生率。当前大多数搬运外骨骼助力位置多为腰部,鲜有研究围绕搬运过程中腰部受力及膝盖压迫问题进行综合探讨。因
学位
随着社会的日益进步,以人为本的核心思想引领着交互领域的不断发展。当前基于计算机视觉的非接触式大屏交互设备在越来越多的场合下成功应用,在教学、会议、医疗、体感游戏以及展览等多领域内为人们的生活提供了极大的便利。然而由于其发展起步较晚,当前仍有很多不足之处:一是精度高的视觉传感器通常都价格昂贵且体积庞大,成本相对低廉的视觉传感器又容易受到各种噪声干扰;二是当前基于计算机视觉的目标跟踪算法效果容易受背景
学位
随着计算机网络技术和人工智能技术的发展突破,低速无人驾驶设备飞速发展,扫地机器人、配送机器人、消毒机器人等广泛应用于家居、商超、酒店、医院等环境中。对于移动机器人来说,构建地图是机器人自主导航以及执行任务的第一步,然而,目前机器人建图仍较多依赖于遥控操作以及人为决策,如何让机器人独立探索环境并完成建图是机器人走向智能化的关键一步。本课题以室内环境下的应用为背景,研究机器人更加高效、智能的自主探索方
学位
随着医疗机器人技术的发展,骨科手术机器人在临床中的应用和优势逐渐凸显,成为了医疗机器人与医疗装备领域的研究热点,同时复杂的骨科手术对机器人提出了更高的要求,智能化、微创化和精准化成为骨科手术机器人的发展方向。在机器人辅助骨科手术中,机器人磨削工具与骨组织交互以及人机交互的稳定性和柔顺性对骨科手术的影响巨大,因此本文利用阻抗控制实现工具与组织交互的稳定磨削,利用导纳控制实现人机柔顺性操作,同时建立阻
学位
随着计算机技术和智能制造产业的发展,智能移动机器人领域受到越来越广泛的关注,而同步定位与建图(SLAM)技术是智能移动机器人在未知环境下工作的基础。SLAM主要是帮助机器人通过传感器在未知的环境中来感知自身在三维空间中的位置以及周围的环境结构,从而实现自主定位、地图构建和路径规划等功能。伴随着技术的发展和应用进入新阶段,SLAM所面对的场景更加复杂多变,这就对原有技术提出了新的要求。传统SLAM系
学位
全膝关节置换机器人手术导航系统通过医学影像和光学定位系统,辅助医生进行手术规划并精准安装假体。机器人手术导航系统融合了多学科技术,结合了机械工程、软件工程、图像处理等技术,可以为医生提供手术规划、定位测量、扩大可视范围等功能,提高手术操作的精确性、安全性和可重复性。相较于传统的全膝关节置换手术,机器人手术导航系统加持下的手术在切骨和假体植入方面有更高的精度,能够获得更好的下肢力线对齐,提高手术成功
学位
核技术水平是一个国家地位和综合国力的重要体现,目前惯性约束激光核聚变(Inertial Confinement Fusion,ICF)是人工可控核聚变的主要方式之一。因其高效、可靠等优点,现已成为各国对寻找未来核聚变清洁燃料和新型武器的研究焦点。微操作和精密装配是完成ICF靶器件组装的关键技术,该靶器件所包含的零件复杂、尺寸跨度大(50μm到5mm),不同零件之间所需的检测装配力要求也是跨数量级的
学位
随着国内集成电路产业的迅猛发展,客户及市场对芯片产品的高质量、低成本的要求越来越高,使得企业质量管理能力的高低将直接影响产品推向客户及市场的成败。产品研发投入成本增加,产品质量不适应客户需求,必将影响了产品竞争力,终将会影响到产品是否能够推向客户及市场,这是关乎企业未来的发展重要因素。本文以DMT公司为例,研究IPD模式下芯片产品类研发项目质量管理的改进方案。在综述相关理论和研究成果基础上,深入分
学位
本文以THB公司“雅江特高压”项目为例,对项目型生产企业的项目质量管理过程及方法进行了研究。从项目质量管理的三个过程:规划项目质量、项目质量保证、项目质量控制分别着手,对项目型生产企业在项目质量管理过程中的特点、现状、存在的问题进行阐述,并针对现状和问题分别给出了对策。本文还重点介绍了质量工具在项目质量的不同过程中的作用,并详细阐述了几种质量工具的实际应用,以及这些质量工具对项目质量的作用。例如,
学位