基于CDTB的篇章结构解析器的自动构建研究

来源 :苏州大学 | 被引量 : 1次 | 上传用户:zabdtt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词、短语和句子级的相关研究日趋成熟,篇章成为了自然语言处理领域的研究焦点之一。篇章分析旨在研究篇章特点和篇章组成单元之间的语义关系,进而从整体上理解篇章。篇章结构解析作为篇章分析的核心任务,其研究目标是依据篇章理论将篇章文本组织成结构化数据,为下游篇章级应用提供支撑。基于中文篇章连接依存树(Chinese Connective-driven Discourse Tree,CDT)理论和对应资源库CDTB,本文针对中文篇章结构自动解析问题进行了研究,具体工作包括:(1)提出了一种基于长短期记忆神经网络和图卷积神经网络组合的中文基本篇章单元(Elementary Discourse Unit,EDU)识别方法。该方法将EDU识别看作一个序列化标记任务,通过对上下文及EDU内部各成分间依存结构信息的表征来实现EDU分割点的确认,在CDTB语料上的实验验证了方法的有效性。(2)提出了一个基于神经网络和转移系统的中文篇章结构自底向上的自动解析方法。该方法将篇章树的构建过程看成状态转移过程,通过预测下一时刻的状态转移来完成篇章解析树的自动构建。在CDTB语料上的实验验证了方法的有效性。本文基于这一方法进一步探讨了篇章子结构表征策略对篇章自动解析的影响。(3)提出了一个基于指针网络的自顶向下的中文篇章结构自动解析方法。该方法将篇章层次结构的构建过程看作是对篇章单元分割点的排序过程,通过对EDU和分割点的有效表征,在编码-解码框架下融合注意力机制实现了篇章结构、关系主次和关系类别的联合学习,在CDTB语料上的实验验证了方法的有效性。(4)结合上述工作,构建了完整的端到端的篇章结构解析器,并分析了误差在各个子模块间的传播状况,以及它们对最终性能的影响。
其他文献
在不断的进化过程中,真核生物为保证遗传信息的精确传递,机体内出现了许多mRNA质量监控机制。其中,无义介导的mRNA降解(nonsense-mediatedmRNA decay,NMD)是一种广泛存在的转
高光谱图像具有光谱分辨率高且图谱合一的特点,近年来对高光谱数据的分析与处理已经成为遥感影像研究领域的热点之一。高光谱图像分类任务在地质勘探、农作物检测、国防军事等领域都发挥着重要的作用,需要更加深入的研究。深度学习具有优异的提取数据本质特征的能力,本文为提升高光谱图像的分类精度提出了两种基于深度学习的分类方法,主要研究内容如下:(1)提出了一个可用于高光谱图像降维的双分支耦合网络,该网络由一维卷积
B2B2C这一新型电商模式包括运营端、供应商端、消费者端以及销售渠道端,强调将商家、消费者与销售渠道进行平台化整合,这种模式符合当前的商业发展趋势,因此,B2B2C平台有广阔的需求。传统的单体式架构的B2B2C平台系统拓展性不足,模块耦合严重;系统逻辑与平台业务联系紧密,通用性很差。针对传统B2B2C平台系统单体式架构的问题以及通用性不足的弊端,实验室对该类系统的改进方案进行了研究,本论文负责研究
合成孔径雷达(SAR,Synthetic Aperture Radar)是一种高分辨率成像雷达,具有全天时、全天候工作的特点,在军事、农业、林业建设、地质勘探等领域有着广泛的应用。随着SAR图像分辨率越来越高,如何充分挖掘SAR图像信息成为了各国学者的研究重点。SAR图像目标检测和鉴别是SAR图像解译的关键步骤,通过检测确定疑似目标,通过鉴别进一步剔除杂波。但在复杂场景下,传统目标检测和鉴别方法性
六价铬(Cr(Ⅵ))是水体中常见的有害重金属元素。零价铁(ZVI)可将Cr(Ⅵ)还原为毒性更低的三价铬(Cr(Ⅲ)),并通过沉淀或共沉淀机理去除Cr(Ⅲ),成为Cr(Ⅵ)污染水体常用的修复材料。然而,零价铁(ZVI)易钝化且颗粒间易团聚,阻碍ZVI电子的有效传递,降低其对Cr(Ⅵ)的修复效率。鉴于此,使用具有良好导电能力和孔隙结构的碳材料可从理论上促进ZVI与污染物Cr(Ⅵ)的定向电子传递,提高对
现如今地震频发,地质灾害给人类造成了严重的生命危害和巨大的经济损失。强烈的地震动摧毁建筑物,诱发次生地质灾害,如山体滑坡、泥石流、堰塞湖等。因此,使得边坡地震稳定性
随着光学技术的发展,具有超光滑表面的平面光学元件应用越来越广。传统超精密抛光技术大多存在效率低、加工质量不易控制等问题,难以满足大批量、低成本的生产需求。传统轮式
原核生物中编码SigF的基因广泛存在,但人们对其的了解主要局限在Escherichia coli、Bacillus subtilis等模式菌株中。单细胞的集胞蓝细菌Synechocystis sp.PCC 6803是常用的
水力压裂是目前煤层气开发中应用最为普遍且效果最为明显的储层改造技术,该技术能够有效增加井底附近煤储层的渗透率,提高煤层气产量。然而,由于煤岩强度较低且内部层理、裂
随着财政性教育经费提高和新《预算法》、《中共中央国务院关于全面实施预算绩效管理的意见》等文件的实施,公共财政预算从“投入型”转向“绩效型”,在高校财务管理逐渐向价