中文复句判定及复句关系识别研究与实现

来源 :南京师范大学 | 被引量 : 2次 | 上传用户:zhongxuw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复句作为自然语言中重要的语法单位之一,上连篇章,下连小句,在自然语言中起重要的作用。根据复句中连接词的有无,可将复句分为具有连接词的显式复句和无连接词的隐式复句。复句在丰富汉语句子结构的同时也为文本的自动理解带来了困难。对复句进行准确判定并对其语义关系进行识别是自然语言处理的基础任务,可以为中文抽象语义表示(CAMR)、机器翻译、自动问答等上层应用提供支持。因此本文基于中文抽象语义表示语料和汉语篇章结构语料库,采用神经网络方法对复句判定和语义关系识别展开了实验性研究。研究内容主要包括:(1)复句判定及语义关系识别数据集的构建。该部分的主要工作是结合复句的相关理论知识,确定了本数据集所包含的语义关系类别,并对从中文抽象语义表示(CAMR)语料和汉语篇章结构树库(CDTB)语料中自动抽取的句子进行人工校对,完成了本文所用的数据集构建,其中显式复句3644句,隐式复句5144句,单句5359句。(2)提出一种基于神经网络的复句自动判定方法。为了利用上下文语义信息,对句子进行编码时采用Bi-LSTM(Bidirectional long short-term memory)获得句子级的上下文语义信息,采用注意力机制捕获句子特征,从而挖掘更深层次的语义信息,通过CNN(convolutional nerual network)提取句子中的局部信息,得到包含丰富语义信息的句子特征表示。实验结果表明该方法能够有效地对复句进行判定。(3)提出一种基于神经网络的复句语义关系自动识别方法。本文从句子结构特征角度关注复句的语义关系,使用句子级的词向量BERT增强句子的语义表示;为了充分利用句子的结构信息,采用Tree-LSTM对句子中的词语和成分句法树标记共同建模;隐式复句由于连接词的缺失使其语义关系识别较为困难,为解决这一难题,本文基于多任务学习将连接词分类信息融入到语义关系识别中。实验表明,对于复句语义关系自动识别任务,上述方法能够取得较好的识别效果。(4)提出复句判定及语义关系自动识别联合模型。为减少误差传递,本文为复句判定和语义关系识别任务构造了联合模型,通过联合模型和参数共享可以使用全局特征来提升局部预测,采用注意力机制使复句语义关系识别任务可以有效地利用复句判定任务所学到的信息,增强模型的性能。实验表明联合模型能够有效地减少误差传递,在两个任务中取得较好的识别效果。
其他文献
自上世纪中后期以来,伴随着全球化的浪潮,非营利组织在世界范围内蓬勃发展,其影响渗透到社会生活的各个方面。作为一种区别于政府和企业的社会组织形式,非营利组织问题不仅涉及到政府管理问题,而且关乎社会的基本结构与公平正义。以文化类非营利组织为例,其不仅在促进历史文化传承发展方面起着重要的作用,同时在相当程度上满足了公民的精神文化需求。我国非营利组织虽然起步晚,但是从非营利组织的数量增长和社会功能来看发展
松本清张推理小说的相关先行论文中,几乎未有用热奈特的デイスクール(言説)论来解析文本叙事的研究。在中国及日本学术界,《点与线》《砂器》等作品备受学者的关注与偏爱,相比之下,围绕《等我一年半》的研究尚处于较少状态,且相关文献主要注重考察作品体现的伦理情念价值。因此,解剖文本、探讨作品叙事的立体结构是本研究的意义之所在。本研究以法国学者热奈特的デイスクール(言説)论作为方法论,全面解剖《等我一年半》的
在新医改要求中,加快城乡社区卫生服务机构建设为基础健全基层医疗卫生服务体系是我国改革开放新时期的五项重点改革任务之一,为社区卫生服务机构发展提供了新动力。随着近年来国家颁布了一系列关于推进社区卫生服务发展和建设世界双一流大学的相关文件,高校医院可发挥的作用愈来愈重要。如何采取有效的营销策略来提升高校医院在社区卫生服务项目中的市场竞争力,保证其在新时期下可以健康并持续的发展成为了一个值得深入研究的问
与疾病一样,贫困是人类的共同敌人,如何消除贫困?面对这一人类共同的问题,以习近平同志为核心的中国共产党人给出了具有中国特色、中国智慧的中国答案:“精准扶贫”。在实践上,精准扶贫是一种扶贫方案,在伦理视域下,精准扶贫蕴含了“以人为本”“公平正义”“共享共富”的伦理精神。“实事求是、因地制宜、分类指导、精准扶贫”、“六个精准”、“五个一批”是精准扶贫的主要内容,其根源在于马克思主义基本立场、中华文化民
目的:本课题旨在探讨基质金属蛋白酶-11(MMP11)和去整合素-金属蛋白酶28(ADAM28)在人乳腺癌及癌旁正常乳腺组织中表达与临床病理参数的关系以及两蛋白表达的相关性,分析它们在乳腺癌发生及浸润转移中的作用及作为乳腺癌进展标志物的可能性,为寻求乳腺癌新的治疗方法提供理论依据。方法:选取2017年05月至2019年05月在黑龙江省佳木斯大学附属第一医院外科乳癌改良根治术标本,经两位高年资病理医
纯电动汽车可以使用驱动电机直接驱动,此时驱动电机的性能则决定着汽车性能,通过对驱动电机输出特性分析,使用添加变速器的方案进行优化纯电动汽车的行驶性能,提高其动力性能和经济性并拓宽驱动电机运行条件。本文是在双电机直接驱动的基础上提出来的,在动力系统中通过加入两挡变速器来优化纯电动汽车的运行性能。本文研究内容主要有以下几个方面:(1)在山东省重点研发计划项目“四轮驱动纯电汽车的关键技术研究”双电机直接
本文选择医保医师作为研究对象,主要原因是在新一轮医药卫生体制改革中,医院在医疗卫生服务体系中发挥主导作用,其中医生又因为其专业性而处于核心地位,要想充分发挥医保的战略购买作用,实现健康中国的宏伟目标,如何激发医保医师积极性、构建科学合理的绩效管理体系,成为非常关键的因素,具有重要研究价值。首先,本文对医保医师的研究背景和研究意义进行了阐述,对相关文献和研究成果进行了梳理总结。全民医保背景下,医保医
目前,耗能减震技术已经在结构应用上得到广泛发展,成为抵御地震和强风的一种有效的措施。低屈服点钢剪切型阻尼器具有易屈服,相对尺寸较小、耗能能力强、造价低廉等特性,因此在工程中得到了广泛的应用。本文使用低屈服点钢BLY160设计制作了 4件剪切型阻尼器,采用试验研究与有限元模拟相结合的方法对低屈服点钢剪切型阻尼器在循环往复荷载作用下的滞回耗能能力以及低周疲劳性能进行了相关研究,具体的研究内容如下:(1
细根(
脱氧核糖核酸(DNA)不仅是生物体中遗传信息的载体,还可以作为纳米材料的构筑单元。尺寸大、复杂度高的纳米结构的组装一直是DNA纳米技术研究工作者努力的方向。基于DNATiles的组装是当前被广泛认可的方案,即先组装出结构单元(Tile),再将数个结构单元堆积成更大的结构。然而,目前基于DNA Tiles构建的纳米结构大多是相同Tiles的简单堆积,若能实现不同形状和尺寸的Tiles的组合将大大提高