半监督的隐式篇章关系识别

来源 :厦门大学 | 被引量 : 2次 | 上传用户:lovewxb1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐式篇章关系识别旨在判断缺少连接词的两个论元(通常为句子或子句)之间的语义关系,例如转折、因果等。准确地识别这些语义关系有助于提高机器翻译、情感分类和问答系统等自然语言应用的性能。目前,隐式篇章关系识别依然是一项极具挑战性的任务,其困难之处主要体现在:1)在缺少连接词的情况下,隐式篇章关系识别需要理解两个论元的语义。2)主流的隐式篇章关系识别模型都是数据驱动的,而人工标注的篇章语料又非常有限。因此,当前的研究工作主要从以下两条主线展开:1)设计基于神经网络的隐式篇章关系识别模型,学习论元的分布式语义表示。2)利用半监督的方法处理训练数据不足的问题。本文沿着第二条主线展开工作,研究如何利用大量的显式篇章实例(或基于它们的人造隐式篇章实例)提高隐式篇章关系识别的性能,其贡献可以总结为以下几点:1)基于协同训练的隐式篇章关系识别方法。前人已经证实人造隐式篇章实例存在“领域问题”和“语义转移问题”,不加区分地用于扩充训练数据反而会导致隐式篇章关系识别性能的降低。因此,本文第2章首先基于递归自编码器学习隐式篇章实例的分布式特征,实验证明这些特征和人工特征是相互补充的。然后,提出一种基于人工特征和分布式特征的协同训练方法,利用两类特征之间的互补性,挑选一些有效的人造隐式篇章实例用于扩充训练数据。实验结果表明基于协同训练的方法在中、英文隐式篇章关系识别任务上都是有效的。2)引入双语约束人造数据的隐式篇章关系识别方法。基于中英双语中存在的“隐式/显式不匹配”现象,本文第3章首次提出基于中英句对构造双语约束的人造隐式篇章实例。它们能够在一定程度上避免“领域问题”和“语义转移问题”,因此更适合用于扩充隐式篇章识别的训练数据。然后,设计了一种简单有效的多任务神经网络模型,用于集成这些双语约束的人造隐式篇章实例。实验结果表明引入双语约束人造数据的方法的性能明显优于集成了其他额外数据的基准系统。3)基于连接词敏感的词向量的隐式篇章关系识别方法。显式篇章实例中,同义/反义词词对通常伴随连接词and/but出现,其它连接词周围的词对同样呈现出一定的规律。因此,本文第4章提出基于大量的显式篇章实例学习连接词敏感的词向量,这种词向量能捕获词对所蕴含的篇章关系信息。使用连接词敏感的词向量代替普通的词向量作为输入特征能显著地提高隐式篇章关系识别的性能。实验结果也表明这种方法能够有效地利用大量的显式篇章实例。
其他文献
学位
在细胞的信号转导过程中,NF-κB通路可以激活或者抑制核内基因的表达,从而将外界的刺激转化成细胞的信号。在免疫系统中,NF-κB在控制抗原受体信号转导通路、调控诱导核转录因子中同样起关键作用。BCL 10是参与NF-κB通路的一个重要功能基因。BCL 10正常的表达水平可以促进免疫因子的产生,增强机体的天然免疫和抵御感染的能力。反之,BCL 10的异常表达,比如过表达、过度磷酸化和核内表达会导致一
为了解决测控基带备机双向捕获过程中错锁的问题,对接收机载波锁定原理、频率捕获单元工作流程进行分析,查找产生错锁原因。搭建模拟测试环境开展试验验证,并对软硬件进行适应性修改,改进了防错锁方法,为测控活动提供有力保障。
哲孟雄现今通称锡金,位于中国与印度之间喜马拉雅山南缘的缓冲地带,对两国政治、经济、军事、文化等关系具有不可忽视的作用。哲孟雄与西藏的关系由来已久,据传统文献记载可上溯到吐蕃王朝。作为一名初入哲孟雄与中国西藏关系研究领域的学生,本论文试图对甘丹颇章时期的哲孟雄与中国西藏的关系做力所能及的分析和研究。从历史的角度而言,可以认为哲孟雄的历史是藏族历史的一部分,尤其是甘丹颇章时期的哲孟雄的政治、经济、文化
“道法自然”是老子哲学中一个很重要的范畴,其核心价值在“自然”。“自然”是“道”的本质属性,是对“道”的性理概括和精神提炼;万事万物各有各的“自然”,“法自然”是“法各自自己的自然”。从自然分属不同主体看,人、地、天、道是并列关系,是“自相法”;从生成论看,道生天地,天地生万物,人、地、天、道是依存关系,次第相依相法,是“转相法”。老子哲学中的“道法自然”是宇宙社会普遍的原则、总则和规律,人、地、
本文综合运用了紫外可见光谱法、荧光光谱法、圆二色光谱法、粘度法、热力学等方法,研究了核黄素、亚甲基蓝、荧光素等稀土配合物与鲱鱼精DNA之间的相互作用,计算了二者相互作用的结合比、结合常数、热力学函数等参数。在生理pH(7.40)条件下研究核黄素-镝、核黄素-钐、亚甲基蓝-钐、亚甲基蓝-镝、荧光素-钐、荧光素-镝与DNA的相互作用,经计算配合物与DNA的结合分别为5 :1,5 :1,8 :1,8 :
学术界对于菲律宾劳工迁移现象的关注由来已久,但其中大多数文献往往是片面的或是带有偏见的,原因在于学者们对于这一现象仍然持怀疑态度。菲律宾劳工迁移现象已经存在了超过四十年的时间,关于该现象对于菲律宾发展的影响也可以在诸多学术文章中窥见。本文首先呈现的是菲律宾国内迁移的历史发展以及它是如何塑造今日的菲律宾劳工迁移产业。基于迁移发展法,本研究也对菲律宾劳工迁移进行了评估。诸如利用全球化理论、新古典主义迁
于2002年3月至2002年12月,以由嘉陵江北碚江段采集到的瓦氏黄颡鱼(Pelteobagrus vachelli (Richardson))幼鱼作为实验材料,采用流水式呼吸仪,分别在15℃,18℃,21℃,24℃,27℃和30℃水温条件下,测定了66尾鱼体(体重范围7.2——9.4g)的静止代谢率。 主要研究结果如下: (1)在实验水温分别为15、18、21、24、27和30℃的条
早期肺癌患者的治疗是以治愈为目标的。针对手术可切除性和可操作性的多学科讨论模式决定了最终的局部治疗方式(手术或放疗)和相关的系统性治疗方案,从而进一步提高患者治愈的可能性。研究证据支持以顺铂为基础的辅助化疗用于切除术后,或与放疗同步使用。共识指南支持以新辅助化疗代替辅助化疗,并支持对不符合顺铂治疗条件的患者采用基于卡铂的治疗方案。由于研究设计效率低下,需要长时间随访来评估生存终点以及对晚期疾病的持
期刊
能源危机、环境污染推动了新型储能设备的研发。超级电容器因比电容高、充放电速率快、循环稳定性高、绿色环保的优点,已经成为电化学领域的研究热点。其中,电极材料是决定超级电容器性能的关键因素。尤其自支撑电极近年来在储能装置中显示出巨大的优势。密胺海绵是一种密度低、孔隙率高、清洁无污染的三维网状结构树脂聚合物,非常适合制备自支撑电极材料。本文以密胺海绵作为前驱体,通过调控碳化温度、活化剂用量等参数调节电极