基于框架表示学习的汉语框架排歧研究

来源 :山西大学 | 被引量 : 1次 | 上传用户:htagsll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
框架语义分析任务主要包含目标词识别、框架识别、语义角色标注三个子任务。本文研究的框架排歧任务是框架识别的关键子任务。框架排歧任务的定义为:针对可激起多个框架的目标词,在给定其所在的上下文环境时,为其自动识别正确的框架。框架排歧是框架识别模型性能的瓶颈所在,在该任务上的突破,将为后续构建高精度的语义角色标注模型奠定基础,推动实现计算机对句子浅层语义信息的有效处理。针对框架排歧子任务,本文主要的研究内容及成果如下:(1)本文提出一种有效区别正确框架与错误框架的基于神经网络的框架表示学习算法。不同于传统的分类算法人工提取特征的做法,本文直接从语料中的例句出发,使用神经网络模型给出了一种框架表示学习的算法。该算法充分利用汉语框架语义知识库(CFN)中例句库、词元库,基于hinge-loss的神经网络,学习到优良的框架分布式表示向量。该框架表示向量可有效提升框架排歧模型的性能。此外,本文比较了其它三种不同的框架表示学习方法,分别是基于词元的框架表示学习、基于Word2Vec的框架表示学习和基于WSABIE的框架表示学习,验证了本文基于神经网络的框架表示学习方法显著好于其它三种方法。(2)本文构建了基于框架表示学习的汉语框架排歧模型。采用WSABIE算法学习得到目标词的上下文表示,排歧时以目标词的上下文表示向量与框架表示向量做余弦夹角来做判决。实验中,在CFN中88个有歧义的词元上进行,框架排歧精度最好达到72.52%。基于组块3组2折交叉验证t-检验,本文所提方法的性能显著高于其它的框架排歧方法。(3)本文设计和开发了CFN框架自动排歧系统。基于构建的基于框架表示学习的汉语框架排歧模型,该系统实现了以框架语义学为理论基础的句法语义分析任务中框架排歧的自动化处理。此外,系统还实现了对框架排歧任务所涉及的框架库、词元库、句子库的信息管理模块,规范了框架排歧及后续语义角色标注等任务的基础数据。本文构建的汉语框架排歧模型可为汉语框架语义分析的后续任务奠定基础。此外,本文提出的汉语框架分布式表示学习方法也可在汉语框架语义分析的其它任务中得到更为深入的应用和改进。
其他文献
目的探索数字化技术在个性化、精确化额瓣修复全鼻缺损中应用的可能性。方法运用研究中心基础人脸数据库对全鼻缺损患者病例进行个性化检索,配准,评价相似性,将相似度较高患
传统的声化学反应器中容易产生驻波声场,不利于提高处理的效率。常用来消除声化学反应器中驻波声场的方法多是从声波的辐射方式上来改变反应器中的声场分布,但多应用于小型声
近年来,破产理论受到越来越多的关注.研究破产理论有利于保险公司对未来做出预测,及时规避风险,具有重要的现实意义.无数专家学者在Lundberg-Cramer经典破产理论的基础上进行
近年来,人们通过各种旅游类搜索网站即可以完成机票的搜索和预订。用户选择出发城市,到达城市和出行日期,并点击搜索后,进入航班行程结果页面,用户可在该页面选择适合自身要
在高速铁路技术快速发展与能源枯竭问题日益严重的今天,将新能源如太阳能运用在高速铁路中有着非常重要的意义。在太阳能各种形式的利用中,光伏发电技术是重点研究的方向。高
随着工业机器人在工业生产中的大量应用,其工作方向已从基本的机械加工和简单协助技术人员,演变成了基于人机交互作用完成不同环境下的复杂任务,机器人编程技术已成研究热点
在分布式系统中,由于不同的机器设备来自不同的厂家,不同的厂家有不同的数据标准,因此需要一种技术来统一数据读取标准,从而使获取机器数据变得更容易。OPC就是这样一个技术
嵌入式系统是软硬件高度紧密结合的系统。近年来,随着互联网、物联网的发展,嵌入式系统的地位也越来越重要,嵌入式系统的软件设计的封闭式的开发方式已经越来越不适应当前应
转子系统是旋转机械的关键部件,确保这些设备安全可靠地运行具有十分重要的社会及经济意义。油膜失稳是转子故障中常见而且危害较大的故障,研究转子系统油膜失稳状态监测与故
当今世界是一个信息化的世界,信息安全得到了社会广泛的关注。密码芯片被广泛应用在社会生产和人类生活的各个方面。传统意义上,密码算法在数学意义上的复杂度决定了其安全性