中文上下位关系自动抽取技术研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:lzmkkaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词汇之间存在多种关系,如:上下位关系、同义关系、反义关系、整体-部分关系等等。其中,作为重要语义关系的一种,上下位关系是描述事物层次关系的基础。在中文自然语言处理中,词汇之间的上下位关系是指词与词之间在语义上的从属关系。即词A和词B在语义上满足:“B是一种/类/个A”,则称A与B之间有上下位关系,其中A是B的上位概念(hypernym), B是A的下位概念(hyponym),或者说B是A的类别,A是B的实例。如何高效、准确的从自由文本之中获取词汇间的上下位关系,是语义抽取的基础问题之一。上下位关系获取任务在一定程度上将非格式化的信息转换为格式化信息,这为更深层次的知识获取提供了基础性支持。同时,上下位关系知识可对本体、知识库、词典构建进行正确性检测、扩充和完善,在自然语言处理如机器翻译、文本理解、信息抽取、信息检索等多个领域有着重要的地位。本文尝试结合多种方法对上下位关系的获取和过滤两个任务进行研究。在上下位关系抽取方面,本文首先提出了一种基于LDA模型的中文词汇上下位关系抽取方法,并结合上下位关系抽取模式自扩展方法,在充分运用维基百科词汇定义的基础上,对中的上下位关系进行抽取。在上下位关系过滤方面,本文提出一种结合语境和布朗聚类特征的上下位关系验证方法,并结合词汇在句中的依存句法特征,对所获得的上下位关系词对进行验证过滤。在CCF NLP&CC2012语义关系识别标准评测集上获得了良好的效果。
其他文献
随着计算机网络技术的迅猛发展,信息安全的重要性与日俱增。数字签名能为数据传输提供身份认证、数据完整性认证和不可否认性等安全服务,因此成为近年来的研究热点。目前研究
云平台为用户提供了执行任务的计算和存储资源,供应商根据用户使用资源的情况计费以获取利润。随着大规模数据需求的迅速增长,存储资源变得越来越重要。然而,对用户和供应商
随着计算机技术的快速发展,网络应用已经在全球得以推广,人类已经进入了网络时代。网络已经成为了人们日常生活中不可缺少的一部分,并在国民经济中发挥着日益重要的作用。然而,由
目前,WebServices技术正受到产业界和学术界越来越多的关注,其应用也越来越广泛,出现了不少功能相同或相似的Web服务。为了对它们加以区分,人们通常采用服务质量(QoS)作为评价和
传统的实体解析是指,给定一个或多个描述现实世界的引用集合,识别其中对应于现实世界中同一实体的所有引用的过程。实体解析是数据清理,数据集成,数据挖掘等技术中关键的一步
随着信息技术的发展,本体(Ontology)的研究在计算机领域日趋流行,在知识工程、数据库设计和集成、信息检索和抽取、软件需求分析、语义Web、面向对象的分析技术和基于Agent的
随着网络技术的发展,网络安全问题受到越来越多的重视。入侵检测作为一种主动的安全防护手段,在保护系统不受攻击当中起着重要的作用,是安全防御体系中必不可少的一个组成部
基于哼唱的音乐检索系统研究是一种涉及音乐理论、信号处理、模式识别等相关领域的综合学科研究,其在音乐数据库管理、Internet音乐检索以及生活娱乐等方面都具有非常重要的
随着通信光缆在电信,电力,铁路及广播电视等行业的广泛应用,光缆线路出现的故障次数也在不断的增加,已给通信网的正常运行带来了较大的影响。如何及时有效的对光缆线路进行维
在信息时代的今天,经过了几十年的高速发展,信息技术和网络技术得到了广泛的应用,互联网走进了千千万万的家庭。由于人们的信息传递方式渐渐从传统的邮递方式转变为依靠网络进行