基于语义依存分析的本体学习方法

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:ab888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今,Web成为了网络信息的主要平台,是人们获取知识的主要来源。但是,由于Web页面的无结构性、超链接的自由无序、以及Web内容的海量性、多样性和动态变化,人们从Web上搜索真正想要的信息其实并不容易。语义Web的出现解决了上述矛盾。语义Web(语义网)提供了一个通用的框架。允许跨越不同应用程序、企业和团体的边界共享和重用数据。作为语义Web中知识语义元数据的载体,本体成为了语义Web的核心元素。 为了将目前无序的Web改造成有序的计算机可理解的知识宝库,语义Web采用多层次的表示框架,本体位于从文档描述到知识推理转折的层次,因此本体的构建是实现语义Web的关键环节。本体构造是一个非常复杂的过程,它需要多个领域的专家参与。虽然目前本体构建工具已经较为成熟,但本体的手工构造仍是一项繁琐而辛苦的任务,在构建的初期和维护阶段需要花费大量的人力,构造合适的通用本体或分类体系需要大量的修剪和编辑时间,并最终导致所谓的知识获取瓶颈。 为了解决本体构建的开销问题,本体学习技术可以说当前的一个研究热点。其目的旨在使用能够实现本体自动构建的机器学习技术来协助知识工程师构建本体。本文基于传统的本体学习方法,针对目前本体学习的薄弱环节和关键问题,提出了新的思路,主要研究工作如下: ·针对概念和实例抽取,通过使用统计方法和自然语言处理技术相结合的方式提取术语,利用语义角色标注及生成的语义依存结构对候选术语进行筛选,通过语义环境及语义角色关系的分析,确定未知概念与实例的正确本体归属。 ·针对非分类关系的抽取,采用基于框架语义和论元语义的语义角色标注方法,引进语义信息到依存树,获得目标文集经过语义角色标注的句法语义依存结构SSDS,然后通过定义的核函数计算概念或实例之间的语义相似度,来确定发现的术语是概念或实例归属时,就可以依据语义框架或述词论元为其标注关系。 ·在提出的本体学习方法基础上,设计实现了SDEOL半自动本体学习系统,采用传统本体学习方法与本文所述基于语义依存分析方法结合的方式进行本体学习。实验结果表明基于语义依存分析的本体学习方法是对传统本体学习的一个有效补充。
其他文献
负载均衡是结构化P2P网络中资源管理和任务调度的关键技术之一。造成结构化P2P网络负载失衡的主要原因是资源查找者对各节点上存储信息的需求往往是不均匀的,从而导致某些节
21世纪,随着信息社会的不断发展和互联网的逐渐普及,人们面对日益增加的信息量,迫切需要有效的工具来分析和处理所需要的数据。随着20世纪80年代神经网络的发展和KDD(数据库
医学图像配准是医学图像处理领域中的一项重要技术,对临床诊断和治疗起着越来越重要的作用。尽管医学图像刚性配准研究已经开展多年,但是目前的主要方法仍然存在不足,需进一
本文描述了一个基于CG树的分布式服务器集群的设计和实现,主要内容有:1、提出了一套较为简单可行的CG树通信协议。该通信协议能在就绪状态下,能够维持集群的正常通信;在集群
近年来各种应用产生的数据呈爆炸性增长,其中很大一部分是实时产生的数据,具有无限性、无序性、突发性、易失性等特点,并且通常数据的价值随时间而减少。如何为这些需要实时
随着Internet的发展和用户的不断增多,对等网络作为一种新的网络应用模式受到了国际上广泛的关注,越来越多的专家、学者投身到对等网络的研究和探讨当中,取得了一系列的研究
当前,计算机的普及使得很多文学或艺术作者直接将作品以数字方式记录和存储下来,而网络的飞速发展也为数字作品的传输提供了便利。这些条件使得数字作品与传统作品相比,在创
本课题针对“需求快速变化”这一企业级管理软件开发中呈现的特点,提出一个“以用户为中心”的软件过程模型,即软件组织和业务用户共同参与软件开发活动,并由业务用户完成最终应
21世纪以来,由于经济的全球化和市场国际化的加速发展趋势,企业所面临的竞争更趋激烈。以客户为中心、基于时间、面对整个供应链,成为新形势下制造业发展的基本动向。这样就必须
流媒体应用是推动未来宽带应用的主动力,但流媒体对带宽的高占用特性使其在Internet上大规模应用面临诸多困难。传统的C/S、单源组播以及CDN(Content Delivery Network)模式