领域本体概念及概念间关系学习算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:FLEXCN
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体,按照Gruber的说法,是概念模型的明确的规范说明。它作为人们对领域知识的共同认识和理解,可以用来模拟人类所拥有的知识网络。由于本体对于知识模拟的先进性,其可以用在各种语义处理及语义理解的场合,如信息检索、语义网、知识工程等。目前,如何构建一个实用性的本体,已经成为了研究热点。手工构建本体费时费力,不利于本体的大规模应用以及本体知识的动态更新。于是,如何提高本体构建的自动性,就成为本体构建研究的重中之重。本体学习利用机器学习、数据挖掘、自然语言处理等各领域方法技术,旨在解决本体自动或半自动构建问题,本文所有研究内容就是围绕本体学习的方法技术展开的。文中提出了一系列本体概念及关系学习方法,构成了一个完整的本体学习流程。在领域概念学习上,首先使用双层tfidf方法学习领域简单概念;然后使用规则匹配和串频统计学习领域复合概念;最后使用上下文依赖对学习到的领域概念作最后筛选,提高学习的准确率。在关系学习方面,首先将学习到的领域概念使用广义后缀树方法来初步构造概念之间的层次结构,接着通过维基百科链接图和层次聚类结合使用,辅助完善该层次结构;然后通过维基百科分类名和信息盒来学习领域概念间任意关系,并通过模板匹配方法对这些关系类型进行扩充。通过使用这一系列方法技术,本文完成了一个本体学习原型系统。该系统中各模块既能独立用于单个本体学习任务,又能结合使用来完成整个本体学习任务。实验表明,该系统不仅充分利用了维基百科的结构性和知识性,又能保证所学本体的规模和时效性,能有效进行中文本体学习。
其他文献
随着移动智能终端的大规模普及和高速无线接入技术的快速发展,移动多媒体网络应用迅速兴起。与之相应地,移动终端上多媒体网络应用的能耗需求迅速增长。而移动终端固有的电池
随着计算机技术的迅速发展,数字媒体的数量也急剧增加,随之而来的是一系列的版权纠纷问题。在拷贝检测应用方面,基于内容的拷贝检测具有更好的鲁棒性和更好的适用性,因而可以看作
因为用户对强大的计算资源和大量的存储空间的需求,云计算已经成为了一个非常有前途的技术。用户可以方便的将数据存储在在线的虚拟化存储空间里面。用户只需要预定,然后支付
现代科学技术的快速发展,人们的工作和生活越来越贴近网络,因而对网络的要求也越来越高。有线电视网,电信电话网以及传统计算机网络3个网络合并为一个分组化、数字化的综合业
随着企业数据中心对数据访问速度的要求越来越高,分离的存储网和以太网使得数据中心布局布线更加复杂,管理成本增大,因此设计高速统一的网络架构成为企业迫切的需求。以太网光纤
随着存储技术的飞速发展,个人计算机的存储能力快速增加。研究发现,人们越来越不愿意删除旧文件,以防止重要信息的丢失。这使得人们经常花费大量的时间进行文件检索。传统的基于
室内移动机器人的定位与避障算法一直是机器人领域内的研究热点,其中定位的鲁棒性主要是指机器人发生异常状况时,对定位功能的自我恢复能力,而避障功能包括对障碍物的检测以及绕
当今社会,经济和科学技术飞速发展,交通运输、金融银行、仓库管理、电力供应以及军事安全等部门对安全防范的需求与日俱增,要求不断提高,进一步促进了视频监控技术的快速发展,但是
量子信息科学是量子力学与信息科学结合的一门新兴学科。量子信息科学采用量子比特来表示量子态。遗传算法是模仿生物自然选择和遗传机理,构造一种随机搜索的计算智能算法。
近年来,随着物联网发展的推进,无线传感器网络得到了非常广泛的应用,比如在智能家居、工业控制、智能交通、智慧城市、医疗卫生、军事国防等。无线传感器网络也正在改变我们的生