基于领域本体的网络文本挖掘和知识验证方法

来源 :华东理工大学 | 被引量 : 0次 | 上传用户:ztwpc2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识的文本挖掘(KAT)是当今计算机领域的一个很重要的研究课题。在本文中,给出了基于本体从海量网页文本库中获取领域知识的方法。首先,介绍了本体的基本概念与背景知识。对当今流行的本体架构与应用进行了初步的探讨。接着,着重详细介绍了在本体的基础上怎样进行领域知识的获取,包括概念获取与属性获取,介绍了用到的一些获取技术,包括文本类聚、文本分类、中文分词等;同时也介绍了知识获取出来以后怎样进行知识验证,主要包括概念验证与属性验证,并提出了一些独到新颖的算法。为了证明我们理论的正确性,以植物领域为例进行了实验,并分析了实验数据与结果。实验数据证明我们的理论是正确可行的。最后,讨论了下一步需要做的工作,怎样完善的知识获取以及验证系统,以及展望今后文本挖掘的发展方向。
其他文献
锂电池是继铅酸电池和镍氢电池后出现的新一代二次电池,因其具有体积小、容量大、无记忆性等优点,而获得广泛的应用.随着锂电池生产技术的发展,锂电池可以提供的电流越来越大
本文通过对网络课什资源的历史沿革,传输特点,组织方式等的分析,参照国际上对元数据标准的研究成果,遵循中国教育信息化技术标准,提出一种以元数据形式描述网络课件的方法。  
学位
传统的反病毒软件使用的是基于特征码的静态扫描技术,即在文件中寻找特定十六进制串,如果找到,就可判定文件感染了某种病毒。但这种方法在当今病毒技术迅猛发展的形势下已经
随着技术、环境和用户需求的不断变化,适应性已经成为软件系统生存和成功的重要因素之一,对软件适应性的研究包括适应性的度量评价越来越成为研究的热点之一。对适应性的度量和
可行装配序列生成是装配序列规划(Assembly Sequences Planning, ASP)的核心问题,是个典型的NP难题。一般的装配序列规划方法或者存在组合爆炸问题,或者无法保证生成最优的装
随着世界范围内对社会公共安全和公众保护需要的日益增长,越来越多的摄像头被安装在学校、医院、街道、住宅小区、公园等场所。面对全天候实时拍摄的海量监控视频数据,如何进行
在现有的因特网上进行实时多媒体传输具有挑战性,根本的原因是IP网络只是“尽力而为”的服务形式。不提供任何质量的服务保证,不适合连续媒体的传输。  随着IP网络的发展和多
本文是基于内容的图像检索技术进行图像检索的基础理论和一般方法,以鱼病图像为研究对象,结合计算机图像处理技术、模式识别、机器视觉技术,建立了利用基于内容的图像检索技术的
随着计算机技术与数据库技术的发展,评价教学效果的主要手段的考试也逐渐通过建立完善的试题库,计算机智能组卷来实现考试的网络化和智能化。试题库的智能化是网络课程智能化发
在装配序列的自动规划中,尤其是对于存在大量可行装配序列的复杂装配,装配序列的紧凑表示是装配序列评价与优化的必要条件,然而传统的装配序列表示方法,要么受组合复杂性影响