一个Web本体分类系统的设计与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:zhl165408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体层是语义Web体系结构中的核心层,伴随着语义Web的研究热潮,对本体的理论和应用研究越来越引起学术界和工业界的重视。本体的获取和构建是本体相关研究中的一个基础性环节,而本体重用是降低本体构建的复杂性和成本的捷径。 Web本体指在Web上发布的本体文档,是现存本体的主要资源。可以预见Web本体的数量会随着相关研究和应用的发展而持续快速增多。鉴于Web本体的分布性,需要对其进行组织和管理。类似于文本自动分类,Web本体自动分类是指在给定的分类体系下,根据Web本体的内容自动判别Web本体类别的过程。对Web本体自动分类有助于提高Web本体的查询效率,有助于本体的有效管理和重用。但是,目前相关研究工作较少涉及针对本体文档的自动分类,有些研究工作简单地将本体文档作为普通文档来处理,忽略了Web本体具有的明显的图结构特征。 本文调研和归纳了传统文本分类的方法框架和关键技术,深入地解析了Web本体的特性,在此基础上,针对Web本体的结构特征和语言学特征,提出了适用的基于向量空间模型的Web本体分类方法。该方法引入本体虚拟文档的概念,以虚拟文档中的词项作为Web本体用于分类的特征项。基于构造自RDF图的本体的词汇依赖图,采用相关基于图的排序算法,首先得到与构造本体虚拟文档相关的词汇对于该本体的重要性值,进而计算特征项的权值。初步实验表明该方法对于Web本体自动分类具有可行性。
其他文献
随着信息技术和互联网的发展,人们置身于浩瀚的信息海洋,可获取的信息也越来越多,越来越纷繁复杂。人们越来越迫切地希望能够对信息进行标引、提炼与浓缩,以较少的文字表达主
目前,移动互联领域发生着深刻的变革,传统的的技术和设备已经被新的技术和设备所取代。特别是云计算和大数据的出现给整个人类的生活带了巨大的变革。基于此社会的各行各业也都
多核处理器的出现使得多线程技术发展迅速,多线程并发程序的软件质量保障受到业界的普遍关注。多线程并发程序由于线程调度序列(Thread Scheduling Sequence, TSS)的不同,使
当前,微处理器正越来越多地被应用于各种恶劣环境中,但是高能粒子产生的单粒子效应会对微处理器的正常工作产生影响,尤其对应用在太空环境中的微处理器而言,影响更严重,成为
随着网络、数据库技术的迅速发展以及数据库管理系统的广泛应用,人们积累的数据越来越多。数据挖掘(Data Mining)是从大量的实际应用数据中提取隐含信息和知识,它利用了数据
由于人脸检测识别技术在安全部门、电视会议、身份鉴别、数字监控等领域的应用越来越广泛,它作为一项极具发展潜力的生物特征识别技术,已成为近年来科学研究的热点,也已引起
目前,系统仿真数据的计算都是在一台机器上进行计算的。系统仿真数据是用来评价支撑业务系统的网络系统的性能的,这就需要实时的计算系统仿真数据,以便向用户展现业务系统运
在计算机视觉领域,三维重建技术已成为其中的一大研究热点。而基于多视图的三维重建算法又是三维重建技术中的重要一支,该算法的核心思想是以多张对同一物体或场景从不同角度
在军用和其它用途的短波无线电通信中,由于短波无线电通信信道自身的特点以及飞机舱内的环境特点,其噪声来源异常复杂,声学环境极其恶劣,信号质量一般来讲也很差。而目前对截
随着Internet的迅速发展,尤其是World Wide Web的全球普及,Web网络上信息资源己经涵盖了社会生活的各个方面,网络信息过载(Information Overload)问题日益突出,这又促使Web挖