基于本体的Web信息分类体系标准化研究及应用

来源 :东北大学 | 被引量 : 0次 | 上传用户:cumt12791
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大信息服务网络,是最丰富和最密集的信息来源。与此同时,纷繁复杂的信息资源的组织和显示方式也各不相同,使得用户在浏览和搜索的过程中遇到很大困难。于是,帮助用户快速准确的获取需要的信息、实现“个性化、一站式”服务已成为Web应用领域的迫切需求,Web信息集成技术已经成为研究热点之一。 在海量的Web数据空间中,Web信息通常以网站的形式进行组织,各个网站设置自己的分类目录进行页面归类、导航,形成信息的组织、分类体系。但是不同的Web站点进行分类体系规划时标准不统一,分类用语不规范,存在明显的语义差异,难以相互兼容、合并,更无法提供多站点Web页面的统一归类。因此迫切需要解决Web信息集成中的分类体系语义异构的问题。 为了解决Web信息集成过程中的Web信息分类体系语义异构的问题,本文引入了本体及其相关技术,研究了在基于分类本体的Web信息集成的背景下异构分类体系的标准化方法,提出了基于Web词汇表的Web信息分类本体,实现了异构分类体系的标准化与合并,很好的解决了网站分类信息语义异构问题。 本文研究的重点是实现一种消除Web信息异构性的方法,并将其在具体应用中体现。首先,本文引入了本体的概念和实例,并定义了Web信息分类体系与基于Web词汇表的Web分类本体WCO;其次,本文详细论述了WCO的构建、存储方法以及分类概念节点在WCO中的查找算法,并给出了实例和实验结果;最后,本文详细论述了Web信息分类体系的标准化方法,并给出了网站分类体系合并方法,解决了语义异构问题,实现了异构信息源的信息集成。
其他文献
随着基于Web的企业应用系统的发展,Web 开发在企业应用系统中所占的比例逐渐增大。目前很多基于J2EE框架的企业应用系统中Web开发水平较低,主要表现为开发中的各种逻辑混杂导致
目前,流媒体业务在互联网应用中的不断发展,但是其速度却难以满足网络用户日益增长的需求,内容发布技术与网络硬件设备正在面对严峻的挑战。 本文通过对比分析了传统内容发布
随着企业对工作效率要求的提高,工作流的应用越来越广泛,对工作流的研究也正向更深层次进行。工作流主要分为两部分:工作流模型的创建和工作流的执行。目前工作流建模工具界面
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的课题。从计算机科学特别是从人工智能的观点
受天气预报技术的制约,目前国内市场尚无法提供高精细化的气象信息,在一定程度上影响了我国气象经济的总体规模,但是我国幅员辽阔,容易遭受各种极端天气的危害,相关行业急需不同领
嵌入式系统是以应用为中心,以计算机技术为基础,并且软硬件均可裁剪,适用于应用系统对功能、可靠性、成本、体积、功耗有严格要求的专用计算机系统。在嵌入式系统需求不断增长的
词的分类问题是语言学和自然语言处理中十分重要的研究问题。由一些语义相近的词组成的词类(或词聚簇)可以看成是纷繁的个别词现象到语言的一般概念的映射,而这些概念是更加本
随着电子技术和嵌入式技术的发展,音频数码产品的功能日益强大。从原始的卡带随身听到音乐发烧友挚爱的CD walkman,再到如今人手必备的MP3,MP4,嵌入式音频设备可谓经历了一次历史
目标跟踪是计算机视觉中一个具有挑战性的任务。近些年来,随着深度学习技术的发展,基于单次深度学习的目标跟踪算法受到了人们的广泛关注。基于单次学习的目标跟踪方法指的是
产品质量是钢铁企业的生存之本。企业要想在如今激烈的市场竞争中占据有利位置,首先必须做到“知己”,即对自己产品质量的优缺点有准确的了解。准确了解产品质量,必须建立在对产