基于本体的制造业领域Web信息集成

来源 :广西师范大学 | 被引量 : 0次 | 上传用户:guyunlong0811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet和Web技术的发展,WWW已经发展成为包含多种信息资源、站点遍布全球的巨大动态信息服务网络,为用户提供了一个极具价值的信息。通过Internet和Web技术,人们可以很容易地访问互联网上各种各样的数据。但由于Web信息是无结构化的,没有明确的语义,因此用户获得有用的信息越来越困难。目前的搜索引擎技术是基于关键词简单匹配,己经不能满足人们快速、准确得到信息的要求。为了能有效的利用Web上的信息资源,使Web能真正成为人们随时可用的知识库,人们提出了Web信息集成的概念,其目标是为用户提供完全透明的、智能的、统一的信息访问接口。本体最初用来描述事物的本质,后来随着人工智能的发展,本体被赋予新的定义。在Web信息集成方面,本体常用于将某个或多个特定领域的概念和术语规范化,为异构Web数据源集成提供统一的概念和术语标准,减少了因为Web数据源采用不同命名造成的语义冲突。在一定程度上解决语义异构的问题,进一步提高了系统的精确性,为用户提供更有价值的信息。本文作为广西科学研究与技术开发计划项目(编号:桂科攻0719001-11)的组成部分,以制造业中汽车领域Web信息为例,研发基于本体的汽车领域Web信息集成平台,全文以基于本体的Web信息集成这条线索进行研究,研究领域本体的构建、基于语义的Web信息抽取和查询。本文的主要工作和创新点如下:首先,本文使用OWL DL本体语言建立一个汽车资讯领域的本体模型。在分析Web网站的特征之后,根据网页可转换为DOM树结构的特点,利用汽车资讯本体关键词,进行页面区域定位,提取页面正文内容。其次,对提取的页面正文内容进行语义抽取,在传统的向量空间模型基础上结合领域本体,根据本体的层次结构特征对概念特征向量赋权重值,生成基于本体的概念特征向量,半自动化地生成本体知识库实例。利用本体,使概念特征向量具有更明确的语义,同时降低了向量模型维数,减少了计算的复杂度;将无结构化网页的文本变成具有语义的、机器可理解的结构化信息。然后,在已建立领域本体的基础上,本文设计了基于本体的查询推理算法,该算法以OWL本体为基础,利用描述逻辑的推理能力,对查询关键词进行概念扩展,再进行实例匹配。为把最符合的结果优先显示给用户,本文对扩展概念赋权重,设计一个基于本体的相关度排序算法,该算法比传统的向量空间模型相关度的算法效果要好,且效率要高。最后,根据研究的关键技术,本文实现了一个基于本体的汽车资讯领域Web信息集成平台原型。该平台使用了描述逻辑推理机提供的推理服务,实现了基于语义的Web信息抽取和查询推理,并对系统进行测试分析,给出了实验结果,表明这种方法的技术可行性,具有实际应用前景。
其他文献
专家搜索是信息检索的重要研究内容之一,属于实体搜索的范畴。目前实体搜索的研究内容更多关注于实体抽取和排序算法的探索和改进,对实体相关性的研究也多关注于相关性本身,
随着计算机和数字技术的快速发展,数字图像已成为计算机视觉领域的重要存储和视觉信息传递的方式。但在实际成像过程中,由于受客观条件等因素的影响,使得最后获取的图像往往
由于多种原因,高校中的实验教学效果普遍较差,特别是IT行业。教材中的内容-般都落后于实际科学技术的发展,许多在实际工作中应用的技术,无法从教材中学到。由于资金短缺,仪器
近年来,随着Internet的迅速发展,网络安全问题显得日益突出。目前,网络上的攻击方式逐渐呈现出一些新特点,从以前大规模的,无特定目的的网络攻击转为小规模的,针对特定用户和
近年来,随着全球信息化进程不断深化,尤其是计算机网络技术的快速发展,基于Internet的电子商务发展迅猛,引起了产业界和学术界的极大关注。支付作为商务活动的一个重要环节,能否较
中国贸易地图从市场供给与需求相结合的角度对贸易和市场状况进行分析,并把供给与需求两种因素放在同一图表上表现出来,使抽象的贸易和市场分析理论变得直观易懂。应用贸易地
“校园网可信运行保障系统接入控制研究”是北京市科委计划项目“校园网可信运行保障系统研究”的子课题,它是基于可信网络架构思想提出的。校园网可信运行是指通过对校园网
好友推荐算法的研究与应用是关于社会化网络推荐的一个热点问题。传统的好友推荐算法有基于共同好友的推荐和基于物品的协同过滤推荐,虽然两者的性能在特定的情景得到了业界
普适计算自20世纪90年代起至今,已取得了长足的发展。从普适计算的定义可以看出,“随时随地”和“透明”是普适计算的本质要求,这两个本质要求同时都具有动态性和模糊性这两
烟气脱硫系统具有强藕合性、不确定性、非线性和大纯滞后等特征,是过程控制中一种典型的控制对象。通过对烟气脱硫控制系统的研究,可以提供烟气脱硫控制系统在工业过程控制中的理论研究和实际应用指导。本文针对火力发电厂烟气脱硫控制系统的特征以及PKS系统自带的算法库并不能很好的解决所遇到的问题,设计了基于参数自校正的模糊PID控制系统,主要研究内容包括以下几个方面:本文首先介绍了国内烟气脱硫系统控制技术的发展