论文部分内容阅读
随着Web技术的广泛应用,手机信息化的程度越来越高,基于关键字匹配的手机搜索引擎无法反映Web信息在现实世界中的语义,由此不可避免地导致查准率和查全率低的缺陷;另一方面,目前本体支持的形式化概念还不足以表示不完备知识。因此,在这样的背景下,本文针对目前搜索引擎中存在的问题,提出了一个由资源搜集模块、语义描述模块、语义提取模块、基于Rough本体知识分析和基于本体的SWRL规则相结合的语义推理模块、语义检索/输出模块构成的基于Rough本体的手机领域语义搜索引擎原型系统MPSSE,为用户提供了一种有效获取所需领域信息的新方法。本文研究的主要内容如下:第一,着重研究了语义Web结构中的关键两层:本体和语义Web描述语言——OWL,介绍了语义Web描述语言的结构和语法和Rough理论与本体结合的新概念——Rough本体,以及介绍了基于本体的逻辑推理中的语义Web规则语言SWRL和Jess规则引擎的工作原理,为后续建立领域本体和实现基于Rough本体的推理奠定了基础。第二,通过研究Rough集理论在决策分析领域的应用,提出了一种基于Rough本体知识分析和基于本体的SWRL规则相结合的推理模型。在该模型中,本体被表示成Rough本体的信息系统的形式,利用Rough集工具Rosetta从信息系统中挖掘出潜在的新知识(决策规则),并通过设置支持度阈值和置信度阈值来筛选出较为关键的规则,为手机分类的判断提供了简洁而直接的知识表达。结合Protege以及Jess推理机,利用SWRL创造性地将决策规则转换成推理规则,运用这些推理规则在领域本体库中生成新的知识,将隐含的信息显式地描述出来,为搜索引擎的智能查询提供服务。第三,研究了手机领域本体的内部组织结构,将它的组成元素抽象为概念实体、概念属性以及概念间关系三种类型,通过结合本体的概念蕴涵、属性关联、相互约束以及公理定义,最终形成一个语义关系清晰的网状结构,成为系统在语义和推理上的底层支撑。采用了目前流行的建模工具Protege进行建模,使用了OWL本体描述语言进行形式化描述。第四,探索了语义检索的实现思路,利用B/S模式设计实现了基于Rough本体的手机领域语义搜索引擎MPSSE,并与基于关键字的检索系统Lucene作了比较,试验表明,基于本体的语义搜索引擎系统能有效地提高了系统的查准率和召回率。