论文部分内容阅读
本体在语义网中起着核心的作用,是语义网中语义的载体。但在很多情况下,不同领域,对许多相同概念会定义出不同的本体,甚至同一领域,不同机构对同一领域定义出的本体也往往各不相同。这就要求有一个高质量的自动映射方法来建立本体之间的对应关系,进而实现用不同本体标注的数据之间的互相转换。在类如跨智能空间的应用中,不单要求本体映射的质量要高,同时要求映射算法有很高的效率。跨智能空间是普适计算实施的一个必经阶段。随着普适计算技术的深入挖掘与推广,智能空间的研究与应用也将从原来的单智能空间阶段逐步扩展到跨智能空间阶段,即无论用户处在哪个智能空间中,都可以充分享受到计算带来的服务。在跨智能空间研究阶段,上下文共享又面临着多项理论与技术上的困难,这是因为对于上下文共享,异构智能空间之间客观存在着语义边界、质量边界和访问边界,其中语义边界指:每个智能空间都需要使用一套语义描述本体,为空间内上下文的共享提供基础。不同的语义描述本体体现了开发者对上下文的认识,而各个智能空间采取何种语义描述本体很难达成统一。因此上下文本体映射是解决上下文本体术语失配的重要手段,也是跨越异构智能空间语义边界的一个重要手段。在跨智能空间的应用中,用户将动态的在各智能空间中切换。由于用户将进入的智能空间无法事先预知,故无法在系统设计阶段完成智能空间的上下文本体与用户的上下文本体间的映射,而只能在系统运行时进行映射。在这种即时映射的需求下,若映射消耗的时间过长,会导致服务响应过期,上下文信息失效,严重影响用户体验。因此,上下文本体映射的效率对于用户成功地进行跨智能空间活动是一个至关重要的问题。本文正是基于以上背景,开展对本体映射的研究工作,具体研究内容包括映射质量方面的一点和映射效率方面的两点:(1)基于概率的映射方法具有坚实的理论基础,但有时难以找到大量的本体实例来计算概率。本文提出了一种基于概率描述逻辑P-CLASSIC的映射方法PDLOM(Probabilistic Description Logic based Ontology Marcher),它利用搜索引擎的统计数据构建出实例在原始概率(primitive concepts)上的分布——贝叶斯网络,然后对概念描述的展开形式(canonical form)使用贝叶斯网络计算其概率。此研究点在第三章中重点阐述。(2)本体映射效率的一个关键因素是候选匹配节点对的个数。针对跨智能空间应用对映射效率的需求,本文提出了本体分割和本体块映射的方法来削减候选匹配节点对,提升本体映射的运行效率。此研究点在第四章中重点阐述。(3)针对跨智能空间应用的服务特点,提出了按需映射方法来进一步削减候选匹配节点对的数目,将一次服务所需的映射时间降至毫秒级,达到服务实时响应的需求。此部分内容在第五章中重点阐述。