论文部分内容阅读
软件复用是解决软件危机的一条切实可行的途径。为此,不仅要有可复用软件资源库(以下简称复用库),还要使复用者能高效地找到合适的可复用软件资源。目前存在许多复用库按不同的方式组织可复用资源,并提供不同的检索服务。这些异构复用库间会存在信息共享和可复用资源全局检索的问题,复用库互操作技术就是要研究解决此类问题,它不仅要能帮助复用者从多个异构复用库中检索构件,而且还要允许这些异构复用库可按各自的特点管理和维护可复用资源。
分析已有复用库互操作技术,本文给出了一个分类比较框架,从互操作的对象、交换的信息、核心技术、支持的系统或工具和互操作的效果等五个角度分析比较了现有复用库互操作技术,总结它们的特点和问题。在此基础上,研究并提出了复用库互操作技术系统化解决方案,主要包括:
(1)针对已有的多种构件类型,提出了一种复用库交换信息的描述模型(MEDM)及其描述语言,提供了在线构件和离线构件的基本描述(BCD)、多种构件关系的描述(RD)和表示模型及分类信息的统一描述(CD),并给出了与IEEE的BIDM规范和W3C的UDDI规范提出的数据模型间互相转换数据的方法。
(2)针对异构复用库中术语词典和检索模型的差异,提出了术语相关度的概念,量化不同表示模型的术语间关联程度,与同义词词典相比,更好地利用了术语间语义的相关性。根据相同构件在异构复用库中不同的描述信息及布尔型与向量型两种检索模型的不同,给出了一个自动计算术语相关度的算法,并提出了一个基于术语相关度的多复用库检索方法-改进的相关度匹配和排序方法(IRMR)。通过在实际复用库数据集上的实验,表明IRMR比传统方法有较明显的改善,利用第三方复用库的信息还能进一步改善IRMR的查询效果。
(3)实现了一个基于对等网络技术的层次型复用库互联体系,给出了相关的通讯协议、支持工具和异常处理。在该互联体系中,各复用库结点可采用各自的组织方式,交换的信息需要满足MEDM,并使用IRMR方法实现术语相关度的自动计算、查询请求的转换及查询结果的合并。复用者无需知道复用库互联体系的拓扑结构,就可以使用相应的查询请求检索其它复用库结点中的可复用资源。
综上所述,本文分析比较了现有的复用库互操作技术,使用复用库交换信息的描述模型为异构复用库间交换信息提供了基础;利用基于术语相关度的多复用库检索方法支持全局检索可复用资源;基于对等网络技术的复用库互联体系为复用库互操作技术提供了支持环境;从而,为异构复用库间信息交换和全局检索问题提供了切实可行且有效的方案。