论文部分内容阅读
软件复用是解决软件危机的一条切实可行的途径。成功的实施软件复用,需要大量的软件构件资源。近年来,Web Services作为一种部署在Internet上的新型的服务构件受到广泛的重视和应用。目前在Internet上已经存在着大量的Web Services资源,但是通用搜索引擎并不能很好地支持Web Services的检索,这使得软件开发人员为寻找合适、有效的Web Services资源需要花费很大的代价。
本文首先对Internet上Web Services资源的现状及当前支持Web Services搜索的工具和系统进行了调研和分析,进而针对当前Web Services搜索工具存在的以下问题进行研究与开发:1)当前Web Services搜索工具所涵盖的搜索来源不够丰富;2)为Web Services提供的描述信息不够丰富;3)所提供的查询方式相对单一。
针对上述问题,本文给出了以下的解决方案:
1.Web Services资源收集:采用通用搜索引擎和特定Web Services发布网站相结合的方法从Internet上收集Web Services资源。
2.Web Services描述信息收集:本文提出了一种从Web Services的相关网页中抽取相应描述信息的方法。该方法首先利用Google搜索引擎构造四种相关网页的查询条件,从Internet上获取Web Services的相关网页。
然后借助于向量空间模型的理论,将Web Services的WSDL文档和相关网页中的若干重要文本片段表示为对应的文本特征向量,通过计算二者之间的相似度,挑选出相似度大于事先给定的阈值的文本片段作为该Web Services的描述信息。
3.Web Services的查询:基于Web Services的WSDL文件中包含的文本信息和从Internet上收集到的外部描述信息,本文给出了一种基于文本的查询和基于Tag浏览的检索机制,帮助软件开发人员检索满足需求的Web Services。
基于上述的解决方案,本文设计并实现了一个Web Services搜索工具,并对工具开发过程中遇到的一些关键问题及其解决过程进行了详细阐述。
最后,对本文提出的Web Services描述信息获取方法进行了实验,并且衡量了获取的描述信息与Web Services的相关性,证实了这些描述信息确实可以很好的帮助用户理解和使用Web Services,此外还对Web Services搜索结果进行了统计分析。