论文部分内容阅读
随着互联网技术的飞速发展,越来越多的企业和个人开始倾向于在互联网上以Web服务的形式发布信息。如何检索这些信息变得尤为重要。传统的搜索引擎因为搜索结果大都局限在HTML网页的内容部分,要找至真正满足用户需要的服务,是一项极富挑战性的工作。服务搜索引擎应运而生,由于所收集的学科领域小、更新及时,因而有效地解决了通用搜索引擎的弊端,也就能够更好、更精准的满足用户的需求。要能有效的在服务搜索引擎进行搜索,主要是对Web服务内容的分析和索引。本文中,我们提出一种新的服务搜索引擎中服务内容索引的方法,不同于Woogle等基于关键字在服务名称中的匹配的索引方法。本方法从服务名称,接口的名称,复杂类型名称等方面对服务文件进行了全面的分析和索引,并且从这些名称和描述中基于聚类算法挖掘出服务之间的服务的相似度,并为服务进行了语义层次的标注和索引。加强了系统对Web服务的理解,加大了用户在进行Web服务检索时的效率,加大了索引结构的准确度和广泛度,为用户提供一个更加合理、全面的搜索结果。本文首先确定了系统的需求,描述了整个系统的运作力方式及索引子系统所处的位置;接着对服务内容索引和语义索引子系统进行了总体的设计;然后对各个内部模块分别作了详细设计,并且对其中关键技术点进行了详细的说明;最后介绍了系统的部署运行环境,并且分别从功能测试、性能测试、系统部署后的联调测试的角度对系统进行了测试和验证。在论文的结尾,笔者对服务搜索引擎索引子系统的研发过程进行了总结,并提出了论文的下一步研究方向。