论文部分内容阅读
本文研究了搜索引擎技术,总结了搜索引擎的发展历史,分析了搜索引擎的工作原理,描述了搜索引擎的分类,阐述了搜索引擎的评价标准以及未来的发展,剖析了当前搜索引擎存在的检索结果不理想的问题;基于元搜索引擎的原理,提出了一种Web文档获取方法。采用向量空间模型(VSM)表示Web文档,进而采用一种改进后的TF-IDF公式计算向量空间模型中每个词条的权重;引入了概念格知识,在此基础上介绍概念格的构造方法,以及基于概念格的规则提取方法。通过这些技术能够创建用户的个性化模型。在上述技术的基础上,本文设计了一个基于概念格的个性化搜索引擎的模型系统。分析了该系统的系统结构,详细介绍了各个模块的功能以及关键算法的实现,给出了部分代码。最后分析了该系统尚待解决的问题以及未来的发展方向。