论文部分内容阅读
在网络普及下,人们进入了全面的电子商务时代。服装,书籍,电子产品,家用电器,甚至是食物都开始铺天盖地的出现在互联网上。面对网络上出现的琳琅满目的商品,如何使自己的产品脱颖而出,如何使用户挑选出最适合自己的商品,成为了各商家的必争之地。也就是说,在这样的大背景下,不仅仅是提升自己产品的质量,还要关注用户的个性化服务,研究用户的真实意图,获取针对用户更准确的搜索结果。伴随着互联网的普遍应用,搜索已经成为了人们生活中不可缺少的一项行为。搜索引擎也从传统的搜索引擎如Baidu、Google搜索到更广范围下,基于B2B、B2C、C2C坏境下的搜索应用。为了能更好实现用户的搜索,学者开始从文本聚类视角对搜索结果进行处理,本文不仅仅关注如何通过文本聚类获得好的用户体验,更将发展的前提置于当前信息的急速发展,电子商务已经普及到人们的视野中。本文在介绍了当前搜索引擎聚类的不足和文本聚类算法之后,为了更好的满足用户个性化服务,提出KM-BKW聚类算法,并构建原型系统模型,跟踪用户浏览行为,分析用户感兴趣信息,再通过聚类算法返回到搜索引擎界面,使用户获得了一次全新的体验。文章的主要研究内容如下:第一部分通过查阅大量文献,对搜索引擎聚类的起源、发展进行介绍,并对搜索引擎聚类进行分类,对目前搜索引擎聚类的不足之处进行归纳总结、说明。第二部分对文本聚类理论知识进行了详细的介绍。第三部分介绍了搜索引擎信息处理方式。第四部分总结互联网下搜索引擎应用特点分析,创新性提出KM-BKW聚类算法技术。第五部分构建了一个基于KM-BKW聚类算法的原型模型系统,应用KM-BKW算法处理数据,关注用户的个性化服务,得到精确的实验结果。第六部分对全文回顾,发现不足及展望未来搜索引擎结果聚类的发展趋势。