论文部分内容阅读
随着二十一世纪电子商务的迅速发展,用户通过互联网进行网络购物的活动越来越频繁,这就促使人们不断改进网络服务来满足顾客的需求。而在电子商务系统中,顾客势必要通过搜索服务进行相关商品的查找。传统的搜索功能大多是基于关键字或者基于一定规则进行匹配,然后返回查询结果给顾客。为了给用户提供个性化的查询服务,个性化搜索孕育而生。在个性化服务帮助下,顾客能够更好的得到查询结果;同时有利于商家增加交易机会,发掘潜在顾客。本文针对目前搜索引擎的不足和当前用户对搜索功能的需求,在深入研究个性化搜索及相关技术的基础上,结合半监督聚类知识,探索了两种实现个性化搜索的方案,并在此基础上实现了一个基于半监督聚类的个性化搜索系统。为此,本文主要工作如下:1)网络爬虫作为自动搜集互联网信息的程序,不仅能够为搜索引擎采集网络信息,而且可以作为定向信息采集器,获取网站特定信息。本文根据正则表达式和对网页结构的分析,用java语言实现了一个网络爬虫系统,爬取京东商城上商品的信息,经过预处理将数据存储到数据库中,作为后续工作的数据源。2)研究了基于属性排序的商品个性化搜索。半监督聚类算法通过引入少量先验知识来指导聚类,可以有效的提高聚类的质量和有效性。本文把用户关注的商品属性信息作为先验信息指导聚类,辅助商品划分,以达到商品的个性化搜索。并利用客观性评价指标和主观性评价对聚类结果进行评价,证实了商品划分的有效性。3)为了更加准确的反映用户的需求,本文把成对约束形式的实例层知识也引入到聚类中,同时结合商品的属性排序知识辅助商品的划分,以实现商品的个性化搜索。主要讲述了成对约束形式的实例层知识的获取和表示,以及如何利用这两种知识实现商品的相似性划分,最后对实验结果进行了客观评价和主观评价。4)结合上述研究工作,基于本文构建的网络爬虫,针对文中提到的两种个性化搜索方案,设计并实现了一款个性化搜索系统。通过对以上问题的研究,本文可以作为电子商务网站实现个性化搜索的一种解决方案。本文的工作可以较好地应用于电子商务领域,能够为电子商务中的个性化推荐技术和销售策略的制定等提供强有力的技术支持和理论基础,同时本文的研究方法还可以为其他相关适用领域的应用问题提供研究思路。