论文部分内容阅读
个性化服务是在Internet“信息爆炸”的背景下对“信息过载”和“信息迷航”问题的解决方案,个性化服务将是未来信息服务的主流模式。本文提出了一个基于Web使用挖掘的个性化电子商务网站系统。该系统利用遗传算法结合聚类方法挖掘用户的访问历史记录,将当前用户的访问行为划分到某一类行为模式中,再根据同类访问行为的记录来进行个性化推荐服务。目前基于遗传算法的聚类分析大都是采用定长染色体,生成的聚类数目是预置的。本文在定长染色体遗传算法聚类的基础上提出了一种基于变长染色体遗传算法的聚类方法,能够在不预先输入某些参数(如:聚类数、初始聚类中心、聚类中心间的最小距离等)的情况下动态的输出聚类结果,这样就可以避免参数设置不当而影响聚类结果。与定长染色体遗传算法结合使用,在可以凭经验确定聚类个数的时候使用定长染色体遗传算法,而在经验不足、无法确定聚类个数的时候使用变长染色体遗传算法,这样就兼顾了算法的效率与效果。本系统优点如下:(1)本系统采用了基于遗传算法的聚类挖掘用户访问模式的方法。基于遗传算法聚类的优势在于不用输入初始聚类中心、聚类中心间的最小距离等参数,避免了其他聚类算法对初始聚类中心等参数非常敏感,参数设置不当会影响聚类结果的问题。(2)本系统将定长染色体编码遗传算法聚类与变长染色体编码遗传算法聚类结合应用,提高了数据挖掘的效率和质量。采用变长编码遗传算法聚类,最后输出的聚类的个数是根据样本的具体分布而定的,无须人工指定聚类数目。(3)具有实时推荐能力,随着用户当前访问序列的变化而不断调整推荐集。系统可以将用户的访问序列实时捕获,再动态的将该用户划分到某一类访问模式,这对网上商场等应用很有意义,因为即使是同一个人访问网站,他的访问兴趣和目的也可能不断变化,因而应该推荐不同的产品。(4)该论文的研究以网上商场等电子商务应用为背景,本系统不仅能针对静态页面,而且可以基于动态网页针对产品进行推荐,尤其适合于应用在电子商务等采用了动态网页技术的网站上。(5)本系统在对用户浏览行为的分析和产品实时推荐过程中,不需要用户主动参与,无论用户是否注册了个人信息,或者是否登陆网站,都能够进行个性化推荐,实现了“零输入”的个性化服务。此外,聚类分析中着眼于最终产品,剔除了中间页面对挖掘的影响。并且考<WP=5>虑了访问的序列特性,这种序列性反映的是用户的一种兴趣,有助于改善推荐结果。