论文部分内容阅读
随着Internet的快速发展和广泛应用,WWW(World Wide Web万维网)已经积累了数据巨大、领域广泛、内容丰富的信息,并成为人们获得信息与服务的重要途径。然而Web信息具有形式多种多样、更新速度较快、冗余垃圾信息较多的特点,也使得Web用户难以快速获得所需的知识信息。如何快速有效满足用户的信息需求,提供高效的信息服务,越来越受到大家的高度关注,并引起人们的足够重视。传统的信息服务方式主要依赖于搜索引擎对Web信息进行检索,将过滤后的信息提供给用户,但这种方法没有考虑到Web用户的多样性,各个用户的背景、习惯、访问目的是不一样的,提供大众化的通用信息服务难以满足不同用户的需求,需要面向用户提供有针对性的个性化信息服务。针对这一问题,本文对基于Web使用挖掘的个性化技术进行了有益的探索和研究。首先,该文介绍了Web使用挖掘理论和应用范围,重点研究和分析了Web使用挖掘的处理流程,概述了个性化服务理论和要求,并对Web使用挖掘在个性化推荐服务中的处理过程进行了深入分析。其次,该文分别以关联规则和聚类两种方式对个性化推荐算法进行了深入研究,在关联规则方式中,分析了Apriori算法的不足之处,提出了剪枝优化和事务压缩改进策略,给出了改进算法应用于挖掘用户频繁访问路径;在聚类方式中,设计了用户页面兴趣度的表示与计算方法、用户使用事务集的形成方法,提出了一种改进的层次聚类算法,并应用于基于用户使用事务集的聚类分析中,给出了结合用户使用文档集的个性化推荐服务策略。然后,该文阐述了基于Web使用挖掘的个性化推荐服务系统的设计思想,分析设计了系统主要组成模块,并对各模块进行了详细介绍,包括用户识别、行为数据收集、用户偏好分析和个性化信息推荐。最后,通过结合中小企业信息化资源平台后台管理系统进行再次开发,在SSH(Struts,Spring,Hibernate)框架上实现了个性化推荐服务系统,并以平台用户的使用记录数据对系统进行了实验分析,推荐服务结果与用户的实际访问情况基本相符,验证了推荐算法的有效性和个性化推荐服务系统的实用性。