论文部分内容阅读
随着Internet的日益普及和电子商务的蓬勃发展,基于互联网的商业Web站点面临越来越激烈的竞争,商务网站从“以站点为中心”向“以用户为中心”发展成为必然。如何对大量复杂的电子商务信息进行有效的组织利用,从中抽取感兴趣的模式,更好地理解客户的行为,从而改进站点的结构或为客户提供个性化的服务成为电子商务发展必须要解决的问题。Web作为一个巨大的广泛分布的全球信息服务中心,包含了大量动态的超链接信息和访问及使用信息,为电子商务的个性化推荐服务提供了丰富的资源。对Web上包含的有用信息的提取则需要以数据挖掘为基础,因此,将Web挖掘融入个性化推荐之中,是解决上述问题的有效途径。本文对基于Web挖掘的个性化推荐进行了较为全面的研究,开展的工作及创新主要体现在以下三个方面:(1)提出了交叉式Web挖掘的个性化推荐新方法。即在基于Web使用挖掘的个性化推荐中引入Web内容挖掘和Web结构挖掘,并依据改进的稀疏矩阵定义,针对Web站点的不同情况选取不同的推荐方法:正常状态下延用基于Web使用挖掘的个性化推荐;而当用户-项目评价矩阵出现冷开始和稀疏性等问题时,就可以根据页面内容之间的相似性和页面链接之间的相似性来为用户提供个性化推荐。另外,采用一致化的表示形式将Web内容和Web结构挖掘的挖掘结果提供给推荐引擎。(2)提出了基于二分法的改进PAM(IPAM)方法,并将其运用于Web结构和Web内容数据的个性化推荐,IPAM算法有效地解决了传统PAM算法迭代次数多、时间复杂度高的问题;另外,本文在IPAM算法中引入Web结构和Web内容在页面上的权重,从实际出发,使得聚类更具实用性。(3)设计并实现了一个简单的离线状态下的基于Web挖掘的个性化推荐系统。实验证明,IPAM算法较之PAM算法更加有效,解决了其时间复杂度高的问题;基于交叉式Web挖掘的个性化推荐方法可以有效的弥补传统个性化推荐的不足,显著地提高了推荐的精确性。