论文部分内容阅读
面对大数据的时代,怎么从杂乱无章的信息海洋里准确的推荐给用户感兴趣的信息,这将是推荐算法研究的主要任务。最为经典的两个推荐算法是基于内容过滤和协同过滤推荐算法,但再经典的推荐算法也有自己的缺点。数据稀疏性和冷启动是协同过滤推荐算法的主要问题。基于内容过滤的推荐算法有一个比较严重的问题,那就是新用户问题,因为该算法并未考虑用户的兴趣改变对推荐效果的影响。当系统中新增一个用户时,新增用户的历史浏览记录是不存在的,它将无法对新增用户做出正确的推荐。针对这些,本文提出一种结合了用户兴趣和领域最近邻的的混合推荐算法(UIDNN),用于个性化服务推荐。首先,考虑用户的兴趣偏好不是永远不变的。用户的兴趣偏好随着时间的变化跟人类对于基本事物的遗忘规律很类似。引入非线性逐步遗忘函数求取用户对商品项目的兴趣度。然后根据用户-商品属性标签集合形成用户-兴趣度集合,对用户-商品项目评分集合中未评价商品项目采用平均值法进行填充、已评价商品项目进行互补形成用户-兴趣度矩阵,降低了数据的稀疏性。其次,引入"属性领域最近邻"方法查找目标用户的最近邻,在查找最近邻居时,根据用户-兴趣度集合去降低算法的在线计算量。这种做法主要是通过判断目标用户的邻居有没有这个推荐能力,从而不去考虑那些对目标用户无推荐能力的用户。预测未评价商品评分,采用用户-兴趣度集合的余弦相似度计算用户的相似度;最后把与目标用户相似度大小在前N位的项目推荐给目标用户。基于这些对目标用户进行推荐。通过实验,本文提出的基于用户兴趣和领域最近邻的混合推荐算法(UIDNN)跟相似度计算方法为皮尔逊相似度(Pearson)、余弦相似度(cos)两种传统的基于用户的协同过滤推荐算法进行比较平均绝对误差(MAE),由实验结果图可以看出,本文提出的基于用户兴趣和领域最近邻的混合推荐算法(UIDNN)有较小的MAE,说明本文提出的UIDNN算法有较高的推荐质量。