论文部分内容阅读
协同过滤算法已经广泛应用于推荐系统中,而基于协同过滤的推荐算法之关键是相似度计算。虽然已经有许多成熟的相似度计算方法,但是基于协同过滤的推荐算法在数据稀疏的情况下表现并不令人满意。同时,新用户或新物品的“冷启动”问题是基于协同过滤的推荐算法中存在的另一个问题。针对这些问题,本文提出了两种改进算法,在实验数据和实际应用中取得了良好的效果。首先,本文研究了九种已知的相似度算法,并根据这九种已知的相似度算法的设计思想提出了一种新的相似度算法PSJ(Proximity-Significance-Jaccard),它考虑了用户评分差值、用户全局评分偏好和用户共同评分物品数三个因素;同时它的Proximity因子使用指数函数反映用户评分差值对用户相似度的影响并避免了零除问题;另外,将NHSM(new heuristic similarity model)方法中的Significance因子和URP因子合并成它的Significance因子,这使得它的计算复杂度低于NHSM方法;而且,PSJ考虑了用户间的评分差值和用户全局评分两个因素提高在数据稀疏情况下的推荐效果,实验结果证明PSJ相似度算法相对于对比相似度算法可以提升推荐效果。其次,针对基于PSJ相似度算法的协同过滤推荐方法在数据稀疏度达到99.99%时表现不是很理想,同时该方法存在的新物品的“冷启动”问题。本文基于矩阵分解算法能够提升推荐系统在上面两种情况下的推荐效果,提出了一种基于PSJ相似度算法的矩阵分解推荐算法。该方法首先使用PSJ相似度算法计算用户相似度,然后使用矩阵分解算法处理用户-用户相似度矩阵,最终根据用户-用户相似度矩阵产生推荐结果。经过实验证明新方法相较于基于PSJ相似度算法的协同过滤推荐算法能够提升推荐效果最后,将两种推荐算法应用到了专注于篮球运动社交网络平台“我奥网”的好友推荐功能上,这个平台拥有大量注册用户的职业生涯数据记录和联赛数据记录,本文的推荐算法通过使用用户比赛数据计算用户之间的相似度,最终为用户推荐和他运动数据相似的用户,帮助用户找到和他运动思维相似的好友。