论文部分内容阅读
随着IT技术、web2.0技术以及云计算技术等的不断发展,信息超载问题使人们在面对海量数据寻找满足自己需求的信息时变得手足无措;同时,信息检索个性缺失问题是用户体验下降,系统用户流失的重要原因之一。本文介绍个性化推荐技术对解决这两大问题的作用与方法,并通过分析协同过滤算法思想原理及其所存在的不足,提出基于Web挖掘的个性化推荐算法,提高推荐系统的推荐质量与性能。为了解决传统的协同过滤算法中所存在的数据稀疏性、“冷启动”以及用户参与度高等问题,引入Web使用挖掘技术,通过挖掘用户的Web日志,了解用户的行为模式、兴趣爱好并构建“用户-项目”兴趣度矩阵,改变协同过滤算法的数据采集方式和数据表现形式:由显示用户评分转变为隐式用户项目偏好度;其次,为了解决传统的协同过滤算法中相似度计算方法邻居误判问题、无法应对新用户或新项目“冷启动”问题等,引入单点作用度机制,从“用户-项目”兴趣度矩阵整体角度,考察用户向量的每个分量在计算用户相似度过程中的作用并加权影响相似度计算结果;最后,为了优化传统的协同过滤算法中邻居集产生的方法,算法衡量用户间项目推荐重要度的差异,对目标用户的相似用户集进行过滤产生最优邻居集。本文采集南京邮电大学Web服务器日志数据并对其进行Web使用挖掘,构建“用户-项目”兴趣度矩阵作为实验数据源,对基于Web挖掘的个性化推荐算法进行实验仿真与测试,使用MAE、覆盖率、精确率和召回率四个算法评估指标将其与传统的基于PC的协同过滤算法进行比较,实验结果表明,基于Web挖掘的个性化推荐算法具有更高的推荐质量。综上所述,基于Web挖掘的个性化推荐算法通过分析传统的协同过滤算法所存在的问题,从数据源获取、相似度计算方法和邻居产生方法三个方面对其进行改进,引进Web挖掘技术、单点作用度机制和推荐重要度机制提高推荐结果的可靠性和准确性并得到了实验验证。