论文部分内容阅读
网络技术的发展使互联网成为了一个巨大的数据载体,人们在享用网上丰富信息资源的同时,也面临着“信息过载”的困扰。个性化推荐系统根据用户历史数据为用户提供个性化推荐服务可以有效缓解信息过载的问题,但是由于用户数据十分稀疏,用户之间相似性难以计算,导致推荐效果并不理想。本文通过挖掘用户对物品属性兴趣度,改进用户相似性的计算方法,提高系统的推荐质量,主要工作如下:1.本文首先设计了一种基于Web日志挖掘的个性化推荐策略。通过收集并处理用户访问的web日志数据,对用户浏览、搜索等隐式数据进行分析,挖掘出用户对物品特征属性的兴趣。在计算相似用户时,把用户对物品属性兴趣相似度与用户评分相似度进行融合,设置一个平衡因子β来衡量它们之间的比重,得到用户相似用户集。通过相似用户对目标用户未购买的物品进行预测评分,把预测评分高的物品推荐给目标用户。最后通过实验表明改进后的算法在用户数据十分稀疏的条件下,也能提供精准的个性化推荐服务,相比其他算法,提高了推荐质量。2.设计并实现了一个基于web日志挖掘的个性化电影推荐系统。整个系统主要由日志收集、离线数据处理、在线实时推荐和用户操作四个模块组成。其中日志收集模块主要负责实时监听服务器日志文件,并把监听到的用户访问数据上传给数据处理模块;离线数据处理模块对收集到的原始日志数据进行处理,挖掘用户兴趣偏好、计算用户相似度、找到近邻用户、预测用户评分等;在线实时推荐模块能够根据用户访问对用户产生实时推荐。用户操作模块是用户与系统的交互,分为用户和管理员两种角色,主要包括用户注册登录模块、电影详情模块、电影搜索模块、电影评分模块、查看推荐列表、查看相似用户信息和查看个人信息等。3.对推荐系统功能和性能进行测试:(1)对系统功能进行测试。模拟真实用户对系统进行操作,测试系统功能是否完备,功能是否可以正常运行,返回结果是否正确。(2)对系统性能进行测试。通过ApacheBench性能测试工具,检测系统在高并发情况下的抗压能力,验证系统的可靠性和稳定。