基于Spark的个性化电影推荐系统研究与实现

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:zhangdeyu520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统就是帮助用户方便快捷的找到其所需求的信息,起到连通用户和信息的桥梁作用。现实情况下,由于用户难以对数量庞大的物品都进行评价,无法形成稠密的评分矩阵,不利于推荐运算操作。在基于邻域的协同过滤中需要计算相似度时,可能会因为缺少共同的历史行为信息,使得推荐效果大打折扣。在此基础上本文采用基于模型的协同过滤算法来挖掘出用户与物品之间的隐藏潜在信息,能够有效地缓解数据稀疏性问题。尽管如此依然存在着冷启动问题,当在新电影进入系统后,难以将其推送给需要它的用户。另外,用户的兴趣爱好也会随时间的流逝而发生相应的变化。对于存在着冷启动问题,当在新电影进入系统后,难以将其推送给实际需求者,为此提出了基于融合聚类和矩阵分解的协同过滤推荐算法。通过将聚类的思想融入到传统的矩阵分解推荐算法中从而达到可以缓解该现象的效果,先把一个大且稀疏的评分矩阵分解为两个较小的稠密矩阵,找出目标物品的近邻集合,再使用它们对应的属性通过一定方式填充新物品属性,然后更新矩阵数据信息,进而为用户做出有效的推荐。对于用户的兴趣爱好随时间而会发生变化的问题,提出基于时间因子和物品属性的协同过滤推荐算法。对于人们的兴趣偏好会随着时间的流逝而发生变化的特点,本文用遗忘函数曲线模拟人脑遗忘的过程,在传统的协同过滤推荐算法中,把用户的评分时间因素融入到物品的相似度计算中,再与物品属性相似度结合得到综合的物品相似度计算方式,从而能更加真实的表现出目前的兴趣爱好状态。本文在Spark平台构建一个关于电影的推荐系统,同时也借助Spark MLlib生态库,并将之实现,此系统将从离线、在线以及热门推荐等方面进行设计。本文系统能充分运用用户的隐式和显式行为信息,向用户提供符合其自身特点的推荐。通过进行相应的实验,可以看出本论文所提出算法改进的有效性,以及设计出的推荐系统的可行性,能够满足用户的需求。
其他文献
学位
学位
学位
学位
学位
学位
学位
随着工业机器人技术的应用普及,应用型人才的教学标准、课程开发和实训设备的开发具有重要意义。本文针对现有中等职业学校工业机器人实训设备功能单一,缺乏实用性的突出问题。根据工业机器人系统集成的设计流程,结合真实汽车生产企业中玻璃涂胶的工艺要求和对涂胶机器人运动算法与轨迹的研究,设计了一种基于汽车玻璃涂胶装配这一典型应用的工业机器人实训教学系统。在完成整个系统的集成设计后,通过教学任务中的硬件安装和软件
学位
传统的粗放型发展方式已严重阻碍社会经济的发展,造成了与资源、能源和环境等难以缓解的矛盾。“十三五”时期是全面建成小康社会的战略决胜期,要继续坚持节约资源和保护环境的基本国策,牢固树立节约集约循环利用的资源观,着力推进绿色发展、循环发展和低碳发展。建设资源循环利用基地是发展循环经济的重要载体和有效平台,推进基地建设是我国发展循环经济的重点任务。基于上述背景和国内外相关研究,选取了北京朝阳、上海老港等