【摘 要】
:
推荐算法是数据挖掘中最重要的算法之一.地点推荐是推荐系统的重要研究内容.针对目前地点推荐面临的数据稀疏、冷启动、个性化程度低等问题,设计并实现了基于Spark并行化处理
【机 构】
:
中国科学院大学计算机科学与技术学院,中国科学院沈阳计算技术研究所,成都信息工程大学统计学院
论文部分内容阅读
推荐算法是数据挖掘中最重要的算法之一.地点推荐是推荐系统的重要研究内容.针对目前地点推荐面临的数据稀疏、冷启动、个性化程度低等问题,设计并实现了基于Spark并行化处理的改进混合地点推荐模型.该算法融合了基于内容的推荐和基于协同过滤的推荐,结合了用户当前的偏好和其他用户的意见.使用基于用户-地点属性偏好的矩阵填充方式,以此改善数据稀疏性问题;同时,对于海量数据,系统采用Spark分布式集群实现并行计算,缩短了模型训练时间.实验结果表明,与其他推荐算法相比,该算法能有效改善数据稀疏性、提升推荐效果.
其他文献
本文基于对南京市江宁大学城大学生对功能一体化校园APP的产品需求分析和校园APP泛滥现象等问题,以大学生的学习、生活、社交中需求的各种功能一体化为设计理念,设计了集校园
现如今,随着时代的进步以及科技的不断发展,人们的生活水平给正在不断提高.互联网做为现代社会的重要产物,正在人们的日常生活、工作过程当发挥着越来越重要的作用,而互联网
旅游业的蓬勃发展,带来了旅游影响的问题。本文以歙县为例,研究了旅游业在发展过程中对其城市功能结构和地区居民生活及文化产生的影响,同时反思了地区旅游业发展与地区社会文化
对于药品生产企业来说,其要想实现GMP,应从厂址与厂区的规划方面入手。本文主要从厂区规划原则、厂区划分、厂区布置、通道设计等方面,对医药厂区项目中选址与规划等的设计理念
图书馆管理的创新应该以人为本,以服务好读者为目标,做到图书管理创新为学生,图书服务创新为读者。该文从图书馆存在的普遍不足入手,阐述了解决高校图书馆存在问题的方法,并进一步
针对天基系统星上处理能力不足、技术落后、无法实现多源数据在轨实时处理等难题,本文提出一个应用于中低轨微小卫星的天基网络化通用服务平台的设计概念,为现在的卫星技术发
基于Space系统(Space Operating System,Space OS)提出了一种叠合式安全机制,该机制在保证安全性的同时具有实用性的特点.首先对系统安全域进行划分,定义了安全机制的要求.提出
交流接触器属于一种用于自动接通或者断开大电流电路的电器,交流接触器能够频繁的接通或者断开交流电路,并且能够实现远距离的控制,其主要控制的对象是电动机,能够用来负载交流接
人类对于饮食的追求是一种价值的体现,中国传统的饮食文化具有一定的养生理念,这是一种具有独特特征的价值追求。现代社会中,人们更关注饮食养生,深入研究中国菜中的养生饮食
高速公路交通标志的合理化和规范化设置对保障高速公路的交通畅通和行车安全发挥着重要作用。如何在高速公路交通标志设置上更好地体现出规范化和人性化,是值得探讨的课题。本