大数据环境下基于协同过滤的推荐系统研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:bd05082052
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统是一种能够主动挖掘用户兴趣偏好,为不同的用户制定个性化的推荐列表,提供个性化推荐服务的智能化系统。协同过滤算法是一种发展较早、应用广泛的个性化推荐算法,目前比较流行的包括社会化推荐算法与概率矩阵分解模型。前一种算法通过融入用户社会属性,提高用户偏好刻画的准确性,后一种算法通过机器学习的方法得到用户、项目的特征,具有较高的准确度。但是,如何拓展有限的社会关系和如何揭示用户之间相互作用对用户特征的影响都还有值得研究和改进的空间。另外,大数据时代的到来,海量数据的处理对推荐系统的计算与存储能力带来了严峻的挑战。由于传统的推荐系统通常运行在单服务器条件下,分析计算能力有限,已经不能满足有效处理爆发式增长数据的需求。针对上面的问题,本文提出了两种新的协同过滤算法,在Hadoop平台实现并行化计算以提高计算效率与存储能力。另外,研究并实现了一个结合Hadoop相关技术和本文所提推荐算法的具有处理海量数据能力的推荐系统。本文主要工作总结如下:1.大数据环境下的社会化推荐算法。该算法在协同过滤中引入社会信任关系,并且挖掘出更多的可信任关系。对于用户之间的信任关系,需要区分项目类别,在各类别下通过社区发现方法发现信任社区作为目标用户候选可信任用户集,以扩展目标用户可信任用户集。再根据候选可信任用户在项目类别下评价的专业性和该用户与目标用户评分的相似性,定义候选可信任用户的信任度。根据信任度得到目标用户可信任用户集,从而得到推荐结果。最终给出算法在Mapreduce编程模型下的并行化实现。2.大数据环境下基于概率矩阵分解的个性化推荐。在该算法中把用户对项目偏好的相似度定义为两部分:用户对项目的评分相似度和用户对不同项目类别的关注度。根据相似度对用户进行聚类,并把用户近邻信息融入到概率矩阵分解模型以揭示用户互相影响关系。再根据聚类结果对用户、项目进行分组并组合,调整更新序列,分别在Spark和MapReduce计算框架下实现并行计算。3.在Hadoop平台,利用本文提出的推荐算法和Spark计算引擎实现了电影推荐系统。该系统具有较优的可扩展性,能够存储和计算海量的数据,能够达到较高的推荐精度,提供良好的用户体验。本文通过对上述研究内容和创新点的讨论,深入研究社会关系和概率矩阵分解模型,结合分布式计算技术提出具有较高推荐精度、可并行计算的推荐算法,并设计实现结合Hadoop相关技术的推荐系统。实验结果表明,所提出的算法可以提高推荐精度并降低计算时间,为进一步研究个性化推荐算法提供帮助。
其他文献
数学分析课程是数学专业的核心基础课,该课程具有高度的抽象性、严密的逻辑性和科学的系统性,从而使得大部分大一新生在学习该课程时遇到较大的困难,导致难以达到很好的学习
建立兼职审计人员库,在管理过程中引入卓越绩效管理模式,通过自我评价、综合诊断、改进提升、总结固化的阶段性工作,逐步形成动态审计人员库,以一个县公司或一个部门为整体,
虽然我国房屋安全鉴定管理工作越来越受到人们的重视,且技术、方法也有了很大的进步。但是房屋安全鉴定管理中仍存在着许多问题。文章就此展开了讨论,先是结合实际分析了其中
九十年来,中国共产党社会救助理论创新的经验主要有:在社会救助工作目标的定位上,以人为本,坚持生命第一的原则;在社会救助主体的认定上,坚持政府与社会协同联动原则;针对社
<正>半夏是我国中药宝库中的重要药材,产地只有亚洲的中国和日本。其功能是燥湿化痰,和胃止呕,主治痰湿水饮,呕吐,咳喘等症。该物种为我国植物图谱数据库收录的有毒植物,其毒
基于HTML 5Canvas技术研究并实现了一个新型在线流程图协作绘制平台,其优势主要有:数据集中存储在云端,方便共享与协作;可自由定制任务节点的元信息,为节点增加绑定附件的功
随着法制建设进程的加快,法学专业教学备受关注。一方面是因为其与时代的融合与接轨属性,满足人们的诉讼需求。另一方面是法学专业毕业生就业难的实际。因此就业背景下法律教
随着人与空间之间情感的加剧,导致了环境空间越发趋向于情感化、人性化、个性化以及具有创造性的空间环境设计。在环境空间设计中,要明确了解使用者的情感需求以及环境空间的主旨,才能将“情”与“趣”更好的融入,从而创造出有意义的设计。使空间更具有人性化,更符合现代人审美需求,使人能与空间进行情感的交流和趣味的体验,空间环境能更好的释放自我,回归自我。本论文将环境空间设计中“情”与“趣”的营造作为主要的研究内
大多数学校体育器材室没有专职的管理员,基本上都是由体育老师兼职,特别是广大的农村学校,成为多数学校体育器材管理比较薄弱的环节。这就要求体育老师在完成每周十几节课时以外
本课题通过模拟试验研究化学沉淀法去除养猪场废水中氨氮污染物的效果,并通过正交试验得出工艺控制条件:Mg∶N=1.2,P∶N=1.05,pH值=10.0,搅拌时间15min,搅拌速度100转/分钟,