基于Hadoop的协同过滤推荐系统研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:Adisc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的高速发展,期间衍生出了一些列改变人们生活的技术产物。其中推荐系统最具代表性,它的出现使得人们不再像过去那样通过搜索引擎从海量的数据中查找自己所需要的信息,而是根据推荐系统主动供的物品信息进行选择。这一局面的改变,得益于人们不断得在推荐算法上进行研究而取得的成果。在推荐领域内,协同过滤推荐算法以出色的推荐效率使得其成为应用最为广泛的算法。协同过滤推荐算法在应用于实际场景的过程中,由于依赖用户行为数据导致无法为新用户进行推荐以及未考虑上下文因素而使得推荐结果缺乏个性化等问题逐渐暴露出来。本文以协同过滤推荐算法作为基础,针对上述问题出基于用户兴趣变化和用户特征的混合推荐算法(Interest Change And User Attribute Based Hybrid Recommendation Algorithm),简称ICUAH算法。主要工作如下:1、对推荐系统中常用的相似性度量方法、典型的推荐算法进行了深入地研究。在此基础之上,对传统的协同过滤推荐算法进行实现以及通过现实的使用场景对两种算法进行对比,为本文的算法改进奠定基础。2、对传统的协同过滤推荐算法中出现的物品冷启动问题、数据稀疏性问题分别结合经典的TF-IDF算法以及交替最小二乘法算法出简要的解决方案。3、将传统的协同过滤推荐算法结合时间上下文因素以及用户特征属性,一方面对用户的偏好、物品与物品的相似性度量方案进行改进,另一方面出对热门物品惩罚权重的方案。从而出基于用户兴趣变化和用户特征的混合推荐算法(ICUAH)。4、使用Java语言对ICUAH算法实现,并利用现有的Movie Lens数据集进行实验评估。由最终的实验结果可得,ICUAH算法高了推荐结果的准确率和覆盖率。5、将ICUAH算法通过MapReduce分布式计算框架并行化,并以其为核心通过使用Spring Boot框架以及Hadoop分布式框架设计和实现一个小型的图书推荐系统。
其他文献
<正> 今年诺贝尔化学奖得主是美国加州理工学院科学家艾哈迈德·泽维尔教授。泽维尔教授应用超短激光闪光成照技术对基本化学反应过程进行了突破性研究。他的贡献使人们对于
本文应用二维、M型及彩色多谱勒超声心动图技术,对200例妊娠期妇女及50例非孕健康妇女,进行了心肾功能的系统对照观察。结果表明,妊娠期肾脏改变,主要表现在肾盂积水。心脏功能的改变主
本文在分析我国钢铁行业产能过剩成因的基础上,提出了化解产能过剩的路径选择。
本文首先简要介绍了自动测试系统及其通用化设计的背景,UML的主要特点和用途,面向对象构框架的概念和基本含义。深入分析自动测试系统通用化设计的基本框架、功能构成和工作原理,利用UML的固有优势对自动测试系统模型进行图形化表达,搭建通用化自动测试系统的元模型框架。本文通过UML中的用例图来进行通用化自动测试系统的需求分析,利用类图和顺序图对系统的静态及动态模型进行图形化描述。自动测试系统的通用化设计可
近年来.天津市东丽区人民检察院自侦工作以争创全国优秀反贪局和全国优秀渎检局为目标.在市院的正确领导下.工作中坚持以执法办案为中心.注重“政治效果、法律效果、社会效果”,狠
天津市公安医院建院于1937年,是隶属于天津市公安局的综合性医院.为天津医科大学的临床教学医院.拥有高级医学专家120名,其中有5名专家享受国务院特殊津贴。医院吸收引进国内外先
近年来关于会计信息失真、会计造假问题受到社会各界的广泛关注,会计诚信问题成为当今经济领域的热门话题,会计诚信缺失的报道屡见于报端,会计诚信缺失的危害日益严重,找出会计诚
1965年,彭德怀在北京挂甲屯闲住6年后,毛泽东在中南海颐年堂约见了他,决定让彭德怀到成都参加西南三线建设的领导工作。于是,这年11月30日,彭德怀乘火车到达成都,担任西南三
对ElGama1型数字签名算法的分析,由于对离散对数问题目前尚未研究出可行的算法,所以基于该问题的ElGama1型数字签名算法的密钥有很高的安全保障。
<正> 本文对66例甲状腺结节进行SPOCT甲状腺核素显像,并与其病理结果对照分析,现报告如下:1.资料与方法 66例患者中女57例,男9例,年龄12岁——66岁,平均42岁。患者静脉注射~(