基于Spark的个性化推荐系统的研究与实现

来源 :电子科技大学 | 被引量 : 12次 | 上传用户:hgscmey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据背景下,现代互联网的高速发展每天都会产生大量数据,对海量数据的挖掘分析并提取出具有价值的信息是一项具有深远意义的研究。如何从海量数据中挖掘有价值的信息具有重大研究意义。大数据时代资讯极度丰富,信息过载问题日趋严重,用户需要花费大量的时间来选择自己感兴趣的信息或者物品。如何快速、准确的找到自己关心的信息已变得越来越难。为了解决这一问题,个性化推荐系统应运而生。由于需要从海量数据中筛选有价值的信息,推荐系统需要分析的数据量十分庞大。如何能准确、实时的响应用户需求,这就要求推荐系统具有很强的数据挖掘分析能力。近些年出现了较多的开源大数据处理框架,目前主流的框架包括Hadoop和Spark。Spark是新一代并行计算框架,已经成为大数据处理领域的研究热点。将推荐系统构建在Spark框架之上,结合Spark强大的大数据处理能力,借助其内存计算的优势,将大大提升推荐系统的性能。本文主要研究了基于Spark框架的个性化推荐系统的设计与实现,并针对算法中的一些不足进行了改进。本文的主要研究工作包括以下几个方面:1)分析了几种目前主流的推荐算法的实际应用场景以及特点,并改进了算法存在的不足。主要分析了协同过滤算法,基于内容的推荐算法和基于SVD的推荐算法。2)结合列式存储文件类型Parquet设计并实现了一个高效的数据仓库,满足推荐系统在计算过程中快速读写查询需求。该数据仓库是本文实现推荐系统的基石,大大提高了其计算效率。3)利用Spark的编程模型设计并实现了四组推荐算法,结合Spark并行化计算能力,设计实现了与之对应的四组推荐引擎。通过增加项目-属性特征改进了基于项目的协同过滤算法,其性能得到明显提升。4)根据上文实现的四组推荐引擎,将他们组合设计了一个混合推荐模型。通过动态调整参数,在不同的场景中组合选择不同的推荐引擎。混合推荐技术可以提供更加个性化的推荐服务。
其他文献
目的:探讨Philips 16层螺旋CT造影检查明确诊断小儿复杂性先天性心脏病的方法并与心脏超声检查比较。方法:对10例复杂性先天性心脏病进行了术前CT造影检查;选择非离子型370碘
报道了苦参中五种主要生物碱——槐果碱、苦参碱、槐定、氧化槐果碱和氧化苦参碱的高效液相色谱测定法。用氨基键合相柱,乙腈—磷酸水溶液(pH 2)—无水乙醇(80:8:10)为流动相
随着癌症分子机理研究的深入和基因转移技术的快速发展,一种癌症治疗的新方法——基因治疗,已开始从理论研究向临床试验过渡。本文着重介绍通过体细胞基因转移治疗癌症的各种
养殖场恶臭一直是养殖场污染治理的难点。近年来,越来越多的研究者关注养殖场的空气质量问题。一方面,养殖场臭气会严重危害环境(如温室气体)、抑制经济的发展(如周边住宅和
<正>体外授精-胚胎移植(in vitro fertilization embryotransfer,IVF-ET)俗称试管婴儿,就是使卵子和精子在实验室的条件下授精,经过培养形成胚胎,然后植入子宫腔的一种技术。
目的紫杉醇壳聚糖聚合物胶束的制备及表面电荷对其在小鼠体内组织分布的影响。方法采用透析法分别制备紫杉醇阳离子(PTX-CCM)和阴离子(PTX-ACM)壳聚糖聚合物胶束;昆明种小鼠
<正>手指l区伸指肌键断裂或撕脱引起的远侧指间关节屈曲畸形称为锤状指[1]。通常患者对保守治疗效果效果不满意,常需要手术治疗。锤状指的治疗常用的方法包括肌键直接缝合法
目的 通过研究一系列带电性不同的蒙脱石与细菌相互作用 ,探讨蒙脱石与细菌作用的机理。方法 抑菌实验 :在含不同浓度蒙脱石的混悬状的平板培养基上 ,接种浓度 1× 1 0 6·
对韩玲娣治疗不孕症临床经验进行总结,介绍其治病特色.韩玲娣治疗不孕症强调辨病与辨证相结合,据月经周期,因势利导,补肾及身心同治等方法,取得很好的临床效果,值得临床推广