基于Spark的ItemBased推荐算法性能优化

来源 :计算机应用 | 被引量 : 16次 | 上传用户：sdtt1314

【摘要】

：

MapReduce计算场景下,复杂的大数据挖掘类算法通常需要多个MapReduce作业协作完成,但多个作业之间严重的冗余磁盘读写及重复的资源申请操作,使得算法的性能严重降低。为提高Item Based推荐算法的计算效率,首先对MapReduce平台下Item Based协同过滤算法存在的性能问题进行了分析;在此基础上利用Spark迭代计算及内存计算上的优势提高算法的执行效率,并实现了基于Spark

【作者】

：

廖彬张陶国冰磊于炯张旭光刘炎

【机构】

：

新疆财经大学统计与信息学院,新疆医科大学医学工程技术学院,新疆大学信息科学与工程学院,清华大学软件学院

【出处】

：

计算机应用

【发表日期】

：

2017年07期

【关键词】

：

协同过滤 MAPREDUCE Spark算法性能优化有向非循环图 collaborative filtering MapReduce Spark algor

【基金项目】

：

国家自然科学基金资助项目（61562078,61262088）,新疆维吾尔自治区自然科学基金资助项目（2016D018014）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

情志护理干预对乳腺癌手术患者焦虑状态的影响

对65例乳腺癌患者术前术后用zung氏焦虑状态自评量表（sAs）进行测评，并根据结果提出护理对策。认为乳腺癌患者术前焦虑状态严重，对手术恐惧引起的焦虑的护理干预以及对术后丧失部

期刊

情志护理干预乳腺癌焦虚状态

对“临床技能考试系统”使用和改进建议

本文介绍了“临床技能考试系统”以及疾病鉴别诊断原理和过程。对“临床技能考试系统”提出了使用和改进建议。医护工作人员利用相关的系统进行相应的学习和训练，一定可以快速

期刊

临床技能疾病诊断临床技能考试系统

Zodiac密码算法的多维零相关线性分析

分组密码算法Zodiac支持3种密钥长度,分别为Zodiac-128、Zodiac-192、Zodiac-256。利用零相关线性分析方法评估了Zodiac算法的安全性,首先根据算法的结构特性,构造了一些关于Zodiac算法的10轮零相关线性逼近,然后对16轮Zodiac-192进行了多维零相关分析。分析结果显示:攻击过程中一共恢复了19个字节的密钥,其数据复杂度约为2~(124.40)个明密文对,

期刊

分组密码Zodiac密码算法线性掩码线性逼近零相关线性分析block cipher Zodiac cipher algorithm linear ma

我国产融有效结合循环经济作用

19世纪下半叶，在西方第一次企业兼并浪潮中，发达工业国家就出现了银行资本和工业资本相互融合的趋势。这一特殊的经济现象引起了经济学家们的重视和关注，他们从不同的角度和立场来分析这一经济现象的内在规律与制度特征，开辟了产融结合理论先河。　　1903年，拉法格在《美国托拉斯及其经济、社会和政治意义》一文中以“金融资本”一词来描述这种工业资本与银行资本日趋溶合的趋势。列宁是金融资本理论的“集大成者”，他在

期刊

经济作用19世纪下半叶国产企业兼并浪潮经济现象工业资本银行资本工业国家

基于显著性语义区域加权的图像检索算法

针对计算视觉领域图像实例检索的问题,提出了一种基于深度卷积特征显著性引导的语义区域加权聚合方法。首先提取深度卷积网络全卷积层后的张量作为深度特征,并利用逆文档频率(IDF)方法加权深度特征得到特征显著图;然后将其作为约束,引导深度特征通道重要性排序以提取不同特殊语义区域深度特征,排除背景和噪声信息的干扰;最后使用全局平均池化进行特征聚合,并利用主成分分析(PCA)降维白化得到图像的全局特征表示,以

期刊

图像检索卷积神经网络深度特征显著性语义区域加权特征聚合image retrievalConvolutional Neural Network(CNN)

浅谈某工程基坑支护的设计与施工

结合工程概况，确定采用深层搅拌桩止水幕墙加喷锚支护的支护方案，介绍了其施工工艺流程，并对深层搅拌桩止水幕墙和喷锚支护的施工工艺过程进行了阐述，从而解决了施工场地狭小的难

期刊

深基坑设计施工基坑监测搅拌桩止水幕墙喷锚支护deep foundation pit support design construction

谈图书馆书刊的清洁与消毒

期刊

图书馆读者服务消毒书刊公共卫生

多频带自适应技术在电力载波方面的研究

智能电网的数字化和信息化建设,对电力载波通信技术提出了更高要求。传统协议标准如G3-PLC已难以适用于复杂、时变、差异性的电网信道,需要对其带宽标准和信道容量进行改进。

期刊

电力载波通信OFDM技术自适应power line carrier communicationOFDM technologyself-adaption

护理部信息管理系统的设计与应用

为提高医院管理工作的效率，使护理管理达到科学化，信息化、高效化，自动化的目的，研制了护理部信息管理系统，经过应用，取得了良好的效果。提高了工作效率，加强了经常性管理，促进了医院

期刊

护理管理信息系统设计应用

10例大肠埃希杆菌肺炎误诊肺结核影像表现分析

大肠埃希杆菌为条件致病菌．主要发生于中老年衰弱患者，原有各种慢性基础疾病危重病患者、如气管插管、长期使用皮质激素及其他免疫抑制剂治疗者，长期使用抗生索而致菌群失调者以

期刊

大肠埃希杆菌肺炎误诊肺结核病例影像表现分析

基于Spark的ItemBased推荐算法性能优化

与本文相关的学术论文