基于Spark的ItemBased推荐算法性能优化

来源 :计算机应用 | 被引量 : 16次 | 上传用户:sdtt1314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MapReduce计算场景下,复杂的大数据挖掘类算法通常需要多个MapReduce作业协作完成,但多个作业之间严重的冗余磁盘读写及重复的资源申请操作,使得算法的性能严重降低。为提高Item Based推荐算法的计算效率,首先对MapReduce平台下Item Based协同过滤算法存在的性能问题进行了分析;在此基础上利用Spark迭代计算及内存计算上的优势提高算法的执行效率,并实现了基于Spark平台的Item Based推荐算法。实验结果表明:当集群节点规模分别为10与20时,算法在Spark中的
其他文献
对65例乳腺癌患者术前术后用zung氏焦虑状态自评量表(sAs)进行测评,并根据结果提出护理对策。认为乳腺癌患者术前焦虑状态严重,对手术恐惧引起的焦虑的护理干预以及对术后丧失部
本文介绍了“临床技能考试系统”以及疾病鉴别诊断原理和过程。对“临床技能考试系统”提出了使用和改进建议。医护工作人员利用相关的系统进行相应的学习和训练,一定可以快速
分组密码算法Zodiac支持3种密钥长度,分别为Zodiac-128、Zodiac-192、Zodiac-256。利用零相关线性分析方法评估了Zodiac算法的安全性,首先根据算法的结构特性,构造了一些关于Zodiac算法的10轮零相关线性逼近,然后对16轮Zodiac-192进行了多维零相关分析。分析结果显示:攻击过程中一共恢复了19个字节的密钥,其数据复杂度约为2~(124.40)个明密文对,
19世纪下半叶,在西方第一次企业兼并浪潮中,发达工业国家就出现了银行资本和工业资本相互融合的趋势。这一特殊的经济现象引起了经济学家们的重视和关注,他们从不同的角度和立场来分析这一经济现象的内在规律与制度特征,开辟了产融结合理论先河。  1903年,拉法格在《美国托拉斯及其经济、社会和政治意义》一文中以“金融资本”一词来描述这种工业资本与银行资本日趋溶合的趋势。列宁是金融资本理论的“集大成者”,他在
针对计算视觉领域图像实例检索的问题,提出了一种基于深度卷积特征显著性引导的语义区域加权聚合方法。首先提取深度卷积网络全卷积层后的张量作为深度特征,并利用逆文档频率(IDF)方法加权深度特征得到特征显著图;然后将其作为约束,引导深度特征通道重要性排序以提取不同特殊语义区域深度特征,排除背景和噪声信息的干扰;最后使用全局平均池化进行特征聚合,并利用主成分分析(PCA)降维白化得到图像的全局特征表示,以
结合工程概况,确定采用深层搅拌桩止水幕墙加喷锚支护的支护方案,介绍了其施工工艺流程,并对深层搅拌桩止水幕墙和喷锚支护的施工工艺过程进行了阐述,从而解决了施工场地狭小的难
智能电网的数字化和信息化建设,对电力载波通信技术提出了更高要求。传统协议标准如G3-PLC已难以适用于复杂、时变、差异性的电网信道,需要对其带宽标准和信道容量进行改进。
为提高医院管理工作的效率,使护理管理达到科学化,信息化、高效化,自动化的目的,研制了护理部信息管理系统,经过应用,取得了良好的效果。提高了工作效率,加强了经常性管理,促进了医院
大肠埃希杆菌为条件致病菌.主要发生于中老年衰弱患者,原有各种慢性基础疾病危重病患者、如气管插管、长期使用皮质激素及其他免疫抑制剂治疗者,长期使用抗生索而致菌群失调者以