大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现

来源 :电子设计工程 | 被引量 : 0次 | 上传用户:JoanFang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高大数据环境下的数据挖掘速度,对分布式计算构架Hadoop进行分析与研究,提出一种基于Hadoop平台的大数据关联规则挖掘算法MRPrePost。该算法在PrePost算法基础上改进而来,采用Hadoop平台降低分布式编程的难度且易于管理,通过一种自底向上的深度优化策略改进PrePost算法,降低内存开销,同时采用负载均衡的分组策略,来提高并行算法的性能,最终试验表明,该算法运行速度快,适应大数据关联规则挖掘。
其他文献
<正> 癫癎是严重危害人类健康的常见病、多发病,引起癫(?)的病理机制复杂。目前一氧化氮(NO)参与癫(?)的发作已得到公认,但具体机制不明,现就NO与癫(?)的最新研究进展综述如
目的探讨微创穿刺引流向血肿腔内加用肾上腺素、立止血治疗急进型高血压性脑出血的疗效、手术时机、防止再出血的效果.方法选择符合急进型脑出血的病例,应用微创穿刺血肿引流
通过投加Mn2+改善了大豆废水中紫硫菌产量。结果表明,最佳Mn2+剂量为10 mg/L,菌体产量达到5000 mg/L。
介绍了Modal/Richcel/棉混纺灯芯绒床品面料的开发、工艺控制及生产实践的技术要点。通过选用合适的工艺,解决了产品在生产过程中遇到的难题,提高了产品的质量,保证了生产的顺利进
德育工作对于教育事业来说是一项十分重要的教学环节,它需要渗透到学生们学习生活中的各个阶段,同时对于学生们的道德教育工作不能仅仅由学校团委工作者独自完成,还需要各科
目的探讨低分子肝素治疗急性脑梗死的疗效及护理对策.方法将80例急性脑梗死病人随机分为两组.治疗组应用低分子肝素,对照组应用复方丹参注射液静滴.结果治疗组总有效率为92.5
婴儿晚发型维生素K缺乏症在临床儿科较为常见,起病急骤,病情重,预后不良,国内外文献常有报道.但在颅脑CT方面,国内文献报道少见,现将近年来我院收治本病患者中,8例做CT检查报
血管性痴呆(VD)是因脑血管疾病所致的智能及认知功能障碍临床综合征.居老年期痴呆的第二位疾病,是目前唯一可预防和治疗的老年期痴呆病.本文就近5年来收治的VD患者65例进行临
随着科学技术的不断进步和应用,电子设备的智能化和虚拟化不断发展,设备的复杂性也在不断增加,为了保证电子设备的安全和正常运行,与传统的电子故障检测技术相比,智能故障检
目的 探讨应用钛网修补颅骨缺损的临床经验。方法 全组16例均采用全麻,术前、术中、术后均合理用药,修补时精确塑形,使边缘紧贴颅骨。结果 全组切口均一期愈合,无并发症出现,随访3