基于OpenCL的频繁项集挖掘研究

被引量 : 0次 | 上传用户:hrbwqwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当今信息技术的高速发展,人们日常生产生活中产生的数据量呈现出爆发式增长。因此,对于海量数据集的处理已成为数据挖掘技术的主要挑战。而如何能以高性价比的方式挖掘到有价值的信息是目前数据挖掘研究的新课题。GPU通用计算技术的日益成熟为数据挖掘技术的发展注入了新的动力。GPU通过与CPU截然不同的发展路线,由当初的专用图形处理器一步步走进今天的通用计算领域,并且正在向传统架构的超级计算机发起挑战。很显然,数据挖掘这类计算密集型应用也必将受益于现代GPU所提供的廉价大规模并行计算能力。关联规则是数据挖掘的重要技术之一,而其中的频繁项集计算任务又是整个算法的核心,研究如何利用GPU通用计算技术来加速频繁项集挖掘具有一定的理论与实际意义。本文通过分析与总结过去关于频繁项集挖掘的研究成果,设计了一种基于OpenCL的CPU+GPU异构执行的挖掘算法,利用OpenCL创建大规模并发线程来加速计算Apriori算法中的计算密集部分。实验采用OpenCL的Java绑定接口来具体实现,并选择了同一级别的CPU与GPU用于改进后算法与原算法的性能对比测试。实验结果表明,改进算法对于稀疏数据集有更好的加速性能,并且随着支持度的降低,加速比呈现扩大趋势,最高达到约20倍。另外,本文初步讨论并实验了利用OpenCL的Local Memory机制来对事务数据的访问作进一步优化。不过,最后的测试结果表明这种改进仅对稠密数据集产生了约10%的性能提升。本文在最后还指出了一些未来值得进一步研究与改进的方向。
其他文献
弥散强化铜基复合材料因具有优良的高强高导性能、抗磨损性能以及抗高温软化性能而备受关注。弥散强化铜基复合材料的主要特征是在铜基体中弥散分布着细小的弥散强化相颗粒,弥
世界经济的发展格局日新月异,金融业发展的市场化、全球化、虚拟化情况愈来愈明显,在大势所趋的情况下,我国的银行业也必须要尽快融入金融改革、创新与竞争的大潮之中,通过成
论文分析了黔东南少数民族村寨的旅游资源结构、发展现状以及管理政策,分析了少数民族旅游村寨社区参与旅游开发管理的必要性,以及少数民族旅游村寨社区在旅游资源开发管理中参
在科技飞速发展的今天,智能化的进程越来越快,作为电网重要节点的变电站也不例外,尤其是在国家提出建设智能坚强电网之后,各地区新建了大量的220KV智能变电站。这些智能变电站运行状态直接影响着整片区域电网的安全,若出现大的故障极有可能导致大面积的停电,将会对国民日常生产造成极大地损失。所以必须要保证智能变电站能够安全稳定的运行,故对220KV智能变电站继电保护技术的研究具有重要意义。本文对智能变电站的
在顾客需求多变的全球市场经济环境下,行业竞争已经日趋白热化。正确理解并满足不同顾客的差异化需求,同时合理控制随之而来的综合营运以及管理成本的提高,实行低成本战略已经成
随着经济的发展与城市化进程的推进,城市商业房地产市场需求不断增长,加之商业房地产高额回报率的驱使,众多房地产投资者、开发商和经营者进军商业房地产领域,掀起一股商业房地产
经过30多年的发展,我国旅游事业的发展取得了巨大的成就,旅游业在国民经济中的战略地位越来越突出。然而,与我国旅游事业的快速发展不同步的是,我国旅游开发建设水平和层次却远远
制造业在我国工业结构中占有重要地位,是工业化阶段的重要产业,其地位不容忽视。长期以来,我国制造业发展的一个重要条件是大量低成本的劳动力。但目前劳动力成本不断上升,已成为
紫外光谱的λmax及εmax受电子效应空间效应 ,溶剂效应的影响所呈现的规律