并行挖掘相关论文
传统数据并行挖掘算法忽略了对数据特征的聚类,数据边界特征点无法得以融合,导致数据挖掘收敛性较差、精度偏低。文章提出基于并行......
本文介绍了关联规则的基本概念和串行挖掘算法,描述了活动网络技术的框架,在CD和DD算法的基础上,介绍了两种新算法—AN-CD和AN-DD......
从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角......
频繁模式是数据挖掘研究关注的主题之一,在图数据挖掘中,频繁模式需要在其模式中嵌入结构,其在图数据中的应用主要为从图数据中挖掘频......
文档作为一种重要的大数据类型,蕴含着丰富的有价值的数据,其具有非结构化、样式不固定、数据混杂、价值稀疏等特征。针对文档大数据......
随着近年来食品安全事件的发生,人们越来越关注食品的安全问题,然而由于基础能力和业务建设能力存在不足,食品安全领域依然面临着......
数据挖掘作为二十一世纪最热门的研究领域之一。随着数据挖掘技术的不断发展,人们已经开始能够从无规律的数据中挖掘出易于理解、......
随着电力通信网的快速发展,其网络拓扑结构越发复杂,所承载的网络设备也越来越多,导致电力通信网的故障种类和数量不断增加,告警信......
随着计算机技术的发展和互联网的普及,在生活、社会生产、科学研究上,数据的作用越来越重要。从海量数据中获取有效信息可以帮助我......
随着数据库技术和计算机技术的不断发展,其应用范围越来越广泛。在企业资源管理系统中产生海量的与企业管理与日常运营相关的数据......
序列挖掘一直为数据挖掘中一个非常重要的分支,从Agrawal和Srikant在1995提出序列的概念之后,越来越多的学者投入到这个课题的研究......
本文对面向人侵检测的数据挖掘研究进展进行了阐述,分析了当前数据挖掘在人侵检测中面临的问题和对策,探讨了将并行挖掘、数据流挖掘......
本文介绍的pSPADE算法,应用于大型数据库的关联规则频繁序列的快速挖掘.pSPADE将原始搜索空间分成更小的基于后缀的类.每一个类可......
基于Web的数据挖掘处理的是海量数据,对这些数据进行分析处理的工作量相当大.为达到快速、高效地完成数据挖掘,重点研究了使用多线......
数据挖掘并行算法,应该以不牺牲挖掘效率和挖掘质量为前提.通过对数据挖掘原理和并行化的深入研究,在考虑到挖掘效率,负载平衡,运......
提出了一种在微机集群上实现的高效并行算法.该算法利用矩阵理论中上三角矩阵的良好性质,通过数据库约简、投影等操作,在微机集群......
互联网犯罪问题日益严峻,云取证也存在数据取证效率低、完整度不高问题。由此提出一种基于并行挖掘大数据的无损云取证模型。把较......
序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并......
针对海量数据难处理的难题,利用Hadoop平台下的Map-Reduce模型,实施了一种改进的对海量数据进行并行处理的K-means算法.为了解决传统......
FP—Growth算法的效率约比Apriori快一个数量级,但存在FP-tree可能过大和串行处理等两大缺点,为此提出了基于局部FP—tree的并行关联......
为提高频繁模式树(FP)的关联规则挖掘性能,论文提出一种FP树的并行挖掘算法,即将FP树进行逐步分解,分解过程中进行剪枝和合并,得到各个简......
基于多Agent的数据挖掘技术,不仅能够针对不同的Web数据综合采用不同的挖掘算法,而且可以在各站点进行并行挖掘,避免Web通信量过载......
序列模式在许多领域都有着重要的应用,大量的数据和模式需要高效的、可扩展的并行算法.针对目前序列模式挖掘算法存在的普遍问题,......
大数据技术的快速发展,现有的离群挖掘算法效率可能显著下降甚至不适用。Spark内存计算可以有效地降低I/O成本,并能提高数据分析和......
从多方合作挖掘分布存储在不同计算站点上多个数据库表而不泄露各方原始数据信息的目的出发,对于每个站点拥有多个数据表的分布式......
基于多Agent系统的数据挖掘技术,能够综合应用多种挖掘算法,实现数据挖掘的并行操作。在简述了几种主要的数据挖掘技术的基础上,提出......
向量处理是计算机的优势,将事务数据库转换为向量矩阵,并对其进行关联规则挖掘,不仅可以充分发挥计算机的优势,而且提高挖掘的效率......
针对传统大数据并行挖掘方法是一次性对所有数据进行挖掘,导致挖掘时间较长,挖掘精度较低等问题,采用量子计算对增量式大数据并行......
针对智能用电数据挖掘面临数据量大、挖掘效率低等难题,进行Map-Reduce模型下基于改进k-means的海量用电数据分析研究。以家庭用户......
随着信息技术的迅速发展,GPS以及带有定位功能的移动终端应用到各个领域中,此外,移动互联网的迅速崛起进一步推动了基于位置服务的......
本论文研究工作是针对中国国家电力集团总公司信息管理系统中信息分析和预测的需要而进行的,主要研究内容和工作成果如下:(1)为进......
随着计算机和数据库技术的迅猛发展,人类进入了信息时代,收集、存储数据的能力大大增强,传统的数据分析工具已经满足不了人们的要......
FP.Growth算法是基于FP树挖掘频繁项目集的经典算法,为提高FP.Growth算法挖掘大规模数据频繁项目集的效率,提出了一种基于FP.Growth的频......
随着现代社会的发展,网络在人们的生活和工作中占有越来越重要的地位。如果网络的运行态势发生恶化,将会给人们的日常工作和生活带......
随着电力网的不断发展,电力通信网规模逐渐壮大,其承载的业务也越来越多,早期的故障处理方法已经不能满足日益提高的网络故障管理......
目的提出基于关系代数理论的关联规则挖掘算法.方法利用数据预处理方法,剔除无关属性、获得相应的目标特征子集.结果基于目标特征......