基于K均值聚类的大数据频繁项集挖掘研究

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:ghostraider
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统大数据项集挖掘方法存在占用内存较多、挖掘效率较低的问题,提出新的基于K均值聚类的大数据频繁项集挖掘方法。通过对K均值聚类的区间标度变量、二元变量等相似度量的分析来表示样本之间的相似度与离散度,根据样本数据的不同属性选择对应矩阵类型;利用频繁项集自身的约束性质压缩空间,缩小挖掘范围;在K均值聚类基础上,采用fg-growth算法将目标数据高度压缩在fp-tree结构中,并命令原始聚类质心和数量,将其作为K均值的输入,实现大数据频繁项集挖掘。仿真结果证明,研究方法有效降低了挖掘计算复杂度,可保证
其他文献
本文采用BP神经网络的方法,以过去七年的数据为基础,实证研究了天然气生产成本,并对未来三年的生产成本与损益进行了预测,实证结论表明:进入稳产期以后,第四采气厂的利润变化
当前方法对脑机接口信号识别时,因其基函数无法自适应调整,导致信号特征提取与识别结果不够准确,因此提出基于经验模式分解的脑机接口信号多模态识别方法。根据固有模态函数及其相关约束条件,通过筛选对经验模式分解实施分析,基于细胞电流架构的信号频率,对脑电信号分类;根据分类结果,采用经验模式分解法对脑机接口信号滤波降噪,经过确定经验模态分解级数,滤波处理剩余信号分量;利用Hilbert变换方法提取信号包络,
几个月前,沃伦·巴菲特(Warren Buffett)披露了自己缴纳的所得税率低于中产阶级,引来了各方的密切关注。你想知道这位生活简朴的亿万富豪交了多少房产税吗?我们发现,他在内布拉
<正>和弦听觉训练在视唱练耳教学中有着非常重要的作用。它是由单声部听觉训练迈向多声部听觉训练的必经之路,也是成功迈向多声部音乐听觉思维的基础与关键。因此,和弦听觉训
对比了传统照明系统的不足,重点介绍了智能照明管理系统的架构和照明管理方式,分析了智能照明管理系统的使用效果。提出在工业厂房中引入智能照明管理系统,实施先进的管理方