数据流中闭频繁项集的并行挖掘算法

来源 :软件工程 | 被引量 : 0次 | 上传用户:brettymate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
闭频繁项集包含了关于频繁项集的完整信息,可显著减少频繁项集挖掘所产生的模式数量,在一定程度上降低了内存开销、提高了时间效率。数据流的特性决定了它需要更高效的挖掘算法,为此使用分治策略,提出一种并行化闭频繁项集挖掘算法PCFI。该算法采用垂直数据格式存储项集的事务,通过对事务集的集合运算,可快速得到项集的支持度计数,合并具有相同事务集的频繁项,得到初始生成子,降低了搜索空间的规模。采用分治策略对初始生成子进行并行处理,得到约简前序集和约简后序集,在挖掘过程中不断地对每一生成子的搜索空间进行减枝,得到更
其他文献
在Visual C#中,解析器可将代码中的扩展标记语言(eXtensible Markup Language,XML)注释处理为外部XML文档。文档对象模型(Document Object Model,DOM)定义了一个独立于平台和语言
在云计算数据服务的基础上,对云计算中XML数据的完整性和完备性以及挑战-响应安全协议作了简要介绍,针对云平台中的安全的XML查询,提出了利用挑战-响应协议在云计算平台中实
【正】 (一)目前,农业银行的不少基层营业所和农村信用社,贷款大于存款超负荷经营的情况相当严重。从经营管理角度分析,有以下原因: 一、缺乏商品经济的管理意识 当前,农业银
11.29上海自贸区举行重点融资租赁项目签约暨融资租赁产业服务措施发布会,宣布设立融资租赁产业发展服务中心(平台),发布《中国(上海)自由贸易试验区关于进一步促进融资租赁
运用技术统计、数据分析和归纳整理等方法,对第八届CUBA大学生篮球联赛男子八强队伍若干指标进行统计、分析研究,揭示大学生篮球比赛中存在的一些问题,并同国外大学生篮球联
性能测试用来保证产品发布后系统的性能能够满足用户需求,在软件质量保证中起重要作用。实际的性能测试中,需要设置场景的并发用户数和集合点来指示多个Vuser同时执行任务。
【正】 一年来,上海市的国库券市场交易总额达4.07亿元,平均日交易量131万元,是1988年上海其他债券和股票交易金额量的十倍,在全国独占鳌头。它的发展过程,可分为以下四个阶
应用写作从八十年代走进高校课堂就尝试着从形式到内容的各项改革,但实际收效并不理想。笔者简要回顾了应用写作课程改革过程中教学观念和教学重点的变化,分析了各个阶段改革重
1977年,孟兴无担任水利水保站站长以来,开拓创新,从抓职工素质教育入手,对职工进行业务、法律知识培训,使职工的素质显著提高。
集中供热的健康发展已成为衡量一个城市基础建设水平的不可缺少的重要部分,仅从供热管道的角度对腐蚀作了问题分析,并对如何防护作了探讨,以便能减缓或避免热能的白白损失,为集中