基于项集信息表的Apriori_T算法

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:puhongjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事务数据库中关联规则的发现是数据挖掘中一个非常重要的研究领域,关联规则的挖掘通常分为两个步骤,首先找出所有频繁项集,然后由频繁项集产生强关联规则。Apriori算法是查找频繁项集的基本算法,简单明了,易于实现,但存在一些不足。针对Apriori算法需要多次扫描事务数据库,并产生大量候选项集,导致算法效率较低的缺陷,设计了一种基于项集信息表的Apriori_T算法,以表的形式来记录项集信息,避免了重复扫描事务数据库,降低了系统的I/O开销,提高了查找频繁项集的效率。
其他文献
9月3日国际复兴开发银行决定在未来15年中每年向俄提供2亿美元的贷款,以支持俄市政住宅改革。9月4日俄媒报道,俄罗斯财政预算收入2009年上半年同比减少27.5%。
语文与文学之间有着千丝万缕的联系,儿童文学与小学语文教育互相关联、互相影响。在小学语文教育过程中,儿童文学发挥着巨大的作用;在儿童文学发展过程中,小学语文的贡献也不
在车辆几何尺寸参数中,车辆轮距是一个重要的参数,目前多采用人工测量方法来获得该参数,该方法费工费力,重复性差且精度不高。为此本文提出一种基于立体视觉和激光投影的车辆轮距高精度测量方法,首先,本文对车辆轮距的定义进行分析,提出了车辆轮距的测量模型以及测量步骤;其次,本文详细说明了获取车辆轮距参数所需三个关键参数的测量方法,包括车辆支承平面的测量,车轮中心三维坐标的测量,以及车轮中心平面的测量。实验结
11月1日物价上涨限制了俄罗斯人民的食品消费。有52%的人认为,物价上涨限制了自己的消费支出;34%的人认为物价上涨增加了家庭支出,但没影响他们的饮食。另有82%的人认为物价上涨很
新公布的2004年中国工业企业1000大与上一年相比.前十名的企业更新了六家.其中.华北电网公司第一次上榜即以1541亿的主营业务收入名列第2;上一年分别名列第27、21的东风汽车公司
采用冷压烧结和热挤压方法制备出1.5~5.0vol%SiCp(130nm)/Al(149~75μm)复合材料,并对其抗压、硬度和滑动磨擦特性进行了研究,旨在研究引入弥散的亚微米级 SiCp 对 SiCp/Al 复合
认证是信息安全的基础服务要求,一般是根据客户端的三个特性来设计的,即"知道什么","拥有什么","是什么"等类型的知识。文章中的认证需要运用知识,产生式规则系统具有和图灵机同等
针对目前工矿企业节能降耗所遇到的问题,该文首先介绍了节能降耗平台及其架构,接着提出了在实时数据平台中使用中间件对数据进行处理的思想,然后根据工矿企业对数据处理要求设计
1823—1845年,Е.Ф.康克林任俄国财政大臣。康克林认为,矿业对国家具有十分重要的意义,国家应采取各种措施促进矿业发展。他对矿业管理制度进行了改革,颁布了改善矿业工人生活的
最近,政府又出台了调控新招,由建设部等七部委联合出台的《关于做好稳定住房价格工作的意见》一时成为了人们关注的焦点。