基于候选项集剪枝的Apriori算法的研究

来源 :阜阳师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:chenghao131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。
其他文献
刻画了半完全环上的投射模,同时得到了关于半完全环上投射模的一些结果,如R是一个半完全环,那么每一个投射左R-模的任一不可分解的分解补极大直和项:每个有限生成的投射左R-模
分析了加权马氏距离判别分析中的权值问题,提出了用熵理论来确定加权马氏距离中权值的方法。实证分析显示基于熵理论的加权马氏距离要优于基于主成分的加权马氏距离。
<正>胡锦涛同志在党的十八大报告中指出:要"牢牢掌握意识形态工作领导权和主导权,坚持正确导向,提高引导能力,壮大主流思想舆论。"这与2003年12月他在全国宣传工作会议上讲话
针对目前商品化单片机实验箱所存在的弊端,自主研发设计了模块化单片机实验教学仪器,在此基础上,提出了从单片机实验教学仪器、实验教学实施和实验教学拓展三个方面改进单片机实