【摘 要】
:
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表
【机 构】
:
阜阳师范学院计算机与信息工程学院,中共阜阳市委党校信息管理中心
【基金项目】
:
安徽省重点研究基地项目(SK2012B625)资助, 安徽省专业综合改革试点项目(2013zy167), 阜阳师范学院专业综合改革试点项目(2013ZYSD05)
论文部分内容阅读
在大数据挖掘中使用经典Apriori算法时,会产生大量的候选集,并需要扫描数据库中所有数据,使得其在实现过程中效率大大降低。为了提高Apriori算法的应用效率,通过建立线性链表记录每个事务中的项数,以达到事务压缩的目的;设置up值来提高1-项频繁集组合的门槛,发现支持度比较大的2-项候选集,以达到剪枝的目的;通过实验来设置up的取值范围,使最终产生的频繁项集的误差能够在接受的范围。实验证明提出的改进方法可以在找出绝大部分关联规则的同时,提高算法运行的效率。
其他文献
刻画了半完全环上的投射模,同时得到了关于半完全环上投射模的一些结果,如R是一个半完全环,那么每一个投射左R-模的任一不可分解的分解补极大直和项:每个有限生成的投射左R-模
分析了加权马氏距离判别分析中的权值问题,提出了用熵理论来确定加权马氏距离中权值的方法。实证分析显示基于熵理论的加权马氏距离要优于基于主成分的加权马氏距离。
<正>胡锦涛同志在党的十八大报告中指出:要"牢牢掌握意识形态工作领导权和主导权,坚持正确导向,提高引导能力,壮大主流思想舆论。"这与2003年12月他在全国宣传工作会议上讲话
针对目前商品化单片机实验箱所存在的弊端,自主研发设计了模块化单片机实验教学仪器,在此基础上,提出了从单片机实验教学仪器、实验教学实施和实验教学拓展三个方面改进单片机实