【摘 要】
:
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效
【机 构】
:
常州工学院计算机信息工程学院江苏常州213002
论文部分内容阅读
研究频繁项集模式挖掘优化问题。传统的挖掘算法常产生大规模的候选项集,并且反复扫描数据库,导致频繁项集挖掘时间过长,空间效率太低。为了改进频繁项集挖掘时时间与空间效率低的问题,提出一种高效频繁项集挖掘算法CPT-Mine。此算法利用编码模式树存储事务数据库中的频繁项集信息,构建FP数组,加快产生频繁项集,引入CPT-Mine算法,快速地挖掘数据库中所包含的频繁项集,无需递归构造条件模式树,只需两次扫描数据库即可生成所有频繁项集。最后的实验证明了该算法能缩短挖掘时间3~10 s,空间效率提高43%。
其他文献
10月,市场进入了第四个季度,也是每年水产的淡季,企业的经营数据基本尘埃落定,预算的完成与否,并不是企业掌舵人目前最关心的,此刻在思考的是明年的战略操作。10年前,大家就
目的:探讨克罗恩病误诊原因。方法:回顾性分析1例小肠克罗恩病误诊病例。结果:剖腹探查术后病理诊断患者为回肠末端克罗恩病。结论:诊断不明确时,在安全条件下可以给予积极的
我国农业的发展带动了粮食生产的快速增长,粮食安全一直是备受关注的话题,粮食安全问题究其根源在于农业种子的安全。种子是农业生产的必须品也是最基本的原材料,它是国家保
“文化治疆”是重启“丝绸之路经济带”的优先和必要的战略选择。新疆建设兵团“建城戍边”、打造“先进文化示范区”,既是这一战略的有力抓手,也是漫长“屯垦戍边”历史的最终
水稻机械的使用不仅可以节省时间、提高效率,还可以减轻劳动负担,机械化已成为现代农业生产的主要方式,但是仍存在着燃料消耗高、动力低、节能环保差的问题.有时会出现生产成
在涉及疾病与健康问题的大众宣传教育中,各种不同的说服策略被开发利用,而所有策略的核心,无非是改变人们的观念与行为。在这些策略背后,为达到教育目的而隐含的"恐吓策略"普
提出了一种融合多种图像特征信息的Web图像聚类算法。本文的创新点主要表现在:将具有"图像标签","时间信息"",地理信息"以及"视觉特征"等多种特征的Web图像的聚类问题转换为K分图的划分问题。接下来将K分图的划分转化为若干个二分图的加权划分问题,利用对角矩阵和拉普拉斯矩阵,对K-1个目标函数进行线性加权,利用二次约束二次规划而完成对K分图的划分。通过对上述过程进行迭代运算得到Web图像的聚类结果
与目前压电基因传感器技术和DNA计算理论相结合,设计了一种基于压电基因传感器DNA计算的方法,并把此方法应用到可满足性问题的解决上,详细论述了计算的过程,并编写程序模拟和验证
20世纪80年代南开大学历史学院的学者们在中国第一历史档案馆中抄录了"清嘉庆朝的刑科题本",2008年,由杜家骥老师主编,正式出版了《清嘉庆朝刑科题本社会史料辑刊》。南开大