垂直数据格式相关论文
频繁项集的挖掘技术在如今的数据“爆炸”时代,有着越来越重要的地位,它是解决实际问题的一种非常重要的手段。很多学者在最近20年......
企业在事故隐患排查治理过程中积累了大量隐患数据,为挖掘其潜在价值,实现事故隐患预警预控,针对隐患类型多、数量大的特点,应用垂......
集成学习是现今机器学习领域研究的热点问题,选择性集成通过对基分类器进行选择来提高集成分类器的泛化能力,降低预测开销。模式挖......
目前FP增长树的建立采用的是事务一项目集数据格式,即水平数据格式,扫描数据库需要2次。采用垂直数据格式,即项目一事务集数据格式,按......
闭频繁项集包含了关于频繁项集的完整信息,可显著减少频繁项集挖掘所产生的模式数量,在一定程度上降低了内存开销、提高了时间效率......
由于频繁项集挖掘在各种实际应用中起到了重要的作用,它已经成为了很多研究的主题,大部分研究的是在精确数据的事务数据集上进行挖......
关联规则是数据挖掘的主要技术之一,它是描述数据库中一组数据项之间的某种潜在关系的规则。关联规则挖掘算法——Apriori算法,主要......
针对现有的基于垂直格式挖掘频繁项集采用正交的方式两两进行比较耗费大量时间和产生的Tid集可能很大浪费存储空间的问题,提出了一......
在稠密型数据库中,现有最大频繁项集挖掘算法效率低、耗时长,挖掘结果模糊,不利于用户使用。为此,提出一种项约束先过滤的最大频繁......
基于.NET架构和数据仓库技术开发经理人决策支持平台,使用多层关联规则算法挖掘购物小票的频繁项集,发现顾客的购物模式,为超市货......