频繁项集挖掘相关论文
频繁项集挖掘在加入差分隐私后将带来敏感度过高、噪声过大、数据可用性较差的问题。为了解决这些问题,提出了基于事务分离的差分隐......
得益于基因组学技术、高通量测序技术及生物信息分析技术的迅猛发展,研究人员能够获得海量生物数据对疾病进行深入研究,并在许多领......
进口轻工消费品的货值金额快速增长,类别与数量也大幅增加,快速准确完成现场涉税监管,对一线人员是个挑战。借鉴关联规则在其他领域的......
在当今世界,随着互联网与其他行业的迅速融合以及数据量的迅猛增长,用户通过分析海量数据中有价值的信息可以针对性地制定下一步发......
近年来,随着我国经济建设和社会生产力的快速发展,空气污染已经成为大众和政府特别关注的重要话题。利用日趋成熟的数据挖掘手段,......
频繁项集挖掘已经成为数据挖掘领域的一个热门研究,被广泛应用于商业决策、经济学、医疗学和生物信息学等领域。人们在做决策时可......
随着云计算技术的快速发展,云服务商为用户提供了性能强大且具有弹性的数据存储和计算资源,将数据挖掘工作外包至云环境可以显著降......
频繁项集挖掘是数据流挖掘中重要的研究领域,目前国内外数据流频繁项集挖掘算法还存在诸多问题。例如模式产生延迟比较严重;挖掘出......
频繁项集挖掘可以广泛应用在关联规则挖掘、相关性分析、入侵检测、序列模式、分类和聚类等多种数据挖掘任务中。迄今为止已经提出......
关联规则挖掘是近年来发展十分迅速而且非常活跃的研究领域。它主要应用于发现数据中不同项目或属性之间的有趣联系。随着被收集和......
关联规则是数据挖掘领域的一个重要分支,它反映的是大量数据中间内在的关联联系,其目的是找出满足最小支持度和最小置信度要求的强关......
现代的搜索引擎系统需要存储海量的数据,并接收大规模用户的高并发检索需求。由于磁盘具有价格便宜、超大容量存储等优势,被很多搜......
关联规则是数据挖掘研究领域中一项重要的研究课题。蚁群算法是受到蚂蚁觅食的集体行为启示而设计的智能算法,作为智能算法的重要分......
随着互联网的快速发展,网络上的信息量变得极其庞大,而作为Web1.0时代就已经出现的传统应用,网络新闻仍然有着很高的使用率。为了方便......
数据流是一种以高速连续形式到来的有序项集,它不同于传统的数据库中的数据。数据流具有连续、实时、无限等特点,并且是快速到来的数......
膜计算是自然计算的一个新分支,模型的构建强调在细胞功能原理中寻求灵感,其模型通常称为P系统。P系统主要由膜结构、对象以及进化......
高效用项集挖掘(High Utility Itemsets Mining,HUIM)是近年来数据挖掘领域中研究的热点问题之一,它解决了传统的频繁项集挖掘(Fre......
在大数据时代下,随着数据收集与存储能力的提升,从数据中挖掘出可用知识变的尤为重要。不确定性数据是一种数据的表示方式,可以表......
随着互联网技术的发展,电子商务成了人们日常生活中不可缺少的一部分。面对各大电商网站大量可供挑选的商品,用户在决定购买之前都......
随着互联网、云计算、大数据等信息技术的快速发展,如何通过数据挖掘获取潜在有价值的知识成为当前的研究热点。其中,频繁项集挖掘......
随着信息技术的发展和云服务的兴起,很多商场通过上传顾客的交易记录给云服务器的方式实现对大规模数据的存储和管理,因此在云服务......
随着互联网技术的快速发展,数据挖掘技术广泛应用于社交网络、医疗机构和教育系统等行业中。大数据时代每天产生的海量数据使数据......
频繁项集挖掘是一项基本的数据挖掘任务,并且在关联规则算法中也发挥着重要的作用。然而在挖掘过程很有可能将用户的个人信息泄露,......
随着大数据时代的到来,各行各业都充斥着大量的数据。对数据进行加工处理,从中挖掘出有用的规则信息,对行业中的资源调配、服务改......
在当今大数据时代,从海量数据资源中挖掘出隐藏的、有价值的信息,为各行业管理者提供决策支持,具有十分重要的意义。关联规则的出......
频繁项集挖掘是近些年来数据库领域和数据挖掘领域一个被广泛研究的课题,频繁项集挖掘中存在一个显著的问题:如果原始数据集中包含......
近年来,中国高速铁路发展迅速,年新增里程和客运量持续走高,现已稳居世界第一,为国民经济发展和日常便捷出行做出了重要贡献。其中......
近年来,随着数据挖掘、机器学习、深度学习等技术的兴起与发展,企业从普通用户处收集到了大量的数据,并对这些数据进行分析处理来......
本文对频繁项集挖掘问题进行了深入的研究和探索,主要研究工作内容和贡献如下: 1、对频繁项集挖掘中搜索空间剪枝问题进行深入研......
作为一项能够有效缩减数据存储量的技术,重复数据删除在存储系统中获得广泛应用.然而,目前针对删冗系统数据冗余特征的研究存在不......
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生......
针对高维、稀疏的中文微博数据,提出一种多步骤的新闻话题发现方法。首先结合微博的传播特点,选取出不同时间窗口中具有较高新闻价值......
针对并行MRPrePost(parallel prepost algorithm based on MapReduce)频繁项集挖掘算法在大数据环境存在运行时间长、内存占用量大......
基于垂直数据布局的关联规则挖掘算法,在频繁项集查找过程中,内存的利用率直接关系到算法的效率。现在的很多算法都是针对内存研究......
为了进一步降低扫描数据库的次数和减轻内存负担,从而更好地提高挖掘频繁项集的效率,一种基于Apriori的优化算法(M-Apriori)被提出. 该......
针对基于垂直数据格式的关联规则挖掘算法在频繁项集查找过程中,需要在内存中保存大量的事务标志列表,有限的内存容量将成为此类算......
在代码演变的历史中,识别出重复的代码变更,对工具开发者、项目开发者、代码研究者都大有裨益。在代码演变的历史信息中,通过抽取......
针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务......
Apriori算法是解决频繁项集挖掘最常用的算法之一,但多轮迭代扫描完整数据集的计算方式,严重影响算法效率且难以并行化处理。随着......
N-list是近几年提出来的一种新的数据结构,它在频繁项集挖掘中有很高的效率.本文基于N-list提出了一种新型的并行频繁项集挖掘算法......
由于互联网技术急速发展及其用户迅速地增加,很多网络服务公司每天不得不处理TB级甚至更大规模的数据量。在如今的大数据时代,如何......
大数据时代的到来,使得人们对数据的处理速度、利用率等方面的要求变得更高。在频繁项集挖掘方面,Count Distribution算法和Data Dis......
频繁项集挖掘是关联规则挖掘中至关重要的一步。对于稠密数据集的频繁项集挖掘,传统的挖掘算法往往产生大量无用的中间结果,造成内存......
Hash-tree is an important data structure used in Apriori-like algorithms for mining frequent itemsets.However, there is ......
模式树是目前频繁项集挖掘最常用的数据结构,使用模式树可以有效地将数据库压缩于内存,并在内存中完成对频繁项集的挖掘。为了进一步......