基于粗糙集对Apriori算法的改进

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:zymmhl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘的方法之一。关联规则挖掘通过分析训练数据集,从其中找到潜在的、有价值的知识。关联规则挖掘在商业领域中有着广泛的应用,著名的“尿布与啤酒”的例子就是关联规则挖掘的杰作。本文首先介绍了数据挖掘的相关概念和算法。在关联规则挖掘中,Apriori算法占据重要地位。Apriori算法对事务数据库中的所有项集进行分析筛选,依照特定的最小支持度,从中找到有强关联的频繁项集,并计算所有强关联记录的置信度,但大量候选集的产生以及多次扫描数据库的操作制约了Apriori算法的执行效率。接着,本文介绍了有关粗糙集理论方法的概念。粗糙集理论能有效地处理复杂系统中的数据与信息,是处理模糊和不精确问题的理想工具。由此,本文将粗糙集理论方法引入到对Apriori算法的改进工作中,提出一套新的改进算法——AprioriRS算法。AprioriRS算法利用项集分类预处理的方法对事务数据库中所有的项集进行预处理,从而减少了大量候选集产生的可能性。在筛选项集的过程中,利用粗糙集理论中的知识约简方法对项集进行化简,避免了重复扫描数据库的操作。在随后的试验中,通过挖掘训练数据集,将改进后的算法与Apriori算法的试验结果进行比较,获得了理想的试验结果。
其他文献
国家“十一五”预研项目“嵌入式半实物仿真测试平台”的研究目的是构建一个评测各种航天软件的通用性测试平台。航天软件测试工作通常在半实物仿真平台下进行,具有较高的实时
组合服务是开放式环境中实现跨组织敏捷应用系统集成的重要技术。目前应用组合服务构建的系统均是采用集中式执行模式。因为集中式执行模式系统在消息传输效率、执行效率、系
自动尿沉渣分类仪器对于临床尿检具有重要的意义。它解决了长期以来传统的通过人工对尿沉渣涂片进行目镜检查的操作过程中存在的受技术水平,视觉上的偏差影响,工作效率低,无
随着数字媒体技术和网络技术的发展与普及,数字视频的生成、传播以及应用变得越来越简单。数字视频的快速增长在为人们提供方便快捷的同时,也带来了各种各样的问题,如通过网络传
Web日志挖掘旨在对Web服务器上的用户访问日志数据使用数据挖掘技术,发掘隐藏在日志数据背后的规律和模式,从大量的Web日志信息中提取出人们需要的有用知识,进而改善Web站点结构
随着信息技术的发展,财政领域的数据访问技术由直接访问后台数据库的方式,改变为通过数据访问中间件访问的方式。采用这种方式能够最大限度的减轻后台数据库的负担,但是同时数据
数据挖掘是近年来兴起的一个新的研究领域,是当今数据库系统研究和应用领域内的一个热点。关联规则挖掘和聚类是数据挖掘的重要模式,在聚类的结果上进行深入的关联规则挖掘,可以
随着信息技术的快速发展,Internet逐渐成为主流的软件运行环境,开放、动态、难控是其最显著的特征。网络的开放性和动态性使得用户需求与计算环境更加频繁地变化,导致软件的变化
剪叉式空间伸展臂作为一种空间可展结构,广泛应用于各种航天器。为降低空间伸展臂的研制成本并使其顺利展开,本文对剪叉式空间伸展臂展开过程进行了仿真分析和优化控制研究。
随着社会的高速发展以及生活压力的增加,人们在日常生活中难免会面临诸如升学、就业、婚姻等问题。这些问题带给人们不同程度心理压力的同时,还伴随着抑郁、焦虑等负面情绪的产