基于序列模式的冗余规则修剪技术的研究

来源 :山东轻工业学院 齐鲁工业大学 | 被引量 : 0次 | 上传用户:dezhouhaote6600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
序列关联规则挖掘是数据挖掘的一个重要研究领域,它反映了大量数据中序列之间有趣的关联或相关联系[1]。但是我们通过传统算法产生的序列关联规则存在着非常多的冗余规则,用户在分析或者利用这些序列规则时意义不大。为了利于用户分析,我们可以采用多种有效技术对冗余规则进行修剪。目前,国内外针对序列正关联规则中冗余规则修剪技术的研究颇多,并提出了多种修剪算法,但对负序列关联规则中冗余修剪技术的研究较少。为此本文采用以下技术进行冗余修剪:(1)结合已有的冗余定义和定理,推出负关联规则中的冗余定义和定理,具体包括以下几点:1)A(?)B型关联规则中的冗余修剪:如果A, B ((?)) I ,A∩B =Φ,B’((?)) B, A(?)B’是一条有效的负关联规则,并且corrA,B<1,那么A(?)B就是A(?) B’的冗余规则;2)(?)A(?)B型关联规则中的冗余修剪:如果A, B (?) I , A∩B =Φ, B’(?) B, (?)A(?)B是一条有效的负关联规则,并且corrA,B<1,那么(?)A(?)B’就是(?)A(?)B的冗余规则;3)(?)A(?)B型关联规则中的冗余修剪:如果A, B (?) I , A∩B =Φ,B’(?) B, (?)A(?)B’是一条有效的负关联规则,并且corrA,B>1,那么(?)A(?)B就是(?) A(?)B’的冗余规则。(2)我们挖掘正负序列规则时,除了序列模式,还应该考虑非频繁极大序列,因为从中可以挖掘到大量的负序列规则。在冗余序列关联规则进行修剪时,我们不仅要考虑相关性还要考虑时间因素。因为在相关性的表达式中,supp (A∪B)表示B发生在A的后面。结合相关性和时间因素,运用本文提出的正负序列关联规则中的修剪定理,在现有的冗余关联修剪算法的基础上提出了一种改进的基于序列模式的冗余规则修剪技术并给出算法。实验结果证明该算法能够有效地减少序列关联规则的数量。
其他文献
智能视频监控自诞生以来就一直是机器视觉领域的研究难点与热点。智能视频监控研究的内容包括运动目标检测、目标分类、目标跟踪、行为分析以及异常个体跟踪。目前关于这几个
属性约简是粗糙集理论中的重要研究内容之一,传统的静态属性约简算法只能处理静态的数据集,然而现实世界中的数据是动态变化的,因此增量式属性约简方法的研究具有重要的理论
僵尸网络是指控制者出于恶意目的使用僵尸程序感染大量网络主机并对其进行控制从而形成的一种攻击网络,它主要通过命令与控制(C&C)信道进行通信。僵尸网络可以用来执行分布式
目前嵌入式领域软件开发方法不利于嵌入式系统的发展,如何将高级的构件技术应用到嵌入式系统软件开发中,以便快速灵活高效地设计系统,已成为其发展的关键。传统的构件描述与检索
无线Mesh网络作为一种解决无线接入“最后一公里”问题的关键技术受到了越来越广泛的关注。为具有不同QoS需求的多种业务提供服务质量保障是基于IEEE802.16无线Mesh网络的基
近年来随着市场竞争的加剧和客户需求的个性化,现代企业生产模式正在朝着“品种多样、批量变小、注重交期、减少库存”的方向发展。车间作业调度是解决现代企业生产过程中工
近年来,随着一些实际应用领域中大规模稀疏矩阵求解问题的推动,代数多重网格AMG(Algebraic Multigrid Algorithm)算法及其并行化的研究成为了数值计算领域的热点。   本文在
学位
随着社会信息化进程的飞速发展,信息技术已广泛应用于社会生活的各个领域,在更好地为人类提供服务的同时,也带来了一个极为严峻的信息安全问题。信息安全不仅关系到个人的切
在面向服务的体系架构中,Web服务是一种典型的技术手段,单个Web服务由于功能有限已不能满足用户复杂的应用请求,因此催生了通过组合现有Wcb服务来构建满足用户复杂需求的增值
如何解决标记多义性问题是机器学习领域的热门研究方向。目前机器学习研究领域应对标记多义性比较成熟的学习范式是多标记学习。多标记学习是对单标记学习的拓展,即允许同一