基于数据仓库的关联规则挖掘算法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:njpolice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是数据挖掘中的一个比较活跃的分支,它用于发现数据库或数据仓库中潜在的、对用户感兴趣的信息。本文在分析目前关联规则挖掘算法中存在的不完善之处的基础上,提出了各种改进方法,取得了一定的效果,研究内容主要包括:(1) 引入最优支持度和最优置信度的概念,使得在特定环境下可以挖掘出最需要的关联规则,产生预期的决策效果。(2) 提出了一种改进的关联规则并行挖掘算法,通过减少库扫描次数和减少候选项目集数目来提高算法的效率。新算法具有较好的扩展性。(3) 提出了一种加权关联规则的并行挖掘算法,通过给每个项目赋予不同的权值来标识数据库或数据仓库中项目的不同重要性,使得算法更切合现实,从而发现用户需要的关联规则。(4) 研究了数值属性关联规则的挖掘算法,利用数据本身的特性来划分区间,然后将划分后的区间映射为布尔属性,最后发现用户感兴趣的关联规则。理论分析和仿真实验证明了本文中方法的正确性和有效性。
其他文献
手势识别是人机交互一个重要的研究课题,由于对它的研究特别是对基于视觉的手势识别的研究顺应了近年来人机交互从机器友好型向着人类友好型发展的趋势,因此有着极大的科研和
随着信息全球化步伐的加快和互联网的飞速发展,网络成为各个企业必不可少的通信设施。许多组织机构需要与分支机构、合作伙伴实现异地互联;同时,网络应用的安全性和可靠性也变得
随着网络技术的普遍应用,其所衍生出来的数字媒体被广泛传播的同时,相应的数字版权问题,逐渐成为版权维护领域所关注的焦点。通过向数字媒体中嵌入特定的信息,可以有效地解决版权
随着分布式计算机系统的发展,特别是其典型范例—Internet的大规模的应用,多Agent系统理论产生了显而易见的价值。而多Agent技术和软件工程的结合,为开发复杂软件开辟了新的
语义Web服务是在传统Web服务的基础上对服务进行了语义封装,为服务组合的研究开辟了新方向,使语义Web服务组合成为服务组合研究的热点。本文主要研究语义Web服务组合中的服务组
网格是继传统互联网、Web之后的第三个大浪潮,可以称之为第三代互联网应用。网格计算实际上是构筑在Internet上的一组新兴技术,其目标是在动态变化的、广域分布的异构虚拟组织
计算机互联网络Internet已成为世界上最大的信息源,任何一个Internet用户都可以在网上查询他想要的信息,但是在网上除了极为有用的信息之外,还存在着许多暴力和色情等不健康内容
近几年来,随着移动互联网技术的蓬勃发展和Web2.0时代的到来,以微博为代表的新一代社交网络产品赋予了普通用户更多创造内容的自由和空间。普通用户在互联网世界的参与度在不断
EPON是基于以太网的技术,采用无连接的传送方式,解决了光纤接入“最后一公里”的问题,可在以太网之上提供多种业务。随着EPON技术的发展及其网络的部署,EPON网络管理的研究和开发
目前在普遍采用关系数据库技术或对象/关系数据库技术的虚拟制造环境中,不能对主要操作复杂数据的虚拟制造环境提供有效的支持。同时,在虚拟制造环境下产品装配过程中的冲突检测