以概念分层为背景知识的关联规则挖掘算法的分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:gqy2004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的快速发展以及人们获取数据手段的多样化,我们所拥有的数据急剧增加,但对这些数据进行分析理解的工具却很少。数据库系统所能做到的只是对这些数据进行存取和简单的操作。大量数据背后隐藏着对决策十分有用的信息,例如数据的整体特征、数据所表现出来的发展趋势等,但从海量的数据中获取这些信息却不是一件容易的事。数据挖掘就是从大量的、不完全的、有噪声的数据中提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程。关联分析是数据挖掘的先行者,并且与其他学科的交叉内容较少。Apriori算法是关联分析的基础,量化关联规则挖掘所关心的问题是将连续数值的关联分析转换为布尔值,多维关联规则分析与约束性的关联分析都是解决实用问题的算法。数据挖掘中应用的方法包括传统的统计分析、分类、估计、预测和相关分析、关联规则、聚集,也包括最新发展起来的一些诸如数据可视化、决策树和神经网络等一些较新的方法。本文首先简要介绍了数据挖掘的产生、功能、分类和可供挖掘的数据源,然后详细分析了关联规则挖掘过程中最常用的频集发现算法Apriori,指出了该算法的不足之处。在此基础上,提出了一种以概念层作为背景知识的多层关联规则挖掘的方法,包括在同一概念层、混合概念层以及交叉概念层上进行关联规则挖掘的方法;同时,文中还给出了从单个属性具有背景知识的情况向多个属性都具有背景知识的情况进行扩展的方法,形成了多维关联规则挖掘的方法,从而克服了原有算法的缺点,极大的提高了算法的适用范围和功能。最后对未来的工作提出了展望。
其他文献
随着印制电路板(PCB)生产的数量和速度的提高,质量控制变得越来越重要.质量控制的其中一个任务是检查印制电路板上的芯片有没有错焊.芯片上的字符串非常小,数量也非常多,用人
面向对象技术与数据库技术相结合有多种方法, 但从现有的研究情况看,面向对象数据库技术是最革命、最具前景的一门技术,尽管面向对象数据库系统做为数据库家族中的一个新兴的研
随着Internet的迅猛发展与普及,数字化的网络进入了人们的生活,每天都有许多公司和个人在网络上进行商务活动;人们通过电子邮件和计算机网络共享文件和信息;各企业也都试图把
H.323建议是在基于分组的网络上实现的多媒体通信系统标准。由H.323系统的通信过程中各个环节的安全性分析显示,该系统在身份认证过程和RAS(注册准入及状态)协议通信等方面存
电子政务需要实现政府各部门间高效、可互操作的信息交换和信息共享.这必然要求数据的格式交换和处理符合开放的标准、要求提供电子政务的信息交换规范.该文主要是针对北京市
在当前的多厂商网络环境下,网管系统互操作是长期困扰电信运营商的一大难题.为了解决这一难题,各大标准化组织制定了一系列接口标准,但却由于种种原因未能发挥预期的作用,从
作为新一代识别技术而异军突起的射频识别(RFID)技术,被誉为最具市场价值和前景的新兴技术之一。它正以意想不到的方式改变着我们的生活。在医疗、物流、交管以及国防等领域
在信息技术飞速发展的今天,互联网已成为每个人工作、学习和生活中的一部分,用户上网离不开搜索工具的帮助。搜索工具以一定的策略在互联网中搜集、发现信息,并对信息进行理解、
时空数据库理论的产生是伴随着现代生产生活的需要而产生的。在许多现实应用中实体本身及实体之间的时态、空间、时空关系特别是时空关系往往成为人们需要对实体进行处理的主
由于网络攻击行为的日益多样化,单一的网络安全技术已经不能满足当前的安全需求。本文介绍了一种新的分布式防火墙系统-主动式防火墙。主动式防火墙集成了网络地址转换NAT、