基于概念格的数据挖掘的研究与实现

来源 :西北大学 | 被引量 : 0次 | 上传用户:saxthon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的广泛应用,导致庞大的数据库日益增多,为了从这些数据中提取出对数据库拥有者有价值的信息,数据挖掘这门学科应运而生。目前数据挖掘技术之所以被认为具有令人兴奋的研究前景,是因为它能够获得广泛的应用。1993年,IBM Almaden Research Center的Rakech Agrawal等人首先提出关联规则挖掘。关联规则是数据挖掘众多功能中的一种,也是目前最重要,最活跃,最为广泛应用的数据挖掘方法之一,这使得关联规则作为数据挖掘的一种重要模式,一直倍受广泛的关注。概念格是从数据中进行概念发现的一种数学工具,可通过Hasse图表现出概念之间的层次关系,概念格作为一种用于数据分析的形式化的工具,已在信息检索、数字图书馆、软件工程和知识发现等方面得到应用,备受国内外学者的重视。本文主要关注基于概念格的数据挖掘的研究,重点是基于索引链表的相对约简概念格(简称相对约简格)的关联规则的挖掘,内容主要涉及基于索引链表的相对约简格的建造及在此基础上的关联规则的挖掘。文章首先讨论了数据挖掘的研究现状及基本任务方法,重点讨论了关联规则算法的研究,经典算法Apriori的实现,优化,以及应用领域和关联规则挖掘中需要注意的事项。在此基础上,以基于索引链表的相对约简格模型为基础,分析了基于索引链表的相对约简格与关联规则之间的关系,描述了基于索引链表的相对约简格进行关联规则挖掘的理论框架,讨论了基于索引链表的相对约简概念格结构生成频繁概念格的思想,并给出构造算法及基于索引链表的相对约简格的关联规则挖掘算法的实现,并与经典关联规则算法Apriori进行对比,通过实验证明了算法的正确性及优越性,尤其在处理大型数据库中的优势。
其他文献
人脸识别是模式识别和计算机视觉领域的热点课题之一,经过30多年的研究,在环境可控条件下已达到实用程度,但在非理想成像(尤其是光照、姿态变化)、用户不配合、大规模人脸库
GPU(Graphics Processing Unit,图形处理器)具有很强的并行计算能力,尤其CUDA(Compute Unified Device Architecture,统一计算设备架构)的出现使得GPU在高性能计算中占据越来
电信运营支撑系统是电信运营商的一体化、信息资源共享支持系统,它以客户服务、业务运营和管理为核心,以关键性事务操作作为系统的主要功能,为网络运营商提供一个综合的业务运营
anycast是一种新型的网络服务,是IPv6的一个新特性。与unicast和multicast一样,它是IP的一种通信模式,anycast给用户的期望是通过一个anycast地址就能访问到该地址所表示的一
对象存储系统系统采用一种新的三方存储架构,和传统的存储系统相比在安全控制上也有着较大的不同,对象存储系统中元数据服务器的安全控制研究是对象存储系统安全性研究十分重
随着计算机网络的快速发展,人们对网络服务质量的要求也越来越高。拥塞控制是网络服务质量研究领域的重要课题之一,是制约网络传输效率的关键性障碍。自1986年网络拥塞现象被
目前,在超级计算领域,对高I/O吞吐率、高并行性和高扩展性的存储系统要求日益迫切,而传统的存储系统已经难以满足应用需求。实际的需求推动着存储系统不断向前发展,一种新兴
智能控制技术是当前控制领域研究的热点之一,广泛应用于不确定性、非线性等复杂系统的控制中。机器人足球是一个典型的多智能体系统,作为智能控制技术研究领域的标准问题,引起越
网格技术试图将广域分布的各种计算资源、存储资源、仪器设备等集合起来进行有效聚合和共享,并以统一的方式向外界用户提供服务。网格系统的设计是一个非常复杂的系统工程,它
为了满足在未来航天器上进行科学实验和空间探测的有效载荷数据采集、处理、存储、综合传输和数据管理需求,我国开始进行星上数据管理系统研究,本论文重点研究了基于1553B数据