关联规则的衡量标准及其算法研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:yin_guohan163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据挖掘受到人工智能与数据库界的广泛关注。关联规则挖掘是数据挖掘中重要的研究课题。关联规则的主要研究对象是交易数据库,其主要目标就是发现交易数据库中交易项目之间是否存在某些关联关系。 目前常用的关联规则的衡量标准是支持度(support)和置信度(confidence)。用现有的衡量标准生成关联规则可能会产生大量冗余的、虚假的关联规则。 当前对关联规则的形式化定义是采用X(?)Y的模式,其中X为前提,Y作为后继。而实际的商品交易中我们往往只知道商品是否被同时购买,而不知道究竟是X的购买导致了Y的购买还是Y的购买导致了X的购买。即X和Y之间不存在前提和后继的关系。因此X(?)Y的模式与商品交易的实际购买情况不符,可能会导致矛盾规则的产生。 本文首先对经典的算法如Apriori、FP_growth等算法进行介绍和深入细致的分析,对比其性能的优劣,给出了它们的一些改进形式。然后研究了关联规则衡量标准及现有的若干改进方法,针对现有关联规则衡量标准的不足,提出增加影响度或相对置信度作为改进的衡量标准。并根据它们的大小,将关联规则分为正关联规则、负关联规则和无效关联规则。之后分析关联规则的形式化描述X(?)Y所存在的问题,提出改进模型和新的衡量标准trust,对新的衡量标准进行分析,并进行改进,给出其挖掘算法。实验表明:本文提出的方法能明显减少无效的关联规则。
其他文献
随着对存储系统的存储容量、IO速度、系统安全性和可用性等方面要求的不断提高,传统的网络存储技术(如NAS,SAN等)由于存在诸多局限性,不能很好的满足大规模分布存储系统的需
随着网络应用的快速增长,用户对通信系统提出了快速、支持多业务并发和支持多协议的要求,致使现代通信设备中的嵌入式系统十分复杂。针对3GBSS软件系统的模块测试、集成测试以
公共对象请求代理体系结构(Common Object Request Broker Architecture, CORBA)技术是一种面向分布对象计算的中间件技术,具有很好的互操作性、平台无关性等优点,特别适用于
软件体系结构是20世纪90年代软件工程领域出现的一个新的研究方向。软件体系结构关注系统的全局组织形式,是对系统结构高层抽象的描述。研究软件体系结构的首要问题是如何描
随着互联网技术和通信技术的进步,人们对于信息通信的需求不断扩张;同时随通信技术尤其是无线网络技术的日益进步,催生了多种异构无线网络在使用中协同工作,因此移动节点在异
全球移动通信技术的发展,刺激了用户对各种丰富多彩的多媒体应用的需求,客观上要求引入新的基础网络设施来提供多媒体业务。3GPP组织推出的IP多媒体子系统作为一个全球的、接入
煤矿作业规程是规范煤矿采掘作业、合理组织生产的技术基础,是指导煤矿安全生产和操作施工的具体体现,是煤矿生产技术管理中一项非常重要的工作。目前,煤矿企业作业规程编制及管
舌诊是中医学中最有临床应用价值的诊法之一。近年来,中医舌诊因其简单有效等特点,在国内外得到了越来越多的认可和应用,同时,随着现代科学技术的发展,将图像处理和模式识别
TCP/IP是网络通信中最常用的协议,已经被许多应用程序广泛应用。不幸的是,TCP/Ip对主机CPU负载增加很大。网络连接的性能水平对于计算机处理应用程序的性能有很大影响:网络越快,
虚拟现实、计算机仿真技术在许多领域都有广泛的应用。但是随着虚拟现实应用的深入,人们对虚拟场景的复杂度和真实感的要求越来越高,这些应用不仅要生成高度真实的复杂虚拟环