基于时态约束的关联规则挖掘方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:greenranqingiqng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是数据挖掘技术的一种方法,侧重于确定数据集中不同属性之间的联系,找出满足给定支持度和置信度阈值的多属性之间的依赖关系。这样的规则可以应用于商品货架设计、存货安排以及根据购买模式对用户进行分配等。传统的关联规则很少考虑关联规则的时间适用性,事实上,每个关联规则都有其成立的时间区域。因此,在挖掘关联规则时附加上某种时态约束会使规则能更好地描述客观现实情况,这样有助于揭示事物发展的本质规律,使得发现的知识更具有现实意义;加上某种时态约束的规则称为时态关联规则。时态数据挖掘作为数据挖掘的一个新的课题,引起了人们极大的关注,其中时态关联规则的挖掘,已经成为众多学者研究的热点之一。本论文首先介绍了数据挖掘有关的概念、技术和研究现状,并介绍了关联规则挖掘的基本理论及经典挖掘算法,并予以算法分析;最后,对时态数据挖掘及时态关联规则挖掘技术进行了论述。针对传统数据挖掘在每一次产生候选项集时都要扫描一遍事务数据库,而用于关联规则挖掘的事务数据库的规模通常是非常大的,需要很大的I/O负载,这样势必影响了算法的效率。基于此,本文提出了两种时态关联规则的改进方法。一种改进方法是在扫描数据库的过程中逐步减小用于将来扫描的事务集,使事务数据库的规模越来越小,从而提高算法的效率;另一种方法是改变挖掘顺序的方法,即先不考虑时间因素而按照普通关联规则进行数据挖掘,然后再考虑时间约束的方法,并结合高效率的优化算法,使得算法的性能有很大的提高,并给出这种方法的性能分析。
其他文献
随着计算机网络技术的迅速发展,企业信息化建设逐步深入,企业信息系统的建设受到越来越大的挑战。能够适应企业业务流程改造,业务流程管理的工作流技术的出现,为企业信息系统的建
随着多媒体技术、计算机技术,通信技术及Internet网络的飞速发展,包括图像在内的各种多媒体数据的数量正以惊人的速度增长。如何提供一个有效的算法来快速、准确的查询这些具有
在目前的加密方法中,椭圆曲线加密方法具有安全性高、密钥长度短、加密和解密速度快等优点,其必将成为当今密码学领域中最具前途的加密方法之一。从讨论信息安全需求开始,在
Ad Hoc网络是由一组带有无线收发装置的移动节点所组成的临时性多跳自治系统,在军事和民用领域具有广阔的应用前景。近年来,随着各类多媒体业务及实时业务的普及和推广,要求网络
本文从研究以电力企业为代表的电力系统信息化现状入手,详细调查了目前电力企业信息化的现实条件、系统分析了当前信息系统存在的不足以及新形势下进一步发展面临的各种困难,
生成高度真实感的虚拟自然场景一直是图形学研究领域中一个富有挑战性的难题。作为自然场景的重要组成部分,地形真实感模拟逐渐得到人们的广泛重视。本论文实现了一个三维分
由于Internet的广泛应用,基于Internet的网络战已经成为信息战的一种重要形式。为了在未来的网络战中掌握主动权,网络攻击技术是不可或缺的网络战武器,而要进行成功的网络攻击,首
数据中心已成为全球信息化建设的基础支持设施。功率供应是建造数据中心的最大限制之一,是数据中心昂贵的资源。然而部署了大量延迟敏感型应用的数据中心功率利用率低下问题一
J2EE服务架构已成为当前行业应用软件开发的主流架构,然而在实际的应用中,J2EE构架的重量级组件却给系统开发和测试带来了很大的困难,以致造成了很多项目的失败。近年来,集成了多
生物识别技术在当今世界中已经得到了广泛的应用。虹膜身份识别是一种新兴的生物身份识别技术,由于其具有唯一性、稳定性、可采集性、非侵犯性等优点而逐步受到人们的重视。与