关系数据库中多表间关联规则算法研究

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:wangxiaomax
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库技术的飞速发展以及Internet的迅猛普及,数据库技术已成为信息社会中对大量数据进行有效组织与管理的重要技术。特别是近些年在各大商场、书店等使用的条码技术,更为各企业方便快捷地收集数据提供了帮助。数据挖掘技术正好可以从大量数据中发现隐藏在数据背后的知识,从而帮助人们更好地理解事物的本质。关联规则是数据挖掘中一种重要的知识类型。随着关系数据库的广泛使用,研究关系数据库中的关联规则挖掘算法有着广阔的发展前景。当前这方面的常用算法是基于单表的,这些算法虽可以应用于多个表上,但需进行相应的转化—将多个表转换为一个表后才可应用。另外,还有基于ILP技术提出的算法等,这些算法分别在挖掘效率及应用范围、模式表示等方面存在一些不足,这就要求提出新的关联规则挖掘算法以适应需求。本文通过研究分析,借鉴传统的Apriori关联规则算法的先进思想,分析了该算法在时间复杂度以及只应用于事务数据库的不足的基础上,结合CrossMine算法中的元组标识传播(Tuple ID Propagation)的思想,提出了一种新的应用于关系数据库中多表间关联规则挖掘的算法BMM。该算法通过分析关系数据库中关联规则的多值、多维等特性,针对这些特征采取相应的措施来解决:首先对关系数据集进行数据预处理,以适应关联规则的发现,然后,通过扩展元组标识传播的思想得到每个属性所对应的目标关系ID,以此可以通过目标关系ID将所有考察的多表间的属性联系起来,从而可以直接作用在多个表上;最后,算法中的数据结构采用了链表结构来表示频繁项集及其对应的目标关系ID,以达到减少对数据库的访问次数。最后通过实验验证BMM算法。同时将BMM算法与基于SQL的算法进行比较做出了比较分析,实验证明该BMM算法表现出更好的时间性能。
其他文献
在许多公共场所中,人们常常面临着处理海量视频的挑战。计算机视觉领域的目标跟踪技术能有效地解决这类问题。然而,实时地视频跟踪技术本身极具有挑战和困难,跟踪过程中会受到背
过去几十年里,计算机动画一直是人们研究的热点,实时仿真运动的布料是计算机动画的重要组成部分,吸引了越来越多的研究。虽然布料仿真非常重要,并且已经有了大量的研究,但快
访问意图是计算机网络对抗中重要的战术情报。本文研究意图识别技术,为计算机网络对抗情报系统获取访问意图及置信度提供技术依据。主要工作概括如下:本文研究意图识别技术,主
模糊推理是模糊控制的理论基础,它已成为分析模糊控制器的重要工具。目前在模糊推理、模糊控制方面主要采用基于CRI的模糊推理算法,该算法对蕴涵算子和复合算子的选取有严格
随着网络技术的快速发展,基于网络的应用越来越多、越来越复杂。种类繁多的应用(合法的或者非法的)不但吞噬着越来越多的网络资源,而且也对QoS和网络安全带来了巨大的威胁。
Web服务是一种自描述的、模块化的、崭新的分布式计算模型,开放标准的采用使得Web服务具有很好的互操作性。以Web服务为代表的软件服务已成为一种新型的Web应用形态,如何实现
语义特征造型是新一代CAD/CAM集成系统的关键技术之一,是产品模型设计的核心。另外,将参数化技术应用于特征造型使得特征具有可调整性,提高了系统设计效率。因此,参数化技术
本文研究总结了近年来专家系统在国内外的发展及应用情况,分析论述了面向工程对象的智能型专家系统的知识表示及其分析、运算和推理过程,详细介绍了实际设计系统时解决的一些
强化学习是一种重要的机器学习方法,不需要建立环境模型,而是通过不断试错,与环境交互获得知识,改进动作策略,具有良好的自学习和在线学习能力。然而,在具有大状态空间的应用
电容层析成像(ECT)技术是近年来发展起来的一种基于电容敏感机理的过程层析成像(PT)技术,在工程应用中有着广阔的应用前景。体绘制技术是三维数据场可视化中最重要的成像技术之一