基于时态数据库双向关联规则挖掘的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zlbqnsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间是现实世界的固有属性,许多数据库都存在时态语义问题,增加了时间因素的关联规则研究是非常有意义的。增加了时间因素也使数据库变得复杂。本章对时态事件空间给出定义,给出时态事件的一种表示方法,在关联规则挖掘方面,扩展了普通关联规则在时态数据库中的应用,分别描述了同一对象不同属性、不同对象同一属性之间的关联规则,给出一种不同对象同一属性之间的时态关联规则算法,在股票时态数据库中实现了该算法,实验表明算法有效。数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息科技超乎想象的进展,许多新的计算机分析工具问世,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统性且可实行的程序。Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等。消费者过去的行为是其今后消费倾向的最好说明。通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。日常生活中通常会遇到这样的情况:超市管理人员希望得到顾客购买情况的更多信息。比如某一时间区间内顾客购买物品的先后顺序。在企业制定决策时,时态模式的双向关联规则对于如何决策时间因素,最大限度的增加正面效益尤为重要。为解决这个问题,需要探索有效的基于时态数据库的数据挖掘技术。为解决以上问题,基于时态数据关系模型和关联规则的相关概念,我们提出一种新型的关联规则,即双向关联规则。给出了相关概念,讨论了双向关联规则中时态数据集的存储技术,提出了相关挖掘算法,并用实例演算过程,从而论证了算法的正确可能性。此规则可以更好地应用于时态数据库中,反映数据之间的强关联关系。双向关联规则主要描述数据间的前后关系,要求各事件按时间次序登记。对企业来说,时态模式下的双关联规则可预测顾客的购买行为,促进销售量。它把数据之间的关联性与时间联系起来,为了挖掘双向关联规则,不仅需要知道事件是否发生,而且要确定各事件发生的先后顺序。这种挖掘方法更有利于企业有效决策的制定。
其他文献
数字图像压缩是图像处理领域的一个热门研究课题。图像压缩主要解决的问题是尽量减少表示数字图像时所需要的数据量,去除冗余数据。本文对图像压缩编码理论和现状及发展趋势
随着计算机视觉技术的发展,立体视觉尤其是双目视觉被广泛应用于物体识别、虚拟现实、工业检测、机器人导航和航空航天等领域。摄像机标定是立体视觉中的关键技术之一,能否有
随着互联网和Web技术的不断发展,搜索引擎凭借自身的特殊优势,在Web前进的道路上扮演着越来越重要的角色,同时也成为人们关注的热点。由于互联网上Web信息的海量化,异构及动
学位
面向服务架构(Service-Oriented Architecture,SOA)是解决当前企业底层IT系统实现技术繁杂,企业资源不能有效集成的最有效的分布式软件架构方法。企业实施SOA系统,能有效地集
基于图像的建模和绘制技术是近年来兴起的一种倍受关注的场景建模和绘制技术,也是目前虚拟场景漫游领域中的主流技术。其最大的特点就是克服了传统的基于几何建模和绘制技术
遗传算法在计算智能、人工生命、图像处理和模式识别等方面具有重要作用。基本遗传算法在理论与应用技术上还存在着许多不足和缺陷,其主要表现为易陷入局部最优解和收敛速度
麝香是一种稀有的药材,是国家的重要战略资源,但产量严重落后于需求。我国上世纪50年代即开展的人工养殖,至今收效不明显,主要原因是,林麝育种成活率低、生产管理技术落后。
现代教育技术是随着现代科学技术发展而产生的一种新型教育技术,多媒体网络教学系统是现代教育技术的重要表现形式。然而,目前的多媒体网络教学系统的多采用C/S或B/S模式,即
作为人工智能一个新的分支,蚁群算法以其较强的鲁棒性、优良的分布式计算能力、易于与其他方法相结合的优点受到了越来越广泛的关注;应用涉及到从一维静态问题到多维动态问题