论文部分内容阅读
时间是现实世界的固有属性,许多数据库都存在时态语义问题,增加了时间因素的关联规则研究是非常有意义的。增加了时间因素也使数据库变得复杂。本章对时态事件空间给出定义,给出时态事件的一种表示方法,在关联规则挖掘方面,扩展了普通关联规则在时态数据库中的应用,分别描述了同一对象不同属性、不同对象同一属性之间的关联规则,给出一种不同对象同一属性之间的时态关联规则算法,在股票时态数据库中实现了该算法,实验表明算法有效。数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。随着信息科技超乎想象的进展,许多新的计算机分析工具问世,例如关系型数据库、模糊计算理论、基因算法则以及类神经网络等,使得从数据中发掘宝藏成为一种系统性且可实行的程序。Data Mining在各领域的应用非常广泛,只要该产业拥有具分析价值与需求的数据仓储或数据库,皆可利用Mining工具进行有目的的挖掘分析。一般较常见的应用案例多发生在零售业、直效行销界、制造业、财务金融保险、通讯业以及医疗服务等。消费者过去的行为是其今后消费倾向的最好说明。通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。日常生活中通常会遇到这样的情况:超市管理人员希望得到顾客购买情况的更多信息。比如某一时间区间内顾客购买物品的先后顺序。在企业制定决策时,时态模式的双向关联规则对于如何决策时间因素,最大限度的增加正面效益尤为重要。为解决这个问题,需要探索有效的基于时态数据库的数据挖掘技术。为解决以上问题,基于时态数据关系模型和关联规则的相关概念,我们提出一种新型的关联规则,即双向关联规则。给出了相关概念,讨论了双向关联规则中时态数据集的存储技术,提出了相关挖掘算法,并用实例演算过程,从而论证了算法的正确可能性。此规则可以更好地应用于时态数据库中,反映数据之间的强关联关系。双向关联规则主要描述数据间的前后关系,要求各事件按时间次序登记。对企业来说,时态模式下的双关联规则可预测顾客的购买行为,促进销售量。它把数据之间的关联性与时间联系起来,为了挖掘双向关联规则,不仅需要知道事件是否发生,而且要确定各事件发生的先后顺序。这种挖掘方法更有利于企业有效决策的制定。