论文部分内容阅读
数据挖掘(Data Mining)是一种从数据库中提取数据、用先进的分析方法开发智能化的、基于事实的一种业务决策和战略的技术,即一种在大量数据中发现信息的有效方法,而时态数据库(Temporal Database)中的时态数据是数据信息中的重要一类,本文就基于时态数据的增量数据挖掘进行了研究,并引入了兴趣度的概念作为评测标准,本文着重分析研究以下几方面的内容: (1)阐述了数据挖掘的现状、挖掘的具体过程以及挖掘方法分类;给出数据挖掘的具体流程图,说明了关联规则的具体模型,介绍了APRIORI算法是如何挖掘出交易集中的布尔型关联规则。 (2)引入兴趣度,论述了关联规则有趣性问题,主要从主观和客观两个方面进行评测,利用模板将用户感兴趣和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测,在关联规则的置信度和支持数基础上提出关联规则的兴趣度概念,并以此对关联规则的有趣性的客观评测增加了约束。 (3)给出了时态数据库中的相邻关系(Adjacency)和增量(Increment)的意义,提出了基于定量属性离散化的基本增量模型,介绍了常用的定量属性离散化方法,并结合DHA法建立一完整的数据挖掘模型,最后用兴趣度等标准判定得出用户感兴趣的定量关联规则。 以上相关的模型,算法及分析通过一个原型系统的实验,证明是有效可行的,所得的运行模型及规则可为系统的决策提供有效的信息。