基于兴趣度的增量数据挖掘算法的研究

来源 :河海大学 | 被引量 : 0次 | 上传用户:vitor330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是一种从数据库中提取数据、用先进的分析方法开发智能化的、基于事实的一种业务决策和战略的技术,即一种在大量数据中发现信息的有效方法,而时态数据库(Temporal Database)中的时态数据是数据信息中的重要一类,本文就基于时态数据的增量数据挖掘进行了研究,并引入了兴趣度的概念作为评测标准,本文着重分析研究以下几方面的内容: (1)阐述了数据挖掘的现状、挖掘的具体过程以及挖掘方法分类;给出数据挖掘的具体流程图,说明了关联规则的具体模型,介绍了APRIORI算法是如何挖掘出交易集中的布尔型关联规则。 (2)引入兴趣度,论述了关联规则有趣性问题,主要从主观和客观两个方面进行评测,利用模板将用户感兴趣和不感兴趣的规则区分开,以此来完成关联规则有趣性的主观评测,在关联规则的置信度和支持数基础上提出关联规则的兴趣度概念,并以此对关联规则的有趣性的客观评测增加了约束。 (3)给出了时态数据库中的相邻关系(Adjacency)和增量(Increment)的意义,提出了基于定量属性离散化的基本增量模型,介绍了常用的定量属性离散化方法,并结合DHA法建立一完整的数据挖掘模型,最后用兴趣度等标准判定得出用户感兴趣的定量关联规则。 以上相关的模型,算法及分析通过一个原型系统的实验,证明是有效可行的,所得的运行模型及规则可为系统的决策提供有效的信息。
其他文献
在光照不均匀,存在阴影以及存在背景小杂色块干扰的图像中准确辨识出叶片图像,并将其显著特征抽取出来是本次课题的研究重点。本课题在对实际叶片图像信息抽取这个领域,提出
计算机领域技术更新速度非常快,但计算机的基本体系结构相对来说几乎不变。可重构计算技术(Reconfigurable Computing—RC)为传统通用处理器和专用处理器(ASIC)提供了一个非常