非频繁关联规则挖掘的研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:wuyonghong1974
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究数据挖掘的典型理论和一些急待研究、发展的课题,并将研究重点放在非频繁关联规则挖掘上。 简单的说,数据挖掘是从大量数据中提取或挖掘知识。 数据挖掘是计算机科学一个活跃的研究领域,出现于80年代后期,从多门学科发展起来,这些学科包括数据库技术、人工智能、统计学等。 关联规则挖掘是数据挖掘的一项重要功能,首先由Agrawal.等在1993年提出,用于发现大规模数据集中项集之间有趣的联系或规则。关联规则挖掘在分析零售店中消费者的购买模式、决策分析和商务管理方面是有用的。现在,关联规则挖掘已经成为理解数据的流行工具。 论文中介绍了关联规则挖掘的典型算法:Apriori算法、FP-G算法和多层关联规则挖掘算法。论文中还总结和介绍了关联规则挖掘近几年的一些重要的研究成果如运用多重相似查询技术提高数据挖掘效率、运用Apriori算法挖掘量化关联规则、基于集体度——置信度框架的关联规则挖掘、挖掘互依赖模式等。 关联规则挖掘面临着一些问题需要解决,本文研究了如下几个问题:非频繁关联规则挖掘、提高挖掘过程的交互性和自动化水平,每一个问题都给出了相应的算法模式或方法。在非频繁关联规则挖掘方面,本文重点研究了基于相似度——置信度的关联规则挖掘,并成功提出了一个算法模式(扩展算法)和一些相关理论。在提高挖掘过程的交互性和自动化水平方面,重点研究了如何用插值与逼近的方法自动确定支持度/置信度阈值,研究并阐述了将牛顿插值法用在关联规则挖掘中自动确定支持度/置信度阈值的方法和一些注意事项,并给出了详细的实验例子。
其他文献
针对节点电量局限性问题,除了改进电源技术外,研究者还从MAC层和网络层协议角度提出了改进方案.该文侧重于AdHoc网络的连通寿命(从网络开始构成到产生网络分割的时间)问题的
该文在综述Web数据挖掘的分类、研究内容和目前的研究现状的基础上,明确了Web用户访问日志数据挖掘研究的难点在于:如何对原始日志数据进行预处理,其中包括如何确定用户事务,
在信息时代,用户产生内容、物联网、定位系统等技术和应用加快了数据产生的速度。为了解决海量数据的挑战,学术界和工业界提出了一系列新型的NoSQL数据库,并进行了广泛的应用。
Web图形交互应用是一类有着众多共性的软件应用领域,随着网络应用技术的不断发展,其应用范围也不断扩大,目前已经渗透到计算机应用的许多领域.为了总结Web图形交互应用领域先
自二十世纪六十年代以来,计算机动画发展迅速,其中的人脸表情动画是动画领域的重要组成部分。而传统的表情动画的自动生成方法耗时耗力,低成本的表情动画的自动生成方法一直是研
二十世纪九十年代出现的分布式对象技术,为网络软件的开发提供了强有力的解决方案。分布式对象技术是将面向对象技术与网络通信技术有机结合而发展形成的,主要是指在网络计算平
随着通信技术的迅速发展,Internet网络用途的扩大,网络规模也随之加大.大规模的网络要求高性能的互连设备,因此网络设备的性能问题越来越为广大网络建设者所重视.为了公正,客
面向对象分析是面向对象软件工程的一个组成部分.它通过类和对象模拟现实世界的实体属性及其行为的分析,发现现实世界系统的层次结构.面向对象分析方法还揭示了可以通过对象/
表情是人类表达情绪的一种基本方式,是非语言交流中的一种有效手段。心理学家认为,情感的表达7%通过语言,38%通过语言的辅助信息(如讲话的节奏,声音频率及语调轮廓等),55%则通过面部表
该文设计的异构数据库查询系统的体系结构是使用联邦数据库和数据仓库以外的第三种方法:中间件技术,在各种异构数据源和相应的接口上建立了一种新的数据模型,可以利用该模型