数据库中关联规则的提取研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:woaichensi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库的增加和数据量的不断增长,数据挖掘已成为从数据库中获取有用知识的重要手段,其中,关联规则挖掘其中的一个重要分支,它侧重于挖掘数据库中项集之间的关联或相关联系.根据关联规则挖掘的数据集的不同,可以将关联规则挖掘技术分为两大类:布尔关联规则挖掘技术和量化关联规则挖掘技术.布尔关联规则挖掘技术研究仅包含二值属性的数据集中的关联规则挖掘;量化关联规则挖掘技术研究包含分类属性或量化属性的数据集中的关联规则挖掘.传统的关联规则挖掘算法及其改进算法通常用来挖掘布尔关联规则;这些算法需多次扫描数据库,产生候选项集,并在此基础上产生用来提取关联规则的频繁项目集.该文提出一种改进的关联规则挖掘算法,只需扫描数据库一次,且不产生候选项目集;算法的性能较传统的关联规则挖掘算法有很大的提高.对关系数据库应用布尔关联规则算法挖掘关联规则,是量化关联规则挖掘技术要解决的问题.该技术的中心问题是量化属性和分类属性的离散化.在完成了数值属性的离散化之后,量化关联规则挖掘问题就转化为布尔关联规则挖掘问题,可以应用布尔关联规则算法来对预处理后的数据集进行挖掘.另外,现实世界的数据库中的噪音数据干扰了数据挖掘获得真实有趣的知识.数据预处理技术的使用使数据挖掘可以在不同层次上来获取相关知识.将数据预处理技术应用到量化关联规则的挖掘上是该文研究的另一个问题.该文重点讨论利用基于概念分层的离散化技术处理关系数据库,进行量化关联规则的挖掘.
其他文献
随着嵌入式系统的蓬勃发展,嵌入式设备在我们的学习和生活中变得越来越重要。嵌入式浏览器是嵌入式设备终端用户浏览网页信息内容的应用软件,其重要性日益提高,已经不可或缺。目
企业所要进行投资的项目,往往具有庞大、复杂、周期长、相关单位多等特点,其经济性受多方面因素的制约,故投资者在作出投资决策时存在着风险.这样,建设项目投资存在着相当多
本文针对传统物流作业效率低下、信息流通不畅的问题,提出第三方物流信息管理模型。通过对第三方物流运作流程的分析,以仓储数据模型和配送车辆调度模型为重点,首先分析了仓储管
1860/1861呼叫中心是中国移动通信为客户提供服务的窗口,是联系客户与移动公司的纽带,也是传统营业及服务手段的延伸。业务系统作为湖南移动1860/1861呼叫中心的重要组成部分,作为
云计算作为一种全新的计算模式被提出来,广泛的应用于商业中。云终端的运用更是减少了用户对PC机硬件的依赖。以虚拟桌面架构为基础将客户端大量的资源消耗与计算量放在了服务
本文在研究了现有入侵检测系统和模糊技术的基础上,讨论了一种基于模糊技术的入侵检测系统模型,将模糊系统较高的准确性、明确的针对性和较好的适应性运用于入侵检测系统,克服目
该文主要论述了虚拟现实技术在地形仿真中的重要应用理论和算法,以及基于SGI图形工作站进行虚拟现实开发的新工具、新方法.首先,在地形数据的获取和处理方面,论述了如何将已
目前各大学开设的传统实验都离不开真实实验器材,实验往往需要前期准备以及实验设备需要定时维护等,实验条件和实验地点受到限制,导致实验效率不高,进而影响教学效果,存在对实验结
群密钥分配的动态安全性一直是组播安全研究的重点和难点。随着研究的不断发展,提出了各种不同的算法。典型的算法有LKH、OFT等。目前,大多数有效算法都采用逻辑密钥树结构来减
该文题目来源于中国石油勘探与生产分公司的科研项目.该文研究了目前流行的WEB开发技术,主要包括WEB页面的处理技术、JAVA技术、JSP技术、JAVABEAN以及JAVA数据库连接技术等