频繁闭合项集挖掘研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:digitalmachineu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术是解决数据丰富而知识贫乏的有效途径,当属信息科学领域的前沿研究课题之一,有关的研究和应用极大提高了决策支持的能力,它已被公认为是数据库研究中一个极富应用前景的领域。相关领域的研究和应用已经大大提高决策支持的能力,它被认为是数据库研究领域中最具发展潜力的一个方向。 频繁模式的挖掘被公认为在很多数据挖掘工作中占据重要的地位,但是,众所周知频繁模式挖掘常常会产生数额很大的频繁项集和关联规则数目,这不仅降低了效率更影响到了效果,因为用户需要从大量的关联规则中寻找有用的规则。 当前的研究提出了一个有趣的选择:挖掘频繁闭合项集与其对应的关联规则,这同关联规则的挖掘具有同样的效果,但是会实质性的减少产生的频繁项集的数量,随后产生的规则的数量亦大大减少。 本文首先对频繁项集挖掘作了些介绍,包括它的定义、性质以及经典的挖掘算法,如apriori,FP-growth。并且在这部分给出了改善FP-growth。的新算法。然后对频繁项集的做了详尽的介绍,其中包括频繁项集的定义和性质,以及它所凭借的数学基础。对挖掘频繁闭合项集的算法closet和closet+作了一些讨论。然后在改良过的FP-growth算法的基础之上,提出了新的挖掘频繁闭合项集的算法。在文章最后对规则的生成给出了一些基本的看法、建议以及优化策略的基本思想。
其他文献
企业利用信息系统的能力和企业自身的管理水平是支撑企业运营的两个重要基础。但是,现有的企业级系统的实施技术却存在着重大缺陷,无法满足企业管理的需要。本文以工作流技术
本课题以“江西消防远程服务网”为研究背景,以软件复用为研究目标,在仔细识别消防远程监控系统中软件复用机会、研究软件复用关键技术的基础上,使用UML(Unified Modeling Langua
医学图像三维重建是目前医学图像处理领域的研究热点。它从二维图像中获取三维结构信息,为用户提供具有真实感的三维图形。在诊断医学、手术规划及模拟仿真等方面有广泛的应
随着互联网的快速发展,人们已经越来越多的依靠互联网获取信息和资源,网络成为了人们生活中不可缺少的知识宝库。然而,由于网络中的资源太过丰富和庞大,为了使网络用户能够快
随着我国经济快速发展,对铁路运输需求越来越大,加强铁路信息化建设水平提高铁路运输能力变得更为重要。列车运行图系统是铁路运输信息化建设的一个重要组成部分,其编制的列
系统建模语言(Systems Modeling Language,SysML)的提出使得模型驱动开发(Model Driven Development,MDD)可以应用于系统工程领域。由于模型驱动开发对自动代码生成的支持,使
组件复用技术中COM(ComponentObjectModel,组件对象模型)是当今解决可复用性最有效和最前沿的技术。它不仅仅采用了面向对象程序设计方法,还体现了组件化的程序设计思想,在整个
本文针对C/C++程序中资源泄漏安全漏洞的静态检查进行了研究。为了达到查找C/C++程序中的安全漏洞,提高软件安全性的目的,本文设计并实现了一种静态检查资源泄漏的方法。该方法以
过去几十年来软件生产率一直在稳步增长,但是仍然不能弥补用户对软件的需求和当前软件生产能力之间的鸿沟。经过大量的软件工程和人工智能领域的研究工作以后,人们发现为了满足
时钟同步是分布式系统中经典的问题,是分布式计算中的核心技术之一。随着计算机技术和网络通讯技术的迅猛发展,人们对该问题给予了更多的关注和研究。分布式系统内事件因果顺序