关联规则挖掘算法研究及在科技管理信息系统的应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wp76155900
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是指从大量的数据中发现人们事先不知道的、有用的知识(或模式)的处理过程,它是继数据库、人工智能等领域之后发展起来的一门重要学科。由于挖掘到的知识能够给各领域以有力的支持,因此,数据挖掘技术得到了广泛的应用。在数据挖掘算法的研究中,比较有影响的是关联规则发现算法,它是数据挖掘研究的一个重要分支,也是数据挖掘的众多知识类型中最为典型的一种。论文首先介绍数据挖掘的功能和数据挖掘中所涉及到的常用算法,重点研究了关联规则中的FP-growth算法,并用实验方法对FP-growth算法和Apriori算法做了比较。并对FP-growth算法进行了分析,提出了基于以下三点的算法改进:1.将双向的FP-树改成单向,以简化数据结构,2.采用改变结点数据结构的方法,避免了条件FP-树生成,提高了计算速度3.在算法流程方面,使用循环替代递归,提高执行速度,降低了内存开销。通过对时间和空间性能的分析和实验的证明,改进的FP-growth算法性能得到提高。文章在实现某高校科技管理系统的系统设计和数据库设计的基础上,将数据挖掘中的关联规则挖掘算法应用科技管理信息系统。经过对关联规则算法的研究和改进,采用了关联规则中的改进的FP-growth算法对经过数据预处理的数据仓库中六张表进行了挖掘,并分析了挖掘结果,提出了高校应当加强国家级项目的申请,加强30-40岁的青年学者的科研能力等建议。论文最后,讨论了目前研究工作中需要进一步完善的问题,指出了今后的研究方向。
其他文献
本文在分析国内外分布式信任模型以及P2P中存在的安全问题的基础上,结合现实世界中的社会关系网络,提出了一种新型的信任模型BGTR以及在此基础上设计了激励机制SOIM。该模型
随着语义Web的发展,已经有大量语义Web数据存在。然而许多数据缺少结构和丰富的知识表示,本体的不完备性比较严重。本体学习能够降低本体的不完备性,是语义Web能否成功的关键之
Internet的迅速发展给人们带来诸多方便的同时,也带来了诸如信息过载、信息迷失、色情和暴力充斥网上等很多问题,为解决这些问题,信息过滤应运而生。中文文本信息过滤是中文
无线传感器网络是一种由大量传感器节点构成的网络,用于协作的探测、采集和处理网络覆盖的地理区域中感知的信息,近年来得到了广泛的应用。安全问题是无线传感器网络中的基本
随着计算机与网络技术的快速发展,网络已成为人们存储与获取信息的主要手段,存储于网上的文本数量也成指数级增长。这在为用户提供了海量信息的同时,也给用户从中获取有用信
无线自组织网络(Ad Hoc)是当前无线通信领域一种新的、正在发展的网络技术,它正在迅速地从军事通信渗透到相关的民用通信领域。在移动无线自组网中,广播被广泛地用于路由发现
鉴于人脸检测技术在安全访问控制、视觉监测、基于内容的检索和新一代人机界面等领域具有广泛的应用背景,一直是模式识别和人工智能等领域的重要研究课题。由于人脸是由复杂的
近年来,随着生物技术的发展,出现了很多生物网络数据,生物网络数据规模有了显著地增加,包括蛋白质作用网络,新陈代谢网络,基因调控网络等。如何从这些数据中挖掘出与功能相关的结构
“基于ArcGIS的金属矿山地质灾害信息系统”是在北京矿产地质研究院“有色金属矿山突发性灾害预警技术研究”项目的资助下。以广西大厂锡矿为示范矿山,利用航天遥感资料、地面
随着Web服务的广泛应用,针对Web服务的发布、发现和使用过程,其中许多关键性技术问题的研究还处于初级阶段,需要进行深入研究和探讨,以便有效地满足服务请求者对Web服务的需