Apriori算法研究及在本科招生数据挖掘中应用

来源 :北京交通大学 | 被引量 : 16次 | 上传用户:womjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是从大量的数据中通过算法挖掘出未知潜在的知识或有价值的规律的过程。Apriori算法是数据挖掘关联规则中的经典算法,该算法通过对数据的关联性进行分析和挖掘,挖掘出信息之间的潜在联系,用来进行决策和指导,广泛应用于各个领域。独立学院作为本科教育新力量的兴起,竞争压力日益增大,提高学校考生报到率和在校学生质量,成为独立学院发展的关键因素。如何利用历史招生信息数据进行挖掘,从而发现其潜在的数据之间的关系,利用数据挖掘的结果进一步指导招生工作,对独立学院招生具有重要意义。本文首先介绍了数据挖掘技术的概念、任务和方法,重点描述了关联规则算法中的Apriori算法。主要工作:首先是重点研究和分析了传统Apriori算法和已有的改进Apriori算法存在的问题,提出了基于数据规模划分的DPApriori算法和基于属性列的DPApriori-N两种改进算法,通过实验验证了改进算法的有效性。其次,分析了招生信息数据,给出了招生信息数据的清洗过程和招生信息数据挖掘系统的需求分析。最后,将改进的Apriori算法应用到招生信息数据挖掘系统中,并以可视化的方法将数据挖掘结果展示出来,为招生工作提供决策、提高考生报到率和考生质量给出了合理化的建议,一定意义上提高了学校的办学质量。
其他文献
随着技术的发展,人们对网络的需求也越来越广泛,这使移动性支持问题成为目前计算机网络发展的热点。传统因特网难以支持移动性本质上是由IP网的体系架构造成的,其根源是IP网
网络协议具有空间分布性、并发性和异步性,这些特性对网络协议的开发质量带来了巨大挑战。协议化验证是对协议的功能和性能进行校验过程,是保证协议开发质量的必要环节。协议
信息技术(IT)是当今世界上最先进最活跃的生产力之一,它已经成为当代社会经济的基础。协同办公系统是政府部门实施信息化建设的非常重要的系统。由于政府部门管理模式和业务
处理器性能的提升主要依赖于两个因素:一是半导体工艺的逐渐进步;二是处理器体系结构的不断发展。二者相互促进,共同发展。但是到了21世纪,由于半导体工艺的限制,处理器的频
随着互联网的广泛普及和宽带网络的高速发展,传统的客户端/服务器的下载模式极大地限制了系统的下载速度和扩展性。针对传统网络拥塞导致网络下载速度过慢等一系列问题,一些技
随着Internet的快速发展,P2P技术的成熟使得现代的网络应用发生巨大的转变,目前它已成为发展最快的网络应用之一。P2P文件共享产生的流量可能是当前Internet最大的单项流量。
随着计算机科学技术的发展和计算机视觉理论的广泛应用,利用计算机图像处理技术对目标进行定位和实时跟踪的研究越来越热门。在智能化交通系统、智能监控系统、军事目标检测
随着Internet的快速发展,尤其是Web服务技术、电子商务等的广泛使用,XML作为一种自描述的半结构化数据模式已成为Web数据表示和交换的新标准,越来越多的信息处理系统采用XML
近年来,随着城市化进程的加快,城市公共交通问题也越来越严重。为了缓解城市交通压力,就需要大力发展智能交通,提高公共交通系统的运行效率和服务质量。而公交调度问题作为智
交通运输业是国民经济和社会发展的基础性产业,它的跨越式发展使得信息化成为必然选择。为此各级政府和相关部门建立了各种各样的交通信息管理系统,但由此也产生了一系列严重问