论文部分内容阅读
数据挖掘是从存放数据库、数据仓库或其它信息库中的大量数据中挖掘出有趣知识的过程。它可以对数据进行从微观到宏观的统计、分析、综合和推理,指导解决实际问题,发现事物之间的相互关联并做出预测。目前数据挖掘已经成为计算机科学与工程研究的一个热点,数据挖掘技术的研究的得到了进一步加深,其应用领域也在不断地扩大。近年来随着我国高校不断扩招,越来越多的学子都有机会迈入大学的殿堂。但由于高校收费制度的改革,高校贫困生的数量不断增加。面多这种令人担忧的情况,我国政府与高校已采取了一系列措施并取得了不少成绩。但由于资助金有限,真假贫困生难分辨等问题存在,使得贫困生资助工作在真正实施时遇到了困难。目前,由于各大高校里校园一卡通系统的建立,数据挖掘技术逐渐被应用在教学评估体系及学生行为分析系统中。在此背景下,我们考虑将先进的数据挖掘技术应用在学生管理信息系统中,可以建立比较完善的学生管理系统和提高学生管理水平,同时为学校管理决策起到指导和辅助作用。数据挖掘可以发现数据背后隐藏着许多重要的信息,快速而又准确地从浩瀚的信息资源中提取出所需信息。将数据挖掘技术引入其中,发掘出贫困学生群体中各种特征之间的相关性和规律。本文以校园一卡通交易数据和基本信息为研究对象,通过数据库和数据挖掘技术的综合运用来建立数据分析系统。首先介绍了数据挖掘的基本任务和技术,接着对关联规则Apriori算法进行了详细阐述,针对算法需要多次读取数据库等缺点提出一种改进的算法,先将事务数据库映射到布尔矩阵,利用向量求“与”运算,寻找频繁项集,且用一种逐层递增的思想动态分配内存,以避免重复匹配的问题。然后利用数据库有关技术,针对校园一卡通的卡内基本信息进行初步分析,对所涉及的多个数据库进行集成与转换,形成了利于挖掘的综合数据库,并以此建立了贫困生信息数据库。最后把改进的Apriori算法放入库中进行运算,发现所需的关联规则。将数据挖掘技术应用于校园一卡通的数据分析,可以为未来学校综合信息知识获取的进一步研究、构造完整的分析平台以及更高层次的领导决策实现打下了坚实基础。