论文部分内容阅读
为了更好地挖掘出隐藏在学生一卡通消费行为中的隐含知识,辅助学校、老师和学生工作管理人员更精准地决策,本文设计并实现了一卡通消费行为分析系统。为了使系统能够更加高效和准确,使用了数理统计和数据挖掘两种数据分析方法,来对一卡通消费数据进行数据挖掘分析,探索学生一卡通消费行为规律以及消费行为同生活、学习、就业和安全之间的潜在联系。具体如下:1.设计了PVW-Kmeans算法,用于系统的聚类分析引擎模块,该算法在K-means算法基础上做了三方面的改进,获得了更好的聚类效果。具体包括:(1)基于泰森多边形的改进,能够更准确地选取初始聚类中心点和确定初始聚类数目;(2)基于加权平均值的改进,能够更准确地区分每个数据对象和更快地把数据对象聚类;(3)基于主成分分析法的改进,能够把多维的一卡通消费行为特征属性降维。使用PVW-Kmeans算法对学生消费行为进行聚类分析,在辅助贫困生认定上将改进的PVW-Kmeans算法同K-means和K-means++算法做了实验对比分析,验证了PVW-Kmeans算法的高效性和准确性。2.设计了WMDE-Apriori算法,用于系统的关联分析引擎模块,该算法在Apriori算法基础上做了三方面的改进,获得了更有效的关联规则。具体包括:(1)基于权重和矩阵的改进,减少了产生的候选项集和重复扫描事务数据库的次数;(2)基于数据划分的改进,缓解了算法的运行压力瓶颈,提高了算法效率;(3)基于影响度的改进,使得到的关联规则更加强而有效。使用WMDE-Apriori算法对学生消费行为进行关联分析,在辅助贫困生认定上将改进的WMDE-Apriori算法同Apriori算法进行了实验对比分析,验证了WMDE-Apriori算法的有效性和高效性。3.设计并实现了一卡通消费行为分析系统,具体包括:(1)总体设计了系统的系统架构、系统功能、数据库、数据流、系统接口等;(2)详细设计了作者分工所属的数据整理模块、统计分析引擎模块、聚类分析引擎模块、关联分析引擎模块、系统内部接口、贫困生辅助认定模块和统计分析模块。系统将挖掘出的学生消费行为规律以及同其他行为之间的隐含联系,结合可视化技术,直观地呈现出来,并对异常行为及时告警,不仅方便了学校、老师和学生管理工作人员的管理,也为辅助他们的决策提供了强而有力的数据支撑。