论文部分内容阅读
随着高校的持续扩招,大学生就业问题越来越严重,引起政府、社会、学校、家庭和个人各方面的广泛关注。近几年,数据挖掘技术在商业取得巨大成功之后在教育领域中也持续受到关注,引入数据挖掘技术研究就业情况缓解就业压力具有重要意义。本文介绍了多值关联规则挖掘算法和多值属性离散化途径,分析了weka平台的java源码,探讨了weka中apriori算法实现过程和如何利用现有的weka文件来实现数据离散化,并将基于约束的关联规则算法集成到weka中,实现规则后件的可控性。根据就业理论,从学校和经济层面选取指标,依托“全国高校基本状态数据库系统”和CCER金融数据库提取数据,利用weka实现指标数据的离散化,采用基于约束的关联规则挖掘算法对数据进行规则提取,分别从就业去向为政务部门、企业、升学、灵活就业和地方项目就业角度分析了不同区域、不同学校类型、不同教学质量的学校学生在上述几种就业选择中的倾向性,实现了对就业去向影响因素的分析。本文通过实证分析,利用多值关联规则挖掘分析就业问题,大学生毕业的就业去向与区域、学校类型、学校教育和学校签订合作机构数量等相关,与地区经济发展水平、学生活动没有直接关系。同时验证了多值关联规则在分析影响因素中的有效性和合理性。采用开源平台,也为进一步实现大系统从数据采集、存储到后台的处理、挖掘甚至解释的复杂集成做下铺垫。