论文部分内容阅读
扶贫助困工作一直是高校工作中的重点难点,总体流程较长,涉及人员角色多样,传统的人工协作方式十分低效。本文以建立一个完整的学生经济水平线上评定系统为目标,利用学生在校园内产生的各种行为数据,寻找一种可靠的自动化判定学生经济水平的方法,并将其应用到实际业务当中,最终为高校贫困资助的相关工作人员提供支持和引导。总体而言,本文完整处理了从数据整合与清洗,到特征提取与选择,再到算法模型的构建与分析,最终完成系统设计与实现的整个过程。在数据整合与清洗部分,我们首先根据国家相关标准建立了高校数据标准数据库,并根据不同数据来源系统的业务特点,对其数据问题进行了针对性分析与清洗,重点对不同数据源的缺失字段进行补全处理。在特征提取与选择部分,我们结合高校运转特点,设立了天、周、月、学期等不同的时间周期,按照不同的时间周期对数据提取时序特征序列,提取的特征大体分为基本统计量特征和复杂特征两类,并在特征提取完成后,采用后剪枝的C4.5决策树方法对特征进行筛选。在算法模型的构建与分析部分,我们根据数据和特征的时序特性,决定采用RNN方法来构建模型,综合LSTM和CW-RNN这两个最为常用的RNN方法的优缺点,提出了二者的融合方法,并对其使用方法和效果进行了说明。最后,在系统设计与实现阶段,我们首先将算法模型成果应用到实际系统中,其次充分考虑业务情况,将线下业务处理为线上流程,再次,提出了扶贫工作的动态管理概念,将高校的扶贫工作从一年一度的周期性业务,改进为常态化的关注和关怀。本文取得的主要成果有以下几点:1)建立高校数据标准,在前所未有的大范围内整合学生数据,并结合实际各系统的实际业务使用情况,针对性地对各数据完成了分析与清洗;2)探索挖掘出了与学生经济情况有关的一系列特征;3)提出了一种改进的递归神经网络模型处理上述特征,并取得了较好的效果;4)结合实际高校助学金认定工作执行情况,设计开发了一套经济困难学生挖掘认证系统。最终的算法结果验证和系统使用反馈表明,贫困指数对于学生经济水平的评估具有较好的参考价值,同时也说明了利用大数据手段对高校数据进行分析处理,具有切实的可行性和实用价值。