数据挖掘在高职院校学生成绩分析中的应用

被引量 : 0次 | 上传用户:lsgaoyan2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着中国高等教育的快速发展,高等职业教育进入高速发展期。民办高等职业教育在这个时期急剧扩张,招生规模的扩大和教师队伍的膨胀带来一系列的问题,在这些问题中,如何保证教学质量是重中之重。找出与学生成绩有关因素不但对改进课堂教学可教育管理具有指导作用,而且对保证教学质量也有重要意义。应用数据挖掘技术对学生成绩数据库进行分析,探索哪些因素与学生成绩有关,能为课程设置、课堂教学及教育管理提供参考意见。数据挖掘被定义为从大量有噪声模糊的、不完全的、随机的数据中提取隐藏在其中未知但又是肯定存在的,具有一定价值的信息和知识的过程。在数据挖掘过程中通常需要面向决策支持系统和联机分析应用数据源的结构化数据环境,即数据仓库;分类是指把某个不连续的标识值分配给一个未标识的记录的过程。决策树是应用最广的分类算法之一。ID3算法是决策树分类的经典算法,应用信息增益作为创建决策树的基本指标,C4.5算法是在ID3算法基础上进行改进的决策树算法,应用信息增益率来进行属性分裂。但是C4.5涉及对数运算,过程相对复杂且计算量大,因此本文引用了一种改进的C4.5算法,它应用数学上的等价无穷小的理论对C4.5算法进行改进,改进后的算法只需要进行加减乘除运算,简化了计算过程,提高了计算速度,从而提升决策树的建树效率。实践表明,C4.5算法创建的决策树弥补了ID3算法倾向于选择取值多的属性的不足,创建的决策树转化为If-Then语句更规范,更能满足决策者的要求;C4.5算法在构造决策树的过程中不断的进行剪枝,创建的决策树叶子节点相对较少,结构紧凑;改进的C4.5算法只需要进行加减乘除计算,简化了计算量和计算复杂度,提高了运算速度,从而提升了建树效率。本文首先对数据仓库、数据挖掘、分类技术基本知识进行了阐述;其次,采用SQL Server 2005 Analysis Service对学生成绩数据进行多维数据的创建,结合安徽文达信息工程学院学生成绩管理系统,创建了以学生成绩事实表为核心的数据仓库,主要内容涵盖学生成绩数据仓库的逻辑模型设计、物理模型的建立以及数据的整合、加工和分析;最后对ID3和C4.5算法进行了详细的介绍,结合安徽文达信息工程学院学生成绩管理系统,应用决策树算法中典型的ID3算法、C4.5算法及改进的C4.5算法对学生成数据进行挖掘,分别生成决策树,转化成分类规则,发现隐藏在学生成绩数据背后的,对教育教学有指导意义的规律。
其他文献
矿山企业电气节能意义重大,其节能现状仍有待改善。应该根据矿山企业的实际情况,遵循经济性和节能性原则,采取合理的电气节能措施包括电气设备节能和电气管理节能,深入挖掘电
文章主要提出大数据时代财务信息系统的变革表现,找出大数据时代下企业财务信息化建设存在的主要问题,提出大数据时代下完善企业财务管理信息化的对策,希望通过本文的研究可
近年来,随着经济时代的快速发展,以利益为目标的传统企业管理模式已经不能满足当前企业现代化管理的发展需求了。因此,现今社会需要在原有传统管理模式的基础上进行改革创新,
本文梳理古代典籍,分析有关风水的定义及其核心理念,追溯其起源,进而揭示出:与"文明"共生的"居住",素被中国古代先哲视为人与自然、社会和谐共存的根本中介,宜居环境尤其具有
抑郁症是包括多种精神症状和躯体症状的复杂的情感性精神障碍。中医学中有许多与抑郁症相关的中医病证及与抑郁症症状类似的描述,病理机制涉及中医五脏,困此抑郁症的辨证应以
新闻专业主义自诞生以来,便在研究与实践中处于建构与解构的循环过程中。本文结合《南方都市报》个案分析,指出对于置身于政治、经济等权力网络中的新闻实践而言,在权力与商
中国的经济发展离不开国有企业,国有企业作为国家调控市场的一个重要筹码,它的作用无可替代,也不可比拟。在国有企业的发展过程中,企业党组织发挥的作用越来越重要,尤其是面
我的网上流浪记我本来的生活很平静。每天朝10晚8地上上班(没办法,打工嘛),周一到周五安排其中的4天喝点小酒,周末打个通宵麻将,星期天睡它个天昏地暗,可以说满悠哉的。可是自从我恋爱上
期刊
目的利用RNA-Seq检测正常小鼠与心肌肌钙蛋白Ⅰ(cTnⅠ)R193H突变所致限制性心肌病(RCM)小鼠中差异表达的基因,探索RCM的发病机制。方法取3月龄C57小鼠和c TnI 193H突变小鼠的
本文就灰土垫层在湿陷性黄土地区浅层处理地基中所作用涉及到的质量检验中的有关问题进行了探讨。