论文部分内容阅读
从海量数据中挖掘知识为决策支持和分析预测服务,已成为人们对信息系统提出的新需求,但数据的处理和数据的提炼技术是匮乏的。起源于贝叶斯统计学的贝叶斯网络以其独特的不确定性知识表达形式、丰富的概率表达能力、综合先验知识的增量学习方法等特性表示了客体的概率分布和因果联系,成为当前数据挖掘众多方法中最为引人注目的焦点之一,成为知识发现领域中的一种重要的知识发现方法。本文主要是对基于贝叶斯网络及其分类模型的应用研究,其主要内容如下:(1)综述了数据挖掘技术的基本概念、数据挖掘中的几种分类方法及其应用,然后结合高等职业教育的现状和学生特点讨论了高等职业教育中贝叶斯网络的基本应用。(2)阐述了贝叶斯网络的理论基础。包括贝叶网络的概念及其性质特点、贝叶斯网络的参数学习和结构学习。讨论了贝叶斯分类和贝叶斯网络分类方法。根据理论知识的描述,用一个典型案例分析论证了贝叶斯网络模型,用K2算法描述了完备数据的结构学习方法。(3)基于K2算法,借助matlab环境,通过机器学习构建了一个高等职业教育中英语应用能力考试的贝叶斯网络分类器。(4)基于贝叶斯网络分类模型在高职教育考试中的应用研究。通过贝叶斯网络分类工具和ID3算法分别完成了对分类模型的验证实验,并对实验结果进行了比较分析。该模型充分利用了学生信息的先验知识,可为高职生今后实用型英语学习指明方向,为学校的教育教学管理或改革提供决策支持。