基于中职学生信息库的分类挖掘研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:huzhan_dong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中等职业教育以促进就业为办学宗旨,故综合学生在校的各种信息预测学生今后的就业情况意义重大。数据挖掘中分类算法研究的日趋成熟为研究上述学生就业情况提供了技术支持。因此,论文围绕着对中职学生信息库分类而展开。 论文对数据挖掘的定义、一般结构、对象、步骤及应用中就应注意的问题进行较全面的分析、归纳和总结,基于数据挖掘分类算法的研究现状,对发展较成熟的几种分类算法如决策树、神经网络、遗传算法、贝叶斯方法、关联规则分类、粗糙集方法、模糊论方法、k-最临近分类法等数据挖掘分类算法分别进行论述。在比较几种典型算法的优点和局限的基础上选取了BP神经网络和决策树两种分类算法应用于中职学生信息库的分类挖掘,提出对神经网络分类算法优化的方案。 论文在对BP神经网络算法进行深入研究后,探讨数据预处理,用示例剖析分类网络模型的训练过程,提出在神经网络算法分类的测试阶段引入拒分的思想,以期分离出测试样本中的异常样本并提高分类模型的分类准确率;由于神经网络中参数多,参数取值是否合适直接影响分类模型的好坏,故论文通过对大量实验数据的分析来选取好的神经网络参数(如初始权值、学习率、迭代次数、隐层节点数),并基于中职学生信息库建立较好的分类模型,达到较高的分类准确率。 本文中还用决策树对中职学生信息库建立分类树,探讨数据预处理,用示例剖析分类树的生成过程,进行适度剪枝,提取分类规则,结合应用背景分析实验结果。 最后对两种分类方法结合实验进行比较分析。 综上,论文能较好的实现把数据挖掘的分类技术应用于学生信息库的分类挖掘。
其他文献
目前,随着通信技术的飞速发展,依赖于组播通信的业务也越来越多。例如:付费电视、发送股票报价、软件升级、在线视频游戏等。使用组播技术传输数据可以极大地节省网络带宽,提高数
学位
开源软件被应用得越来越广泛,但因为开发模式的松散性,开源软件通常缺乏完善的文档和注释,想要完整的理解并深入定制和应用开源软件难度较大。在重用开源代码前,开发人员通常会对
城市排水系统是保障城市正常运转和生态环境的重要基础设施,是城市的主要脉搏之一,有“生命工程”之称。昆明的市政基础建设在改革开放以后取得了巨大的成就,随着城市的发展,地下
车牌识别技术的任务是分析、处理汽车图像,自动识别车牌号码,它主要包括车牌定位、字符分割和字符识别等三个方面的内容。由于车辆牌照号码对于车辆就相当于身份证和每个公民的
金字塔销售行为(非法传销),是在我国市场经济过程中出现的,一种诱惑力强、隐蔽性高、危害性大的经济犯罪。该犯罪行为一旦具有规模,对某一城市、某一省份乃至全国市场经济秩序带来
国家岩矿化石标本资源平台是科技部国家自然科技资源共享平台项目的子项目。该项目是将分散在全国相关单位和专业研究人员的具有重要科学价值的珍贵岩矿化石标本,以“共享”
2003年以前,大庆油田采油三厂已经开发完成了“生产信息管理及辅助支持系统”并在实际应用中取得了较好效果,为全方位策划思考企业经营活动信息流及支持系统的开发提供了宝贵经
Web2.0时代以来,协同信息系统的广泛应用为知识共享和再创造需求提供了强大的平台。除了被部署在单纯信息共享的学习型组织上,该系统已经成为涉及隐私、安全等重要领域的核心工
多智能体系统是人工智能领域的重要学科,具有自主性、分布性、协调性等特征。多智能体技术被广泛应用于工业制造、交通控制、面向智能体软件开发等领域。多智能体平台将多智能
卫星网络具有覆盖范围广且灵活的特点,可以实现全球网络的无缝覆盖,已经逐渐成为下一代互联网的基础部分。卫星网络自提出以来,路由技术一直是其研究热点。在小卫星网络中,星间链