论文部分内容阅读
师生的教与学离不开教材的支持,教材在整个教学工作中发挥关键的作用。目前,国家大力推进教材的编写和出版工作,进而涌现出了大批种类繁多、内容丰富的教材。同时,市场上的教材也呈现出参差不齐的现象,例如有些教材形式单一,配套资源不足,不能很好地适应经济社会发展对技能型人才培养要求等问题。因此,如何选取合适的教材来更好地为教学服务,已经成为教师和教学管理人员亟待解决的首要问题。通过建立科学合理的教材质量评估体系能够帮助教师和教学管理人员遴选更加合理的教材,进一步促进教学工作有效地开展,进而提升教育教学质量和人才培养能力。然而,应该如何建立科学合理的教材评估方法呢?只有经过严格准确的数据处理、计算和实验分析,才能保证评估结果的准确性和科学性。通过综合分析和研究,利用数据分类技术可以对教材的质量等级进行识别。同时,为了提高分类结果的准确性和分类的效率,对传统的K最近邻分类进行改进,先利用最短系统聚类法对教材样本进行聚类,然后对聚类后的小簇或孤立点使用K最近邻法进行分类,最终预测出教材的质量等级。论文主要讨论数据挖掘技术的研究背景和意义,结合本研究中利用的数据分类技术的实施过程,重点讨论常用的数据分类算法的特点和存在的问题,并联系教材质量评估的应用要求,选择一种合适的分类算法进行教材样本的分类。针对K最近邻(KNN)分类法具有较高的计算开销的问题,提出先利用最短系统聚类法.对样本进行预先聚类,然后再对聚类后的小簇或孤立点进行分类,极大地缩小分类样本的规模和数量,降低运算成本,进一步提高分类的效率。论文以教材数据为研究对象,分别从理论、算法和应用三个方面对教材质量等级分类进行研究。主要包括以下研究成果:首先,系统阐述了常用的数据分类算法,通过分析比较各自的优劣,重点研究KNN分类法,并总结出传统的KNN分类法存在的问题。详细研究了改进传统的KNN分类法的措施,提出先利用最短系统聚类法进行聚类然后再分类的KNN分类法,改进后的新方法能极大地提高分类效率。其次,将提出的新方法运用于教材质量评估中。通过对教材样本进行分类,能够预测出教材的质量等级,为教材的选取提供科学合理的依据。最后,通过实验分析科学地论证了新方法的优势。主要从关键参数选取、数据规模等方面对新方法执行效率的变化情况进行分析,展现出新方法较强的处理能力。