论文部分内容阅读
随着数据库技术的迅速发展以及数据库管理系统的广泛应用,人们正逐步陷入“数据丰富,知识贫乏”的尴尬境地。而近年来互联网的发展与快速普及,使得人类第一次真正体会到了数据海洋,无边无际。面对如此巨大的数据资源,人们迫切需要一种新技术和自动工具,以便能够利用智能技术帮助我们将这巨大数据资源转换为有用的知识与信息资源,从而可以帮助我们科学地进行各种决策,由此产生了数据挖掘技术。数据挖掘,常常也被称为数据库知识发现(Knowledge Discovery from Database,简称KDD),它可以从数据库,或数据仓库,以及其它各种数据库的大量各种类型数据中,自动抽取或发现出有用的模式知识。数据挖掘是一个多领域交叉的研究与应用领域,所涉及的领域包括:数据库技术、人工智能、机器学习、神经网络、统计学、模式识别、知识系统、知识获取、信息检索、高性能计算以及可视化计算等领域。近十几年来,数据挖掘技术已得到广泛的研究,并在商业、会融、医疗等领域得到成功地应用,但在部队的军事训练领域的应用比较少。在现代高科技条件下,信息在作战中的功能、地位和作用大大提高,战斗力的快速生成越来越重要,信息已成为影响战争全局的极其重要的巨大资源和力量。指挥员凭借自身的专业知识和经验,难以从当前众多的训练信息中迅速、准确地获取训练的效果,最终直接影响战斗力的生成,而在激增的数据背后隐藏着许多重要的信息,指挥员希望能够对其进行更高层次的分析,以便更好地指导军事训练。目前,大部分指挥员缺乏对信息平台的运用,不能对复杂的测试训练成绩进行分类评估,本论文通过利用决策树技术对军事训练成绩分类评估,把众多、冗杂的测试成绩录入数据库后,综合分析评估,提取辅助决策的关键性数据和隐藏的预测性信息,旨在提高士兵的训练成绩和提升部队战斗力。决策树技术是数据挖掘分类和预测的主要技术之一,是通过在一组无次序、无规则的实例中推理出决策树表现形式的分类规则。决策树方法与其它分类方法相比具有可理解性、易训练、易实施和通用性等优点,所以本论文选择将决策树技术应用到军事训练成绩分析研究中。本文主要进行了以下几个方面的研究工作:1、论文介绍了数据挖掘相关技术和理论基础。在介绍数掘挖掘基本概念的基础上,对数据挖掘的对象、可发现的模式进行了详细的分类、归纳和总结,并对数据挖掘常用方法和数据挖掘的步骤进行了详细地阐述。2、决策树技术的分析与研究。通过第三章,详细分析了应用决策树技术挖掘数据信息的具体步骤,并对决策树的经典算法及其基本思想进行了归纳、分析和研究,对各种算法之间的差别进行了客观地比较。3、分析了现有对军事训练成绩分析的不足。针对军事训练成绩分析的重要性和作用,提出将数据挖掘技术应用于军事训练成绩分析中的重要意义。4、完整地介绍了决策树技术在军事训练成绩分析挖掘中的全过程。第五章所讨论的内容是论文的重点。采用收集士兵训练的各个科目的成绩的方式收集数据,并对数据进行了预处理操作,利用C4.5算法生成了军事训练体能成绩分析决策树模型和军事训练技能成绩分析决策树模型,并由此产生了分类规则。