改进聚类分析算法及其在成绩分析中的应用研究

来源 :大连交通大学 | 被引量 : 0次 | 上传用户:honfei1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘被称为未来信息处理的骨干技术,它以一种全新的概念改变着人类利用数据的方式。数据挖掘是指从大量的数据中提取有用的信息和知识的过程。这里要求数据源应该是大量的、真实的、含有噪音的,所发现的信息和知识是潜在的并隐藏在大量数据背后的,是用户感兴趣的、可理解、可运用的知识。聚类分析是数据挖掘的一项基本任务,聚类就是将数据对象分组成为多个类或簇,划分的原则是在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。本文的课题以省信息产业厅项目“嵌入式网上智能教学平台”为背景,主要通过对数据挖掘技术的相关分析与比较,提出改进的聚类分析算法,并将此算法与教育统计学相结合,从海量成绩数据中提取出隐藏于其中的有用信息。开发了嵌入式网上智能教学平台的成绩分析系统,实现学生成绩分析和试卷质量评价报告的自动生成。本文针对传统的基于遗传算法的K-means算法由于在遗传过程中易早熟,在算法后期整个种群停滞不前而得不到全局最优解的问题。提出一种改进的基于遗传算法的聚类分析算法。该算法用一种改进的基于模拟退火的自适应方法对适应度进行拉伸,然后动态调整交叉概率与变异概率并用跨世代精英选择策略进行选择,同时结合经典的K-means算法,使该算法可得到聚类划分效果极佳的聚类中心。本文使用Java语言进行了K-means算法和传统的基于遗传算法的K-means算法与本文算法的对比实验,实验结果表明,本文算法有效地避免了K-means算法受初始聚类中心选择的影响而容易陷入局部最优的可能,并消除了对孤立点数据的敏感性,同时也克服了传统的基于遗传算法的K-means算法因过早收敛而陷入局部最优的缺点。理论分析与实验表明,该算法的聚类划分效果明显优于K-means算法和其它传统的基于遗传算法的K-means算法。将改进的基于遗传算法的K-means算法应用到试卷质量的成绩分析中,并结合到网上教学当中去,从而发现嵌入式系统网上智能教学平台中试题的不足之处,并进一步改善试卷的质量,取得令人满意的智能化教学效果。
其他文献
随着多媒体技术及网络的迅速发展,三维模型也逐渐成为继声音、图像和视频之后的第四种多媒体数据类型。针对海量网络信息中搜寻需要的三维模型问题,研究三维模型预处理、交互
针对当前移动应用计算需求增大的情况,出现了一种新的计算模式,移动云计算(Mobile Cloud Computing,MCC)。典型的移动云计算模式,是基于任务上载的云协作式计算。在移动云协
随着知识经济的快速发展,知识资产已经成为企业的重要资源。到目前为止,国内外企业的知识管理还处于探索阶段,但知识管理作为一种管理模式已经深入人心,并且越来越多的企业开始认
基因芯片及高吞吐量的DNA测序机技术的发展导致了超大规模的基因组数据的集成,而将这些数据转化为有价值的生物信息是目前人们面临的最大挑战,同时也成为基因调控网络研究中
游戏引擎是最近十年出现的新名词,也是当前计算机应用技术领域倍受关注的一个研究方向。游戏引擎是同一类游戏中经过规范化的可复用部件,它有机结合了多种子引擎,包括图形、声音
当今世界,科学技术飞速发展,信息技术日新月异。随着网络技术及多媒体技术的快速发展和在教育中的广泛应用,E-learning这一新颖的学习方式日渐得到应用和推广。网络学习平台
脱机手写数字识别在很多领域具有广泛的应用前景,国内外学者对此做了大量的研究工作,提出了很多预处理和模式识别的算法,大大提高了手写数字的识别精度。但到目前为止,手写数字识
工作流的概念起源于生产制造业与办公自动化领域,是针对日常工作中具有固定程序的活动提出的一个概念。将工作流引入企业日常工作给企业带来诸多好处:提高效率——自动化使得
网格是高性能计算和信息服务的战略性基础设施,而网格技术已成为下一代互联网应用的关键技术。高速网络的发展将分散的、异构的计算资源有机地整合到一起形成计算网格,为解决
随着Internet的发展,Internet已经成为人们获取信息的重要手段之一。Internet正不断增强着人类社会的生产力,改变着人类社会的生产方式,也因此Internet成为上个世纪最伟大的人类