改进聚类分析算法及其在成绩分析中的应用研究

来源 :大连交通大学 | 被引量 : 0次 | 上传用户：honfei1984

【摘要】

：

数据挖掘被称为未来信息处理的骨干技术,它以一种全新的概念改变着人类利用数据的方式。数据挖掘是指从大量的数据中提取有用的信息和知识的过程。这里要求数据源应该是大量

【作者】

：

刘剑

【机构】

：

大连交通大学

【出处】

：

大连交通大学

【发表日期】

：

2008年期

【关键词】

：

数据挖掘聚类遗传算法成绩分析 K-means算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

数据挖掘被称为未来信息处理的骨干技术,它以一种全新的概念改变着人类利用数据的方式。数据挖掘是指从大量的数据中提取有用的信息和知识的过程。这里要求数据源应该是大量的、真实的、含有噪音的,所发现的信息和知识是潜在的并隐藏在大量数据背后的,是用户感兴趣的、可理解、可运用的知识。聚类分析是数据挖掘的一项基本任务,聚类就是将数据对象分组成为多个类或簇,划分的原则是在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。本文的课题以省信息产业厅项目“嵌入式网上智能教学平台”为背景,主要通过对数据挖掘技术的相关分析与比较,提出改进的聚类分析算法,并将此算法与教育统计学相结合,从海量成绩数据中提取出隐藏于其中的有用信息。开发了嵌入式网上智能教学平台的成绩分析系统,实现学生成绩分析和试卷质量评价报告的自动生成。本文针对传统的基于遗传算法的K-means算法由于在遗传过程中易早熟,在算法后期整个种群停滞不前而得不到全局最优解的问题。提出一种改进的基于遗传算法的聚类分析算法。该算法用一种改进的基于模拟退火的自适应方法对适应度进行拉伸,然后动态调整交叉概率与变异概率并用跨世代精英选择策略进行选择,同时结合经典的K-means算法,使该算法可得到聚类划分效果极佳的聚类中心。本文使用Java语言进行了K-means算法和传统的基于遗传算法的K-means算法与本文算法的对比实验,实验结果表明,本文算法有效地避免了K-means算法受初始聚类中心选择的影响而容易陷入局部最优的可能,并消除了对孤立点数据的敏感性,同时也克服了传统的基于遗传算法的K-means算法因过早收敛而陷入局部最优的缺点。理论分析与实验表明,该算法的聚类划分效果明显优于K-means算法和其它传统的基于遗传算法的K-means算法。将改进的基于遗传算法的K-means算法应用到试卷质量的成绩分析中,并结合到网上教学当中去,从而发现嵌入式系统网上智能教学平台中试题的不足之处,并进一步改善试卷的质量,取得令人满意的智能化教学效果。

其他文献

基于内容的三维模型检索方法研究及实现

随着多媒体技术及网络的迅速发展,三维模型也逐渐成为继声音、图像和视频之后的第四种多媒体数据类型。针对海量网络信息中搜寻需要的三维模型问题,研究三维模型预处理、交互

学位

三维模型三维模型检索特征提取搭积木相似性度量

一种基于蚁群算法的移动应用云协助式调度方案

针对当前移动应用计算需求增大的情况,出现了一种新的计算模式,移动云计算(Mobile Cloud Computing,MCC)。典型的移动云计算模式,是基于任务上载的云协作式计算。在移动云协

学位

移动云计算任务上载状态转移蚁群算法

基于语义Web的知识管理系统的研究与实现

随着知识经济的快速发展，知识资产已经成为企业的重要资源。到目前为止，国内外企业的知识管理还处于探索阶段，但知识管理作为一种管理模式已经深入人心，并且越来越多的企业开始认

学位

语义Web知识管理系统软件企业体系结构信息咨询服务

基于模糊Petri网的基因调控网络建模研究

基因芯片及高吞吐量的DNA测序机技术的发展导致了超大规模的基因组数据的集成,而将这些数据转化为有价值的生物信息是目前人们面临的最大挑战,同时也成为基因调控网络研究中

学位

模糊着色Petri网模糊Petri网逆向推理模糊逻辑基因表达水平DNA可信度基因网络

基于OpenGL的三维游戏引擎的研究

游戏引擎是最近十年出现的新名词，也是当前计算机应用技术领域倍受关注的一个研究方向。游戏引擎是同一类游戏中经过规范化的可复用部件，它有机结合了多种子引擎，包括图形、声音

学位

三维游戏引擎虚拟现实OpenGL软件包游戏开发

基于Moodle平台的课程资源和教学计划集成方法的研究与应用

当今世界,科学技术飞速发展,信息技术日新月异。随着网络技术及多媒体技术的快速发展和在教育中的广泛应用,E-learning这一新颖的学习方式日渐得到应用和推广。网络学习平台

学位

网络教育Moodle平台模块化教学计划集成

Hopfield神经网络的改进及其应用——基于Hopfield神经网络的脱机手写数字识别

脱机手写数字识别在很多领域具有广泛的应用前景，国内外学者对此做了大量的研究工作，提出了很多预处理和模式识别的算法，大大提高了手写数字的识别精度。但到目前为止，手写数字识

学位

脱机手写数字识别识别精度

基于Petri网的工作流模型在物流管理系统中的应用

工作流的概念起源于生产制造业与办公自动化领域,是针对日常工作中具有固定程序的活动提出的一个概念。将工作流引入企业日常工作给企业带来诸多好处：提高效率——自动化使得

学位

工作流模型Petri网随机Petri网时间Petri网建模性能分析

基于多QoS的网格资源管理与任务调度算法研究

网格是高性能计算和信息服务的战略性基础设施,而网格技术已成为下一代互联网应用的关键技术。高速网络的发展将分散的、异构的计算资源有机地整合到一起形成计算网格,为解决

学位

网格计算QoS任务调度模糊区间资源绑定资源聚类makespan关联任务

基于Linux平台高性能安全网关的研究与实现

随着Internet的发展，Internet已经成为人们获取信息的重要手段之一。Internet正不断增强着人类社会的生产力，改变着人类社会的生产方式，也因此Internet成为上个世纪最伟大的人类

学位

高性能安全网关加密认证网络安全密钥协商数据转发速度

改进聚类分析算法及其在成绩分析中的应用研究

与本文相关的学术论文