论文部分内容阅读
摘 要:高校教师教育技术能力是教育信息化大环境下教师教学能力的重要体现,如何有效地对评价这一能力并对其进行合理聚类,是促进教师专业化发展的首要工作。文章采用基于粒子群的K均值聚类算法实现了这一目的,以期利于今后对高校教师开展有针对性地培训和观摩工作,促进教育技术在学科教学中的有效发展。
关键词:教育技术能力;粒子群算法;K均值聚类算法
一、引言
高校教师教育技术能力是教育信息化大环境下教师教学能力的重要体现,它是指教师运用各种信息技术并以各种教育理论为指导来支持教育教学和自身专业发展的能力,包括教师个人基本信息素养、信息化组织与实施教学活动的能力、对教学资源和教学过程进行设计、开发、利用、管理与评价的能力,以及教师的伦理道德意识和所承担的社会责任。因此,教师教育技术能力是现代教师最重要的专业能力之一,对推进信息技术与学科课程整合、改善教师的能力结构、加快教育信息化发展等具有重要的作用。
如何高效地对高校教师教育技术能力进行评价并按评价结果合理地聚类分类,从而提升教师教育技术能力培训的针对性和有效性,已成为促进教师专业化发展的首要工作。这有利于高校整体性推进教育技术培训工作,培养出既懂专业知识并掌握教育理论、又能很好地将信息技术与学科课程整合的高校教师,促进教育技术在学科教学中的有效发展。
二、方法
聚类分析(ClusterAnalysis)是一种探索性的统计分析研究方法,实质是建立一种分类方法,即从样本数据出发,按照它们在性质上的亲密程度在没有先验知识的情况下自动进行分类,有效地解决“物以类聚”问题。高校教师正是这样一个具有相似性个体的集合,不同教师之间的教育技术能力既有相同之处又有明显的区别,因此可通过聚类分析对教师按教育技术能力进行分类,从而有针对性地对不同类别的教师群体进行有效的教育技术能力培训。
在聚类分析里各种各样的聚类算法中,最经典、最常用的当属K均值聚类算法。K均值聚类算法以k作为参数,即在需要分类的数据中寻找K组数据作为初始聚类中心;然后计算其他数据距离这K个聚类中心的距离,将数据归入与其距离最近的聚类中心,从而把含有n个对象的集合划分为k个子集,以使每个子集内部的所有对象具有较高的相似度,而各个子集之间的相似度较低;再对这K个聚类的数据重新计算其均值,以找出这些类新的聚类中心。重复上述步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。
K均值聚类算法的聚类结果一般会受到所选聚类中心的个数、初始位置以及模式样本的几何性质及读入次序等的影响,在实际应用中需要试探不同的K值并选择不同的聚类中心起始值,一般可选择样本集中前K个样本作为初始聚类中心。这使得K均值聚类算存在一个明显的问题,即对初始中心点的选取非常敏感,导致聚类结果的波动范围较大,稳定性较差,算法易陷入局部最优解。
由于基于粒子群的K均值算法可以较大的随机性产生下一代解群,并且各代种群中所有解可以共享“全局信息”和每个解不断提高“自我素养”,这使得每代种群中的解既可以自我学习又能同时向其他解学习,从而算法不易陷入局部最优解,且具有较快的收敛速度。因此本文采用基于粒子群的K均值算法来对高教教师教育技术能力进行聚类分组。
三、算法
本算法中每个粒子对应一个可行解,即由一组确定的聚类中心领衔的一种样本聚类划分方案,其解的结构包括组成该粒子的m个聚类中心的位置、m个聚类中心的速度及这个粒子的适应度值。
1.初始化种群时,首先将样本随机划分成k类,计算各类的聚类中心,并将k个聚类中心的位置顺次存入数组作为该粒子的初始位置(即由“划分”确定“中心”),记为Pibest(i=1,……,k);其次,初始化该粒子的速度;再次,计算该粒子的适应度,即计算所有样本到各自所在划分的中心的距离之和,将所有粒子适应度最大值的粒子的位置记为Gbest。反复操作该方法n次,以产生n个初始粒子群。
2.对于其后每代每个粒子,首先根据该粒子这一代k个聚类中心的位置,重新确定围绕各中心的划分,即将每个样本划分到离它距离最近的中心所在的划分中;其次,对新形成的聚类划分重新计算各自新的聚类中心(即由“中心”确定“划分”,再确定“中心”);再次,计算新划分、新中心下该粒子的适应度;最后,按照(3)中规则进行更新,以生成新一代粒子群:
3.更新规则:
对于每个粒子,若适应度大于其上一代的适应度,则更新Pibest;
对于每个粒子,若适应度大于其上一代所有粒子适应度的最大值,则更新Gibest;
再按下面两式更新每个粒子的速度和位置:
其中,Vi和Xi是当前粒子的速度和位置,Vi’和Xi’是更新后粒子的速度和位置,Pibest是每个粒子自身经历过的最优位置,Gbest是粒子群整体经历过的最优位置,w是惯性权重,rand()是介于(0,1)之间的随机数,c1、c2是学习因子,通常c1=c2=2。
算法若达到结束条件(位置足够好或已达到最大迭代次数)时,算法结束,否则转到第(2)步。
综上所述,本算法通过调整聚类中心获得最优划分,最后的聚类中心依然是各类中样本的均值,利用粒子群算法给聚类中心加扰动,以增强跳出局部极值和寻找最优聚类的能力,如果多次扰动下聚类划分不变或已达扰动次数上限,则认为当前的聚类为最优聚类,也就是找到了最优聚类中心。
四、实证
现针对某高校150名教师的教育技术能力进行评估。我们选取教师个人基本信息素养、信息化组织与实施教学的能力、科研创新与技术交流的能力、社会责任这四项一级指标为评估指标,通过问卷调查得到这150名教师在这四个评价指标上的得分,然后经过加权平均并做归一化处理后,将得分作为算法处理的数据对象。现设数据样本数为150,粒子數为50,算法迭代次数为100,聚类数为3,可得到如下图1所示的数据聚类结果图,由此可以看出这150位教师按教育技术能力聚类的大致分布图。由于算法具有较快的收敛速度,因此随着迭代次数的变化,在第10代以后算法相对收敛,并逐渐趋于平稳,很少出现波动不定的现象,如下图2所示。
综上所述,虽然高校教师的教育技术能力不尽相同,具有较大的模糊性和非确定性,但通过本方法可以客观、公正和有效地评价高校教师的教育技术能力,并对他们按能力合理地聚类,以利于今后对其有针对性地观摩和开展培训,促进教育技术在学科教学中的有效发展。
图1数据聚类结果图图2算法随迭代次数收敛的情况图
参考文献:
[1]赵讯.高校教师现代教育技术能力刍议[J].重庆工学院学报(社会科学).2008(04):151-152,180.
[2]刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005(06):54-58.
[3]钟志强.教师教育技术能力培训形成性评价实证研究[J].现代远程教育研究.2012(02):90-96.
(作者单位:青海师范大学计算机学院)
关键词:教育技术能力;粒子群算法;K均值聚类算法
一、引言
高校教师教育技术能力是教育信息化大环境下教师教学能力的重要体现,它是指教师运用各种信息技术并以各种教育理论为指导来支持教育教学和自身专业发展的能力,包括教师个人基本信息素养、信息化组织与实施教学活动的能力、对教学资源和教学过程进行设计、开发、利用、管理与评价的能力,以及教师的伦理道德意识和所承担的社会责任。因此,教师教育技术能力是现代教师最重要的专业能力之一,对推进信息技术与学科课程整合、改善教师的能力结构、加快教育信息化发展等具有重要的作用。
如何高效地对高校教师教育技术能力进行评价并按评价结果合理地聚类分类,从而提升教师教育技术能力培训的针对性和有效性,已成为促进教师专业化发展的首要工作。这有利于高校整体性推进教育技术培训工作,培养出既懂专业知识并掌握教育理论、又能很好地将信息技术与学科课程整合的高校教师,促进教育技术在学科教学中的有效发展。
二、方法
聚类分析(ClusterAnalysis)是一种探索性的统计分析研究方法,实质是建立一种分类方法,即从样本数据出发,按照它们在性质上的亲密程度在没有先验知识的情况下自动进行分类,有效地解决“物以类聚”问题。高校教师正是这样一个具有相似性个体的集合,不同教师之间的教育技术能力既有相同之处又有明显的区别,因此可通过聚类分析对教师按教育技术能力进行分类,从而有针对性地对不同类别的教师群体进行有效的教育技术能力培训。
在聚类分析里各种各样的聚类算法中,最经典、最常用的当属K均值聚类算法。K均值聚类算法以k作为参数,即在需要分类的数据中寻找K组数据作为初始聚类中心;然后计算其他数据距离这K个聚类中心的距离,将数据归入与其距离最近的聚类中心,从而把含有n个对象的集合划分为k个子集,以使每个子集内部的所有对象具有较高的相似度,而各个子集之间的相似度较低;再对这K个聚类的数据重新计算其均值,以找出这些类新的聚类中心。重复上述步骤,直到新的聚类中心与上一次的聚类中心值相等时结束算法。
K均值聚类算法的聚类结果一般会受到所选聚类中心的个数、初始位置以及模式样本的几何性质及读入次序等的影响,在实际应用中需要试探不同的K值并选择不同的聚类中心起始值,一般可选择样本集中前K个样本作为初始聚类中心。这使得K均值聚类算存在一个明显的问题,即对初始中心点的选取非常敏感,导致聚类结果的波动范围较大,稳定性较差,算法易陷入局部最优解。
由于基于粒子群的K均值算法可以较大的随机性产生下一代解群,并且各代种群中所有解可以共享“全局信息”和每个解不断提高“自我素养”,这使得每代种群中的解既可以自我学习又能同时向其他解学习,从而算法不易陷入局部最优解,且具有较快的收敛速度。因此本文采用基于粒子群的K均值算法来对高教教师教育技术能力进行聚类分组。
三、算法
本算法中每个粒子对应一个可行解,即由一组确定的聚类中心领衔的一种样本聚类划分方案,其解的结构包括组成该粒子的m个聚类中心的位置、m个聚类中心的速度及这个粒子的适应度值。
1.初始化种群时,首先将样本随机划分成k类,计算各类的聚类中心,并将k个聚类中心的位置顺次存入数组作为该粒子的初始位置(即由“划分”确定“中心”),记为Pibest(i=1,……,k);其次,初始化该粒子的速度;再次,计算该粒子的适应度,即计算所有样本到各自所在划分的中心的距离之和,将所有粒子适应度最大值的粒子的位置记为Gbest。反复操作该方法n次,以产生n个初始粒子群。
2.对于其后每代每个粒子,首先根据该粒子这一代k个聚类中心的位置,重新确定围绕各中心的划分,即将每个样本划分到离它距离最近的中心所在的划分中;其次,对新形成的聚类划分重新计算各自新的聚类中心(即由“中心”确定“划分”,再确定“中心”);再次,计算新划分、新中心下该粒子的适应度;最后,按照(3)中规则进行更新,以生成新一代粒子群:
3.更新规则:
对于每个粒子,若适应度大于其上一代的适应度,则更新Pibest;
对于每个粒子,若适应度大于其上一代所有粒子适应度的最大值,则更新Gibest;
再按下面两式更新每个粒子的速度和位置:
其中,Vi和Xi是当前粒子的速度和位置,Vi’和Xi’是更新后粒子的速度和位置,Pibest是每个粒子自身经历过的最优位置,Gbest是粒子群整体经历过的最优位置,w是惯性权重,rand()是介于(0,1)之间的随机数,c1、c2是学习因子,通常c1=c2=2。
算法若达到结束条件(位置足够好或已达到最大迭代次数)时,算法结束,否则转到第(2)步。
综上所述,本算法通过调整聚类中心获得最优划分,最后的聚类中心依然是各类中样本的均值,利用粒子群算法给聚类中心加扰动,以增强跳出局部极值和寻找最优聚类的能力,如果多次扰动下聚类划分不变或已达扰动次数上限,则认为当前的聚类为最优聚类,也就是找到了最优聚类中心。
四、实证
现针对某高校150名教师的教育技术能力进行评估。我们选取教师个人基本信息素养、信息化组织与实施教学的能力、科研创新与技术交流的能力、社会责任这四项一级指标为评估指标,通过问卷调查得到这150名教师在这四个评价指标上的得分,然后经过加权平均并做归一化处理后,将得分作为算法处理的数据对象。现设数据样本数为150,粒子數为50,算法迭代次数为100,聚类数为3,可得到如下图1所示的数据聚类结果图,由此可以看出这150位教师按教育技术能力聚类的大致分布图。由于算法具有较快的收敛速度,因此随着迭代次数的变化,在第10代以后算法相对收敛,并逐渐趋于平稳,很少出现波动不定的现象,如下图2所示。
综上所述,虽然高校教师的教育技术能力不尽相同,具有较大的模糊性和非确定性,但通过本方法可以客观、公正和有效地评价高校教师的教育技术能力,并对他们按能力合理地聚类,以利于今后对其有针对性地观摩和开展培训,促进教育技术在学科教学中的有效发展。
图1数据聚类结果图图2算法随迭代次数收敛的情况图
参考文献:
[1]赵讯.高校教师现代教育技术能力刍议[J].重庆工学院学报(社会科学).2008(04):151-152,180.
[2]刘靖明,韩丽川,侯立文.基于粒子群的K均值聚类算法[J].系统工程理论与实践,2005(06):54-58.
[3]钟志强.教师教育技术能力培训形成性评价实证研究[J].现代远程教育研究.2012(02):90-96.
(作者单位:青海师范大学计算机学院)