论文部分内容阅读
大数据时代观:一种可以采纳的思维模式
依据现有传统思维模式实现上述的“全数据”评估,必然存在人力、物力和海量数据的困境。因此,我们必须转变思维模式,革新传统监控评估技术。大数据时代观就是一种可以采纳的思维模式。其关键是“样本=总体”。
在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机抽样应运而生,“抽样”的目的就是用最少的数据得到最多的信息,它可以被视为那个时代的产物。但是,当感应器、手机导航、网站点击等被动地收集了大量数据,而计算机可以轻易地对这些数据进行处理,我们可以获得海量数据的时候,其缺陷越来越难以忽视了。〔见维克托·迈尔-舍恩伯格(英)《大数据时代:生活、工作与思维的大变革》(中文版).浙江人民出版社.2012版,以下简称“维克托文”〕例如用抽样的方法分析整个人口的情况,正确率可达97%。对于某些事物来说,3%的错误率是可以接受的。但是对于教育来说,3%的错误率是不能接受的。数据处理技术已经发生了翻天覆地的改变,我们的方法和思维也要跟上这种改变,要以每一个学生数据中心,合法地收集他们的所有数据,用“样本=总体”为思路,设计评估,设计质量监控。
(一)大数据时代观点综述
进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数大数据时代来临,并命名与之相关的技术发展与创新。大数据时代观下有许多成功案例,如2009年甲型H1N1流感爆发的时候,谷歌更有效、更及时的发布了“流感”指示标。令人惊人的是,谷歌的方法是建立在大数据的基础之上的,而不需要分发口腔试纸或联系医生。这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。(见“维克托文”)
为了引入大数据时代的基本观点,我们对这段时间内与监控有联系论点做一个综述。
首先,“从硅谷到北京,大数据的话题正在被传播。”“我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。……如今,一个大规模生产、分享和应用数据的时代正在开启。”“互联网时代,尤其是社交网络、电子商务与移动通信把人类社会带入了一个以PB(1024TB)为单位的结构与非结构数据信息的新时代。”大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。
其次,让数据“发声”。“大数据”专家杰夫·乔纳斯(Jeff Jonas)提出要让数据“说话”。在数字化时代,数据处理变得更加容易、更加快速,人们能够在瞬间处理成千上万的数据。但当我们谈论能“说话”的数据时,我们指的远远不止这些。
其三,“样本=总体”。当数据处理技术已经发生了翻天覆地的变化时,进行抽样分析在大数据时代就像在汽车时代骑马一样。(见“维克托文”)随机抽样取只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。一旦抽样过程中存在任何偏见,分析结果就会相去甚远。探索以大数据为基础的克服抽样缺陷的解决方案,是提高数据利用效率的重要手段。联系到我国现代化所面临的种种问题以及教育、交通、医疗保健等各方面挑战,通过大数据这种创新方式来解决问题,意义就更大。(见“维克托文”)
其四,大数据的核心就是建立在海量数据的基础之上的1预测。有预测的监控,才有可能不断完善受监控的学校或区域。而这种“完善”是自主,内在的,随着监控系统接收到的数据越来越多,它们可以聪明到自动搜索最好的信号和模式,并监控系统也将自己改善自己。将目前单纯依靠人类判断力的监控模式,转变为监控在计算机系统帮助下,成为受监测的主体和监控实施者共同自主完善模式下的监控行为。
从上述大数据的观点来看,目前在教育质量监控评估上,过于依赖“抽样”数据,都比较重视各种终端信息的采集,但对于管理和教学过程中的信息及发展性的信息关注不够,教学质量信息采集时效性较差,是出现“两费两差一不足”,不利于对教学质量进行全过程管理,影响教学质量评估诊断、促进效用的及时发挥。
(二)大数据时代观下的教育质量监控设想
目前评价方法一般是“加权求和”,虽然简单,但容易降低评价的可能性,无法发挥数据全部作用。现有的网络评价应用无疑延伸了评价的时间、拓宽了评价的空间、丰富了监控的内容,但同时也使评价数据库的数据急剧增多,这些浩瀚的数据背后隐藏着许多重要的信息。传统的数据分析手段只能获取这些数据的表层信息,难以从中挖掘出有助教学决策的有价值的信息,来构建有效的教学质量预警机制。
以下我们从教育质量监控体系包括以下五个相互联系、相互影响的子系统(即教育教学质量管理理念、组织机构、资源状况、教育教学过程和质量评价分析)出发,谈谈教育质量监控的设想。
1. 树立以学生发展为本质量监控的出发点和归宿。首先在监控上要关注每一个学生的发展,监控的样本等于所有学生,将学生体检的健康数据、出入校门或班级的出勤数据、进入场所(宿舍、饭堂、图书馆的时间)时间、作业次数记录、以及学业水平数据、家庭及社区环境数据、入学毕业跟踪数据都作为监控的对象,并在此基础上形成区域(或学生)学生发展状况报告,发布学生健康状况报告、学业水平报告。
2. 教育管理机构为主导的全员参与监控实体。组成一个纵横交错、相互作用、相互制约的监控机构网,对教育活动的全过程实施全面监控。
3. 区域内一体化的资源状况监控系统。监控人力资源管理、基本设施建设与管理、经费管理等。在此基础上可以了解区域内的均衡化发展的程度,学校资源利用情况。
4. 实时化教育过程监控系统。实时化过程监控是对教学计划运行过程的观察、监督,对偏离教学质量目标的行为进行实时分析和处理,保障课程设施正常开展,防范不按国家要求设置课程情况,防范加班加点情况。监控主要包括教学准备与设计监控、课堂教学过程监控、课程考试监控、实践教学监控等。目前来看,课堂教学评价系统记录产生大量评价数据,然而,这些数据主要是在日常教务管理过程中产生的,是教学质量测量的最重要的数据源,管理系统一般都没有对其进行深入分析,也没有发现其中隐藏的各种知识,这就使得教学管理人员无法从整体上把教学的综合效果、变化趋势等,教务管理系统积累的海量数据没有能够发挥应有的作用。要利用专门的分析软件进行分析,为改进教学、提高教学质量服务。 5. 评语式的质量评价分析系统。要培育大数据时代的监控专家,保障教育“数据”真正发言,形成基本“评语”;要努力开发符合“全数据”的智能化教育管理系统,该系统对现有教育管理系统具有很强的兼容性,能够采纳已有数据。
为实现上述五点设想,建议采取以下工作策略:
1. 组建适合“全数据”质量监控机构和队伍;
2. 研究“全数据”质量监控理论,开发监控框架,建立适合全数据评价评估的数学模型;
3. 摸清我省现有中小学学校内管理系统的类型(教务、学籍、图书、健康、成绩等等),同时要研究非教育系统与学生相关的数据系统,在此基础上充分利用现有数据资源;
4. 监控中的有关指标尽量避免抽样,其数据指向是现有教工、学生的日常数据,达到两个目标:监控评估是真实的,监控数据不需要临时采集。
(三)教育监控系统数据库
教育监控系统数据库建设首先要抓好数据框架研究。从宏观上看,质量监控系统数据一般分为 “硬数据”和“软数据”。(见凌惜勤等《建立校级教学基本状态数据系统,完善教学质量监控体系》教改经纬.2011.总第219期)
“硬数据”一般是以数字的形式出现,具有统计功能,主要包括数量,名次和比率,如在校学生数、师资队伍情况、学校占在面积、校舍及实验室面积、教学仪器设备的数量及价值、图书馆藏书及体育场馆面积,各项教学经费投入情况等。而“软数据”一般是指对客观事物的判断和描述,不具有统计功能,主要包括文字、文档、图像信息等。大数据观点下,格外重视“软数据”。挖掘这些数据往往可以深入分析学校的办学指导思想,办学目标定位、人才培养方案、教学计划的制定与落实情况、教学管理制度的制定及执行情况、教学质量标准的制定及监控情况,各种评估、评价(如学生评教、教师评学、各级各类的听课评价,社会及用人单位的评价等)及反馈、各种总结报告、获奖情况,无疑这些数据是十分重要的监控信息。要重视软数据库模式的标准研究和建设。
为实现以学生发展为中心的全数据理念,首先要建立适合其理念数据维度。例如TQMDSS(见张忠玉等《一种基于本科教学质量监控的决策支持系统》华南师范大学学报(自然科学版).2007,04)中重要的维度有:
1. 时间维度。根据学校的实际情况又分为年度维度和学期维度,其属性较为简单“年度(年度编号,年度);学期(学期编号,学期)。
2. 学生维度。学生、教师信息都存放在TQMS中的用户信息表中,为了方便区分教师和学生,在数据源数据库Classroom Teaching中,建立专门的学生视图,作为学生维度数据源。这样学生维度属性为:学生(学生号,年级,学生姓名)。由于学生用户太多,为便于筛选,采用多级别维度;依次为年级、学院、专业、高级别的学生集合必须包含低级别的学生集合。
3. 教师维度。同学生维度一样,建立教师视图作为教师维度数据源,教师维度属性为:教师(教师号,学院、教师名);教师没有年级和专业属性(因此许多高校教师主要以院系为单位管理,经常跨专业授课)。
4. 教学班级维度。教学班级是对某学期、某教师为某班级(教学对象)开设的某一门课程的抽象描述。
其次,为提高监控工作的水平,要设法保障监控数据质量。
可能造成统计数据质量不高的原因会是多方面的,如法制意识不强;统计人员队伍素质不高;被统计或调查对象不配合。提高统计数据质量的措施首先要提高统计人员素质;要把握数据源头,夯实统计数据质量基础;也要对统计数据质量进行监控。对数据质量监控的方法可以分为以下几类:按监控时间可分为日常监控和时点监控;安数据质量监控范围可分为抽样监控和全数监控;安数据质量监控的手段可分为审核、复核、校验、实地检查。
大数据时代观下监控模式的发展前景
(一)用数据库(包括学校概况、师资队伍、校园校舍、办学经费、图书资料、仪器设备、专业与课程、教学管理、教学效果、学生基本情况等数据群组信息)可以达到教育质量全面监控的目的,形成全面的、动态的教学质量监控体系。各个学校的状态数据库所采集的数据项是原始的,是真实、客观、准确的,未来开发的监控系统会自动生成各项工作中所需要的衍生数据,为更深的层次分析教育现象产生的原因以及教育发展的偏差和趋势服务。
(二)监控系统将是智能化的实时的开放的系统,从目前监控过于依赖专家的单一模式,转变为将系统数据分析与专家协调监控模式。系统也将有利于实施民主监督与社会监督。
(三)有利于教育主管部门和学校用数据信息治校,而不是分数治校。教育行政部门用数据发现“细微”的问题,及时提醒,引导教育,而不是分数掐死教育。也可以有效避免将教学质量监控等同于考试,避免监控沦落为片面追求升学率的推手。
(作者单位:广东省教育研究院)
责任编辑 邹韵文
依据现有传统思维模式实现上述的“全数据”评估,必然存在人力、物力和海量数据的困境。因此,我们必须转变思维模式,革新传统监控评估技术。大数据时代观就是一种可以采纳的思维模式。其关键是“样本=总体”。
在信息处理能力受限的时代,世界需要数据分析,却缺少用来分析所收集数据的工具,因此随机抽样应运而生,“抽样”的目的就是用最少的数据得到最多的信息,它可以被视为那个时代的产物。但是,当感应器、手机导航、网站点击等被动地收集了大量数据,而计算机可以轻易地对这些数据进行处理,我们可以获得海量数据的时候,其缺陷越来越难以忽视了。〔见维克托·迈尔-舍恩伯格(英)《大数据时代:生活、工作与思维的大变革》(中文版).浙江人民出版社.2012版,以下简称“维克托文”〕例如用抽样的方法分析整个人口的情况,正确率可达97%。对于某些事物来说,3%的错误率是可以接受的。但是对于教育来说,3%的错误率是不能接受的。数据处理技术已经发生了翻天覆地的改变,我们的方法和思维也要跟上这种改变,要以每一个学生数据中心,合法地收集他们的所有数据,用“样本=总体”为思路,设计评估,设计质量监控。
(一)大数据时代观点综述
进入2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数大数据时代来临,并命名与之相关的技术发展与创新。大数据时代观下有许多成功案例,如2009年甲型H1N1流感爆发的时候,谷歌更有效、更及时的发布了“流感”指示标。令人惊人的是,谷歌的方法是建立在大数据的基础之上的,而不需要分发口腔试纸或联系医生。这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的产品和服务,或深刻的洞见。(见“维克托文”)
为了引入大数据时代的基本观点,我们对这段时间内与监控有联系论点做一个综述。
首先,“从硅谷到北京,大数据的话题正在被传播。”“我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。……如今,一个大规模生产、分享和应用数据的时代正在开启。”“互联网时代,尤其是社交网络、电子商务与移动通信把人类社会带入了一个以PB(1024TB)为单位的结构与非结构数据信息的新时代。”大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。
其次,让数据“发声”。“大数据”专家杰夫·乔纳斯(Jeff Jonas)提出要让数据“说话”。在数字化时代,数据处理变得更加容易、更加快速,人们能够在瞬间处理成千上万的数据。但当我们谈论能“说话”的数据时,我们指的远远不止这些。
其三,“样本=总体”。当数据处理技术已经发生了翻天覆地的变化时,进行抽样分析在大数据时代就像在汽车时代骑马一样。(见“维克托文”)随机抽样取只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。一旦抽样过程中存在任何偏见,分析结果就会相去甚远。探索以大数据为基础的克服抽样缺陷的解决方案,是提高数据利用效率的重要手段。联系到我国现代化所面临的种种问题以及教育、交通、医疗保健等各方面挑战,通过大数据这种创新方式来解决问题,意义就更大。(见“维克托文”)
其四,大数据的核心就是建立在海量数据的基础之上的1预测。有预测的监控,才有可能不断完善受监控的学校或区域。而这种“完善”是自主,内在的,随着监控系统接收到的数据越来越多,它们可以聪明到自动搜索最好的信号和模式,并监控系统也将自己改善自己。将目前单纯依靠人类判断力的监控模式,转变为监控在计算机系统帮助下,成为受监测的主体和监控实施者共同自主完善模式下的监控行为。
从上述大数据的观点来看,目前在教育质量监控评估上,过于依赖“抽样”数据,都比较重视各种终端信息的采集,但对于管理和教学过程中的信息及发展性的信息关注不够,教学质量信息采集时效性较差,是出现“两费两差一不足”,不利于对教学质量进行全过程管理,影响教学质量评估诊断、促进效用的及时发挥。
(二)大数据时代观下的教育质量监控设想
目前评价方法一般是“加权求和”,虽然简单,但容易降低评价的可能性,无法发挥数据全部作用。现有的网络评价应用无疑延伸了评价的时间、拓宽了评价的空间、丰富了监控的内容,但同时也使评价数据库的数据急剧增多,这些浩瀚的数据背后隐藏着许多重要的信息。传统的数据分析手段只能获取这些数据的表层信息,难以从中挖掘出有助教学决策的有价值的信息,来构建有效的教学质量预警机制。
以下我们从教育质量监控体系包括以下五个相互联系、相互影响的子系统(即教育教学质量管理理念、组织机构、资源状况、教育教学过程和质量评价分析)出发,谈谈教育质量监控的设想。
1. 树立以学生发展为本质量监控的出发点和归宿。首先在监控上要关注每一个学生的发展,监控的样本等于所有学生,将学生体检的健康数据、出入校门或班级的出勤数据、进入场所(宿舍、饭堂、图书馆的时间)时间、作业次数记录、以及学业水平数据、家庭及社区环境数据、入学毕业跟踪数据都作为监控的对象,并在此基础上形成区域(或学生)学生发展状况报告,发布学生健康状况报告、学业水平报告。
2. 教育管理机构为主导的全员参与监控实体。组成一个纵横交错、相互作用、相互制约的监控机构网,对教育活动的全过程实施全面监控。
3. 区域内一体化的资源状况监控系统。监控人力资源管理、基本设施建设与管理、经费管理等。在此基础上可以了解区域内的均衡化发展的程度,学校资源利用情况。
4. 实时化教育过程监控系统。实时化过程监控是对教学计划运行过程的观察、监督,对偏离教学质量目标的行为进行实时分析和处理,保障课程设施正常开展,防范不按国家要求设置课程情况,防范加班加点情况。监控主要包括教学准备与设计监控、课堂教学过程监控、课程考试监控、实践教学监控等。目前来看,课堂教学评价系统记录产生大量评价数据,然而,这些数据主要是在日常教务管理过程中产生的,是教学质量测量的最重要的数据源,管理系统一般都没有对其进行深入分析,也没有发现其中隐藏的各种知识,这就使得教学管理人员无法从整体上把教学的综合效果、变化趋势等,教务管理系统积累的海量数据没有能够发挥应有的作用。要利用专门的分析软件进行分析,为改进教学、提高教学质量服务。 5. 评语式的质量评价分析系统。要培育大数据时代的监控专家,保障教育“数据”真正发言,形成基本“评语”;要努力开发符合“全数据”的智能化教育管理系统,该系统对现有教育管理系统具有很强的兼容性,能够采纳已有数据。
为实现上述五点设想,建议采取以下工作策略:
1. 组建适合“全数据”质量监控机构和队伍;
2. 研究“全数据”质量监控理论,开发监控框架,建立适合全数据评价评估的数学模型;
3. 摸清我省现有中小学学校内管理系统的类型(教务、学籍、图书、健康、成绩等等),同时要研究非教育系统与学生相关的数据系统,在此基础上充分利用现有数据资源;
4. 监控中的有关指标尽量避免抽样,其数据指向是现有教工、学生的日常数据,达到两个目标:监控评估是真实的,监控数据不需要临时采集。
(三)教育监控系统数据库
教育监控系统数据库建设首先要抓好数据框架研究。从宏观上看,质量监控系统数据一般分为 “硬数据”和“软数据”。(见凌惜勤等《建立校级教学基本状态数据系统,完善教学质量监控体系》教改经纬.2011.总第219期)
“硬数据”一般是以数字的形式出现,具有统计功能,主要包括数量,名次和比率,如在校学生数、师资队伍情况、学校占在面积、校舍及实验室面积、教学仪器设备的数量及价值、图书馆藏书及体育场馆面积,各项教学经费投入情况等。而“软数据”一般是指对客观事物的判断和描述,不具有统计功能,主要包括文字、文档、图像信息等。大数据观点下,格外重视“软数据”。挖掘这些数据往往可以深入分析学校的办学指导思想,办学目标定位、人才培养方案、教学计划的制定与落实情况、教学管理制度的制定及执行情况、教学质量标准的制定及监控情况,各种评估、评价(如学生评教、教师评学、各级各类的听课评价,社会及用人单位的评价等)及反馈、各种总结报告、获奖情况,无疑这些数据是十分重要的监控信息。要重视软数据库模式的标准研究和建设。
为实现以学生发展为中心的全数据理念,首先要建立适合其理念数据维度。例如TQMDSS(见张忠玉等《一种基于本科教学质量监控的决策支持系统》华南师范大学学报(自然科学版).2007,04)中重要的维度有:
1. 时间维度。根据学校的实际情况又分为年度维度和学期维度,其属性较为简单“年度(年度编号,年度);学期(学期编号,学期)。
2. 学生维度。学生、教师信息都存放在TQMS中的用户信息表中,为了方便区分教师和学生,在数据源数据库Classroom Teaching中,建立专门的学生视图,作为学生维度数据源。这样学生维度属性为:学生(学生号,年级,学生姓名)。由于学生用户太多,为便于筛选,采用多级别维度;依次为年级、学院、专业、高级别的学生集合必须包含低级别的学生集合。
3. 教师维度。同学生维度一样,建立教师视图作为教师维度数据源,教师维度属性为:教师(教师号,学院、教师名);教师没有年级和专业属性(因此许多高校教师主要以院系为单位管理,经常跨专业授课)。
4. 教学班级维度。教学班级是对某学期、某教师为某班级(教学对象)开设的某一门课程的抽象描述。
其次,为提高监控工作的水平,要设法保障监控数据质量。
可能造成统计数据质量不高的原因会是多方面的,如法制意识不强;统计人员队伍素质不高;被统计或调查对象不配合。提高统计数据质量的措施首先要提高统计人员素质;要把握数据源头,夯实统计数据质量基础;也要对统计数据质量进行监控。对数据质量监控的方法可以分为以下几类:按监控时间可分为日常监控和时点监控;安数据质量监控范围可分为抽样监控和全数监控;安数据质量监控的手段可分为审核、复核、校验、实地检查。
大数据时代观下监控模式的发展前景
(一)用数据库(包括学校概况、师资队伍、校园校舍、办学经费、图书资料、仪器设备、专业与课程、教学管理、教学效果、学生基本情况等数据群组信息)可以达到教育质量全面监控的目的,形成全面的、动态的教学质量监控体系。各个学校的状态数据库所采集的数据项是原始的,是真实、客观、准确的,未来开发的监控系统会自动生成各项工作中所需要的衍生数据,为更深的层次分析教育现象产生的原因以及教育发展的偏差和趋势服务。
(二)监控系统将是智能化的实时的开放的系统,从目前监控过于依赖专家的单一模式,转变为将系统数据分析与专家协调监控模式。系统也将有利于实施民主监督与社会监督。
(三)有利于教育主管部门和学校用数据信息治校,而不是分数治校。教育行政部门用数据发现“细微”的问题,及时提醒,引导教育,而不是分数掐死教育。也可以有效避免将教学质量监控等同于考试,避免监控沦落为片面追求升学率的推手。
(作者单位:广东省教育研究院)
责任编辑 邹韵文