论文部分内容阅读
〔摘 要〕教育大数据作为一种重要的资源,只有通过资源共享,才能达到最大化的利用。本文从教育大数据与资源共享关系出发,构建教育大数据信息平台,并对平台的构建机理、框架结构和功能效用进行详细阐述。最后,从开放获取、分类存储、整合共享、技术支撑和管理协同五个方面论述平台的运行机制,旨在推动大数据背景下的教育大数据信息资源的开放与共享。
〔关键词〕教育大数据;资源共享;平台构建;运行机制
DOI:10.3969/j.issn.1008-0821.2017.12.016
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2017)12-0090-06
〔Abstract〕Being an important resource,only through resource sharing,could education big data get maximize utilization.This article embarked from the education big data and resource sharing relationship,builded the college education big data resource sharing platform,and expounded the construction mechanism,frame structure and functional utility of the platform in detail.Finally,from the open access,classification,storage,integration of sharing,technical support and management synergy five aspects discussed the operating mechanism of the platform,in order to promote the openness and sharing of education data resources in the context of big data.
〔Key words〕education big data;resource sharing;platform construction;operation mechanism
大數据时代已经到来,大数据正在成为推动教育系统颠覆性创新与变革的科学力量[1]。高校作为人才的聚集地和科学创新的发起地,拥有丰富的教育、教学、科研资源,而这些资源一直处于不断地变化、更新和积累中,这些静态和动态资源以及外界与之相关信息汇集在一起,势必形成规模庞大且海量的教育大数据。2013年3月,国家发布了《教育信息化十年发展规划(2011-2020)》将“优质数字教育资源建设与共享行动”列为“中国数字教育2020行动计划”之一[2],这说明教育资源共享已经成为社会关注的焦点。教育大数据作为一种特殊的资源,只有实现充分共享,才能达到最大化利用。因此,本文尝试构建教育大数据信息平台,并探讨建立相应的运行机制确保其良性运行,以期丰富教育大数据共享的理论,支持和促进高校教育教学的创新与发展。
1 教育大数据与资源共享
1.1 教育大数据内涵
大数据是指大的、超过传统数据库系统处理能力的数据。它还包括创新的技术,以捕捉、存储、分发、分析和管理不同结构的数据集[3]。通常,大数据的核心特征常被概括为“4V”,即数据量大(Volume)、 输入和处理速度快(Velocity)、 数据多样(Variety)和真实性(Veracity)[4]。高校的教育、教学、科研、管理等各种教育活动都会产生大量的数据,我们称之为教育大数据。教育领域大数据资源的内涵及构成是很广泛的,一般来讲,教育大数据特指整个教育活动过程中产生的以及根据教育需要采集到的、一切用于教育发展并可创造巨大潜在价值的数据集合[5]。
1.2 教育大数据构成
教育大数据分为与教育活动相关的学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据。1)学生学习行为大数据,是指学生个体层面与学习相关的大数据,包括学生基础信息、学生思想、心理及健康状态、学习行为记录、学习兴趣与动机、学习违规以及与学习相关的其他信息,如学生住宿起居、饮食、卫生等。2)教师教学行为大数据,是指教师层面教学相关的的大数据,包括教职工基础信息、教师教学行为记录、教学方式方法、课件制作、作业布置、课程考核以及受欢迎程度等方面。3)学校教育资源大数据,是指学校教育管理过程产生的大数据,既包括教育建设管理过程生成的精品课、PPT课件、教学视频、图片、试题试卷等各种形式的教学资源,也包括大型科学仪器、实验场地、办公工具、科研成果、专利以及论文发表等各类科研资源,另外,还包括学生管理、教务管理、课堂管理、科研管理等教育管理资源。4)政府教育管理大数据,是指政府层面有关教育管理的大数据,包括教育政策、教育行政管理及相关统计数据等,如教育部在2012年发布的7个教育管理信息系列标准中提到的所有数据以及出台的各项教育政策等。这些教育大数据资源将对促进教育发展、优化教育资源配置、提升教育质量及水平起到极为重要的作用。
1.3 教育大数据信息共享主客体及衔接
数据也是一种资源,并且是极为重要的资源。从资源依赖理论来讲,没有任何一个组织是自给自足的,所有组织都必须为了生存而与其环境进行交换[6]。其实,教育大数据信息共享不是一个静止的概念,而是一个动态的过程,涉及共享主体、共享客体及共享载体3个方面。其中,教育大数据信息共享主体是指对于高等学校的教育大数据信息进行开放共享的主体,可以是教育团体,如教育团队、科研团队以及创新团队等,也可以是作为个体的人,如学生、教师等,还可以是组织机构,如高校及内部各职能部门、企业、政府机关等;教育大数据信息共享客体主要是指由学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据共同构成的资源集合。共享主体要想充分共享客体资源,必须借助一定形式的、可操作的、实践性的载体才能最终实现,这个载体称之为教育大数据信息平台,而教育大数据信息平台在满足共享主体的资源需求、促进共享客体的最大化利用等方面将发挥着关键作用。 2 教育大数据信息平台构建机理及效用
2.1 教育大数据信息平台构建机理
2.1.1 平台内涵
教育大数据信息平台是一个跨地域、跨媒介的大系统体系,它针对教育大数据共享服务中涉及的基础设施服务需求,能够提供教育大数据的接入、存储、管理、共享及服务所需的基础支撑环境,并且为教育大数据共享的开发、测试、数据存储、托管、运维与调优提供支撑服务,从而有效地提高教育资源利用率。教育大数据信息平台的功能主要有两种:一是资源聚合,即打破部门壁垒、解决信息不畅,实现学生行为大数据、教师教学大数据、学校教育大数据和政府管理大数据的集成整合;二是共享服务,即通过标准化的数据处理和规范化的流程再造,为广大教育大数据共享主体提供服务。
2.1.2 框架结构
教育大数据信息平台是通过“三个支撑”架构起的平台体系,即以计算机、网路软硬件为技术支撑,以资源整合和数据处理为管理支撑,以应用服务和用户服务为服务支撑,形成上、中、下三层既有区别又联系紧密的功能架构。如图1所示。
上层包括两个方面:1)应用服务支撑层。应用服务支撑层其功能主要涉及教育大数据信息整合和教育大數据信息分析与挖掘两个方面,其中教育大数据信息整合包括教育大数据信息融合和教育大数据共享信息检索两项服务;教育大数据信息分析与挖掘包括教育大数据信息分类筛选和教育大数据信息挖掘利用等。以上两大系统相互融合形成对教育大数据共享应用服务的有力支撑。2)用户服务层。具体包括以下方面:一是将教育大数据资源向全社会开放,并提供教育大数据资源信息查询浏览、信息发布及资源申请下载、云计算等服务;二是提供成果转让、产学研结合等教育成果的应用与推广服务;三是开展教育大数据资源平台租赁、校办企业成长规划建设、产业创新推广等产业服务;四是对教育创新的全景展示、预测评估以及规划建设等业务。该服务层主要是为大学、教育院所、网络大众、企业、政府等提供全方位的教育大数据资源共享服务。
中间层包括两个方面:1)数据资源层。通过对各种积累数据、最近数据以及互联网采集数据进行汇集、整合、重构,按照统一的信息标准、技术标准及管理标准进行规范,采用动态更新模式,形成学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据等教育大数据资源池。在教育大数据资源池中,按标准规范对数据进行清洗、质量评估和管理,并充分运用信息、网络、大数据、云计算等现代技术,对教育大数据资源进行战略重组和系统优化,促进教育大数据资源的高效配置和综合利用。2)基础平台层。主要包括教育大数据元数据管理平台、教育资源管理与搜索平台、教育资源融合与挖掘平台、教育资源共享网络服务平台、教育资源质量监控平台等。基础平台层主要为教育大数据资源访问以及应用服务功能的实现提供基础支撑。
下层包括两个方面:1)硬件基础设施层。硬件层分为网络集成层及智能终端层两部分。其中,网络集成层指电信网络、有线电视网络和计算机网络的教育资源相互渗透、互相兼容,并逐步整合成为全覆盖、统一的资源信息共享网络,其中计算机互联网是其核心部分。其技术功能趋于一致,业务范围趋于相同,网络互联互通、资源开发共享,教育协同创新,能为教育资源共享提供多种服务。智能终端层是指具有多媒体功能的智能设备,这些设备支持音频、视频、数据等功能,如可视电话、会议终端、内置多媒体功能的PC、PDA等,一般由固定终端(计算机)和移动终端(手机、笔记本电脑等)组成。硬件基础设施层处于教育大数据信息平台整体框架的最底层,可为平台高效运行提供强有力的支撑。2)系统软件层。教育大数据信息平台的系统软件层由IaaS、PaaS和SaaS架构整合而成,即Infrastructure(基础设施)-as-a- Service,Platform(平台)-as-a-Service,Software(软件)-as-a-Service,主要向教育用户提供3种模式服务[7]。其中IaaS提供的服务是对所有设施的利用,包括处理、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序,并且能控制操作系统的选择、储存空间、部署的应用,也有可能获得有限制的网络组件(防火墙,负载均衡器等)的控制;PaaS提供给教育用户的服务是把客户采用的开发语言和工具(Java,python,.Net等)、开发的或收购的应用程序部署到供应商的云计算基础设施上去。客户能控制部署的应用程序,也可能控制运行应用程序的托管环境配置;SaaS提供给用户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过搜索客户端界面访问,如浏览器。消费者不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等。因此,根据教育大数据的需求,向上层应用提供支持分布式文件系统、并行文件系统、分布式数据库融合的大数据存储服务,支持分布式计算、并行计算、流式计算融合的大数据计算服务,以及适于多样化异构科技应用的统一程序接口及云服务全生命周期管理等服务,从而更好地服务于政府、高校、科研院所、企业以及广大用户。
2.2 教育大数据信息平台功能效用
2.2.1 提高教育资源使用效率
教育大数据信息平台通过信息开放共享,能有效避免人力、物力的重复投入,减少教育资源的浪费。与此同时,它也将促进教育管理工作模式发生改变,因为教育管理者可依托共享平台提供的资讯和信息,最大限度地减少重复研究、无效研究,可将更多时间和精力投入到对专业水平要求更高的研究中去,从而减少研发操作成本。另一方面,对于高校或个人来讲,大型科研仪器设备、实验室等可通过教育大数据信息共享平台来实现共享,这将减轻购置科技设备等带来的运营困难和资金压力。因此,教育大数据信息共享平台通过资源开放和共享,可以实现国家科技投资的节约,提高教育大数据的利用效率。
2.2.2 减少教育资源流失 以往教育数据积累和维护的规范性和连续性都欠佳,基本处于松散化状态,这很容易导致教育数据的丢失,进而产生难以估量的损失。教育大数据信息平台建立后,将众多的教育大数据汇集在一起,形成有价值的资源,统一存储、管理和维护,因此,教育大数据信息平台具有教育资源的积累和维护功能,有助于防止教育资源流失。
2.2.3 促进教育大数据资源共享
教育大数据信息平台既是一种平台,又是一种载体,可以为全社会的教育及科技创新活动提供普遍的公共服务。同时,教育大数据信息平台能有效解决教育活动中的信息不对称、资源对接难以及资源分配不公等问题。大型科研仪器、场地、实验室等资源共享均可通过教育大数据信息平台来实现,从而提高场地设备使用率,减少教育资源的浪费。
2.2.4 加强教育交流与合作
教育大数据信息平台不仅能提高教育资源信息存储能力,而且将会促进教育交流与合作。教育大数据信息平台利用最先进的网络化、数字化和多媒体信息技术,建立共享服务平台,将最新的教育教学成果和技术创新成果进行适时的展示和传播。学生、教师、管理等各类人员都可及时地通过教育大数据信息平台了解前沿信息、分享教育大数据知识、掌握研究最新进展,实现教育交流与合作。
2.2.5 发挥教育资源潜在价值
教育大数据作为重要的资源类型具有极强的使用价值。教育大数据信息平台的建立将有助于教育大数据所蕴含的科学价值、社会价值和经济价值充分发挥。此外,依托教育大数据信息平台来促进资源共享,强化协同创新,可产生出新的科研成果,而新科研成果又形成了新的资源,从这一点来讲,教育大数据资源通过共享利用能够产生增值效应。
3 教育大数据信息平台运行机制体系
教育大数据信息平台运行机制体系是一个复杂的系统,教育大数据共享主体只有通过共享平台才能使客体发生效用,而这个过程的实现要依赖一定的运行机制来保障。因此,我们有必要对教育大数据信息平台的运行机制体系进行分解重建,并将其解构为5个相互联系的子系统,即开放获取机制、分类存储机制、整合共享机制、技术支撑机制和管理协同机制,维持整个平台体系的良性运转。见图2。
图2 高校教育大数据信息平台运行机制体系图
3.1 开放获取机制
对于教育大数据信息共享来讲,开放是获取的前提,获取是开放的保障,共享才是最终目的。因此,最重要的一点就是教育大数据信息资源首先要开放,才能为而后的获取和存储奠定基础。
3.1.1 有限开放与多种形式开放相结合
一方面,有限开放。高校大型科研仪器、实验场地等资源大多是国家出资建设,从法理上讲有其公共性,不能个人据为己有。因此,不仅科研仪器、实验场地等公共资源应该放开,而且依托这些公共资源产生出的教育数据、科研成果等也应开放。同时,有些教育大数据成果、科研数据涉及国家安全、商业秘密、个人隐私,这样的教育大数据资源是不便公开的,故教育大数据资源开放应是“有限”的,而不是“无限”的。
另一方面,采用多种形式开放。要想达到开放效果,需从以下方面下工夫:一是要强制开放。针对可开放和不可开放的教育大数据范围,用法律法规形式进行明确界定,以保证开放的强制性和延续性;二是鼓励开放。在教育大数据评价机制中引入教育大数据开放因子,将教育大数据成果开放数量、影响力等情况与课题申报、项目评审、职称评定等挂钩。又如将科研设备开放率、共享使用率作为仪器、设备再购置的重要参考因素等;三是有序开放。按照产生年代、产生主体以及产生方式等分门别类,采取分批次、分类别、分步骤的开放形式;四是网络开放。在注重质量和使用价值的前提下,将科研数据、成果等教育大数据资源通过网络形式进行开放,保证机器可读,以增强数据的公开性、透明性。
3.1.2 明确获取范围、内容及手段
教育大数据共享的实现首先依赖于对来源广泛的教育数据的获取[8]。对教育大数据的获取,可从以下三方面入手:一是明确教育大数据获取范围和内容。高校在教育活动过程中会产生大量的数据,但受教育大数据共享主体需求、数据本身以及获取时间、技术手段所限,并不是所有的教育大数据都会被获取。因此,需要根据共享主体的需求、目的、用途等,对教育大数据获取的范围进行明确界定,以做到有的放矢;二是选择合理的获取形式及手段。一般来说,教育大数据获取形式主要分为强制获取和自愿获取。对于政府或高校投资购置的大型仪器、实验室、科技文献、图书等公共教育资源,可进行强制获取,而对于本人付出脑力劳动以及时间、管理成本的科研成果、专利、科学数据、实验数据等,需本着自愿原则进行获取;三是运用大数据挖掘分析技术。通过对大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、可扩展的存储系统等大数据挖掘分析技术的综合运用,可极大提高教育大数据挖掘与数据分析的速度,取得良好效果。
3.2 分类存储机制
3.2.1 实施教育大数据分门别类
教育大数据的巨大价值主要表现在两个方面:一是教育大数据本身隐含的价值,尽管收集到的数据信息是凌乱的,但其中却可能隐含着有价值或有规律性的数据;二是通过运用大数据分析处理技术,可从海量的数据中抽离有价值的东西,甚至归纳出有规律性的东西。因此,可按照價值性(Value,英文简写V)对教育大数据进行分类,具体可分为两大类:一是有价值数据,含关键价值数据(主要用于关键领域或进行关键决策)和非关键价值数据(主要用在非关键领域或进行非关键决策);二是无价值数据,这类数据不重要,对教育决策不起什么作用,甚至可能起反作用。因此,针对现实中教育大数据质量的参差不齐现象,在数据采集时,应设置必要的信息采集规则和机制[9],并运用信息过滤技术,去粗取精、去伪存真,将符合采集规则和要求的数据收集到平台数据库中,然后引入更为专业的数据分析技术,将采集到的分散无序的教育大数据进行组织、加工与分析,使其转换成符合数据库文件格式的且有规律的有序数据,最后对于有价值的数据,按照一定的标准格式进行存储,供开放共享和利用,对无价值的数据进行淘汰。这样,通过教育大数据信息进行收集分析、分类处理以及价值提取,为日后教育大数据充分利用奠定了良好基础。 3.2.2 做好教育大数据存储保值
首先,建立起教育大數据存储的标准化体系。具体包含4个方面:一是通过标准规范化数据表示、元数据类型和操作方式,为数据的统一存储提供基础;二是制定关于分布式文件系统、数据仓库的相关标准,解决多类型数据的可靠存储问题[10];三是建立Hadoop开源分布式计算平台,平台由标准化硬件(服务器和内部服务器存储)组成,能够并行处理大数据请求。在存储方面,该系统具有高容错性,不仅提供了适合那些拥有大数据集的应用平台,而且还提供了高吞吐率的数据读写[11];四是制定教育大数据分析技术要求、分析过程模型、可视化工具要求等标准,提高大数据处理的质量。
其次,选择合适的大数据存储技术方法。针对不同类型的教育大数据,有3种存储技术可以选择:一是存储海量非结构化数据的分布式文件系统,有代表性的是 Google 的 GFS 和开源的 HDFS (Hadoop Distributed File System);二是存储海量无模式的半结构化数据的NoSQL数据库,能够极大的适应云计算的需求;三是存储海量结构化数据的分布式并行数据库系统,Greenplum是基于PostgreSQL开发的一款海量并行处理架构的、无共享的分布式并行数据库系统,采用Master/Slave架构,Master只存储元数据,真正的用户数据被散列存储在多台Slave服务器上,并且所有的数据都在其他Slave节点上存有副本,从而提高了系统可用性[12]。
最后,注重云计算在大数据存储中应用。云计算的出现为大数据存储平台的形成奠定了基础,也为数据存储以及计算提供了强大的载体。可以说,大数据与云计算是一个硬币的两个面,二者的有效结合将改变传统数据存储模式。由于云存储标准与大数据的存储标准需求在架构模型、数据模型、接口协议、操作模式以及服务使用方式上十分类似,所以,大数据存储标准可以在现有云存储标准上进行扩展,以满足教育大数据的存储需求。
3.3 整合共享机制
3.3.1 建立互惠互利的利益共享关系
教育大数据资源共享是一个信息使用过程,资源开放主体是信息的传递者,而资源共享主体是信息的接受者,两者在资源共享过程中互惠互利的利益共享关系,是教育大数据进行大范围共享的前提和基础。教育大数据信息资源共享是资源拥有主体彼此之间的利益共享,因此,建立起互惠互利的利益共享关系至关重要。
3.3.2 推行平台建设的标准化和规范化
标准化既是教育大数据信息平台建设的关键,也是教育大数据资源共享得以实现的重要保障。首先要确定教育大数据资源共享的范围,确定哪些教育大数据资源可以录入到教育大数据信息平台;其次,摸清共享资源的基本情况,形成第一手资料;再次,制定教育大数据资源信息的标准化规范,把“碎片化”、“零散化”的教育大数据资源进行分门别类,将符合要求和规范的教育大数据资源统一纳入共享平台;最后,对涉及教育大数据信息平台的政策体制、组织结构、经费来源、隶属关系等建设事项,通过法律法规形式进行规范和界定。
3.3.3 采用信息资源带动实体资源路径
在教育大数据信息平台运行过程中,涉及到的各类资源势必很多,并且这些资源基本上是处于分散状态,共享的优先次序将对共享效果产生重要影响。可行的路径应该是先对学校中的教育信息资源进行共享,然后带动教育实物资源共享,从而实现教育大数据资源的广泛共享。因此,教育大数据信息共享可采用信息资源带动实体资源的形式来实现。
3.3.4 创设安全良好的大数据资源共享环境
随着人们对教育大数据需求的不断增加以及大数据本身数据量的不断叠加,教育大数据资源将会是海量的。但是,海量的数据极有可能被计算机病毒、黑客攻击,威胁到数据安全。因此,创设安全良好的教育大数据资源共享环境就显得尤为必要。一方面,应采用先进的数据分析处理技术,对所采集的教育大数据进行价值提取,筛选出本身有价值且更安全的数据;另一方面,加大信息安全技术的应用,如防火墙技术、加密技术、跟踪检测技术、病毒防范技术等。同时,通过用户注册认证、权限设置、实名制等形式,来对用户进行有效识别和过滤,保证教育大数据的安全使用。另外,还应不断更新数据分析处理技术,研发更加便捷和人性化的用户操作界面,以提升教育大数据的存储效率及用户体验。
3.4 技术支撑机制
3.4.1 设计开发与平台相匹配的软件系统
第一,资源开放软件集。主要包括资源开放类软件、资源发现类软件、资源获取类软件,依托这些软件实现教育资源的信息发布、智能检索和资源下载服务,架起教育资源需求与供给双方桥梁;第二,搜索引擎软件集。采用新型语义分析技术,使资源和资讯搜索结果关联丰富,实现从检索引擎走向推荐引擎,增强对用户的吸引力;第三,共享资源软件集。建立数据库系统,如科学数据库,大型设备、高精仪器、重点实验室数据库,以及财源、智源数据库,这是教育资源共享的前提,同时开发元数据管理软件、分析软件,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能,实现教育资源的充分共享;第四,网络社交软件。搭建交流互动平台,建设交互对象库,负责各类输入/输出设备的管理,实现用户动作到其内部形式的转换,表现部件负责翻译人机意图,解析交互任务,对话管理部件对来自用户多个交互通道的信息进行整合,理解用户交互意图[13]。这样充分体现反馈、在线咨询、资源评价等互动功能,促进用户需求与教育资源供给的对接。
3.4.2 实现教育大数据资源与互联网信息技术对接
计算机和网络信息技术是教育大数据资源共享得以实现的重要载体和手段,这对整合碎片化的各类教育资源、方便多元化的用户使用以及彼此之间的共享协作起到桥梁和纽带作用。教育资源要实现与互联网信息技术的对接,一方面需要对已摸底记录的学术资源进行程序编码,以符合网络信息传播特点;二是加强信息库本身的改进升级,使其囊括所有可能开放共享的教育大数据资源;三是利用大数据的挖掘、分析技术、云计算等,对海量的教育大数据资源进行快速遴选、整合和利用,促进学科交叉和数据集成。教育大数据资源共享与互联网信息技术的对接,在不远的将来,有可能对教育创新产生巨大的推动作用,并极可能发现新的创新点。 3.4.3 加速线上和线下教育大数据信息资源融合
线下的教育大数据资源整合,需要依托一定实体组织机构形式,如各种协同创新中心、联合实验室等,而线上网络信息化是教育大数据资源共享发展的方向和落脚点。只有将线上、线下教育大数据资源进行有效整合,方能形成广泛的教育资源共享。
3.4.4 加强大数据相关技术的研发与应用
随着大数据的推进与发展,教育大数据处理与分析已经成为推动教育改革与发展的驱动力[14],将给教育大数据资源共享带来前所未有的改变。通过应用大数据相关技术,能极大提高科研数据挖掘与数据分析的速度及效率。大数据技术包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统等方面,这些技术的研发、升级与教育资源共享相融合至关重要。
3.5 管理协同机制
3.5.1 发挥政府政策主导作用
教育大数据资源大多具有很强的公共性和基础性,是高校教育教学、科学研究以及政府教育决策重要的支撑条件。推进教育大数据资源开放共享、合理配置,涉及到学生、教师、高校及政府等多方利益,是一项复杂的系统工程。因此,政府部门除了在教育大数据资源共享的政策、法令等方面积极参与,更要在规划设计、基础设施建设、环境营造以及加强监管等方面发挥主导作用。
3.5.2 强化高校的组织协调能力
高校具有管理部门多、学生教师群体大、教育资源丰富等特点,教育大数据在挖掘、获取、存储、开放、共享以及利用时,尤其需要高校强大的组织协调能力。要打破教育大數据共享的部门壁垒以及利益掣肘,拓展教育大数据共享范围、共享深度,这需要高校建立适合教育大数据资源共享管理的组织机构。首先,成立教育大数据资源共享管理委员会,由分管教育管理工作的党委/行政领导为负责人,教务、学工、科研、网络、资产、图书、后勤、政策咨询、保卫等部门负责人为成员;其次,设置教育大数据资源共享管理办公室。作为教育大数据共享管理委员会的常设协调机构,具体负责部门协调沟通、制度规范制定、教育资源整合和管理队伍建设等工作;最后,成立教育大数据信息平台中心,作为业务执行部门,下设综合部、网络部、技术部、运营部、财务部等核心部门,其他种类部门可根据实际情况进行增设。
3.5.3 强化教师、学生共享的自觉性
高校每天都会产生大量的、动态的、连续的教育大数据,而其采集、获取、存储以及共享需要教师、学生的积极配合和支持,这离不开高校教师和学生的共享自觉性。因此,有必要建立起大数据共享的自律机制:首先建立定期培训机制。从事高校教育大数据共享工作的部门工作人员应定期参加有关教育大数据管理、技能的培训,加强工作人员的自觉性意识;其次,加强教育资源共享宣传。学校各有关部门都应制定教育大数据共享的宣传机制,在潜移默化中强化学生及教师的共享意识;最后,形成教育大数据共享的文化氛围。只有营造一种全校性的倡导教育资源共享的氛围,才能形成高校教育大数据持续共享的局面。
参考文献
[1]刘雍潜,杨现民.大数据时代区域教育均衡发展新思路[J].电化教育研究,2014,35(5):11-14.
[2]钱冬明,管珏琪,祝智庭.数字教育资源共建共享的系统分析框架研究[J].电化教育研究,2013,35(7):53.
[3]李馨.高等教育大数据分析:机遇与挑战[J].开放教育研究,2016,22(4):50-56.
[4]What is Big Data?[EB/OL].http//www.villanovau.com/university-online-programs/what-is-big-data/,2014-01-07.
[5]杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015,36(9):54-61.
[6]马迎贤.资源依赖理论的发展和贡献评析[J].甘肃社会科学,2005,(1):118.
[7]Hjxgood.云计算的三种服务模式:IaaS,PaaS和SaaS[EB/OL].http://blog.csdn.net/hjxgood/article/details/18363789,2014-01-16.
[8]顾小清,郑隆威,简菁.获取教育大数据:基于XAPI规范对学习经历数据的获取与共享[J].现代远程教育研究,2014,(5):13-23.
[9]孙卓.基于大数据构建图书馆知识服务引擎研究[J].图书馆学研究,2013,(18):48-51.
[10]云计算和大数据的标准化需求和标准化组织有哪些?[EB/OL].http://blog.csdn.net/orangelizq/article/details/48086217.
[11]王凤领.基于Hadoop高校教育资源云存储平台构建研究[J].计算机技术与发展,2016,26(3):176-180.
[12]李海波,程耀东.大数据存储技术和标准化[J].信息技术与标准化,2013,(5):23-26.
[13]卢莉莉.面向任务的人机交互模型研究及应用[D].重庆:重庆大学,2005.
[14]胡水星.大数据及其关键技术的教育应用实证分析[J].远程教育杂志,2015,33(5):46-53.
(本文责任编辑:孙国雷)
〔关键词〕教育大数据;资源共享;平台构建;运行机制
DOI:10.3969/j.issn.1008-0821.2017.12.016
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2017)12-0090-06
〔Abstract〕Being an important resource,only through resource sharing,could education big data get maximize utilization.This article embarked from the education big data and resource sharing relationship,builded the college education big data resource sharing platform,and expounded the construction mechanism,frame structure and functional utility of the platform in detail.Finally,from the open access,classification,storage,integration of sharing,technical support and management synergy five aspects discussed the operating mechanism of the platform,in order to promote the openness and sharing of education data resources in the context of big data.
〔Key words〕education big data;resource sharing;platform construction;operation mechanism
大數据时代已经到来,大数据正在成为推动教育系统颠覆性创新与变革的科学力量[1]。高校作为人才的聚集地和科学创新的发起地,拥有丰富的教育、教学、科研资源,而这些资源一直处于不断地变化、更新和积累中,这些静态和动态资源以及外界与之相关信息汇集在一起,势必形成规模庞大且海量的教育大数据。2013年3月,国家发布了《教育信息化十年发展规划(2011-2020)》将“优质数字教育资源建设与共享行动”列为“中国数字教育2020行动计划”之一[2],这说明教育资源共享已经成为社会关注的焦点。教育大数据作为一种特殊的资源,只有实现充分共享,才能达到最大化利用。因此,本文尝试构建教育大数据信息平台,并探讨建立相应的运行机制确保其良性运行,以期丰富教育大数据共享的理论,支持和促进高校教育教学的创新与发展。
1 教育大数据与资源共享
1.1 教育大数据内涵
大数据是指大的、超过传统数据库系统处理能力的数据。它还包括创新的技术,以捕捉、存储、分发、分析和管理不同结构的数据集[3]。通常,大数据的核心特征常被概括为“4V”,即数据量大(Volume)、 输入和处理速度快(Velocity)、 数据多样(Variety)和真实性(Veracity)[4]。高校的教育、教学、科研、管理等各种教育活动都会产生大量的数据,我们称之为教育大数据。教育领域大数据资源的内涵及构成是很广泛的,一般来讲,教育大数据特指整个教育活动过程中产生的以及根据教育需要采集到的、一切用于教育发展并可创造巨大潜在价值的数据集合[5]。
1.2 教育大数据构成
教育大数据分为与教育活动相关的学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据。1)学生学习行为大数据,是指学生个体层面与学习相关的大数据,包括学生基础信息、学生思想、心理及健康状态、学习行为记录、学习兴趣与动机、学习违规以及与学习相关的其他信息,如学生住宿起居、饮食、卫生等。2)教师教学行为大数据,是指教师层面教学相关的的大数据,包括教职工基础信息、教师教学行为记录、教学方式方法、课件制作、作业布置、课程考核以及受欢迎程度等方面。3)学校教育资源大数据,是指学校教育管理过程产生的大数据,既包括教育建设管理过程生成的精品课、PPT课件、教学视频、图片、试题试卷等各种形式的教学资源,也包括大型科学仪器、实验场地、办公工具、科研成果、专利以及论文发表等各类科研资源,另外,还包括学生管理、教务管理、课堂管理、科研管理等教育管理资源。4)政府教育管理大数据,是指政府层面有关教育管理的大数据,包括教育政策、教育行政管理及相关统计数据等,如教育部在2012年发布的7个教育管理信息系列标准中提到的所有数据以及出台的各项教育政策等。这些教育大数据资源将对促进教育发展、优化教育资源配置、提升教育质量及水平起到极为重要的作用。
1.3 教育大数据信息共享主客体及衔接
数据也是一种资源,并且是极为重要的资源。从资源依赖理论来讲,没有任何一个组织是自给自足的,所有组织都必须为了生存而与其环境进行交换[6]。其实,教育大数据信息共享不是一个静止的概念,而是一个动态的过程,涉及共享主体、共享客体及共享载体3个方面。其中,教育大数据信息共享主体是指对于高等学校的教育大数据信息进行开放共享的主体,可以是教育团体,如教育团队、科研团队以及创新团队等,也可以是作为个体的人,如学生、教师等,还可以是组织机构,如高校及内部各职能部门、企业、政府机关等;教育大数据信息共享客体主要是指由学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据共同构成的资源集合。共享主体要想充分共享客体资源,必须借助一定形式的、可操作的、实践性的载体才能最终实现,这个载体称之为教育大数据信息平台,而教育大数据信息平台在满足共享主体的资源需求、促进共享客体的最大化利用等方面将发挥着关键作用。 2 教育大数据信息平台构建机理及效用
2.1 教育大数据信息平台构建机理
2.1.1 平台内涵
教育大数据信息平台是一个跨地域、跨媒介的大系统体系,它针对教育大数据共享服务中涉及的基础设施服务需求,能够提供教育大数据的接入、存储、管理、共享及服务所需的基础支撑环境,并且为教育大数据共享的开发、测试、数据存储、托管、运维与调优提供支撑服务,从而有效地提高教育资源利用率。教育大数据信息平台的功能主要有两种:一是资源聚合,即打破部门壁垒、解决信息不畅,实现学生行为大数据、教师教学大数据、学校教育大数据和政府管理大数据的集成整合;二是共享服务,即通过标准化的数据处理和规范化的流程再造,为广大教育大数据共享主体提供服务。
2.1.2 框架结构
教育大数据信息平台是通过“三个支撑”架构起的平台体系,即以计算机、网路软硬件为技术支撑,以资源整合和数据处理为管理支撑,以应用服务和用户服务为服务支撑,形成上、中、下三层既有区别又联系紧密的功能架构。如图1所示。
上层包括两个方面:1)应用服务支撑层。应用服务支撑层其功能主要涉及教育大数据信息整合和教育大數据信息分析与挖掘两个方面,其中教育大数据信息整合包括教育大数据信息融合和教育大数据共享信息检索两项服务;教育大数据信息分析与挖掘包括教育大数据信息分类筛选和教育大数据信息挖掘利用等。以上两大系统相互融合形成对教育大数据共享应用服务的有力支撑。2)用户服务层。具体包括以下方面:一是将教育大数据资源向全社会开放,并提供教育大数据资源信息查询浏览、信息发布及资源申请下载、云计算等服务;二是提供成果转让、产学研结合等教育成果的应用与推广服务;三是开展教育大数据资源平台租赁、校办企业成长规划建设、产业创新推广等产业服务;四是对教育创新的全景展示、预测评估以及规划建设等业务。该服务层主要是为大学、教育院所、网络大众、企业、政府等提供全方位的教育大数据资源共享服务。
中间层包括两个方面:1)数据资源层。通过对各种积累数据、最近数据以及互联网采集数据进行汇集、整合、重构,按照统一的信息标准、技术标准及管理标准进行规范,采用动态更新模式,形成学生学习行为大数据、教师教学行为大数据、学校教育资源大数据和政府教育管理大数据等教育大数据资源池。在教育大数据资源池中,按标准规范对数据进行清洗、质量评估和管理,并充分运用信息、网络、大数据、云计算等现代技术,对教育大数据资源进行战略重组和系统优化,促进教育大数据资源的高效配置和综合利用。2)基础平台层。主要包括教育大数据元数据管理平台、教育资源管理与搜索平台、教育资源融合与挖掘平台、教育资源共享网络服务平台、教育资源质量监控平台等。基础平台层主要为教育大数据资源访问以及应用服务功能的实现提供基础支撑。
下层包括两个方面:1)硬件基础设施层。硬件层分为网络集成层及智能终端层两部分。其中,网络集成层指电信网络、有线电视网络和计算机网络的教育资源相互渗透、互相兼容,并逐步整合成为全覆盖、统一的资源信息共享网络,其中计算机互联网是其核心部分。其技术功能趋于一致,业务范围趋于相同,网络互联互通、资源开发共享,教育协同创新,能为教育资源共享提供多种服务。智能终端层是指具有多媒体功能的智能设备,这些设备支持音频、视频、数据等功能,如可视电话、会议终端、内置多媒体功能的PC、PDA等,一般由固定终端(计算机)和移动终端(手机、笔记本电脑等)组成。硬件基础设施层处于教育大数据信息平台整体框架的最底层,可为平台高效运行提供强有力的支撑。2)系统软件层。教育大数据信息平台的系统软件层由IaaS、PaaS和SaaS架构整合而成,即Infrastructure(基础设施)-as-a- Service,Platform(平台)-as-a-Service,Software(软件)-as-a-Service,主要向教育用户提供3种模式服务[7]。其中IaaS提供的服务是对所有设施的利用,包括处理、存储、网络和其它基本的计算资源,用户能够部署和运行任意软件,包括操作系统和应用程序,并且能控制操作系统的选择、储存空间、部署的应用,也有可能获得有限制的网络组件(防火墙,负载均衡器等)的控制;PaaS提供给教育用户的服务是把客户采用的开发语言和工具(Java,python,.Net等)、开发的或收购的应用程序部署到供应商的云计算基础设施上去。客户能控制部署的应用程序,也可能控制运行应用程序的托管环境配置;SaaS提供给用户的服务是运营商运行在云计算基础设施上的应用程序,用户可以在各种设备上通过搜索客户端界面访问,如浏览器。消费者不需要管理或控制任何云计算基础设施,包括网络、服务器、操作系统、存储等。因此,根据教育大数据的需求,向上层应用提供支持分布式文件系统、并行文件系统、分布式数据库融合的大数据存储服务,支持分布式计算、并行计算、流式计算融合的大数据计算服务,以及适于多样化异构科技应用的统一程序接口及云服务全生命周期管理等服务,从而更好地服务于政府、高校、科研院所、企业以及广大用户。
2.2 教育大数据信息平台功能效用
2.2.1 提高教育资源使用效率
教育大数据信息平台通过信息开放共享,能有效避免人力、物力的重复投入,减少教育资源的浪费。与此同时,它也将促进教育管理工作模式发生改变,因为教育管理者可依托共享平台提供的资讯和信息,最大限度地减少重复研究、无效研究,可将更多时间和精力投入到对专业水平要求更高的研究中去,从而减少研发操作成本。另一方面,对于高校或个人来讲,大型科研仪器设备、实验室等可通过教育大数据信息共享平台来实现共享,这将减轻购置科技设备等带来的运营困难和资金压力。因此,教育大数据信息共享平台通过资源开放和共享,可以实现国家科技投资的节约,提高教育大数据的利用效率。
2.2.2 减少教育资源流失 以往教育数据积累和维护的规范性和连续性都欠佳,基本处于松散化状态,这很容易导致教育数据的丢失,进而产生难以估量的损失。教育大数据信息平台建立后,将众多的教育大数据汇集在一起,形成有价值的资源,统一存储、管理和维护,因此,教育大数据信息平台具有教育资源的积累和维护功能,有助于防止教育资源流失。
2.2.3 促进教育大数据资源共享
教育大数据信息平台既是一种平台,又是一种载体,可以为全社会的教育及科技创新活动提供普遍的公共服务。同时,教育大数据信息平台能有效解决教育活动中的信息不对称、资源对接难以及资源分配不公等问题。大型科研仪器、场地、实验室等资源共享均可通过教育大数据信息平台来实现,从而提高场地设备使用率,减少教育资源的浪费。
2.2.4 加强教育交流与合作
教育大数据信息平台不仅能提高教育资源信息存储能力,而且将会促进教育交流与合作。教育大数据信息平台利用最先进的网络化、数字化和多媒体信息技术,建立共享服务平台,将最新的教育教学成果和技术创新成果进行适时的展示和传播。学生、教师、管理等各类人员都可及时地通过教育大数据信息平台了解前沿信息、分享教育大数据知识、掌握研究最新进展,实现教育交流与合作。
2.2.5 发挥教育资源潜在价值
教育大数据作为重要的资源类型具有极强的使用价值。教育大数据信息平台的建立将有助于教育大数据所蕴含的科学价值、社会价值和经济价值充分发挥。此外,依托教育大数据信息平台来促进资源共享,强化协同创新,可产生出新的科研成果,而新科研成果又形成了新的资源,从这一点来讲,教育大数据资源通过共享利用能够产生增值效应。
3 教育大数据信息平台运行机制体系
教育大数据信息平台运行机制体系是一个复杂的系统,教育大数据共享主体只有通过共享平台才能使客体发生效用,而这个过程的实现要依赖一定的运行机制来保障。因此,我们有必要对教育大数据信息平台的运行机制体系进行分解重建,并将其解构为5个相互联系的子系统,即开放获取机制、分类存储机制、整合共享机制、技术支撑机制和管理协同机制,维持整个平台体系的良性运转。见图2。
图2 高校教育大数据信息平台运行机制体系图
3.1 开放获取机制
对于教育大数据信息共享来讲,开放是获取的前提,获取是开放的保障,共享才是最终目的。因此,最重要的一点就是教育大数据信息资源首先要开放,才能为而后的获取和存储奠定基础。
3.1.1 有限开放与多种形式开放相结合
一方面,有限开放。高校大型科研仪器、实验场地等资源大多是国家出资建设,从法理上讲有其公共性,不能个人据为己有。因此,不仅科研仪器、实验场地等公共资源应该放开,而且依托这些公共资源产生出的教育数据、科研成果等也应开放。同时,有些教育大数据成果、科研数据涉及国家安全、商业秘密、个人隐私,这样的教育大数据资源是不便公开的,故教育大数据资源开放应是“有限”的,而不是“无限”的。
另一方面,采用多种形式开放。要想达到开放效果,需从以下方面下工夫:一是要强制开放。针对可开放和不可开放的教育大数据范围,用法律法规形式进行明确界定,以保证开放的强制性和延续性;二是鼓励开放。在教育大数据评价机制中引入教育大数据开放因子,将教育大数据成果开放数量、影响力等情况与课题申报、项目评审、职称评定等挂钩。又如将科研设备开放率、共享使用率作为仪器、设备再购置的重要参考因素等;三是有序开放。按照产生年代、产生主体以及产生方式等分门别类,采取分批次、分类别、分步骤的开放形式;四是网络开放。在注重质量和使用价值的前提下,将科研数据、成果等教育大数据资源通过网络形式进行开放,保证机器可读,以增强数据的公开性、透明性。
3.1.2 明确获取范围、内容及手段
教育大数据共享的实现首先依赖于对来源广泛的教育数据的获取[8]。对教育大数据的获取,可从以下三方面入手:一是明确教育大数据获取范围和内容。高校在教育活动过程中会产生大量的数据,但受教育大数据共享主体需求、数据本身以及获取时间、技术手段所限,并不是所有的教育大数据都会被获取。因此,需要根据共享主体的需求、目的、用途等,对教育大数据获取的范围进行明确界定,以做到有的放矢;二是选择合理的获取形式及手段。一般来说,教育大数据获取形式主要分为强制获取和自愿获取。对于政府或高校投资购置的大型仪器、实验室、科技文献、图书等公共教育资源,可进行强制获取,而对于本人付出脑力劳动以及时间、管理成本的科研成果、专利、科学数据、实验数据等,需本着自愿原则进行获取;三是运用大数据挖掘分析技术。通过对大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、可扩展的存储系统等大数据挖掘分析技术的综合运用,可极大提高教育大数据挖掘与数据分析的速度,取得良好效果。
3.2 分类存储机制
3.2.1 实施教育大数据分门别类
教育大数据的巨大价值主要表现在两个方面:一是教育大数据本身隐含的价值,尽管收集到的数据信息是凌乱的,但其中却可能隐含着有价值或有规律性的数据;二是通过运用大数据分析处理技术,可从海量的数据中抽离有价值的东西,甚至归纳出有规律性的东西。因此,可按照價值性(Value,英文简写V)对教育大数据进行分类,具体可分为两大类:一是有价值数据,含关键价值数据(主要用于关键领域或进行关键决策)和非关键价值数据(主要用在非关键领域或进行非关键决策);二是无价值数据,这类数据不重要,对教育决策不起什么作用,甚至可能起反作用。因此,针对现实中教育大数据质量的参差不齐现象,在数据采集时,应设置必要的信息采集规则和机制[9],并运用信息过滤技术,去粗取精、去伪存真,将符合采集规则和要求的数据收集到平台数据库中,然后引入更为专业的数据分析技术,将采集到的分散无序的教育大数据进行组织、加工与分析,使其转换成符合数据库文件格式的且有规律的有序数据,最后对于有价值的数据,按照一定的标准格式进行存储,供开放共享和利用,对无价值的数据进行淘汰。这样,通过教育大数据信息进行收集分析、分类处理以及价值提取,为日后教育大数据充分利用奠定了良好基础。 3.2.2 做好教育大数据存储保值
首先,建立起教育大數据存储的标准化体系。具体包含4个方面:一是通过标准规范化数据表示、元数据类型和操作方式,为数据的统一存储提供基础;二是制定关于分布式文件系统、数据仓库的相关标准,解决多类型数据的可靠存储问题[10];三是建立Hadoop开源分布式计算平台,平台由标准化硬件(服务器和内部服务器存储)组成,能够并行处理大数据请求。在存储方面,该系统具有高容错性,不仅提供了适合那些拥有大数据集的应用平台,而且还提供了高吞吐率的数据读写[11];四是制定教育大数据分析技术要求、分析过程模型、可视化工具要求等标准,提高大数据处理的质量。
其次,选择合适的大数据存储技术方法。针对不同类型的教育大数据,有3种存储技术可以选择:一是存储海量非结构化数据的分布式文件系统,有代表性的是 Google 的 GFS 和开源的 HDFS (Hadoop Distributed File System);二是存储海量无模式的半结构化数据的NoSQL数据库,能够极大的适应云计算的需求;三是存储海量结构化数据的分布式并行数据库系统,Greenplum是基于PostgreSQL开发的一款海量并行处理架构的、无共享的分布式并行数据库系统,采用Master/Slave架构,Master只存储元数据,真正的用户数据被散列存储在多台Slave服务器上,并且所有的数据都在其他Slave节点上存有副本,从而提高了系统可用性[12]。
最后,注重云计算在大数据存储中应用。云计算的出现为大数据存储平台的形成奠定了基础,也为数据存储以及计算提供了强大的载体。可以说,大数据与云计算是一个硬币的两个面,二者的有效结合将改变传统数据存储模式。由于云存储标准与大数据的存储标准需求在架构模型、数据模型、接口协议、操作模式以及服务使用方式上十分类似,所以,大数据存储标准可以在现有云存储标准上进行扩展,以满足教育大数据的存储需求。
3.3 整合共享机制
3.3.1 建立互惠互利的利益共享关系
教育大数据资源共享是一个信息使用过程,资源开放主体是信息的传递者,而资源共享主体是信息的接受者,两者在资源共享过程中互惠互利的利益共享关系,是教育大数据进行大范围共享的前提和基础。教育大数据信息资源共享是资源拥有主体彼此之间的利益共享,因此,建立起互惠互利的利益共享关系至关重要。
3.3.2 推行平台建设的标准化和规范化
标准化既是教育大数据信息平台建设的关键,也是教育大数据资源共享得以实现的重要保障。首先要确定教育大数据资源共享的范围,确定哪些教育大数据资源可以录入到教育大数据信息平台;其次,摸清共享资源的基本情况,形成第一手资料;再次,制定教育大数据资源信息的标准化规范,把“碎片化”、“零散化”的教育大数据资源进行分门别类,将符合要求和规范的教育大数据资源统一纳入共享平台;最后,对涉及教育大数据信息平台的政策体制、组织结构、经费来源、隶属关系等建设事项,通过法律法规形式进行规范和界定。
3.3.3 采用信息资源带动实体资源路径
在教育大数据信息平台运行过程中,涉及到的各类资源势必很多,并且这些资源基本上是处于分散状态,共享的优先次序将对共享效果产生重要影响。可行的路径应该是先对学校中的教育信息资源进行共享,然后带动教育实物资源共享,从而实现教育大数据资源的广泛共享。因此,教育大数据信息共享可采用信息资源带动实体资源的形式来实现。
3.3.4 创设安全良好的大数据资源共享环境
随着人们对教育大数据需求的不断增加以及大数据本身数据量的不断叠加,教育大数据资源将会是海量的。但是,海量的数据极有可能被计算机病毒、黑客攻击,威胁到数据安全。因此,创设安全良好的教育大数据资源共享环境就显得尤为必要。一方面,应采用先进的数据分析处理技术,对所采集的教育大数据进行价值提取,筛选出本身有价值且更安全的数据;另一方面,加大信息安全技术的应用,如防火墙技术、加密技术、跟踪检测技术、病毒防范技术等。同时,通过用户注册认证、权限设置、实名制等形式,来对用户进行有效识别和过滤,保证教育大数据的安全使用。另外,还应不断更新数据分析处理技术,研发更加便捷和人性化的用户操作界面,以提升教育大数据的存储效率及用户体验。
3.4 技术支撑机制
3.4.1 设计开发与平台相匹配的软件系统
第一,资源开放软件集。主要包括资源开放类软件、资源发现类软件、资源获取类软件,依托这些软件实现教育资源的信息发布、智能检索和资源下载服务,架起教育资源需求与供给双方桥梁;第二,搜索引擎软件集。采用新型语义分析技术,使资源和资讯搜索结果关联丰富,实现从检索引擎走向推荐引擎,增强对用户的吸引力;第三,共享资源软件集。建立数据库系统,如科学数据库,大型设备、高精仪器、重点实验室数据库,以及财源、智源数据库,这是教育资源共享的前提,同时开发元数据管理软件、分析软件,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能,实现教育资源的充分共享;第四,网络社交软件。搭建交流互动平台,建设交互对象库,负责各类输入/输出设备的管理,实现用户动作到其内部形式的转换,表现部件负责翻译人机意图,解析交互任务,对话管理部件对来自用户多个交互通道的信息进行整合,理解用户交互意图[13]。这样充分体现反馈、在线咨询、资源评价等互动功能,促进用户需求与教育资源供给的对接。
3.4.2 实现教育大数据资源与互联网信息技术对接
计算机和网络信息技术是教育大数据资源共享得以实现的重要载体和手段,这对整合碎片化的各类教育资源、方便多元化的用户使用以及彼此之间的共享协作起到桥梁和纽带作用。教育资源要实现与互联网信息技术的对接,一方面需要对已摸底记录的学术资源进行程序编码,以符合网络信息传播特点;二是加强信息库本身的改进升级,使其囊括所有可能开放共享的教育大数据资源;三是利用大数据的挖掘、分析技术、云计算等,对海量的教育大数据资源进行快速遴选、整合和利用,促进学科交叉和数据集成。教育大数据资源共享与互联网信息技术的对接,在不远的将来,有可能对教育创新产生巨大的推动作用,并极可能发现新的创新点。 3.4.3 加速线上和线下教育大数据信息资源融合
线下的教育大数据资源整合,需要依托一定实体组织机构形式,如各种协同创新中心、联合实验室等,而线上网络信息化是教育大数据资源共享发展的方向和落脚点。只有将线上、线下教育大数据资源进行有效整合,方能形成广泛的教育资源共享。
3.4.4 加强大数据相关技术的研发与应用
随着大数据的推进与发展,教育大数据处理与分析已经成为推动教育改革与发展的驱动力[14],将给教育大数据资源共享带来前所未有的改变。通过应用大数据相关技术,能极大提高科研数据挖掘与数据分析的速度及效率。大数据技术包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统等方面,这些技术的研发、升级与教育资源共享相融合至关重要。
3.5 管理协同机制
3.5.1 发挥政府政策主导作用
教育大数据资源大多具有很强的公共性和基础性,是高校教育教学、科学研究以及政府教育决策重要的支撑条件。推进教育大数据资源开放共享、合理配置,涉及到学生、教师、高校及政府等多方利益,是一项复杂的系统工程。因此,政府部门除了在教育大数据资源共享的政策、法令等方面积极参与,更要在规划设计、基础设施建设、环境营造以及加强监管等方面发挥主导作用。
3.5.2 强化高校的组织协调能力
高校具有管理部门多、学生教师群体大、教育资源丰富等特点,教育大数据在挖掘、获取、存储、开放、共享以及利用时,尤其需要高校强大的组织协调能力。要打破教育大數据共享的部门壁垒以及利益掣肘,拓展教育大数据共享范围、共享深度,这需要高校建立适合教育大数据资源共享管理的组织机构。首先,成立教育大数据资源共享管理委员会,由分管教育管理工作的党委/行政领导为负责人,教务、学工、科研、网络、资产、图书、后勤、政策咨询、保卫等部门负责人为成员;其次,设置教育大数据资源共享管理办公室。作为教育大数据共享管理委员会的常设协调机构,具体负责部门协调沟通、制度规范制定、教育资源整合和管理队伍建设等工作;最后,成立教育大数据信息平台中心,作为业务执行部门,下设综合部、网络部、技术部、运营部、财务部等核心部门,其他种类部门可根据实际情况进行增设。
3.5.3 强化教师、学生共享的自觉性
高校每天都会产生大量的、动态的、连续的教育大数据,而其采集、获取、存储以及共享需要教师、学生的积极配合和支持,这离不开高校教师和学生的共享自觉性。因此,有必要建立起大数据共享的自律机制:首先建立定期培训机制。从事高校教育大数据共享工作的部门工作人员应定期参加有关教育大数据管理、技能的培训,加强工作人员的自觉性意识;其次,加强教育资源共享宣传。学校各有关部门都应制定教育大数据共享的宣传机制,在潜移默化中强化学生及教师的共享意识;最后,形成教育大数据共享的文化氛围。只有营造一种全校性的倡导教育资源共享的氛围,才能形成高校教育大数据持续共享的局面。
参考文献
[1]刘雍潜,杨现民.大数据时代区域教育均衡发展新思路[J].电化教育研究,2014,35(5):11-14.
[2]钱冬明,管珏琪,祝智庭.数字教育资源共建共享的系统分析框架研究[J].电化教育研究,2013,35(7):53.
[3]李馨.高等教育大数据分析:机遇与挑战[J].开放教育研究,2016,22(4):50-56.
[4]What is Big Data?[EB/OL].http//www.villanovau.com/university-online-programs/what-is-big-data/,2014-01-07.
[5]杨现民,王榴卉,唐斯斯.教育大数据的应用模式与政策建议[J].电化教育研究,2015,36(9):54-61.
[6]马迎贤.资源依赖理论的发展和贡献评析[J].甘肃社会科学,2005,(1):118.
[7]Hjxgood.云计算的三种服务模式:IaaS,PaaS和SaaS[EB/OL].http://blog.csdn.net/hjxgood/article/details/18363789,2014-01-16.
[8]顾小清,郑隆威,简菁.获取教育大数据:基于XAPI规范对学习经历数据的获取与共享[J].现代远程教育研究,2014,(5):13-23.
[9]孙卓.基于大数据构建图书馆知识服务引擎研究[J].图书馆学研究,2013,(18):48-51.
[10]云计算和大数据的标准化需求和标准化组织有哪些?[EB/OL].http://blog.csdn.net/orangelizq/article/details/48086217.
[11]王凤领.基于Hadoop高校教育资源云存储平台构建研究[J].计算机技术与发展,2016,26(3):176-180.
[12]李海波,程耀东.大数据存储技术和标准化[J].信息技术与标准化,2013,(5):23-26.
[13]卢莉莉.面向任务的人机交互模型研究及应用[D].重庆:重庆大学,2005.
[14]胡水星.大数据及其关键技术的教育应用实证分析[J].远程教育杂志,2015,33(5):46-53.
(本文责任编辑:孙国雷)