高校数据中心的智慧数据体系的规划与设计

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:binics
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着高校的信息化建设水平的不断提供,需要对学校的信息资源进行有效整合和深度应用。文章对高校智慧数据体系的规划、设计和建设进行了初步研究和探讨,界定了智慧数据体系规划的内容,明确了研究方法。通过对高校各业务系统的分析,规划了高校信息资源体系架构,设计了数据管理和分析应用的技术平台,用于指导高校基于大数据技术的智慧数据体系平台构建。
  关键词:数据体系;数据仓库;大数据;数据管理
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2015)19-0003-02
  随着高校信息化建设的逐步深入,各高校在建设过程中产生了大量的信息,如学生的学籍信息、选课信息、消费信息等;教师的教学信息、科研信息等;还包含涉及人、财、物等相关的校情信息。不少高校已建立了数据中心积累了大量的结构化数据,解决了“数据孤岛”问题。数据中心里面的数据除了能提供简单查询和统计功能外,许多看似没有关联的数据之间常常暗含联系,蕴藏更多的信息和知识,这就需要运用专业的工具和方法进行分析。因此,在当今智慧校园的大背景下,同时基于大数据、云计算等新技术快速发展和应用,各高校也需根据学校自身发展的需要,制定统一的数据标准体系,对学校的数据模型进行统一设计,这是推进学校数据中心建设的依据,在此基础上再进行数据采集、分析和挖掘,并最终展示出来,形成一套完整的智慧数据体系系统。智能数据体系是智能校园的一部分,它不但是简单地从数据到信息,从信息到知识,从知识到智能这么理性,更重要的是从价值发现新价值。因此,智慧数据体系也将成为一座桥梁连接虚拟世界和现实世界。
  1研究内容
  高校数据中心的智慧数据体系的研究包括四个部分组成:1)总体规划。总体规划是对全校业务系统和数据进行梳理,形成学校信息化建设的顶层设计。2)数据采集。数据采集是通过制定策略,获取学校各部门业务系统中产生的数据,并对其进行清洗和存储。3)数据分析。数据分析是运用专业工具对采集的数据进行专项的分析、提取和挖掘。4)信息服务。信息服务是指根据校园网各类用户的需求,通过门户或其他客户端将数据分析的结果传递给用户进行使用。
  2总体规划
  信息资源体系的总体架构规划采用SOA架构进行规划,主要包括三层:网络基础设施层、数据平台层、服务展现层。见图1。
  信息资源体系架构设计是高校智慧数据体系规划的基础,是对高校数据中心信息资源体系总体架构和智慧数据体系技术架构的梳理和规划。信息资源体系架构的设计过程就是从业务系统中抽象出数据体系的过程,按照学校信息化规划中对数据集成及数据仓库的建设要求,以及学校各部门对信息化的需求,分析各部门业务体系、数据管理和应用现状,设计基于全校的数据体系,是智慧数据体系的基础。
  以上图为例,采用面向对象的方法,从业务和信息的视角,对学校各部门使用的业务系统的相关组成对象和业务过程进行抽取和分类,形成教学、人财物和科研、学生、公共服务四类信息的聚合体,描述各对象之间的业务关系,形成学校顶层业务视图,为学校信息化建设、数据的管理和综合应用建立了顶层框架。
  通过对学校各部门使用的应用系统的分析,首先对学校各业务系统中产生和存储的信息进行梳理,对业务数据进行分类、体系化,建立了学校信息资源体系架构,在信息资源体系框架下,根据各类业务系统中数据之间的关联关系,进行学校数据模型的设计;其次根据学校各部门数据应用需求和数据技术分类,规划基于全校统一的数据体系框架,对数据的获取、存储、应用、管理需求进行分析,研究智慧数据体系建设中使用的关键技术,设计各类技术架构,指导数据中心的建设。
  3数据采集
  教学和科研是高校的两大重要工作,因此,教学信息和科研信息是高校的两大核心功能的重要数据,要提高学校的教学水平和科研能力,需要有效的从各业务系统中取得相关数据。高校的智慧数据体系架构必须以学校现有的业务系统为基础,能够应对未来信息化的发展以及各业务系统产生的数据管理需求,因此,业务系统中各阶段产生的数据都是非常有意义的,对其进行采集,并按生命周期进行管理,既保证了数据的完整性又能提高学校数据的质量。高校的智慧数据体系架构的数据采集包括数据的产生、交换、存储、管理等内容。
  3.1数据的获取
  在学校信息化发展过程中,大部分高校已经基本建立了各类信息系统等,积累了大量的结构化数据,同时还有许多包括XML等半结构化数据,以及多种形式存在的非结构化数据。数据的获取通过使用ETL工具对多种来源的数据进行抽取,转换和加载,并通过企业服务总线(Enterprise Service Bus,ESB)以及文件传输技术,实现学校各部门业务系统之间数据的关联和聚合,并采用统一的数据结构进行数据的存储。高校只有将各个业务充分整合,数据有效的获取,以提高数据的质量,才能将信息化对学校发展的推动作用发挥出来。根据数据类型和来源的不同,需要制定不同的数据抽取策略如抽取方式、抽取时间、抽取周期等,既要满足数据分析的需要,又不能影响业务系统的性能。
  3.2数据的存储
  学校近年来建设了各类业务系统,产生大量的数据,为保证不同系统之间的数据合理存储和高效利用,避免共享时出现数据不一致的问题,需要合理规划学校的数据存储,建立统一的数据存储标准。数据存储架构设计就是将清洗后的数据按计划增量的方式导人到数据仓库中,用于解决学校数据的存储和管理难题。目前,在高效中各部门产生的业务数据分布总体成星型分布,因此数据存储架构采用数据集中存储和数据分布存储相结合的模式。学校数据中心存放的是各部门需要共享的交换数据、记录生命周期的数据、历史数据,以及用于决策分析的数据。其他数据仍存放于原来的各业务系统的数据库中,用以支持各业务系统的正常运行。另外,在数据存储的时候还要考虑对非结构化数据按照统一的标准进行有序、高效的存储,以方便下一步数据的分析。   3.3数据的管理
  学校数据中心的数据积累是个漫长的过程,数据从产生、交换、存储到应用有完整的生命周期。在数据产生和积累过程中,要有效管理才能确保数据质量,使学校数据具有更高的价值。数据管理的目的就是去寻找优化手段,建立有效的数据生命周期管理,有效的控制数据资源,重视历史数据积累,提升数据资源的利用率。高校数据管理架构应以数据为中心,以需求主导服务方向,建立并实施数据管理标准规范(包括编码标准化、数据标准化和维护数据标准化三方面),完善数据最优化。
  4数据分析
  数据采集完成后的数据将作为数据分析的原始数据。数据分析是智慧数据体系中数据处理流程的重中之重,它将在这个环节体现数据价值之所在。数据分析技术可以从采集的大量的实际应用数据中找到真正有价值的信息和知识,为教师提供学生学习和教学相关的信息以提高教学质量,为科研者提供,为高校管理者提供更科学的统计分析作为决策基础,从而有效的提高学校的教学质量、科研水平等,这对于学校的发展非常重要。在宏观上,高校可以在学科规划、合理设置课程、院系办学评估、智慧化校园网络建设等方面借助大数据分析技术,挖掘数据中潜在的价值。也可以从一些特定的数据中分析挖掘某一方面信息,比如:上网行为分析、学生心理健康、就业情况分析、学习者特征挖掘。
  5信息服务
  信息服务是根据不同校园网用户的需求,为用户提供公共信息服务、专业信息服务、信息处理服务、决策信息服务等。由于信息服务面向最终用户,因此它也是智慧数据体系的“窗口”。系统存储的大量数据通过对数据分析体系有效、清晰、灵活地呈现给用户,满足不同决策层级用户的决策需求。在高校,数据挖掘可用于学校教学、科研、管理等业务层面进行宏观的挖掘和预测,还能用于评估和判断在微观方面的服务需求,为学校更早的发现问题。比如学习行为分析、干预师生行为、对上网行为分析进行心理干预等。
  6总结
  当今,云计算及大数据技术快速发展,我们可以利用此类技术及时方便的获取需要的数据,但随着数据的大量累积,要将海量的数据转换成有用的信息或知识,变得越来越难,必需运用许多专业工具进行挖掘和分析,发现数据之间暗含的信息。因此,在高校中建立基于全校范围的智慧数据体系迫在眉睫,只有通过统一的规划,自动的获取和存储存储,有目的的分析与挖掘,给校园网各类用户提供各种统计、分析和决策信息。因此,建立智慧数据体系是高校建设与发展的必由之路,也是智慧校园建设的一部分。本文从智慧数据体系架构设计方面对高校当前和未来信息资源应用和管理的内容和技术架构进行了初步的探讨,希望能对高校信息化建设,以及数据的应用和管理起到参考作用。
其他文献
在面临大学转型之际,将对教学改革产生深远的影响,计算机基础课程势必要做相应的改革。针对我校应用型本科的定位,根据不同专业对计算机知识的需求不同,对大学"计算机基础"进行
2008年我国GDP为300670亿元,比上年增长9.0%。在金融危机的背景下.我国9%经济增长率在全球经济中可以说是一枝独秀。2009年,中国经济形势究竟如何.能否实现8%的增速.这些都引起了海内
漏电在井下环境中产生的危害大,影响范围广,因此要求漏电保护装置可靠、速动及有选择性。该文提出的总馈电开关处采用附加直流电源检测,分支开关处采用零序电流幅值和零序功率方向的融合选线方式,双重选线方式防止误判错判,总开关和分开关都采用DSP(TMS320F28335)为控制器,总分复用,提高漏电保护的可靠性、灵敏性及准确性。
采用感性和形式相结合的分类方法,分析了体育娱乐产生的条件,提出了体育娱乐的6种具体形式:超过对象的项目有操作性运动中的探险与冒险类活动,体能类活动,技能类活动;超越自我的项目
进入新世纪以来,农八师农业产业结构一直处于不断调整中。本文从农业在三大产业中的位置和农业内部结构的角度分析了农八师农业产业结构的现状,分析其存在的问题,并提出了相
传统电力系统采用分布式计算方法,难以实现信息的高效互动和共享。随着特高压技术、智能电网技术的不断发展,分布式计算方式的弊端逐渐显现。为更好、更快的实现智慧城市的愿景,云计算以其优异的计算功能、可扩展性、可共享性,逐渐在电力系统的计算中显现出优势,并必将成为未来电力系统的计算核心。目前,云计算技术在我国电力系统中的应用仍旧处于研究、探索阶段,本文就电力系统中云计算技术的应用进行探究。
采用文献资料与数理统计相结合的研究方法,对NBA 优秀'大前锋”的身体形态、技术结构与综合能力进行评价.结果显示,'大前锋”在24-2 7岁之间首次达到最佳状态,31-32
采用问卷调查法、观察法等,发现女子柔道运动员比赛中不良心理的成因,主要有:为获取利益和奖金;对比赛无所谓;社会舆论和领导的压力;意志力薄弱等.据此,提出了矫正方法.
对中国经济而言,2007年是不平静的一年。“三过”问题(投资增长过快、信贷投放过多、外贸顺差过大)依然存在,结构性价格增幅持续走高,资本流动性过剩势头较猛,国民经济运行中积聚着
摘要:非正规金融是指非法定的金融机构(非正规金融部门)所提供的间接融资以及个人之间、个人和企业之间的直接融资。近年来,随着吉林省农村经济结构和产业结构的不断调整与变化,农村经济日益活跃,农民对贷款的需求也在增加。但由于受吉林省农村信用社贷款的范围和额度的限制,很多农户对资金的需求不能得到充分满足,这促使非正规金融在农村的快速发展。规范吉林省非正规金融的发展,对全面推进新农村建设具有重要意义。