大数据在高校档案信息管理中的应用研究

来源 :中国教育信息化·高教职教 | 被引量 : 0次 | 上传用户:sinbala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:本文首先介绍了高校档案信息管理现状,并针对高校档案资源的信息特征进行了总结与归纳;其次,就大数据技术特点与大数据技术的应用条件进行了分析与阐述;最后,针对大数据技术在高校档案资源信息管理中的应用进行了详细介绍,并对未来高校档案信息管理的发展趋势进行了技术展望。
  关键词:大数据:档案管理;数字化校园;智慧校园
  中图分类号:TP393
  文献标志码:B
  文章编号:1673-8454(2015)07-0054-02
  一、前言
  随着我国高校教育事业的快速发展,我国高校的教育信息化已经日益完善,高校内各个管理信息平台所产生沉积下来的大量电子文件,给高校的档案管理与信息应用带来巨大挑战。大数据以海量信息、多数据类型、价值密度低等技术特征为高校档案信息资源的数据挖掘与数据分析提供了技术保障,也为高校利用档案信息资源进行新的知识发现与趋势预测提供了强有力的技术支撑。
  二、高校档案管理现状
  当前高校的档案管理主要面临如下问题:(1)高校已有的档案信息管理平台已不能满足日趋庞大的档案信息资源的管理与存储,高校现有档案管理信息平台多为B/S或C/S单一服务器的系统架构方案,在不引入服务器集群或虚拟云存储技术的前提下,随着档案资源数据存储的增大,极有可能会引发磁盘物理存储容量不足,进而导致平台数据库“胀库”危险。(2)高校内部的档案资源数据来源广泛,种类繁杂,有资料显示2012年以来,非结构化电子文件,如文档、表格、网页、音视频等数据信息占整个校园网数据信息总量850/0以上。这些内容各异、格式不同的信息都将成为未来高校档案的重要数据源。(3)当前我国高校档案管理尚存在“重馆藏轻利用”的现象,档案管理人员往往把高校档案馆藏量作为硬性指标来衡量,而对于档案信息的应用服务普遍重视不够。
  三、高校档案的信息特征
  (1)种类样式多、内容广泛。高校档案来源丰富,其中包括师生个人信息如职工人事档案、职工医疗保健档案、学生学籍档案,也有反映教务教学情况的,如教务档案、试题库,还有反映学校政务类别的如校务档案、财务档案、基建档案及各类资产类档案等。
  (2)高校档案存储形式多样。高校档案的存储介质既有传统纸质档案如人事档案卷宗、财务原始报销凭证及公文文书,也有教务、科研、OA办公等管理信息系统生成的数据库文件;此外,除了传统的字处理文档和结构化数据库文件外,还包括大量电子表格、电子邮件、影音等半结构、非结构化电子文件。
  (3)高校档案资源体量大,数据冗余度较高。随着高校网络及办公自动化水平的提升,高校的校园网内产生并沉淀大量电子文档,这些文档、报表来自学校不同部处的业务信息系统,虽然电子文件内容相对完整、独立,但不同类别电子文件之间存在大量数据冗余,占用并浪费了档案资源共享平台的存储空间。
  (4)高校档案调阅频繁,档案综合利用率高。高校人员技术职称晋升、学生评优评先、财务审计分析、设备仪器招标等工作都需要提供大量数据佐证。而调阅档案则是最直接、最有效的一种信息获取手段。因此,高校档案调阅频繁,档案综合利用率较高。
  (5)高校档案价值密度较大,高校档案资源大多是经由高校教学、科研、财务、人事等各个管理信息系统采集得到,这些由业务信息系统提交汇总的档案信息无论从格式上还是内容上都是相对完整规范的,其档案信息价值密度较高。
  四、大数据技术的应用环境
  所谓大数据技术就是将海量信息资源在合理时间内进行采集与处理,并将其结果反馈给用户,帮助用户实现辅助决策。大数据具备Volume信息海量;Variety数据类型多,日志、音视频、地理位置等半结构、非结构化数据并存;Value价值、数据价值密度稀疏;Velocity高速、时效性强、信息采集处理速度快的基本特征。档案资源共享平台上不但能够管理传统意义上的档案信息资源,更能记录数万师生在高校校园生活中衣食住行的点点滴滴,借助于大数据应用,可以在高校档案资源管理平台上真实客观地展现师生的教学、生活全貌。
  大数据的应用环境主要由业务、技术、数据三个维度要素构成。高校档案资源管理平台为适应大数据应用也应按档案业务、档案信息技术以及档案资源进行如下调整和部署:
  (1)档案大数据应用业务维的构建。档案业务主题的定义与描述,在进行大数据分析前,要对其业务分析的主题进行科学细致的定义和描述,只有对其待分析业务准确地定义和描述,才能对档案信息模型进行准确建模。
  (2)档案大数据应用数据维的构建。档案数据模型的转换,以往高校档案资源共享平台下的信息大多借助于数据库系统进行存储与管理,档案数据库系统主要是为档案业务信息管理而创建,并不适用于数据分析。因此在档案大数据应用时,首先要将档案资源共享平台下的档案信息进行数据模型的转换,即将二维关系特征的业务型档案信息转换为具有多维度、多度量的档案数据模型。
  (3)档案大数据应用技术维的构建。首先在大数据软件上要考虑档案数据挖掘算法的加载,在处理完档案数据模型转换工作后,则可筛选适用于档案系统特征和业务需求的数据挖掘算法:此外,在大数据应用的硬件上,要考虑其运行环境应具备足够的计算与存储性能,高校部署并开展大数据应用,必须具备强大的计算机运算处理能力,院校通过夜间开启大数据应用,可有效缓解校园网昼间服务器的计算负荷;此外,档案信息的大数据存储可通过部署云存储或配置大容量磁盘阵列等方式予以解决。
  五、大数据在高校档案管理中的应用
  (1)大数据技术可用于高校档案信息的资源发掘。在校园大数据时代,信息应用服务及师生用户的客观需求引领着高校档案由常规分析向广度、深度分析转变。人工智能、机器学习、知识图谱等一系列大数据技术能够从海量档案信息资源当中分析潜在价值并找出学校特有办学规律。未来,利用海量档案信息资源进行数据挖掘与数据分析将成为高校档案信息服务的主营业务。
  (2)大数据技术有利于高校档案用户信息的数据挖掘。当高校全面进入智慧校园时代,校园师生用户将会对高校档案资源的信息服务、应用服务、智慧服务的要求变得更为迫切。高校档案资源共享平台借助大数据技术可对来访用户身份、来访记录等结构化信息及其存储行为、搜索方式、位置信息等半结构化信息进行分析与处理,从中挖掘并找到用户的隐形诉求从而提升档案信息的应用服务水平。
  (3)大数据技术可用于高校档案知识发现与趋势预测。高校档案资源共享平台中的档案资源与用户信息相对孤立,如学校一卡通系统用户行为信息、教务考试成绩信息、学生系统的学管信息等即便能够被高校档案资源共享平台收录、采集,但都是独立存储,学校无法从利用这些档案资源中进行知识发现和趋势判断,借助大数据技术则可找出这些档案信息间、用户间以及档案与用户间的潜在逻辑关联规则,从而能够为学校教学、学生综合素质评价、财务分析等各领域提供趋势判断和辅助决策。
  六、结束语
  随着高校数字校园、智慧校园建设的逐渐深入,未来将会有更多的信息技术融合到高校档案信息管理中。如云计算与云存储服务,将会解决高校海量档案信息资源存储不足问题,同时借助于云架构模式,能够实现校际档案信息平台互联互通及档案资源共享:4G移动通信与智能终端的普及,将拓展丰富校园用户访问档案资源的媒介渠道;而大数据技术更会引领高校档案界从“狭义档案资源观”向“大档案观”里程碑式地发生转变。
其他文献
内容提要 本文选取1990-2014年17个国家以及全球6大经济地理区域的数据,利用动态面板协整模型(FMOLS和DOLS),从可再生能源使用的新视角,重新探究了环境库兹涅茨曲线(EKC)假说。研究发现:(1)发展中国家与发达国家的EKC具有不同特征,前者在远低于后者经济发展水平时就出现拐点;(2)可再生能源使用率随经济发展呈现“U”型特征;(3)可再生能源使用率先于EKC越过拐点,提高可再生能源
摘 要:以云技术为依托来构建完善的云教学体系,是当下各大高校关注的焦点。文章以全国计算机等级考试的二级考试数据库科目《MySQL数据库程序设计》课程为例,提出了基于云计算技术的教学全过程向云端搬迁的实施策略,并对基于云教学体系的教学效果进行了分析总结。  关键词:云计算;高校课程;云教学;教学实践  中图分类号:TP399 文献标志码:A 文章编号:1673-8454(2018)18-0077-0
规模化养鸡的目的是为了获取最大利润,每一个从事蛋鸡养殖的饲养者都知道最大的利润是源于蛋鸡最佳生产性能的发挥,可纵观目前国内的鸡场特别是广大农村的商品代蛋鸡饲养户,
期刊
猪气喘病是由肺炎支原体引起的猪的一种慢性、接触性传染病。主要临床症状是咳嗽、喘气,剖检变化为融合性支气管肺炎。肺的尖叶、心叶和隔叶的对称性实变,肺门淋巴结增生。病
摘 要:本文对教育信息化背景下的新型电子备课的方式进行了全新探索,摒弃了目前电子备课系统仅仅只是上传一篇教学设计电子文档的备课方式,重构了一个集备课与授课一体的网上备课系统,并由此对如何实现备授课的有效衔接、如何借助教学模式引领教师转变传统教学方式、如何使用微教学单元库促进教师利用优质资源等途径进行了阐述,促进了教学资源的可持续发展。  关键词:备课系统;微教学单元;教学资源;教学设计;信息技术 
摘 要:翻转课堂作为一种新型教学组织形式,越来越受到广大高校师生的青睐。翻转课堂教学方式的流行与数字化、网络化的在线支持环境有着密切的关系。如何构建高校翻转课堂在线支持环境,更好地服务于翻转课堂教学,已成为当前迫切需要解决的问题。文章首先分析了当前高校翻转课堂在线支持环境的状况,并指出缺少整合与联通、缺少对移动终端的支持、缺少专用的学习交流工具等问题所在。文章从平台级支持、学习资源支持、学习服务支
李充、皇侃等人对于《论语.述而》“甚矣吾衰也。久矣吾不复梦见周公”一句的解释非常特殊,展示了其哲学思想的典型特色。郑玄、朱子认为孔子就是实际的圣人,是在唯一的凡俗之世中不断成长的、诚实如一地展示其修证境界的圣人。李充认为圣人一方面“无想,何梦之有”,一方面又展示出有梦、有壮、有衰的气质性存在。这里的衰、梦只是“寄言”,是孔子为了便于世人理解自己,随顺世俗而俯仰的方法。皇侃也认为,这是“同物而示衰”。李充的想法暗含着凡人皆可以向上提升,以至于成圣。不过,这是李充思路的一种理论上的可能。他之后的皇侃,尽管在佛
针对目前我国的学业档案信息资源建设中存在的资源分布不均、整体效益不高等问题.本课题从提高系统的实用性入手,用全新的视角审视了高校学业档案管理工作和企业招聘形式,基于云
<正>鸭传染性浆膜炎是一种由鸭疫巴氏杆菌引起的以危害雏鸭为主的急性或慢性传染病,与致病性大肠杆菌混合感染后,常造成雏鸭短期内大批发病和死亡,生长发育严重受阻,给养鸭户
期刊
内容提要 2016年以来,中央部委以及各级地方政府出台了大量政策文件,旨在推动人工智能快速发展。在总结梳理中国过去30年所实施的产业政策不足的基础上,将美国、日本、德国等发达经济体的政府与中国各级政府所出台的人工智能产业政策进行对比分析,发现当前中国发展人工智能的产业政策存在一些问题,如果处理不当有可能出现各地区盲目发展人工智能和产能过剩的局面。要想促进人工智能的健康发展,需要对产业政策进行三方面