论文部分内容阅读
一、大数据的优势
大数据的概念提出后不久,该技术即和云计算一起对于网络社区、气象灾害控制、疾病预防等领域中被广为运用。由于大数据不依赖于随机抽样,并未全样本处理提供了可能,所以大数据帮助档案管理实现了从静态向动态的蜕变以及从因果关系分析向现实预测的过渡[1]。下面简要从“4V”的角度说明大数据的优势:
1.1 数量(Volume)
大数据技术可以处理TB级的数据量,通过改进算法和运算方式,甚至可以获得对于更大数据量的处理能力,符合当今数据爆炸性增长的趋势。
1.2 价值(Value)
大数据进行全样本的分析,因而这一数据挖掘过程往往会得出一些极富价值的结论。
1.3 种类(Variety)
分析的数据种类极为多样化,包括文字资料、数据资料、图像资料乃至影音资料等。
1.4 速度(Veloctiy)
大数据处理要求在秒级的时间跨度内给出分析结果,这与传统的数据分析方式有着本质区别。
二、大数据时代档案管理的可靠性变革
传统的档案管理模式中,档案由专人于专门场所保存,一旦档案失窃或者档案储存场所遭受了自然灾害,那么被保存的档案容易遭受到不可逆的破坏。而在大数据时代,数据的存储往往依托于多台主机完成,即便某一台服务器发生了故障,系统也可以由其他服务器支撑运行而不至于陷入瘫痪状态。并且,因为数据通过云端在不同服务器上有所备份,所以这类故障并不会造成严重的数据丢失问题,例如,陕西省近期在西安重点建设沣西大数据产业园,其将实现数据的规模化集中吞吐、深层次整合分析、多领域社会应用、高效益持续增值作为发展目标,意在成为国家政务资源后台处理与备份中心、国家级大数据处理中心和国内最大的信息资源聚集服务区,目前,中国联通、中国移动和中国电信三大运营商以及全国人口数据处理与备份(西安)中心、陕西广电网络等项目已入区,只要三大运营商在某一片区的服务器出现了问题并因此丢失了数据,储存于此处的备份数据将会立刻派上用场。当然,在不同服务器之间进行传播的过程中可能会引发档案泄露等问题,因此,高校档案管理系统在大数据化改革的过程中使用权限控制程序、存储隔离、传输层加密、数据检验、数据备份、分布式存储等技术来保证被保存数据的安全可靠。
三、大数据时代档案管理的高共享性变革
现有的档案管理中,由于不同档案归属于不同部门管理,并且同一档案在制作的过程中也往往需要经由不同部分,在这种分开管理的模式下,不同部门之间的交互作用相对较少,这就导致了“信息孤岛”的产生,信息的缺乏使得信息的使用者无法有效挖掘数据的全部内容。与之对应,大数据技术作为档案管理中的新元素,可以保障用户对于数据的共享性,其通过多个节点构建了较节省存储空间的用户间数据交流的平台,一方面传统档案部门难以充分利用信息的困境将会得到有效缓解,不同部门之间将会发挥自身特定的信息优势,将同一问题的不同角度结合起来,更为科学地解决问题;另一方面,大数据技术也可以减少档案重复建设等因素所附加的成本,每个档案管理部门只需要重点建设与自身需求有关的部分,而对于共性的内容,则可以直接借鉴其他部门的资料。
四、大数据时代档案管理的高附加值化变革
较之传统的档案管理,引入了大数据技术的高校档案管理工作可以创造出更高的单位附加值,一般而言,不同的档案管理模式创造出来的每封档案的附加价值是存有差异的,档案交流程度、档案存储数目、档案检索方式和档案覆盖率等因素均会影响到被保存档案的价值。大数据改革可以减少档案管理中所需要的场地和人力,并使档案管理摆脱存储空间的约束,海量的数据被存储于云端或者不同节点,数据管理者可以对于这些数据进行全样本的分析,进而发生数据背后蕴含的深层次的信息价值。此外,既然更大数量级的数据处理技术变为了现实,那么不同信息储藏部门之间也就不需要再担心信息处理能力不足所致的信息失效问题,其相互之间达成有关信息共享的协议的可能性增加,在这种背景下,高校内各部门乃至各单位的档案联系更为密切,档案管理者或者数据发掘者可以采用一种交叉学科的视角,更为全面地解释一个社会问题,而在纸质档案时代或电子档案时代初期,不同部门之间的信息获取壁垒使得解释者的思维往往囿于自身所掌握的有限资料,这既无益于解决对应问题,还容易造成从业人员思维方式的“僵化”。
综上,大数据技术自身的特点决定了其必然会为高校的档案管理工作注入诸多新的元素,包括档案管理系统在可靠性、共享性乃至信息附加值上的改变等,可以说,这种变革是一种双面的创新,如果其成功过渡,将会对提高我国高校档案管理工作的能力和效率大有裨益,但与此同时,这一过程中存在的风险及问题也是档案工作者所必须正视的问题。因此,如何有效抓住大数据时代的机遇实现有效的技术创新是高校档案管理工作所必须认真思考的问题。
(作者单位:陕西榆林学院党政办公室机要科)
大数据的概念提出后不久,该技术即和云计算一起对于网络社区、气象灾害控制、疾病预防等领域中被广为运用。由于大数据不依赖于随机抽样,并未全样本处理提供了可能,所以大数据帮助档案管理实现了从静态向动态的蜕变以及从因果关系分析向现实预测的过渡[1]。下面简要从“4V”的角度说明大数据的优势:
1.1 数量(Volume)
大数据技术可以处理TB级的数据量,通过改进算法和运算方式,甚至可以获得对于更大数据量的处理能力,符合当今数据爆炸性增长的趋势。
1.2 价值(Value)
大数据进行全样本的分析,因而这一数据挖掘过程往往会得出一些极富价值的结论。
1.3 种类(Variety)
分析的数据种类极为多样化,包括文字资料、数据资料、图像资料乃至影音资料等。
1.4 速度(Veloctiy)
大数据处理要求在秒级的时间跨度内给出分析结果,这与传统的数据分析方式有着本质区别。
二、大数据时代档案管理的可靠性变革
传统的档案管理模式中,档案由专人于专门场所保存,一旦档案失窃或者档案储存场所遭受了自然灾害,那么被保存的档案容易遭受到不可逆的破坏。而在大数据时代,数据的存储往往依托于多台主机完成,即便某一台服务器发生了故障,系统也可以由其他服务器支撑运行而不至于陷入瘫痪状态。并且,因为数据通过云端在不同服务器上有所备份,所以这类故障并不会造成严重的数据丢失问题,例如,陕西省近期在西安重点建设沣西大数据产业园,其将实现数据的规模化集中吞吐、深层次整合分析、多领域社会应用、高效益持续增值作为发展目标,意在成为国家政务资源后台处理与备份中心、国家级大数据处理中心和国内最大的信息资源聚集服务区,目前,中国联通、中国移动和中国电信三大运营商以及全国人口数据处理与备份(西安)中心、陕西广电网络等项目已入区,只要三大运营商在某一片区的服务器出现了问题并因此丢失了数据,储存于此处的备份数据将会立刻派上用场。当然,在不同服务器之间进行传播的过程中可能会引发档案泄露等问题,因此,高校档案管理系统在大数据化改革的过程中使用权限控制程序、存储隔离、传输层加密、数据检验、数据备份、分布式存储等技术来保证被保存数据的安全可靠。
三、大数据时代档案管理的高共享性变革
现有的档案管理中,由于不同档案归属于不同部门管理,并且同一档案在制作的过程中也往往需要经由不同部分,在这种分开管理的模式下,不同部门之间的交互作用相对较少,这就导致了“信息孤岛”的产生,信息的缺乏使得信息的使用者无法有效挖掘数据的全部内容。与之对应,大数据技术作为档案管理中的新元素,可以保障用户对于数据的共享性,其通过多个节点构建了较节省存储空间的用户间数据交流的平台,一方面传统档案部门难以充分利用信息的困境将会得到有效缓解,不同部门之间将会发挥自身特定的信息优势,将同一问题的不同角度结合起来,更为科学地解决问题;另一方面,大数据技术也可以减少档案重复建设等因素所附加的成本,每个档案管理部门只需要重点建设与自身需求有关的部分,而对于共性的内容,则可以直接借鉴其他部门的资料。
四、大数据时代档案管理的高附加值化变革
较之传统的档案管理,引入了大数据技术的高校档案管理工作可以创造出更高的单位附加值,一般而言,不同的档案管理模式创造出来的每封档案的附加价值是存有差异的,档案交流程度、档案存储数目、档案检索方式和档案覆盖率等因素均会影响到被保存档案的价值。大数据改革可以减少档案管理中所需要的场地和人力,并使档案管理摆脱存储空间的约束,海量的数据被存储于云端或者不同节点,数据管理者可以对于这些数据进行全样本的分析,进而发生数据背后蕴含的深层次的信息价值。此外,既然更大数量级的数据处理技术变为了现实,那么不同信息储藏部门之间也就不需要再担心信息处理能力不足所致的信息失效问题,其相互之间达成有关信息共享的协议的可能性增加,在这种背景下,高校内各部门乃至各单位的档案联系更为密切,档案管理者或者数据发掘者可以采用一种交叉学科的视角,更为全面地解释一个社会问题,而在纸质档案时代或电子档案时代初期,不同部门之间的信息获取壁垒使得解释者的思维往往囿于自身所掌握的有限资料,这既无益于解决对应问题,还容易造成从业人员思维方式的“僵化”。
综上,大数据技术自身的特点决定了其必然会为高校的档案管理工作注入诸多新的元素,包括档案管理系统在可靠性、共享性乃至信息附加值上的改变等,可以说,这种变革是一种双面的创新,如果其成功过渡,将会对提高我国高校档案管理工作的能力和效率大有裨益,但与此同时,这一过程中存在的风险及问题也是档案工作者所必须正视的问题。因此,如何有效抓住大数据时代的机遇实现有效的技术创新是高校档案管理工作所必须认真思考的问题。
(作者单位:陕西榆林学院党政办公室机要科)