大数据背景下名录库的更新维护探析

来源 :今日财富 | 被引量 : 0次 | 上传用户:hakhid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据时代的两大特征是数据爆炸和数据利用成都的提升,如何在大数据背景下,开展统计工作和大数据的深度融合,提升名录库更新维护的水平和质量,是关系统计工作和名录库管理的重要问题。
  一、前言
  随着信息时代发展的逐步深入,数据正呈现一种大爆发的增长模式,数据产生的数量前所未有,数据扩展的规模与日俱增。大数据技术不可避免的对政府统计工作产生一定影响。在大数据时代背景下,开展名录库更新和维护的研究,具有重大而现实的意义。
  二、名录库数据源探讨
  基本单位名录库,是指包括了全部法人单位、产业活动单位的基本标识和主要属性信息的数据库,是经济社会管理的基础。而统计系统基本单位名录库,作为基本单位名录库的延伸,是统计机构用于各类统计调查的基本单位名录库。本文的讨论主要针对统计系统基本单位名录库。
  1、名录库数据源现状分析
  名录库是统计工作的四大工程之一,是统计工作得以完成的前提。只有建立健全名录库建设,才能保证统计数据的及时更新和维护,各类统计调查单位在进行抽样和统计中才能够准确定位,最终提升统计能力。名录库的质量要素包括实效性、全面性和准确性,这三种质量要素很大程度上取决于名录库的数据源。就我国现阶段的名录库数据源分析,每五年一次的经济普查数据能够为名录库更新提供较为详实的数据,各地方各部门自行组织的各类统计调查在名录库局部调整和更新中具有重要的意义。由县级以上相关部门提供的行政记录是名录库更新的重要外部数据来源,更新周期一般为半年。
  2、名录库数据质量分析
  无论是在传統统计工作还是大数据处理过程中,统计工作流程至少涉及统计机构、数据用户和数据提供者三个参与主体,并由这些参与主体的行为及其交互作用延伸出诸如目的性、准确性、时效性等统计数据质量维度,以及与此相联系的成本问题。名录库建设、更新,作为统计工作的基础一环,也符合统计工作流程的一般规律,我们将名录库建设、更新中的参与主体及数据质量维度进行梳理。
  名录库的内部渠道主要是通过各种统计机构的调查,收集和整理本部门的相关信息。多数单位在这一过程中作为数据的提供者,并不是数据的使用者,工作积极性不高,另一方面,这类机构同时还肩负着其他的工作任务,负担较重。非统计部门作为名录库信息的外部渠道,既是数据的提供者,也是数据的使用者。但是不同部门存在业务上的差异,统计部门主导建设的名录库并不能用于政府机构使用。
  3、名录库存在问题分析
  我国经济社会发展取得了举世瞩目的成就,相应的我国单位数量呈现井喷式的增长。名录库更新和维护工作在如此巨大数据量面前,显现出一定的技术难度。区县统计局在人员配备和名录库技术方面存在客观短板,难以在短时间内完成名录库的更新维护工作。部分地区基层组织在指导性目录之外进行委托事项,需要进行购买,名录库的更新经费支持很少,寄希望于社区人员无偿进行名录库更新不切实际。
  三、大数据背景下名录库的更新维护
  1、信息范围确定
  互联网大数据时代,信息量越来越大。在名录库更新方面,不是所有的信息都具有价值,这就需要通过利用大数据筛选技术,排除那些价值密度不高、信息真假难辨的信息区域,对可以使用的信息范围进行“聚焦”,锁定信息范围的方向。聚焦,在大数据信息统计领域,就是指的更新名录库所使用的具体数据源。名录库建设的基本单位包括法人单位和产业活动单位,在数据收集中,需要准确定位可靠的数据信息站点。
  2、数据提取
  在名录库更新中的信息提取,指的是利用大数据分析技术,在基本确定信息范围之后,对于有效信息较为集中的特定区域,综合运用信息提取技术进行信息提取。在数据信息发生变化的情况下,需要整合出某种适合的表达式,并通过表达式对信息进行过滤和剔除,最终提取到有价值的数据。在信息家户飞速发展的今天,信息的产生和更新速度,对信息提取部门提出了巨大的挑战。
  3、信息整合
  在利用信息技术确定信息范围之后,能够在一定程度上降低无效信息的干扰,得到比较准确的名录库基本信息列表。伴随着大数据、互联网和云计算等技术的发展,智能搜索技术日渐完善,在提取名录库基本信息和属性的基础上,还能够得到数据周围地理及天气信息。这就为获取之前难以得到的数据周边信息提供了便捷的工具。地理位置信息能够降低外出调查人员的工作量,优化路径选择方案。
  4、信息甄别
  经过上述三个步骤,能够得到用于补充和更新名录库的有效数据。但是在使用上述数据进行名录库填制之前,还需要进行数据信息的甄别。经常使用的方式是数据相互印证技术,统一数据来源或者相似数据来源的信息具有一定的关联性和近似性,这就是大数据背景下进行信息甄别的逻辑思路。通过数据内在的逻辑性进行数据的相互验证和相互推测。
  四、大数据时代名录库管理展望
  数据的重要价值在大数据时代显得尤为突出,数据是统计部门的立命之本和工作核心,面对汹涌的信息化浪潮,统计工作者需要一拥抱的姿态进行大数据模式下的名录库管理工作实践,促进大数据和统计工作的深度融合,抢占发展先机,丰富数据调查体系,建立共建共享数据管理模式,打破各部门之间的信息壁垒,实现数据和名录库的互联互通。
  五、结语
  通过上文的研究和探讨,可以看到传统的数据统计方式方法和名录库管理技术已经不能适应大数据背景下统计工作的新要求,为此,本文基于现阶段名录库管理,结合大数据和智能管理,提出了大数据背景下名录库的更新维护的原则方法和新手段。(作者单位为江苏省兴化市戴窑镇统计站)
其他文献
Caspase-8作为细胞死亡信号诱导复合体中不可或缺的一员而一直备受关注,是细胞凋亡信号因子中研究的热门。然而,最近研究指出Caspase-8除了作为细胞凋亡信号中的一员外,还有
A我的生日是阴历3月30日,请问我是什么星座?这个星座的人在爱情和将来的爱人选择方面是什么情况?Q星座是用阳历算的,用阴历反推可能会有误差,但大体可以确定你是金牛座。含蓄
1.问题提出“二元一次不等式表示的平面区域”这一内容,尽管苏教版教材是安排在一元二次不等式之后单独一节课,作为二元一次不等式组与简单的线性规划问题的起始课,它是学习
传动比和功率是平行转子—轴承系统中主要的性能参数之一,也是影响系统运动稳定性的主要因素。通过数值分析,找到了它们对系统稳定性的影响规律,发现了该系统失稳时不同于一般转
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
离婚后,夫妻双方都需要放下不必要的自尊,共同选择真正适合孩子的抚养方法,而非对自己最便捷的。研究表明,当离异的父母双方都保持着高度合作、互相尊重的理智想法时,共同抚
高中同学聚会,班长把当年的班主任也请来了。  好多年没见面了,同学们的变化都很大,只有班主任还是那么婆婆妈妈。聚会快结束时,有几个同学喝醉了,班长拿出手机熟练地划拉起来,给开车来的同学叫上滴滴代驾,给没开车的同学叫上滴滴打车。  上了年纪的班主任不会使用智能手机,就凑在班长身边,把APP上的车牌号、驾驶员手机号逐个抄在小本子上。在酒店门口,每來一辆汽车、一个代驾,班主任都要核对无误后,才让自己的学
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
临床上应用的中药注射剂有上百种,但其对细胞色素P450 2C9酶活性的研究却很少。中药注射剂对CYP2C9酶的活性不管是抑制或是诱导作用,在应用经CYP2C9代谢的药物时,要重视中药
目的研究痰热清注射液不良反应发生率、不良反应类型、严重程度、表现形式、易感人群及影响因素,对痰热清注射液临床合理用药、联合用药进行评价,完善药品说明书。方法采用注