基于数据挖掘技术的统计工作创新相关研究

来源 :中国管理信息化 | 被引量 : 0次 | 上传用户:wodetiantian3321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]随着经济的快速发展,“互联网 ”时代的到来,各行各业的发展产生海量的数据信息,统计工作面临新的机遇与挑战。如何提高统计数据质量、如何充分发挥数据挖掘技术在统计工作中的优势,是统计工作者们共同思考的话题。本文重点阐述数据挖掘技术在统计工作中的创新应用。
  [关键词]数据挖掘技术;统计工作;创新;研究
  doi:10.3969/j.issn.1673 - 0194.2018.06.066
  [中图分类号]TP311.13 [文献标识码]A [文章编号]1673-0194(2018)06-0-02
  随着信息技术的快速发展,大数据、云计算、物联网等先进的科技在人们日常生产生活中得到了更为广泛的应用,先进的信息科技大大加快了数据的传播速度,提高了传播质量。在统计工作过程,利用信息技术能有效提高数据信息的及时性、完整性与有效性,大大提高了一国的综合国力与国际竞争力。
  在政府日常运营中,统计部门发挥至关重要的作用,统计工作质量的高低直接影响政府决策的有效性与科学性。在新形势下,信息技术体系的不断完善,有效提高了统计工作的质量,例如:數据挖掘技术,在统计工作的信息化进程中发挥不可替代的作用,为政府的科学决策提供强有力的支撑。笔者根据自身多年的工作经验,谈谈自己对数据挖掘技术下统计工作创新研究的几点思考。
  1 数据挖掘技术与统计学
  数据挖掘技术虽然起步比较晚,但是对于统计工作来说具有深远的意义。从技术层面来看,数据挖掘技术高度统一了人工智能、统计学、数据库管理、数据仓库、可视化、并行计算与决策支持等,通过数据库、数据仓库技术存储及管理数据,再结合统计学方法和人工智能分析数据等,深度研究数据挖掘技术在日常统计工作中应用,能有效快速统计瞬息万变的数据信息,从而挖掘出更有效、更有意义的数据信息。
  1.1 数据挖掘技术具有高智能化
  随着计算机网络技术的高速发展,数据存储技术、大数据推广技术也得到快速发展与广泛普及,随后,统计学方法体系也得到完善。新形势下,随着“互联网 ”时代的到来,各行各业的发展都迎来“数据大爆炸”“知识匮乏”的现状,而工作人员将数据挖掘技术与计算机网络技术高度统一,以从海量数据信息中挖掘出更多有用的信息。数据挖掘技术与统计学由于都属于数据处理专业,具有较高的连通性。统计学利用建模手段去挖掘海量数据信息中有用的数据;数据挖掘技术也有明显的数据挖掘特征,旨在发现更多、更有益、可利用、可发掘的数据。由此可见,统计工作中充分利用数据挖掘技术非常重要
  1.2 数据挖掘技术加快统计学的发展步伐
  现阶段,统计工作者的主要任务就是以数据信息为基础,建立模型,并深度分析研究模型。建模之后,再分析数据,这一步非常重要,然而,从目前来看,统计工作者对模型的阐述与分析研究并不深入。利用数据挖掘技术,可以针对数据集,根据不同的需求利用不同的数据挖掘技术,例如:决策树,神经网络、聚类分析等,能大大提高数据处理的有效性。值得一提的是,数据挖掘技术处理数据具有很多优势,例如:能有效处理量大、维数高、结构复杂及类型多样的数据信息。由此可见,数据挖掘技术的种种优势,能有效加快统计学发展步伐,提高统计工作信息化程度,进一步提升统计工作的质量与效率。
  2 现阶段统计工作存在的问题与缺点
  2.1 易造成数据的冗余
  我国现阶段的统计部门所应用的数据格式并没有完全统一的规定与要求,数据格式较多,比如VF、SQL、TEXT等。这样一来会使统计数据产生冗余,格式不够统一,使得数据在处理起来较为麻烦且复杂,给统计工作也带来了很大的难度。
  2.2 数据缺少统一的管理标准
  由于数据的来源和获取渠道极为广泛,所以管理起来也会遇到很多的问题,存放较为分散,没有一个统一且标准的管理模式,由此导致无法实现对数据进行进一步的深加工,继而无也法更好地利用和开发所获得的数据资源,造成数据资源的严重浪费。
  2.3 缺少对数据资源的剖析和利用
  统计工作在社会的各个层面皆有应用,统计指标多,拥有大量的数据资源。虽然统计部门获取的数据资源较为丰富,但对于这些数据资源无法实现层次更深的分析和提炼,缺少深度挖掘数据资源的工具,从而不能有效地利用好数据资源,使得统计工作与信息化严重脱节。除此之外,对于已经挖掘出的数据信息也没有进行仔细的甄别,无法判断现有资源是否完全,对于决策的利弊也不得而知。
  2.4 缺少有效的后续开发
  对于统计工作来说,统计数据是为政府和企业提供重大决策的主要依据,需要对统计技术和统计工作有一定的创新和开发,但就目前的统计工作来看,只是单纯地为制作表格而进行数据总结,并没有实现后续的开发工作。这样一来就使得数据资源不具备再次利用的价值,从而也降低了统计工作的质量与效率,无法实现对统计工作的进一步创新与开发。
  3 数据挖掘技术在统计工作中的适应性
  3.1 超强的综合应用性
  新形势下,数据挖掘技术能利用具有超强综合应用性的手段,来有效挖掘出统计工作者所需求的某种特性的数据,从而有效拓展统计工作的深度与广度,加快统计工作的创新发展。
  3.2 较强的实际有效性
  数据挖掘技术是一种具有明确目的的数据深加工技术,工作性能非常稳定。首先,其能有效提高统计者分析整理相关数据的质量,其次,对聚类分析、神经网络等技术手段的有效利用,能挖掘出更深层次、更高质量的数据信息,充分提高其实际有效性。
  3.3 较高的技术适用性
  现阶段,统计工作需要庞大的数据库作支撑,并为数据挖掘技术的应用提供广阔的平台。数据挖掘技术在这个平台上进行数据整合,从而提高统计数据的真实性、完整性与有效性,从而获取更深层次、更有用的信息资源。   4 数据挖掘技术在统计工作中的发展前景
  数据挖掘技术具有自动预测趋势和行为、关联分析、粗糙集分析、聚类分析、概念描述、变化和偏差检测、回归分析等潜在优势。因此,笔者认为,在日常统计工作中充分利用数据挖掘技术非常重要,能帮助人们获取更多、更有用的数据信息。在未来统计工作中,利用数据挖掘技术时应做好以下几点。
  4.1 研发、利用数据挖掘系统
  现阶段,一方面各单位的统计工作中的数据信息具有多样性,现有的挖掘技术不可能適用于所有的数据库;另一方面,统计工作涉及范围广,内容繁杂,数据量大,硬性指标多,至今为止,没有任何一种数据挖掘系统能满足统计工作所有的需求。由此可见,新形势下,最为紧迫的工作就是立足于统计工作的实际情况,去研发一种通用的数据挖掘系统,以适用于所有的统计工作,例如:多维数据挖掘系统、关系数据挖掘系统与空间数据库挖掘系统等。数据仓库数据挖掘系统的应用,能及时弥补应用数据挖掘技术中预处理数据耗时多的缺陷。利用建立数据仓库的手段,避免每次抽取、清洗、转换和装载数据的繁杂程序,创新地根据主题来组织存放数据库,为数据挖掘技术获得有效数据源提供强有力的保证。
  4.2 提高所挖掘数据的质量
  无论何时,统计数据的质量都非常重要,如果所挖掘的统计数据质量较低,那么就意味着所得的结果也是质量较低的。高质量的数据能为政府科学决策、进行现代化管理提供依据,因此,国家与社会各界高度重视获得高质量的数据信息。由此可见,必须保证统计部门的数据集的质量。只有提高数据挖掘技术质量,减少应用过程中出现的问题,提高技术有效性,才能为数据利用部门提供更高质量、更有效的数据信息。在今后的发展过程中,技术人员应注重提高数据挖掘技术所挖掘信息的有效性、适用性。同时,将数据挖掘技术应用到实际的统计领域,例如,交互式数据挖掘系统,针对客户的需求而精准挖掘数据,全方位、多角度地根据数据的动态改变,灵活挖掘所需要的数据信息。
  4.3 优化数据挖掘的结果
  政府统计机构是数据信息的利用者,由此可见,政府统计部门应着手为统计工作谋划新的发展方向,高效利用数据挖掘技术,挖掘出能帮助决策者科学决策的有用数据。但是,所挖掘的数据最终的使用者并不一定就是数据挖掘方面的专业人员,而是统计部门的相关人员,因此,应不同程度地优化、简化所挖掘出来的数据结果,提高其科学性。
  4.4 提高数据的保密性与安全性
  在数据挖掘技术的开发与利用方面,很多国家的统计部门已有非常完善的研究开发计划,例如:欧洲国家的政府机构设计的SODAS、KESO和SPIN等,并有配套的专门软件,开发出具体的数据挖掘工具应用在实际工作中。为充分发挥数据挖掘的潜在价值,我国相关统计机构也在加紧研发和引进先进数据挖掘技术。由于政府统计工作具有特殊性,与国家安全紧密相关,因此必须提高数据的安全性与保密性。
  5 结 语
  数据统计工作对于任何一个国家的发展都是至关重要的,统计部门是整个政府体系中的中枢机构,它所掌握的数据,是政府进行决策的依据。在信息技术快速发展、“互联网 ”普及各个角落的今天,人们的生活习惯正悄无声息地发生改变,信息技术的发展,让庞大数据信息的处理与传输工作变得更加便捷。在未来,统计工作应高度结合先进的信息技术,不断创新发展,构建完善的统计体系,让统计工作在社会主义现代化建设中,在全面建成小康社会的事业中,发挥最大的效用。
  主要参考文献
  [1]行智国,吕斌.数据挖掘及其在官方统计中的应用前景[J].江苏统计,2003(2).
  [2]王斌,会曲颖.数据挖掘技术及其应用现状[J].统计与决策,2006(10).
其他文献
在现代市场经济环境下,企业对成本信息精确性的需要十分强烈。作业成本法相对于传统的成本核算方法而言,能够根据成本发生的作业动因对所发生的成本进行合理分配,因此会使所
畜牧业是涪陵区农村经济的四大支柱产业之一。本文对涪陵区畜牧业近年来的发展成效和经验进行研究总结,并分析了存在的问题,提出了今后发展对策,以推动涪陵区畜牧业产业化发展。
<正>2012年欧洲中期天气预报中心(ECMWF)年度学术会议的主题是季节天气预报。在2012年9月3—7日,历时整整一周的会上,分别来自ECMWF和英国(各5人)、美国(4人)、法国(2人)以及
期刊
当前,我县农村畜牧生产正处于粗放型向集约型转变的初始时期,农村家庭散养动物仍是畜禽生产的主体。全面落实农村家庭散养动物的防疫工作,直接关系到整个畜牧业的发展和人民群众
“十一五”时期是我国全面推进农业现代化,加快社会主义新农村建设的关键时期,畜牧业作为农村经济的主导产业,将在新农村建设中发挥重要作用。那么,如何才能抓住机遇,乘势而上,大力
为了检验水下机器人的碰撞性能,本文利用了Ansys/Workbench中的Explicit Dynamics模块对一种无人有缆水下机器人的碰撞过程进行数值模拟,并分析了该结构的碰撞性能。为水下机
针对纳米技术产业化的现状和发展趋势,分析了存在的主要问题.研究了纳米技术产业化创新发展的路径选择,提出通过动态联盟联合攻关、创新人才驱动发展、建设“六位一体”的综
从高校实验中心管理层面,提出了基于仪器设备生命值的动态管理方法。阐述了仪器设备管理中需要量化的指标,以及在仪器设备日常使用、管理和优化资源配置等方面应注意的问题,
我国加入WTO,农产品市场对外开放,大量质优价廉的国外动物及其产品涌入我国,无疑对我国畜产品市场产生较大冲击。由于我县农户大多数长期从事粮食等大宗作物的生产,无论在规模、
摘要:滨海新区实施创新驱动战略,应重视提升小巨人企业创新能力。通过总结现有研究成果并结合滨海新区实际,构建小巨人企业研发能力影响指标体系。并随机选取滨海新区小巨人企业