大数据浅谈

来源 :现代经济信息 | 被引量 : 0次 | 上传用户:goblinzehong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着全面数字化时代的到来,我们日常的生活将全面数字化。本文浅谈了大数据的概念、大数据的产生、意义或者价值以及未来的发展趋势。
  关键词:大数据;价值;发展趋势
  中图分类号:TP311 文献识别码:A 文章編号:1001-828X(2016)030-000-01
  大数据一词最早出现于1980年,未来学家阿尔文·托夫勒在《第三次浪潮》这本书中首先使用了大数据一词。然而在技术层面真正提出大数据这个词是2008年8月由维克托·迈尔-舍恩伯格及肯尼斯·库克耶两位数据工程师提出。随着互联网及计算技术的发展,今天,大数据已经成为我们日常无时无刻不在制造产生并运用的最重要信息资源。
  2015年9月,国务院印发《促进大数据发展行动纲要》(以下简称《纲要》),系统部署大数据发展工作。《纲要》明确,推动大数据发展和应用,在未来5至10年打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。
  一、大数据的概念
  大数据这个概念提出并不早,从2008年提出至今,业界还没有公认的说法。就其定义而言,大数据是一个较为抽象的概念,至今尚无确切的定义。比较典型的有以下几种。
  1.麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
  2.维基百科的定义是:大数据是需要处理的资料量规模巨大,无法在合理的时间内,通过当前主流软件工具撷取、管理、处理并整理的资料,它成为帮助企业决策的的资讯。
  3.Gartner研究机构认为:大数据是指需要借助新的处理模式才能拥有更强决策力、洞察发现力和流程优化能力的具有海量、多样化和高增长率等特点的信息资产。
  4.IDC对大数据的定义是:大数据一般会设计两种或以上的数据形式。它要收集超过100TB的数据量,并且是高速、实时的数据流,或者是从小数据开始,但数据量每年会增长60%以上。
  二、大数据的特征
  1.数据量巨大
  第一个特征是数据量大。随着互联网技术的广泛运用,互联网的信息急剧增多。大数据已经从TB级别跃升到PB级别。随着科技的进步,也许大数据的起始计量单位至少是PB(1000个TB)、EB(100万个TB)或Z(10亿个TB)了。
  2.数据种类繁多
  第二个特征据是数据类型繁多。包括网站日志数据、呼叫中心通话记录、各类社交媒体中产生的文本数据,各类位置信息数据等等。不仅包括传统的关系型数据,也包括未加工过的半结构化和非结构化的数据,例如网页、文档、视频、音频、图片、邮件等各个形势存在的数据类型。
  3.数据价值密度低
  第三个特征是数据价值密度相对较低。数据量在呈几何级数增长的同时,这些海量数据的背后所隐藏的有价值信息切并没有呈现出相应比例的增长,反而是因为量的巨大,从而获取和捕捉到对使用这些数据的使用者有价值和需求的难度成倍增加。
  4.数据处理速度快、时效高
  第四个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。每一时刻,我们都在产生数据,都在进行数据更新,这就要求处理数据的速度必须快。
  三、大数据的产生
  大数据的产生是计算机和网络通讯技术被广泛运用的必然结果,特别是互联网、移动互联网、物联网、社交网络等新一代信息技术的发展。数据的产生可归类为以下四类。
  1.由数据库产生的大数据
  由企业内部的办公自动化(OA)、企业资源计划(ERP)、物料需求计划(MRP)等业务及管理和决策分析系统所产生的数据。这些数据通过多年的累计和沉淀形成企业内部的数据,通过多年的管理、清洗、集成、结构化和标准处理,可为企业管理决策提供支持和帮助。
  2.由Web记录产生的大数据
  在Web1.0时代,网站为用户指定了大量的标准化模块操作,用户在使用互联网时,参与度相对较低,对互联网的贡献度较低,产生的数据量也较少,进入Web2.0时代,互联网变成开放式的,用户的参与度更高,个人从Web1.0时代的数据使用者变成2.0时代的数据制造者,由此带来了数据量的爆发式增长。每时每刻,个人只要登录互联网就在制造产生数据。
  3.由移动互联网产生的大数据
  移动互联网也算是互联网,所以移动互联网产生的数据应该归类在互联网产生的数据范围以内,但是随着智能终端和无线通信技术的不断发展,移动互联网正成为每一个用户采用最多的互联网参与方式。
  四、大数据的价值
  在每时每刻产生的海量数据时,我们每一个人,每一个参与者都将自己的实际情况、企业的发展方向、股市的发展趋势、社会的价值导向、甚至恐怖份子的行动意图等各个方面。所有的过去和当下都可以用数据表示,我们所有的现象、本质以及未来都完全蕴藏在数据中。
  五、大数据未来发展的趋势
  趋势一:数据的资源化
  大数据已成为企业和社会关注的重要战略资源,并已成为大家争相抢夺的新焦点。
  趋势二:与云计算的深度结合
  大数据离不开云处理,云处理为大数据提供了弹性可拓展的基础设备,是产生大数据的平台之一。
  趋势三:数据泄露泛滥
  未来几年数据泄露事件的增长率也许会达到100%,除非数据在其源头就能够得到安全保障。可以说,每个财富500强企业都会面临数据攻击,无论他们是否已经做好安全防范。因为企业的所有信息都包含在企业数据中。
  趋势四:人类通过数据化永生
  这个听起来比较玄乎,但确实是有可能实现并做到的。例如一个人的身体各种特征指标都可以用数据来表示,比如颜值,现今我们去医院的各种检查最后都是以数字的形式表示。当科学技术进步到一定程度,我的感情,我们的思维都可以用数字化表示的时候,我们每个人就可以在数字层面下得到永生。
  六、结语
  随着大数据时代的到来,我们每一个个体由数据的使用者变成数据的制造产生者,我们的所有完全融入了数字,形成一序列的数据链,在数据与数据之间只有充分融入,把握主动,站在数据挖掘的顶端才能更号的掌握未来。此文只是对大数据的一些浅显概念做了简单的阐述,不乏错误与不足之处,请斧正为谢!
  参考文献:
  [1]陈工孟,须成忠.大数据导论-关键技术与行业应用最佳实践.北京:清华大学出版社,2015.
其他文献
在建筑经济中进行成本管理,不仅能够为企业价格提供合理依据,而且有利于制定出科学的经营策略,在增加企业经济效益的同时,带动其社会效益,推动行业的持续化发展.
摘要:本文以武汉商学院为例,采用虚拟化技术作为数据中心整合中产生聚合效应的关键技术。虚拟化技术的使用使我校提高了基础架构的利用率、节约了成本、降低了资源消耗,实现对绿色节能的支持,并带来更高效的管理方法,构建了我校的绿色数据中心。  关键词:虚拟化;容灾;架构;绿色数据中心  中图分类号:TP3 文献识别码:A 文章编号:1001-828X(2016)030-000-02  随着我校教育信息化的不
伴随着经济的发展和建设,我国市政公用工程有了快速发展,其工程中道路施工技术和质量的控制工作更为突出,只有将道路施工进行保障,才能够最大限度的提升行车的稳定性和路面的
之所以提出这样看似胡言乱语甚至荒诞离奇的奇谈怪论,并不是我发神经病而故弄玄虚,更不是我就真正被“书读多了”所困惑,而是几十年的统计工作亲身经历,使我的这一感觉日渐强
在旧有的信息安全管理工作中,往往都是仅仅针对事故或故障已经发生的情况进行管理,这种方式属于事后管理的方式,其仅仅是在系统出现安全性故障之后而采取措施来进行补救,但是
目的 探讨支撑喉镜下CO2激光杓状软骨部分切除治疗双侧声带麻痹的疗效.方法 回顾分析2010年1月至2017年6月期间诊断为双侧声带麻痹,并在山东大学齐鲁医院耳鼻咽喉科接受支撑
王孺童先生虽然刚逾不惑之年,但是他著述颇丰,用“著作等身”来形容毫不为过。在中华书局出版的《国民阅读经典》系列丛书中,王孺童一人就有《百喻经译注》《金刚经·心经释义》《坛经释义》《道德经讲义》四部著作。不久前由宗教文化出版社出版发行的《王孺童集》,更是多达18卷,750万字,涉及佛学、散记、艺评、诗词、音乐、诸子、史籍等诸多领域,很多没有见过面的读者还以为他是个白发须眉的长者。  除了学者的身份之
期刊
多层砖房通常会发生开裂现象,安康属西北地区,年温差大,夏季日温差也较大,房屋建成后一年,有的二~三年,甚至更长一段时间后,墙体产生裂缝,裂缝的形态有斜缝,垂直裂缝,水平裂缝
台风分级与警报等级rn台风级别rn超强台风(SuperTY):底层中心附近最大平均风速大于51.0米/秒,也即16级或以上.rn强台风(STY):底层中心附近最大平均风速41.5-50.9米/秒,也即14