论文部分内容阅读
1什么是大数据?
答:大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。它包括了4个特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值),简称大数据的4V特点。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
2大数据时代是什么意思?
答:在未来,我们认为会存在这样一个时代:几乎我们每一个举动,都会被记录,并变成数据被存储起来,无数的数据就组合成了你本人的一个信息库。通过这个信息库,你的一言一行,你的思想都变得可预测。这就是大数据时代。
3大数据技术分为哪些阶段?
答:从技术的角度由底层往上而言,大数据分为最基础的数据库处理阶段、存储阶段、架构设计阶段、实时计算阶段、数据采集阶段、商业实战阶段。值得注意的是,不同阶段对从业者有不同的技术要求,换言之大数据整个产业链需要不同技术的人才来支撑。
4什么是数据挖掘?
答:数据挖掘是大数据中重要的一个技术,它是采用数学的、统计的、人工智能和神经网络等领域的科学方法,如记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等技术,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。
5大数据和数据大集中有什么区别?
答:大数据实质是数据量到了一定程度,怎么获取、处理和分析的事情。其他问题比如数据中心怎么建设、是否采用数据大集中的形式可以说和大数据的实质关系不大。数据大集中是一种建设模式,意思主要是不搞分级分地区的部署,而把数据中心统一在一处。比如银行的中国南北两大数据中心、税务部门的大集中建设,这样数据库在物理上是位于一处汇总的。
6数据挖掘与统计学的关系是什么?
答:数据挖掘来源于统计分析而又不同于统计分析。数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。
7大数据的商业价值
答:大数据的很多“特质”是要与商业结合才能体现的,主要有:细分顾客群体,使得营销对象更精准;模拟实境,发掘新的需求和提高投入的回报率;帮助企业发掘并增强产业链中比较薄弱的部门;实现数据存储空间出租;帮助从不同角度层次分析了解客户;使数据搜索产业具备更全面的维度。
8大数据可以做什么?
答:首先对大数据的处理分析正成为新一代信息技术融合应用的结点。其次,大数据是信息产业持续高速增长的新引擎,这其中包括了对硬件设备领域的影响,对软件与服务领域的影响。再次,大数据将使得各行各业的竞争力核心从“业务驱动”模式转变为“数据驱动”模式。最后,大数据还将使得很多科学研究的方法发生改变,比如社会普遍使用的抽样调查方法会转变为实时监测、跟蹤研究、数据挖掘分析等等。
9大数据目前的发展趋势
答:大数据目前发展的趋势主要可分为以下几个方向:数据的资源化、与云计算的深度结合、科学理论的突破、数据科学和数据联盟的成立、数据安全高度重视化数据管理逐渐成为核心竞争力、数据质量成为商业智能成功的关键、数据生态系统内部角色分工逐渐细化。
10什么是数据仓库?
答:数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。(编辑/有庆)
答:大数据(big data),是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。它包括了4个特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值),简称大数据的4V特点。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
2大数据时代是什么意思?
答:在未来,我们认为会存在这样一个时代:几乎我们每一个举动,都会被记录,并变成数据被存储起来,无数的数据就组合成了你本人的一个信息库。通过这个信息库,你的一言一行,你的思想都变得可预测。这就是大数据时代。
3大数据技术分为哪些阶段?
答:从技术的角度由底层往上而言,大数据分为最基础的数据库处理阶段、存储阶段、架构设计阶段、实时计算阶段、数据采集阶段、商业实战阶段。值得注意的是,不同阶段对从业者有不同的技术要求,换言之大数据整个产业链需要不同技术的人才来支撑。
4什么是数据挖掘?
答:数据挖掘是大数据中重要的一个技术,它是采用数学的、统计的、人工智能和神经网络等领域的科学方法,如记忆推理、聚类分析、关联分析、决策树、神经网络、基因算法等技术,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。
5大数据和数据大集中有什么区别?
答:大数据实质是数据量到了一定程度,怎么获取、处理和分析的事情。其他问题比如数据中心怎么建设、是否采用数据大集中的形式可以说和大数据的实质关系不大。数据大集中是一种建设模式,意思主要是不搞分级分地区的部署,而把数据中心统一在一处。比如银行的中国南北两大数据中心、税务部门的大集中建设,这样数据库在物理上是位于一处汇总的。
6数据挖掘与统计学的关系是什么?
答:数据挖掘来源于统计分析而又不同于统计分析。数据挖掘不是为了替代传统的统计分析技术,相反,数据挖掘是统计分析方法的扩展和延伸。大多数的统计分析技术都基于完善的数学理论和高超的技巧,其预测的准确程度还是令人满意的,但对于使用者的知识要求比较高。而随着计算机能力的不断发展,数据挖掘可以利用相对简单和固定程序完成同样的功能。
7大数据的商业价值
答:大数据的很多“特质”是要与商业结合才能体现的,主要有:细分顾客群体,使得营销对象更精准;模拟实境,发掘新的需求和提高投入的回报率;帮助企业发掘并增强产业链中比较薄弱的部门;实现数据存储空间出租;帮助从不同角度层次分析了解客户;使数据搜索产业具备更全面的维度。
8大数据可以做什么?
答:首先对大数据的处理分析正成为新一代信息技术融合应用的结点。其次,大数据是信息产业持续高速增长的新引擎,这其中包括了对硬件设备领域的影响,对软件与服务领域的影响。再次,大数据将使得各行各业的竞争力核心从“业务驱动”模式转变为“数据驱动”模式。最后,大数据还将使得很多科学研究的方法发生改变,比如社会普遍使用的抽样调查方法会转变为实时监测、跟蹤研究、数据挖掘分析等等。
9大数据目前的发展趋势
答:大数据目前发展的趋势主要可分为以下几个方向:数据的资源化、与云计算的深度结合、科学理论的突破、数据科学和数据联盟的成立、数据安全高度重视化数据管理逐渐成为核心竞争力、数据质量成为商业智能成功的关键、数据生态系统内部角色分工逐渐细化。
10什么是数据仓库?
答:数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。数据仓库是决策支持系统和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。(编辑/有庆)