计算机数据分析常用方法与比较

来源 :科学与财富 | 被引量 : 0次 | 上传用户:huawei_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:基于数据化时代的发展特点,很多科研工作与行业发展都需要通过数据分析来获得发展依据,数据分析工作也显得越来越重要了。为了完成分析数据的任务,现代人对于数据分析技术进行了开发,并获取了更多的分析方法,计算机在数据分析工作之中发挥了相当重要的作用,应用计算机可以以较高的效率处理种类丰富,数量庞大的数据。分析人员需要以分析条件以及数据实际情况为准,选出合适的分析方法,本文对几种常见的分析数据的方法展开比较性研究。
  关键词:计算机;数据分析;常用方法;比较
  数据分析已经逐渐成为了各个行业之中的基础性工作,在对数据进行分析之后可以清晰地找出数据之间存在的规律与联系,在验证了规律的正确性之后,还可以通过合理的方法来运用规律达到一定的目的,进行而成正确可靠的决策。虽然人们对数据分析工作不断改进,但是需要处理的数据量仍在不断增加,数据分析工作逐渐变得更具难度,选择合适的分析方法颇为关键,本文对常用的数据分析方法展开研究,并通过对比来给数据分析人员提供参考。
  1 数据分析工作概述
  在了解数据分析工作中常用的分析方法时,工作人员需要对数据分析这项工作任务的基本概念有所了解,在数据分析工作中,分析人员具有相对较强的目的性,其会对目标数据进行收集、整理以及加工,再选定分析方法对数据展开多角度的分析工作,借此来将数据之间存在的可靠联系与科学规律找出,辅助其他工作,在数据分析过程中,提炼出有价值的信息这个环节非常重要,在数据分析工作结束之后,工作人员还要对分析过程的各种工作情况进行整理,撰写出详细的数据分析报告 。
  在开展数据分析工作时,分析人员一般会从数据挖掘方法与统计分析方法两种方法之中选出合适的分析方法,数据分析结果与选定的分析方法存在极大的联系,甚至会给分析结果的精准度带去影响,因此可知选对分析方法的意义。
  2 数据挖掘方法分析
  分类分析:决策树。决策树是一种树形结构,通过把实例从根节点排列到某个叶子节点来分类实例,叶子节点即为实例所属的分类。常用的决策树方法有C4.5、CART和Assistant。决策树能生成可理解的规则,计算量相对较小,能够清晰显示比较重要的字段,但当类别太多时,错误也可能增加较快,比较难预测连续性的字段,在一般算法分类时,只根据一个属性进行分类,这是其缺点。人工神经网络。人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,它是数据挖掘中机器学习的典型代表。简言之,“神经网络”就是通过输入多个非线性模型及不同模型之间的加权互联,最终得到一个输出模型。贝叶斯分类方法。贝叶斯分类方法主要用于预测类成员间关系的可能性,它是统计学的一种分类方法。在许多场合,朴素贝叶斯分类算法可以与决策树和神经网络分类算法相媲美,该算法能运用到大型数据库中。
  回归分析。数据挖掘中的回归分析主要是指多元线性回归和逻辑斯蒂回归,后者多在数据化运营中使用。多元线性回归主要描述一个因变量如何随着一批自变量的变化而变化,其回归方程是因变量与自变量关系的数据反映,最常用的是最小二乘法,即找出一组对应自变量的相应参数,使得因变量的实际观测值与回归方程的预测值之间的总方差减到最小。
  聚类分析。聚类分析是指当要分析的数据缺乏描述信息,或是无法组成任何分类模式时就采用聚类的方法,将组之间的差异识别出来,并对个别组内的相似样本进行挑选,实现同组数据相近,不同组数据相异。
  3 统计分析方法分析
  描述性统计分析。描述性统计分析是通过图标或数学方法,对数据资料进行整理、分析并对数据的分布状态、数字特征和随机变量之间的关系进行估计和描述的方法。它分为集中趋势分析、离中趋势分析和相关分析三大部分。集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。离中趋势分析主要靠全距、四分差、方差、平均差、标准差等统计指标来研究数据的离中趋势。相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象进行其相关方向及相关程度的研究。这种关系既包括两个数据之间的单一相关关系,也包括多个数据之间的多重相关关系。
  回归分析。回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。按照涉及的自变量的多少,分为回归和多重回归分析;按照因变量的多少,分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,分为线性回归分析和非线性回归分析。这里讲的回归分析是指一元线性回归,区别于数据挖掘方法中的多元线性回归。
  关联分析。关联分析又称关联挖掘,通过分析由定性变量构成的交互汇总表从大量数据中发现项集之间有趣的关联和相关联系。其基本思想就是将一个联列表的行与列中各个元素的比例结构以点的形式在较低维的空间中表示出来。
  因子分析。因子分析是指研究从变量群中提取共性因子的统计技术,即从大量的数据中寻找内在的联系,减轻决策困难的分析方法。因子分析有重心法、最大似然揭发,最小平方法,拉奥典型抽因法等,都以相关系数矩阵为基础。
  方差分析。方差分析又称“变异数分析”或“F检验”,用于两个及两个以上样本均数差别的显著性检验。研究所得的数据一般呈现波动状。造成波动的原因可分成两类,一类是不可控的随机因素,另一类是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。
  4 两种分析方法对比分析
  前文详细地介绍了数据挖掘方法与统计分析方法,对两种类型的分析工作的实现途径进行了详细地解析,以下是对这两种分析方法的对比情况。
  从理论来源的角度来看,这两种分析方法理论基础都是统计基础理论,在统计方法中的随机事件与概率均来自于统计学,另外抽样分析也与该理论存在联系,而在数据挖掘系统之中应用的贝叶斯分类法也可以被看做是基础统计理论的延伸,因此可以明确两种分析方法虽然具有存在差异的分析途径,但是却具有同样的理论研究基础。
  在分析实践工作之中,两种方法之间存在的差异就很明显了,应用统计分析方法时,工作人员需要先给出判断与假设,再应用其他的数据分析技术来对已有的判定以及假设进行验证,在分析中会形成很多函数关系式,而选用数据挖掘技术时,工作人员会直接通过算法找寻数据间的主要联系,并不需要应用大量的函数关系式,因此可知在处理数量较大的数据时可以有限选用数据挖掘技术。
  5 结束语
  本文重点介绍的两种分析方法是当前的数据统计工作中应用频次最高的分析方法。分析人员在不同的客观分析条件之下可以选择应用不同的方法,也可以按照分析工作的不同阶段来对不同的分析方法加以与应用,先借助统计分析工作对数据进行整体性地处理,再通过数据挖掘技术对数据进行深度分析,本文还简单地对两种数据分析方法进行了对比,数据分析人员在方法选择方面要保持一定的靈活性,规范地开展数据分析工作,切实将数据分析工作的作用在预测与方案制定等工作中发挥出来。
  参考文献:
  [1]赵禹.(2016). 计算机数据分析常用方法与比较. 数字技术与应用(3), 256-256.
  [2]梁萌, & 管阳. (2017). 基于并行数据库的海量数据分析处理方法的研究. 电子设计工程, 25(10), 132-135.
  [3]康晓鹰. (2017). 对计算机分析处理技术中的数据分析的探析. 中国培训(2), 71-71.
  [4]宋智广. (2017). 基于计算机辅助设计的数据处理方法和装置.CN 103810351 B.
其他文献
摘 要:结合船舶结构的缺陷情况,本文举了一些关于结构缺陷形成之后产生的危害的典型案例,借以阐述船舶结构检验的重要性,提出防止出现船舶结构缺陷以及修理原则的相关理论。  关键词:船舶结构;缺陷分析;修理原则  船舶在营运的过程中,随着环境荷载和操作荷载的不断作用,服务能力会逐渐出现衰减的趋势,在复杂的环境下,结构功能的丧失意味着船舶遭到了破坏,影响船龄的增长以及船舶的使用。一旦超过期望寿命,船舶运输
期刊
摘 要:经济发展过程中,建筑行业是其中较为重要的组成部分之一,这些建筑行业的发展让我国经济发展的步伐得到提升。城市发展过程中,为了满足大量城市人口在住房上的需求,城市中的高层建筑数量会越来越多,想要这些高层建筑的修建质量得到专业性的满足,就必须采用新型技术让建筑的施工过程更加科学,专业。本文将会在以下部分内容中做详细解说,仅供专业人士的参考与借鉴。  关键词:房屋建筑; 高层住宅; 施工技术  随
期刊
摘 要:按照项目施工工程的整体角度来看,现场的成本管理工作对于整个工程质量具有重要的影响,并且也还是整个建筑工程施工单位经济管控的重要基础。根据当前建筑行业的发展状况可以看出,将建筑工程的施工成本通过科学有效的方式进行管理是极具现实意义的。可以显著地提高建筑工程施工项目的完整性与施工机构的形象,并且还能够扩大整个建筑工程项目的利润空间。除此之外,在施工现场的成本管理与控制工作当中,必须要对施工现场
期刊
摘 要:随着社会经济的不断发展,工程项目数量也在不断的增多,这也是由于人们以及市场的需求所决定的,在如今的工程建设中,施工单位以及投资单位都会偏于注重工程造价的问题,因为这个问题直接关系到整体工程的经济效益,所以马虎不得。这就要求有关的施工人员以及管理人员能够对工程造价的全过程加以控制和管理,进而争取工程造价的利益做大化,使得企业的经济利益与社会效益并存,这样也有利于满足工程项目建设的要求,同时也
期刊
摘 要:随着我国综合国力的增强,建筑行業得到了飞速发展,暖通工程不仅是机电系统中的用电大户,也是建筑工程的重要组成部分,暖通设计的合理性是影响建筑物使用效果和寿命的最直接因素。在相关工作人员的不懈努力下,暖通配套设施已经越来越完善,但是,我们在欣喜于巨大成就的同时,更应该看到其中存在的问题。本文站在暖通工程施工中的暖通设计的角度对相关问题进行分析,望同行人士指正。  关键词:暖通工程; 施工; 暖
期刊
摘 要:随着时代的不断发展,技术也在不断的进步,在我国的仪器制造以及设计中能够有所体现。酒精测试仪就是一种测量人体酒精程度的设备,经过测量能够知道人体内的酒精含量,给出一定的结果。但是在实际的应用过程中,还是会发现很多的不足之处,大多数的酒精测试仪都比较笨重,识别不便等,这些都不利于酒精测试工作的顺利进行。因此,基于人机工程学的智能酒精测试仪设计方案就被人们提了出来。经过改良,能够优化性能,使得仪
期刊
摘 要:当前国内市场经济的发展迅速,城市化进行脚步加快,建筑工程行业也得到了良好的成长空间并且逐渐地成为了我国的支柱型产业。但是如果建筑工程行业想要在未来充满变数的市场环境里有一席之地,就必须要将工程施工技术以及施工工艺进行改进与创新。深基坑支护技术作为建筑工程中相当重要的施工技术,其良好的适应性与安全性也得到了业内人士的高度关注。将深基坑支护技术进行分析与探索,为城市的发展与国家经济建设打下坚实
期刊
摘 要:改革开放以来,中国社会得到巨大的发展,各种高新技術设备被广泛应用于企业的生产之中。为了使企业的生产效率得到提高,在生产之中应用了自动化设备。由于某些企业自身的原因,在进行生产时无法使用标准的自动化设备,而是逐渐开始引用非标自动化设备。本文就针对非标自动化设备的特点进行分析,并对它的创新设计技术进行论述。  关键词:自动化设备;非标;特点;创新设计;  在信息技术高速发展的今天,为了提高生产
期刊
摘 要:为了保证高层建筑能有效的应对火灾,需要高层建筑做好暖通空调装置排烟施工,并能结合高层建筑的实际防烟需要以及暖通空调装置的特点,制定科学的暖通空调装置防排烟施工方案。本文就高层建筑物当中暖通空调装置防排烟施工进行了分析。  关键词:暖通空调;高层建筑;防排烟  高层住宅在为人们提供优质居住环境、良好视野的同时也给人们带来了一些不便,比如高层火灾逃生就是一个难题。为了是高层发生火灾时候人们的安
期刊
摘 要:现在我国科学技术发展水平不断提高,智能建筑的数量越来越多,功能也越来越多样。但实际上智能建筑和电气工程自动化技术的关系非常密切,这就需要设计人员对这部分技术给予足够的重视,提高对自动化技术的应用力度。这样才能不断提高智能建筑的智能水平,给人们的使用带来足够的便利。本文首先简要分析了电气工程自动化技术对智能建筑的作用,之后结合这项技术的必要性总结了一些应用要点,希望可以给相关工作的开展提供一
期刊