浅谈计算机数据挖掘

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:jk305
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]目前,随着社会经济的快速发展,人类已经进入了网络信息时代,随之产生了各种类型的数据海量。在这些数据的背后隐藏着许多重要的信息,如何从这些数据中找出某种规律,发现有用信息,越来越受到人们的重视。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘技术为海量信息的处理提供了科学和有效的手段。本文介绍了数据挖掘的概念、对象、任务、过程、方法、应用领域及其面临的挑战。
  [关键词]计算机;数据;挖掘技术
  中图分类号:G633.67 文献标识码:A 文章编号:1009-914X(2014)42-0134-01
  计算机数据挖掘技术的产生是社会的一种进步,了解计算机数据挖掘对我们来说非常的重要,计算机数据挖掘在网络信息时代的今天对于任何一个企业来说都是非常的重要,我们要充分认识数据挖掘的概念、对象、任务、过程、方法和应用领域,只有充分地认识数据挖掘的概念、对象、任务、过程、方法和应用领域,我们才能够更好地完善和发展它。
  1 计算机数据挖掘的概念及对象
  1.1 计算机数据挖掘的概念
  数据挖掘(Data Mining)是指基于一定业务目标下从海量数据中挖取潜在的、合理的并能被人理解的模式的高级处理过程。与传统的数据分析最大本质区别是数据分析所得到的信息具有先前未知、有效和实用三个特征,即数据挖掘是发现那些不能靠直觉发现的信息或知识,甚至违背直觉的信息或知识,挖掘出来的信息越出乎意料越有价值。
  1.2 计算机数据挖掘的对象
  计算机数据挖掘具有一定的针对性,计算机数据挖掘的对象(目标数据)并不是所有的数据,它是具有选择性的,计算机数据挖掘的对象主要是指企业中能够揭示一些未发现的隐藏信息和企业中比较有意义和研究价值的数据,明确这一点非常的重要,计算机数据挖掘的对象的选择性是影响计算机数据挖掘效率的主要因素,对于一个没有充分认识计算机数据挖掘对象的选择性的企业来说,它的计算机数据挖掘的效率会比成熟的计算机数据挖掘的企业或者是充分认识到计算机数据挖掘的对象的选择性的企业要低得多。同时,明确目标数据的类型也非常重要,它直接决定了要使用的数据挖掘技术和方法,大体上数据类型分为三类:记录数据,给予图形的数据和有序的数据。
  2 数据挖掘的价值实现难点分析
  数据挖掘是数据库中的知识发现,从知识发现到知识应用、再到价值评估是一条数据挖掘价值变现的过程,虽然数据挖掘重要性毋庸置疑;但事实上其转变商业价值之路仍有较多困难。
  2.1 知识发现
  知识发现是这条路的始端,直接决定了最终价值的高度。挖掘的方法是通用的,但难度不在挖掘技术,而在于实施人员对数据业务的理解,在于数据的质量。实施人员必须清楚的知道数据回收的场景和原理,稍有沟通缺失,都会影响知识的质量度。
  2.2 知识应用
  发现了知识,只是迈出第一步,需要将相关的知识发现交给业务部门进行运营使用。不管是以甲方公司还是乙方公司的形式存在,难点在于语言的翻译转发。数据挖掘的语言形式是概率形式,类如“连续三天内在站内搜索超过10次,浏览搜索结果相关页面20次以上的用户最终购买概率为42%”,因此需要实施人员深谙运营知识,将挖掘结果语言转化成运营结果语言,最终成为友好的商业运营智慧。应用的过程还需要及时跟踪、分析、调整,毕竟市场是多变的,分析与执行就像左脑和右脑,两者距离的远近,影响结果的优劣。
  2.3 价值评估
  数据挖掘的效果评估决定最终的话语和地位。从结果来看,如果结果有效,如何界定是知识有效还是执行有效;如果结果无效,如何界定是知识无效还是执行无效;如果知识有效,如何界定是通过挖掘发现还是已知发现。如果不能很清晰的界定,数据挖掘的存在价值都会大打折扣。曾经有个笑话,“通过我们海量数据发现,中国的15-20岁的男性网民最喜欢使用QQ即时通讯工具”,这样的知识发现虽然是个笑话,但在现实行业里是个不争的事实。数据挖掘的价值应当是显现的、直观的、令人信服的,不在于挖掘的技术多么高深,而在于整个体系的搭建和成果的展现,做的再好,看不到效果,等于无效。
  3 计算机数据挖掘的技术方法、应用领域及挑战
  3.1 计算机数据挖掘的技术
  计算机数据挖掘有很多的专业技术,我们来简单介绍一下主要的计算机数据挖掘的技术:第一,计算机数据挖掘的统计技术。统计是计算机数据挖掘必不可少的技术,在数据清理过程中,统计提供数据发现极端值;第二,人工智能技术。人工智能技术是近些年来新兴的计算机数据挖掘的技术,它在数据挖掘中的应用比较广,它可以对数据进行推断和智能代理,是计算机数据挖掘的重要技术;第三,决策树方法。决策树方法是代表决策集合的单杆结构,它具有一定的分类规则,有一定的预测作用,是计算机数据挖掘的主要技术之一。
  3.2 计算机数据挖掘的方法
  随着近些年数据挖掘技术的广泛使用,数据挖掘的方法也在不断的进步和完善,现阶段主流的数据挖掘的方法有分类、关联规则、聚类分析等。分类是找出一组数据对象的共同特点并按照既定的分类模式将其划分为不同的类别。关联分析是描述数据之间所存在的关联规则,即根据一个事务中某些项的出现可导出另一些项在同一事务中也出现,即隐藏在数据间的关联或相互关系。聚类分析是把一组数据按照相似性和差异性分为几个类别,使得属于同一类别的数据间的相似性尽可能大。
  3.3 计算机数据挖掘的应用领域
  计算机数据挖掘最大的应用领域就是商业领域,它能够为商业机构提供欺诈侦查和客户市场分类等数据。在这个高速发展的信息时代,网络是商业发展的主要推动因素,我们要使计算机数据挖掘在商业上的应用领域更广。以下是近些年来计算机数据挖掘的主要应用领域:第一,计算机数据挖掘在我国银行领域中的应用。银行是一个数据集中度和数据处理要求均非常高的领域,对于一个银行来说,每天都要面临着海量的数据,这些数据的挖掘分析对于银行来说是其发展的根本所在;第二,计算机数据挖掘在电子商务中的应用。电子商务是网络高速发展的产物,对于电子商务而言,海量数据的挖掘分析成为了电子商务未来发展的保证,因此,计算机数据挖掘在电子商务中的应用得到了快速的发展。
  综上所述,数据挖掘技术是一新兴的研究领域,我们不仅要对数据挖掘的概念、对象、任务、过程、方法和应用领域进行充分的认识。尽管对数据挖掘的研究仍面临着诸多问题和挑战,还存在很多问题值我们去探索研究,但我们有理由相信在不久将来数据挖掘发挥的作用和价值会越来越大。计算机数据挖掘技术将会在各个领域得到广泛的应用,并对人类的活动产生深远的影响。
  参考文献
  [1] 周碧珍.浅析计算机数据挖掘技术在档案信息管理系统中的应用[J].黑龙江科技信息,2009(01).
  [2] 朱世武.数据挖掘运用的理论与技术[J].统计研究,2003.
其他文献
[摘 要]施工单位在建筑工程的施工过程中,除了要确保工程的质量、安全、进度之外,还需要满足企业的利润需求,而这一目的只有通过提高施工现场的管理水平才能实现,本文全面分析分了当前建筑施工现场管理中所存在的问题,并针对其问题提出了相关的建议,期望对加起建筑施工现场管理有所帮助。  [关键词]建筑工程;施工管理;问题;对策  中图分类号:TL372+.2 文献标识码:B 文章编号:1009-914X(2
期刊
[摘 要]概述了火灾事故调查的意义和重要性, 针对当前火灾事故调查队伍建设中存在的问题和存在问题的原因, 结合实际, 阐述了加强火灾事故干部队伍建设的对策和建议。  [关键词]火灾调查;问题;原因;对策;建议  中图分类号:X928.7 文献标识码:B 文章编号:1009-914X(2014)42-0105-02  火灾事故调查是法律赋予公安机关消防机构的重要职责,是公安机关消防机构与广大人民群众
期刊
[摘 要]石油能源与国家的经济发展息息相关,随着机械采油技术的应用和发展,油田进入快速开发期,能耗形式逐步严峻,油田开发成本逐年增加,对此油田开发企业开展举升工艺优化调整、加大节能设备优选应用力度、加强非节能设备改造利用等攻关研究。本文对油田机采的技术现状及存在问题进行了分析,同时对油田机械采油技术的发展形势进行了展望。  [关键词]石油工业、机械采油、技术现状、发展趋势  中图分类号:TE355
期刊
[摘 要]防雷接地工程的优劣,对人身和电气设备的安全有着重要的影响。本文主要从风电场防雷接地系统设计、施工,以及风电机组、电气系统、集电线路、通讯系统防雷的措施等几个方面,详细的阐述了如何有效降低雷电侵扰带来的伤害,减少因雷击造成的损失,保证风电场安全经济的运行。本文在此谈了谈自己的看法和观点,可供参考。  [关键词]风力发电;山区风电场; 防雷接地系统  中图分类号:TM862 文献标识码:B
期刊
[摘 要]随着工业化的迅猛发展,城市空气质量日益下降,城市空气质量研究备受关注。本文拟从多方位剖析大气颗粒物与多环芳烃复合污染效应,并提出相应的污染防治措施。  [关键词]大气颗粒物、多环芳烃、污染特征、防治对策  中图分类号:X513 文献标识码:B 文章编号:1009-914X(2014)42-0119-01  环保部发布的《2013中国环境状况公报》指出:2013年大气环境质量呈现下滑趋势,
期刊
[摘 要]液压齿轮泵作为十分重要的机械设备,在我国很多领域都得到了广泛的应用,这种设备具有众多优点,不但能够提高设备工作效率,同时也能够保障其工程质量,但是,在其运行的过程中,一直存在一个问题,那就是噪声问题,由于它是由齿轮油泵为主要源动力的液压系统,因此,其所产生的大部分噪音是来自于油泵,为了能够降低噪音,科学,合理对其进行分析和诊断是非常必要的。文章首先从齿轮油泵造成产生的机理进行了分析和研究
期刊
[摘 要]为推进电子信息工程现代化技术的科学发展, 我们只有明确电子信息工程内涵, 探究现代化电子信息工程技术核心意义, 强化政府支持、方能制定快速发展科学对策,探究新型增长点、实现服务创新, 创设显着效益, 真正推进电子信息工程的持续全面发展。本文对电子信息工程的现代化技术进行了探讨。  [关键词]电子信息工程;现代化;技术;措施  中图分类号:TN0 文献标识码:B 文章编号:1009-914
期刊
[摘 要]本文针对当前农村闲置地的主要状况,充分分析产生的根本原因,就如何盘活利用农村闲置土地提出了建议与对策。  [关键词]农村 闲置 土地集约利用  中图分类号:F301.2 文献标识码:A 文章编号:1009-914X(2014)42-0122-01  郯城县是苏鲁边界的一个传统农业大县。该县辖15个乡镇、开发区,674个行政村,人口98万,农村和农业人口86.6万。该县总面积为1312平方
期刊
[摘 要]随着社会的不断发展,科学技术水平也得到极大程度的提高,这就极大地促使了智能时代的到来,而随着智能电网被大力的推广使用,智能电能表的出现则顺应了社会发展的要求,电能表的使用为用户提供了极大的便利,同时也有效的保证了用电的安全。智能电能表有着诸多的功能,在本文中则主要对智能电能表的功能以及其具有的特征进行相应的阐述,让更多的人可以更好的去了解智能电能表,从而有效的起到一种推广效果。  [关键
期刊
[摘 要]在电力系统中,各种类型的、大量的电气设备都是通过电气线路而联结在一起的。因为电气线路覆盖的面积十分辽阔,还有十分复杂的运行环境以及各种人为因素带来的影响,所以就很容易发生电气故障。电力系统中的任何一个地方发生故障,都会对电力系统的运行产生或多或少的影响。为确保10kV供电系统能够正常运行,对继电保护装置必须正确去设置。因为供电是否畅通,与10kV供电系统能否正常工作有十分密切的关系,而且
期刊