大数据挖掘关键技术的分析与研究

来源 :中国新通信·理论版 | 被引量 : 0次 | 上传用户:tw2008hr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:随着互联网事业的发展,大数据挖掘已经成为企业关注的重要问题,本文对大数据挖掘技术进行分析,体现了对海量数据的整合,企业可以通过大数据挖掘技术,实现对客户信息的整理,并且为客户提供个性化的服务模式。
  关键词:大数据挖掘;关键技术;研究
  一、大数据概念
  随着互联网技术的不断发展,大数据已经逐渐影响人们的学习和生活,所谓大数据,是指数据相对较为庞大,无法通过计算机软件有效的获取。IBM曾经提出大数据的4个特征:(1)数据量庞大,达到PB等级。(2)存在视频、图片以及日志等多样化的文件形式。(3)具有较快的处理速度。(4)具有高质量的数据。在大数据处理过程中,通过数据分析挖掘技术,可以挖掘数据的价值。
  互联网大数据是指用户在使用终端的情况下产生的数据信息,其包括网络协议以及流量等情况,网络是由供应商提供,同时其可以通过数据信息来获取用户的相关数据[1]。随着互联网事业的不断发展,企业同样获取了较大的发展机遇,互联网大数据可以为其发展提供基础信息以及使用信息,通过对数据的掌握,了解网络的运行状况,并且可以加强用户的体验。大数据分析是对网络的服务管理,可以分析用户体验的相关信。
  二、大数据分析及数据挖掘技术
  数据不经过分析是没有使用价值的,只有经过分析之后变为特定的格式的信息,才能在应用时发挥数据潜在的价值。在大数据使用之前,要对大数据进行分析和数据挖掘,这一活动的目的是从看起来没有什么关联的大量的、复杂的数据中,通过技术手段快速的找出这些数据之间的存在潜在关联。对大数据进行分析的处理流程与传统数据进行分析处理流程基本相同,但由于大数据要处理的数据的结构十分复杂(有结构化数据也有非结构人数据)、数据量非常大,而且对数据处理时效性要求还非常高,所以在进行大数据分析和数据挖掘时,有新的、更高的要求。
  对大数据进行分析和挖掘,本质就是从获得的海量数据中,按照某种方法或策略,采用相关技术手段来提取这些数据里所包含的、我们不能直接发现的、但又有应用价值的信息的过程和方法。在进行大数据分析与数据挖掘时,可以采用不同的技术手段,这些技术又分为大数据描述性技术和大数据分析预测性技术。大数据描述性技术主要是利用技术手段分析海量数据与数据之间存在的相关规律的技术;而大数据分析预测性技术主要是利用技术手段对使用历史数据进行分析,从而预测这一行业或领域未来情况的技术。
  大数据分析与数据挖掘技术在整个大数据应用过程中十分重要,它实现功能主要有:(1)未来发展的趋势预测功能。这一功能主要是通过对数据本身进行特定分析,然后对数据规律进行总结,继而通过总结来预测未来的发展趋势,也就是我们常说的所谓“智慧”;(2)大数据的总结功能。这一功能主要是利用数学上经常使用的统计学方法来实现,如:在对大数据进行分析时可以用“求方差”或者求“标准差”等方法,来对大量数据进行统计与分析;(3)数据的聚类与分类功能。主是把海量数据按不同类别分解成不同的子集,方便用户理解;(4)数据关联分析与数据偏差检测功能。主要用于发现事物之间的关联性,找出极端的特殊例子。
  数据分析与挖掘技术的本质是知识发现的过程,通常可以分为6 个子过程,分别为定义数据分析与挖掘目标、进行数据取样、进行数据探索、进行数据预处理、模式发现、模式评价。在数据分析与挖掘前需要对数据分析与挖掘目标进行定义;数据取样是利用样本数据对总体目标进行评价估计的重要方法;数据探索的目的是发现数据中复杂关系;数据预处理是保证数据质量的重要手段;模式发现是利用关联分析、神经网络分析等分析技术对事物或现象进行描述、识别、分类和解释的过程;模型评价是在建立的各种模型中找出大数据分析过程中解决实际问题的所适用的模型。在数据分析和挖掘过程中要用到各种算法,不同的算法有不同的作用和适用场合。云计算技术可以为大数据分析与挖掘提供稳定可靠的算力,已经成为大数据分析及数据挖掘技术重要支撑技术。
  三、实时数据挖掘技术
  互联网数据具有复杂性的特征,其不利于实现故障的诊断以及用户的体验,数据挖掘模块是通过对无线网络的理解,采用数据分析和挖掘的方式获取报表,以此来开放应用程序编程接口(Application Programming Interface,API),其可以获取以下几种类型的数据信息:(1)网络分析信息,通过对流量以及会话等模块的分析,可以实现对网络性能的关键绩效指标(Key Performance Indicator,KPI)分析。(2)网元分析。通过网元对比以及网元组对比等趋势分析,可以获取RNC性能负载。(3)终端分析。通过终端设备的使用情况分析,可以获取小时的数据变化,继而可以获取相关的性能指标。(4)用户分析。通过对用户数据的比较,可以获取用户资源的使用情况。(5)应用分析。通过对用户应用业务的分析,可以获取用户的累计分布情况以及单个用户的时间变化。(6)通过QoS以及QoE等指标的分析,可以获取用户网络状况以及负荷等相关信息。
  在实时数据分析中,多媒体数据挖掘同样是重要的技术手段。通过画像建立以及视频推广等模式进行分析。用户画像的挖掘技术通过视频播放以及注册搜索等行为,采用大數据分类方式构建模型,包括性别或者年龄模型等,通过对模型的预测,可以对用户进行判断,以此来为企业的发展提供数据信息支持。视频推荐模式是根据用户的行为,对视频的相关热度等情况进行分析,可以获取用户的兴趣反馈数据,其便于识别用户的ID,经过信息整理,企业可以采用针对性的推荐来满足客户的基本需求。另外,通过用户画像以及视频推荐,可以为广告企业进行定位,其将符合用户需求的广告投放到定向的人群,以此来提升媒体的运营质量。
  随着互联网事业的发展,大数据挖掘已经成为企业关注的重要问题,本文对大数据挖掘技术进行分析,体现了对海量数据的整合,企业可以通过大数据挖掘技术,实现对客户信息的整理,并且为客户提供个性化的服务模式。
  参考文献:
  [1]李平荣.大数据时代的数据挖掘技术与应用[J].重庆三峡学院学报,2014(3):45-47.
  [2]段云峰,等.大数据的互联网思维[M].北京:电子工业出版社,2015
  [3]程学旗,等.大数据系统和分析技术综述[J].软件学报,2014,(09)
  作者简介:
  王文彬(1967-),男,河南濮阳人,硕士,教授,研究方向:计算机应用技术。
  基金项目:濮阳职业技术学院自然科学项目,互联网环境下大数据挖掘关键技术研究, 2020PZYKY2
其他文献
摘 要:本文提供了一种方法,在数据存储的同时依据业务规则进行数据索引的创建,建立索引工作机制,该机制确保索引数据本身安全、高可用性;客户端依据已创建的索引,利用SQL引擎进行可视化高效查询、展示;创建资源管理模块和和任务处理模块,资源管理模块实现集群内资源的管理、调度,任务处理模块实现所有任务的资源申请、任务切分、结果合并、任务状态维护、结果输出,这样保证了任务执行的快速、高效。  关键词:索引
期刊
摘 要:随着社会的发展,我们逐渐走进了信息时代,在工业生产当中,有许许多多的传统的机械设计制造已经无法满足当今社会的发展需求,顺应时代发展的需求,相关技术人员提出了自动化技术的概念,并成功的将其运用到实际中,其中机械自动化的作用优势在与传统技术对比下更加显得具有优势,无论是在生产过程中的生产质量还是在生产效率方面。本文就是针对机械设计制造及自动化相关内容及未来发展方向进行分析。  关键词:机械设
期刊
摘 要:郑东新区龙子湖智慧岛是国家大数据(河南)综合试验核心区,是河南大数据和金融产业对外开放的关键名片,智慧岛对推动河南省数字产业化、产业数字化起到重要的引领示范作用,有利于推动河南省产业转型升级,实现高质量发展,推进河南数据资源整合、开放与共享,更好地服务于经济发展和人民生活改善。  关键词:龙子湖智慧岛;河南省;大数据发展  一、抓机遇促发展,不负国家厚望  实施国家大数据战略,是党中央、
期刊
摘 要:本文结合大容量传输设备电源配置要求,对大容量传输设备电源能耗展开分析,同时提出大容量传输设备电源系统建设思路。借此在满足大容量传输设备用电需求基础上,有效控制设备电能损耗,完善大容量传输设备整体设计。  关键词:大容量;传输设备;电源系统;建设思路  引言:大容量传输设备在各行业应用中,其运行稳定性影响着传输数据安全性。电源系统作为大容量传输设备基础性支撑装置,相关人员只有深入探究大容量
期刊
摘 要:本篇对频段为5.8GHz的一种短距离专用的无线通信接收机前端进行研究分析,从其架构设计、电路设计和芯片三方面入手,探究其设计思路及设计手法。  关键词:超外差低中频;射频前端;5.8GHz  短距离专用无线通信近几年发展迅猛,人们工作效率得到了极大提高。基于这种无线通信的技术平台目前比较多,但大部分在电路设计方面较为复杂、能耗较高,并且使用较多外部元件,例如无线局域网接受器件等,其成本就相
期刊
摘 要:国家电网根据“大云物移智链”建造了泛在电力物联网,可以有效地利用电网企业的资源优势,使电力部门的企业能够运作,在数码经济中占有一席之地,实现利润的多重增长。随着时间的推移,物联网技术在国家电网网络中的应用正在稳步扩大,终端的数目持续增加,因而安全防护工作将变成必要化,以实现泛在电力物联网的安全运行以及国家电网的稳步前行。笔者本文旨在分析泛在电力物联网的全景网络安全防护体系。  关键词:泛
期刊
摘 要:随着大数据兴起,大数据分析技术在油田生产中的应用研究受到社会各界的广泛关注。文章对大数据分析技术进行了简要陈述,阐明了油田数据的特点以及油田大数据分析体系的主要内容,对自动筛选异常井、自动诊断异常井、制定间抽井抽油计划以及规划油井清洗工作等大数据的实际应用进行了详细分析。  关键词:大数据分析技术;油田;数据处理  一、大数据分析技术概述  (一)数据抽取技术  数据抽取技术是指可以将数
期刊
摘 要:21世纪是科技巨大进步的世纪,人们的生活水平越来越高,信息传播的方式越来越灵活,电视节目作为一种娱乐方式,已经深入人们的生活。在美妙的节目播出背后,是一系列精准技术的支撑,本文将就播出系统的特点和为保证播放顺利安全进行的安全系统功用两方面进行分析并提出相应的改进建议。  关键词:电视播出;安全技术;高新技术  引言:  作为最早融入人们生活的娱乐产品之一,电视已经是生活的必备品之一,在智
期刊
摘 要:当前我国的机械制造业已经得到了迅速的发展和进步,尤其是精密加工技术也得到了长足的发展。在现代化机械设计制造过程中,只有机械设计制造的精密加工和制造工艺水平不断提升和进步,才能保障我国机械制造行业始终处于不停地进步状态,同时在国际上的地位也能够获得不断地提升。  关键词:机械设计;制造工艺;精密加工  随着国际社会形势不断地变化和发展,我国的机械设计制造行业必须加快提高速度和进步的幅度,在
期刊
摘 要:信息技术的快速发展,。从最初的互联网到信息技术到VR技术,使得人们的生活发生了翻天覆地的变化。VR技术属于一种较为智能且新型的科技,该项技术已经逐步渗透到医疗、教育等各个行业,未来也必将渗透人们的日常生活。本文基于VR技术进行基本阐述,分析计算机组装与维护实训教学的现状,提出在计算机组装与维护实训教学中融入VR技术的策略。  关键词:VR技术;计算机组装与维护;实训;优势  引言:计算机
期刊