面向流式数据的工业质量数据分析平台

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:zhushaoxiang2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据处理技术是当代信息技术领域的重要发展方向之一,随着大数据相关技术的不断发展与应用,实时计算领域越来越被关注。以Hadoop为代表的基于MapReduce计算框架的大数据处理技术往往是通过批处理方式对历史数据进行分析,而实时计算领域则强调的是对瞬时数据进行在线处理。另一方面,传统工业企业产品在生产过程中,无时无刻不在产生着海量的数据,典型的如工业设备传感器数据等。这些数据的特征是连续、无限增长、无序,并且需要实时响应,被称为流式数据。工业企业在面对这些海量的流式数据时,主要有以下三点问题:1)无法解决海量流式数据的大规模存储问题;2)像对待普通数据一样处理流式数据,无法发挥流式数据实时性的特点;3)传统的技术架构无法对流式数据进行更高维度的分析,不能应用机器学习模型等新兴技术手段去分析处理。显然,以传统的数据分析处理方法并不能对流式数据进行有效的分析及存储。如何去挖掘工业质量流式数据更深层次的价值,对这些质量数据进行各个维度的分析,并且以可视化的形式动态展现给普通用户,是本文研究的主要目的。基于本课题(面向工业企业的质量大数据分析云服务平台)的实际研究背景与需求,本文从一个相对通用的、高可用的实时流式数据处理框架的设计出发,将整个质量数据分析平台细分为以下四个关键模块:1)数据采集模块;2)流式数据实时处理模块;3)数据存储模块;4)大数据可视化模块。总体来说,本文的主要研究贡献有如下三点:1)针对工业质量流式数据的产生场景及特点,以Apache Flume为基础,完成对工业质量数据的实时采集的设计及实现。2)在Spark集群的基础上设计并且实现了一套相对通用的、高可用的实时流式数据处理框架,并且能够在该框架的基础上应用Spark Sql与Spark mlib完成对流式数据的结构化查询以及机器学习模型的应用,使框架具有良好的可扩展性。3)将前后端分离架构应用于大数据可视化模块,使前端项目可以专注于流式数据的响应式展现,达到实时流式数据处理的可视化需求。后端项目可以在基于RESTFUL风格的基础上实现微服务化架构,实现高可用、高并发、低耦合的数据可视化模块。本文从质量数据分析平台的总体设计出发,在各个模块的具体设计与实现上给出了相应的介绍。在某钢厂1580热轧生产线设备产生的真实数据的基础上,完成整个实时流式数据处理流程的构建。
其他文献
期刊
目的了解1,25(OH)2D3对尿毒症血液透析患者的糖耐量异常、胰岛素分泌低下及胰岛素抵抗的影响.方法将24名尿毒症血液透析患者[平均年龄(37±1)岁],分为2组,每组12人,治疗
压电超声换能器的性能直接影响超声成像的质量,是超声成像设备的核心组件,其基本结构包括压电材料、背衬和匹配层。本文首次尝试引入镁合金作为医用压电超声换能器的匹配层材
近年来,随着我国经济体系的不断发展,传统的货币需求模型不再适用于对我国货币需求的测度。传统的货币数量论在我国失效,超额的货币供应并没有导致物价指数的飞速上涨,进而引发通货膨胀。在这种情况下,对货币需求的重新测定就显得尤为重要。同时,随着资本市场的不断扩张,虚拟经济快速发展,逐步脱离实体经济,微观主体在进行资产选择时,往往会将虚拟经济资产纳入投资考量。因此,有必要建立考虑虚拟经济资产影响的货币需求模
研究了La1-x SrxCo1-xBxO3(B=Fe,Ni,Cr)复合氧化物催化剂CO氧化活性,半通过氧的程序升温热脱附(TPD)研究了该类催化剂的表面氧,结合活性与表面氧随x的变化规律讨论了表面活性氧种。
长期以来,我国商业银行主要是借贷模式的运作,资产业务和负债业务一直是其主要的利润来源。然而,随着金融创新活动的深化和金融业竞争的加剧,传统业务所能提供的利润空间越来越
全面提高教师素质是落实立德树人根本任务、培养德智体美劳全面发展的社会主义建设者和接班人的重要保障。进入新时代,“互联网+”为高中地理教师自主参与研究、创设一体化的教研交流氛围以及教师自我反思、学科引领、同伴互助提供了强有力的信息技术支撑。然而,“互联网+”的优势并未在高中地理教研中得到充分利用,仍有许多地理教师由于缺乏相关理论指导和实践经验,不能及时获取丰富的地理教育资源,无法在开放的环境中与专家
期刊
在今年3月中旬至6月SARS肆虐北京期间,空气消毒成了当务之急.一般采取的空气消毒方法是长时间紫外线照射及用过氧乙酸进行喷雾,但是人体长期接触紫外线或过氧乙酸可以引起角