基于Hadoop的煤矿设备数据规范化和清洗的研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:toefltoefl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络信息化技术快速发展和煤矿机械设备日趋大型化、复杂化,煤矿设备的运行数据规模不断地扩展,数据量从GB级迈向TB级甚至PB级,而且数据的差异性也越来越大。对于这种煤矿设备的海量异构数据,传统的数据分析处理系统已经不能满足数据处理和深度挖掘的需求,云计算技术可以高效地实现对这些问题处理。针对现有煤矿机械设备系统的实际情况和需求,分析云计算技术在工业化生产中广泛有效的应用,建立了基于Hadoop平台的煤矿设备数据处理系统,利用平台的海量存储HDFS和分布式计算Mapreduce技术,实现对这些海量级数据的处理、分析和深度挖掘。首先,针对煤矿设备海量异构格式的数据需要规范化描述问题,设计了用XML数据格式做为多样化海量数据的一种应用标准,分析元数据抽取和关系—映射模型技术,实现对煤矿设备异构数据的规范化描述。其次,在实验室环境下搭建了Linux集群和Hadoop集群的平台,建立基于Hadoop的煤矿设备系统数据处理系统,并对平台所用到HDFS技术和分布式计算Mapreduce技术进行了详细分析,实现对煤矿设备数据的海量存储和高效计算。最后,在Hadoop平台上建立对煤矿设备振动数据进行特征值提取和异常点清洗的整体架构,并提出了相应的Mapreduce算法,可以有效地实现对煤矿机械设备振动数据的处理。通过利用该系统平台对设备数据进行HDFS的读写和Mapreduce处理等性能测试,结果表明,Hadoop平台系统能够正常高效运行。因此,基于Hadoop的煤矿设备数据处理系统能够为煤矿设备维护提供很好的技术支持。
其他文献
本文以ZY6800/15/32D型液压支架为研究对象,建立了该支架三维虚拟样机,以《煤矿液压支架第一部分:通用技术条件》中的强度试验条款要求为加载条件,对支架整体进行了的有限元
机械加工行业大量应用切削液,会提高企业生产成本,加速社会资源的损耗速度,同时会引起恶劣的环境污染。随着科技的进步及创新意识的增强,具有保护环境及高效应用清洁特点的干
设备管理是企业管理的重要组成部分,水泥企业的设备大多数是在恶劣的工况环境中连续运行,因此需要先进的设备管理理念对其设备管理工作进行指导,需要设计开发一套相应的设备
期刊
期刊
随着现代制造工业的发展对材料性能要求的不断提高,促进了镍磷基合金镀层的发展,开发具有多功能及性能优良的镍磷基双合金沉积层成为一个新的研究热点。本文采用连续施镀的方
随着机器人相关技术日新月异的进步,使机器人拥有类似于人的感知能力与行为能力,进而能够与使用者进行自然和谐的交流互动,成为机器人发展的一种必然趋势,所涉及的人机交互技
期刊
随着现代建筑物的高度的不断增加,施工升降机在建筑行各业中占有举足轻重的地位,它给工人施工节约了相当可观的时间,是提高建筑行业劳动生产率的强有力的工具。随着现代化工
本文结合淮北矿业集团孙疃煤矿的实际开采情况和1028工作面的实际地质赋存条件,应用理论分析、数值模拟和现场试验相结合的方法,研究了1028工作面底板在支承压力和承压水水压