基于Anaconda平台的专项技术数据分析系统在生产线中的应用

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:meimeilaile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘  要:目前,某大型汽车制造企业的生产线相关设备并未按照其所属的专项技术对数据进行分类分析,存在数据资源浪费的问题。该企业动力总成区域生产线设备众多,所使用的尖端专项技术种类繁杂。基于专项技术的角度,对日常数据资源进行筛选与分析,从而更有针对性地做好生产线维护工作。该研究使用Python这一跨平台、面向对象编程的计算机程序设计语言,基于Anaconda这一开源的数据处理平台进行数据处理。将原始数据导入Pandas数据包中的DataFrame框架之中,进行数据清洗工作。该研究所述数据挖掘工作以A轴技术的“报警信息”及“报警号”为关键字段,使用网络爬虫技术获取专项技术数据,以专项技术数据获取停机时间和设备可用率这两个生产线关键指标,并进行相应的数学计算。并对关键指标作数据可视化处理,将其以可视化报表的形式呈现。本文以该大型汽车制造企业动力总成区域的某条生产线为例,介绍专项技术数据分析在生产线设备中的应用。
  关键词:数据分析  编程  专项技术  生产线  应用
  中图分类号:TB497                           文献标识码:A文章编号:1674-098X(2021)04(b)-0131-07
  Application of Specialized Technical Data Analysis System Based on Anaconda Platform in Production Line
  LI Guangzhou
  (Planning & Technology, Beijing Benz Automotive Co., Ltd., Beijing, 100176 China)
  Abstract: At present, the production line related equipment of a large automobile manufacturing enterprise does not classify and analyze the data according to its special technology, which leads to the waste of data resources. There are a lot of equipment in the power assembly area of the enterprise, and the kinds of advanced special technologies used are complex. Based on the perspective of special technology, daily data resources are screened and analyzed, so as to do a better job of production line maintenance. This research uses python, a cross platform, object-oriented programming language, to process data based on anaconda, an open source data processing platform. The original data is imported into the DataFrame framework of pandas data package for data cleaning. The data mining work described in this study takes the "alarm information" and "alarm number" of a-axis technology as the key fields, uses the web crawler technology to obtain the special technical data, and uses the special technical data to obtain the downtime and equipment availability, two key indicators of the production line, and carries out the corresponding mathematical calculation. The key indicators are visualized and presented in the form of visual report. This paper introduces the application of special technical data analysis in the production line equipment by taking a production line in the powertrain area of the large automobile manufacturing enterprise as an example.
  Key Words: Data analysis; Coding; Specialized technology; Production line; Application
  隨着智能制造、制造物联网技术的发展,制造企业可以从加工设备中采集和获取制造过程中产生的具有典型大数据特征的海量数据[1]。数控加工设备、底层传感器、PLC等每时每刻可以采集大量的数据,由此形成数控车间制造大数据[2]。这些海量的数据为后续的数据分析工作提供了数据基础。制造大数据不仅具有传统大数据的4V特征,即Volume(数据量大)、Variety(数据类型多样)、Value(数据价值比较大但是有价值的信息密度比较低)、Velocity(数据时效性高)特征,还具有数据间的强关联性,具有对数据采集、存储、处理实时性要求高等特征[3]。   数据分析是用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程[4]。
  生产线上不断提高的产量会给生产线管理带来诸多问题[5],生产线数据处理就是其中之一。在日常生产中,某大型汽车制造企业的生产设备产生了海量的生产数据,其中包含众多故障报警信息,但目前这些数据信息并未按照其所属的专项技术进行分类分析,从而造成了对现有数据资源的巨大浪费。
  对于类似问题,周寻[6]认为应该对设备综合效率进行发掘和优化,并主要通过精益生产理论以及约束理论等方法研究提高生产线的资源优化方案,分析出可能改进的机会和方法和方案。孙伟峰[7]认为通过对机械部件所产生的信号进行处理和分析,可以有效判断出故障状况,从而提高故障检测的效率,并强调了对数据进行科学的管理的重要性。Panagiotis Tsarouhas[8]做了数据趋势与序列相关性测试,他认为应该使用统计学方法分析生产线的故障数据并计算出生产线的可靠性有效性与可维护性,从而提升生产线性能。Naser Habibifar等人[9]使用仿真模拟以及数据环境分析的方法研究药品生产线的优化问题,为此他们仿真出药品生产线并搭建数据分析环境来验证自己的设想。
  本文的研究从某大型汽车制造企业入手,该企业动力总成区域坐拥诸多种尖端专项技术,例如,电主轴技术、A轴技术、机器人技术、珩磨技术、试漏技术、压装技术、测量技术、激光打码技术等。技术种类繁杂,涉及到的生产线及设备种类及数量众多。
  基于專项技术的角度,运用数据科学的相关方法对日常海量的数据资源进行筛选与分析,可以及时调整生产设备的维护计划并对设备问题进行提前预测,从而最大限度地减少停机次数与时长,更有针对性地做好生产线维护工作。
  1  专项技术数据分析
  Anaconda是一个开源的数据处理平台,易于使用并且具有强大的数据处理能力。Python是一种跨平台、面向对象编程的计算机程序设计语言,它包含多个数据处理包,如Numpy、Pandas、Scipy、Matplotlib、Scikit-learn等。Pandas是Python的一个数据分析库,它含有诸如DataFrame、Series等数据结构模块。python具有很强的可移植性,由于其开源的本质,已经被移植在许多平台上,按照开源的理论,Python几乎适应各种平台;Python是解释执行的,即Python语言写的程序可以直接从源代码运行,无需先通过编译生成可执行文件[10]。本文使用Python编程语言,基于Anaconda平台进行数据处理。
  1.1 数据采集
  数据采集是指将传感器安装在待测设备合适的位置或配置在设备的周围,进而将待测设备的运行情况、工作环境等信息映射成相应的光、电、磁等信号,通过信号放大器与相匹配的数据采集系统将信号传输至上位机进行存储、显示或打印的过程[11]。某大型汽车制造企业使用相关软硬件系统采集所有生产线设备的实时数据。
  设备相关数据信息由设备上的硬件传感器以及工厂工 业网络统一传递到该系统采集数据。
  1.2 数据清洗
  数据清洗是一种提高数据质量的可行有效的技术方法,它主要用于处理在数据质量问题中,出现在实例层的脏数据,从而充分提高数据的质量[12]。
  某大型汽车制造企业动力总成区域的设备每天会产生海量的数据。需要使用大数据技术对这些数量巨大的数据进行处理,筛选出所需的有效数据,从而对有效数据进行分析与处理。使用Pandas数据包中的DataFrame框架,DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,DataFrame的行索引是index,列索引是column。将原始数据导入该数据处理框架中处理原始数据,进行数据清洗工作。
  为上述数据集合建立起对应的DataFrame框架,将杂乱无章的原始数据统一地转换为DataFrame数据类型。选取并设置相应的column name,使用DataFrame框架去直接获取该框架column中所一一对应的value,该返回值为Series数据类型,对该返回值进行过滤处理,其中,Series可以理解为由一列索引和一列值组成的结构,而DataFrame就是由一列索引和多列值组成的结构,DataFrame中的每一列都是一个Series对象。
  使用isnull()、dropna()等编程指令筛选出原始数据中的NaN值,再使用fillna()编程指令修补数据。其中,isnull ()指令可以判断所有的空值,dropna()指令可以删除缺失数据所在的行,NaN值是Python指令在做计算时无法返回的一个符号,NaN值需要被处理,fillna()指令用于填补缺失值。
  另外,如图1,需要使用判断编程指令找出异常值并进行处理,从而保证数据的连贯性。使用index编程指令对初筛过的数据重新设定数据索引目录(index项),使得筛选出的每个有效数据都对应有其专属的索引目录(index项)。编制好新的索引目录(index项)的相关数据就组成了一个全新的DataFrame框架,该框架中的数据全部是完成数据清洗后的有效数据。
  1.3 数据挖掘:获取专项技术数据
  数据挖掘是从大型数据库中抽取出未知的、有意义的关系、趋势和模式的过程,是数据库研究中具有重要价值的研究领域,其广泛应用在金融、医疗、电信、人工智能等领域[13]。
  A轴单元作为五轴数控机床的关键功能部件,其控制精度直接影响工件的加工精度和表面质量[14]。A轴技术作为设备关键技术,被广泛地使用于汽车发动机生产线设备之中。A轴伴有大量相关故障报警信息。 其“报警信息”文本及“报警号”数字信息是数据处理的关键信息,使用网络爬虫原理识别“报警信息”关键字段并抓取“报警号”。将获取到的Series数据类型装载到相应的DataFrame框架中得到专项技术数据,如图2。   1.4 基于專项技术的生产线关键指标计算
  某大型汽车制造企业生产线的核心指标是设备综合效率,该指标反映的是每日/月生产线除设备故障外正常运行的时间占比。从设备技术角度考虑,影响设备综合效率的关键指标是停机时间(DT)和设备可用率(TA, Technology availability),如图3、图4。
  基于该理念,以上述专项技术数据获取生产线核心指标。使用计算机底层时间,来统一数据处理的时间设置,即为使用统一的时间度量衡。使用数学公式计算出基于专项技术的生产线关键指标:停机时间(DT)和设备可用率(TA)。相关指标的数学计算需要用到以下这些参数:生产线设备生产时间,PTi=PT;生产线设备总数,DN;DT单元(单个计量单元的DT数值),DTi。
  单个计量单元的设备可用率计算:
  (1)
  停机时间(DT)的计算:
  (2)
  设备可用率(TA)的计算:
  (3)
  1.5 专项技术数据可视化
  数据可视化是关于数据视觉表现形式的科学和技术研究,实现可视化是为了证实我们对数据的认识[15]。数据可视分析旨在利用计算机自动化分析能力的同时,充分挖掘人对于可视化信息的认知能力优势,将人、机的各自强项进行有机融合,借助人机交互式分析方法和交互技术,辅助人们更为直观和高效地洞悉大数据背后的信息、知识与智慧[16]。
  对基于专项技术的设备关键指标做数据可视化处理,将其以可视化报表的形式呈现出来。打印出该可视化报表的打印时间、某区域某专项技术的设备关键指标:停机时间(DT)和设备可用率(TA)。下面以某大型汽车制造企业动力总成区域的某条生产线为例,以A轴技术(A Axis)作为切入点,展示基于专项技术的设备关键指标可视化报表,如图5。
  2  专项技术数据分析在生产线设备中的应用
  做好生产线设备的维护保养工作,可有效延长生产线的使用寿命并有效提高设备的使用率和完好率[17]。下面以某大型汽车制造企业动力总成区域的某条生产线为例,介绍该专项技术数据分析在独立的生产线维护体系中的应用。该区域与其他区域生产线在设备投产时间、设备备件型号、所生产的产品型号、设备数量与所应用的专项技术种类等诸多方面存在着较大的不同。针对设备的老化、维护保养以及所使用的专项技术等问题,需要使用不同的维护策略。依托专项技术数据分析系统所生成的专项技术相关关键指标,有针对性地制定出基于专项技术的生产线维护体系,如图6。
  2.1 某区域生产线维护体系总揽
  依托专项技术数据分析系统,为某大型汽车制造企业动力总成区域某生产线的所有设备建立起独立的生产线维护体系。
  在实际工作中,为了更加有针对性地保障生产线的正常运转,需要提前做好预防性维护工作,做好计划并组织好工作内容。在某大型汽车制造企业动力总成区域某生产线维护体系的建立过程中,为每一台设备添加了诸如“任务清单描述”“维护策略”“工序描述”“时间间隔组”“系统条件”“工序号”“总工时”“工时单位”“参与人数”“每人工作持续时间”“数量”等条目。生产线维护工作是复杂繁重的,而以上的这些条目则正好有力地分解了维护工作,将繁杂的工作划分到具体的条目之中,从而使得实际维护工作进行得更为细致与准确。
  2.2 某区域生产线维护条目
  对于生产线日常运营而言,一个主要的目标就是要最大化地减小成本,要同时减少生产和维护成本[18]。制定出合理的维护条目会较好地减少成本支出。
  该维护体系中的每个维护条目是种类繁多并且在技术难度和人员要求等方面都存在着诸多的不同之处。为了使维护工作顺利展开与有效实施,该体系中的不同条目一般使用不同的时间间隔组。时间间隔组的组成为1~60个月,不同的维护条目一般使用不同的时间间隔组来完成,如图7。
  3 结语
  我们处在一个大数据技术与计算机编程技术日趋完善的时代,我们也正站在物联网时代的门口。而这些技术在制造业的实现是需要有硬件、软件接口的。而本文所述的专项技术数据分析系统及相应的生产线维护体系则正好起到了这样的一个接口功能。
  基于专项技术的设备关键指标可视化报表会显示每天该生产线所拥专项技术所存在的问题,会将所有信息数据积累到一起,从而为每项专项技术形成专项故障信息数据库。这就为数据分析工作提供了有效的数据样本,在数据量积累到一定规模之后,即可使用机器学习的方法,将该数据样本分为训练集、验证集和测试集,从而建立更为有效的数据模型用以生产线设备的可能专项技术故障作预测。
  参考文献
  [1] 王孟卓.基于大数据分析的数控加工工时预测技术研究[D].北京:中国工程物理研究院,2020.
  [2] 王孟卓,尚鋆,白翱.面向数控加工工时预测的智能车间制造大数据分析技术体系研究[J].现代制造技术与装备,2020(4):33-37.
  [3] 李敏波,王海鹏,陈松奎.工业大数据分析技术与轮胎销售数据预测[J].计算机工程与应用,2017(11):100-109.
  [4] 维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013.
  [5] Samihah Abdullah, Widad Ismail, Zaini Abdul Halim. Implementation of Wireless RFID for Production Line Management System in a Real Environment[J].Wireless Personal Communications,2015:3119–3132.
其他文献
(1.华中师范大学城市与环境科学学院 湖北武汉 430079;2.湖北高通空间技术有限责任公司 湖北武汉 430223;3.上海司南卫星导航技术股份有限公司 上海 201801;4.湖北省安全生产应急救援中心 湖北武汉 430064)  摘 要:我国是全球发生滑坡灾害最频繁、影响范围最广的国家之一,对经济民生造成了重大伤害。滑坡的防灾减灾一直以来受到政府管理部门和社会各界的高度重视,大力推行监测预
摘 要:焚烧法是我国目前危险废物处理和净化的最主要的方法,但是在危险废物燃烧的过程中会产生一定的有害气体,如氮氧化合物以及含硫化合物等,因此,需要相关的处理部门针对不同成分的烟气采取不同的处理工艺来切实减少有害气体的产生,减轻其危害程度。本文根据某危废处置中心焚烧废气处理系统运行情况,对废气成分、浓度、废气治理措施及治理效果进行了详细介绍。经“SNCR脱硝+烟气急冷+干法脱酸+布袋除尘器去除二噁英
摘 要:在世界建筑领域内,日本建筑独树一帜。其住宅建筑延续了民族建筑传统,融合了现代建筑先进技术,坚持尊重自然、以人为本、节约经济、生态环保,在建筑设计和建造方面有较高的科技含量。本文针对日本当代独立住宅的建筑特点进行分析,用设计实例进行印证,借鉴学习其长处以求为我所用,为改进和提高我国住宅产业的技术水平提供参考。  关键词:日本 独立住宅 建筑传统 建筑技术  中图分类号:TU241.1
摘 要:针对焊接精密钢球强度、精度和表面质量要求,设计内凹半球铜电极并开展了中频点焊焊接试验,获得焊接缺陷情况。然后利用ansys的电流仿真功能,获得了点焊过程中电流分布规律,确定了产生球面局部缺陷的原因,进而优化仿真参数,获得电流分布情况,确定优化参数,指导了焊接电极优化,最终优化上电极并进行焊接试验,获得各项指标合格的理想样件。  关键词:中频点焊 焊接试验 电流分布 焊接电极  中图分类号:
摘 要:本文主要对单台海水冷却循环泵同时四列凝汽器水室运行的工况进行分析,当前机组计划性功率期间停运一台CCW泵,需要隔离一列凝汽器水室,即被隔离的凝汽器水室的汽侧抽真空隔离阀,两个旁排阀,进出口电动隔离阀关闭。汽侧抽真空隔离阀如果隔离不严会影响真空泵运行甚至损坏真空泵。汽侧抽真空隔离阀及两个旁排阀需要现场手动关闭,且阀门行程几百圈,操作费力费时。隔离一列水室后需要将凝汽器水室抽真空系统停运,其他
摘 要:华能营口电厂#2机组汽轮机为前苏联哈尔科夫汽轮机厂制造,自高压抗燃油液压控制系统改造后,高压缸绝对膨胀值显著变小、轴向位移增大。本文通过机组运行数据对比确定可能造成上述问题的原因,分析机头部分滑销系统卡涩是引起高压缸绝对膨胀值变小和轴向位移增大的原因。滑销组卡涩影响级内效率,增加运营燃料成本。同时滑销断裂或突然恢复将造成机组振动突变,从而触发机组保护动作,甚至使动静叶片发生刮蹭危及人身和设
摘 要:为了能够有效检测金属内部缺陷,从有限元基本原理出发,建立二维有限模型。利用激光激励源对具有不同大小及相同埋深的孔洞缺陷的二维有限元模型进行激发,获得纵波波形仿真数据。通过对波形进行分析得出,得出缺陷半径、缺陷上下边界位置计算公式,并与实际信息进行对比,得到的计算误差控制在5%以内,验证了公式的准确性,为缺陷重构提供了一定的理论与数据基础。  关键词:有限元分析 孔状 内部缺陷 边界位置  
摘 要:针对嫩江流域水污染及水资源管理问题,选取2016—2020年监测的嫩江干流9个断面,以单因子评价方法为基础,结合主成分分析对嫩江干流断面汛期及非汛期主要水质污染因子及水质类别进行综合评价。结果显示,2016—2020年嫩江干流断面水质总体较好,年际间呈现改善趋势;2018年非汛期水质变差,并于2019年恢复。主成分分析说明在这五年期间,对水质影响最大的指标为化学需氧量和高锰酸盐指数。不同方
摘 要:传统的土地利用动态调查方法费时费力,难以应对当下城市发展过程中遇到的各种土地规划与利用方面的问题。随着低空摄影测量技术的不断进步,以无人机为平台的遥感数据采集和处理系统正逐渐受到遥感与测绘行业的青睐。本文以无人机倾斜摄影测量技术为数据获取手段,研究利用DSM(Digital Surface Model,DSM)数据获取城市土地利用变化信息,并进一步应用到城市土地利用动态监管工作中的方法,为
摘 要:电子政务是信息化环境下的新型政务模式,随着近几年信息技术的不断迭代升级,特别是近两年智慧政务云平台系统建设概念的出现,很好地解决和改进了上述传统政务信息系统建设的弊端,实现了智慧化、数字化云办公。本文立足对当前智慧政务云平台主要技术实现路径的分析,梳理主要技术关键点,并结合具体建设案例,对实施路径和方法进行了探索,并总结了相关建设经验和效果。  关键词:智慧政务 行政云 办公平台 云服务器