论文部分内容阅读
摘要:在航空领域当中,现有的很多航空公司,都是采用文字的方式进行维修记录,对于这些非结构化的数据资料,利用数学方法,难以进行快速准确的分析,无法为后续工作的开展提供良好的依据。因此,需要采用相应的数学方法,对非结构化的数据资料进行转换,使之成为结构化数据资料,通过分析模型的建立,综合计算结果,实现对飞机可能发生故障原因、故障类型的玉盘。采用多元Logistics回归分析方法,分析后得到预判结果影响因素,最终得出结论,为飞机维修效率和质量的提升提供帮助。
关键词:统计分析方法;飞机维修;数据挖掘
前言:近年来,随着社会经济的快速发展,航空运输领域取得了很大的进步,航空业市场快速发展,因而相关工作量也都大大增加。在飞机维修方面,航空维修数据越来越多,利用传统方法难以高效处理。对此,可以利用统计分析方法挖掘飞机维修数据,从而为维修计划安排、航材储备等加以安排。在航空维修数据分析当中,现有的维修故障数据,大多以非结构化数据为主,需要经过结构化转换后,才可用于数据挖掘分析。
1 维修数据整理转化
1.1 故障特征参数选择
对原始条目信息摘录后,取得故障发生机型、故障发生区域、故障发生时间等故障特征参数[1]。在时间方面,对故障发生频率分析,确认故障发生日期,从而对故障多发季节分析判断。利用空间角度,对故障发生频率加以分析,取得故障发生地区信息。另外,通过分析故障发生不同机型分析,了解故障多发飞机机型,从而在日常维修中加以注意。
1.2 故障因变量选择
将因变量作为发生故障的原因,主要包括了使用年限过长而正常发生的自发性故障,雷达收发机方面的故障,以及冰雹、雷击、鸟击等外物冲击故障。经相关研究表明,外物冲击是引发故障的主要原因,其次是雷达收发机故障引发的问题。
1.3数据结构转化
在数据分类完成之后,针对各类数据,采取相应方法加以转换,将非结构化数据转变为结构化数据。在各个变量中,使用数据表示变量下的各个类别,得到以阿拉伯数字为主的数据形式[2]。使用SPSS统计学软件,分析得到的数据。在相应的数字对应关系选择中,并没有固定规则,可以根据实际情况进行选择,唯一需要注意的,就是要明确各个类别所对应的数字。在处理后,原有的非结构化数据,转变为结构化数据,同时满足和定性变量数据的要求。
2 飞机维修数据挖掘分析
2.1 判别分析
在统计分析当中,判别分析是一种常用方法,利用这一方法,综合机型、空间、时间等信息,能够较为准确的预测飞机容易发生的故障及原因,从而提前做好可能的航材保障、维修计划,以降低维修人员的工作压力,提高飞机维修工作效率。在预测可能的故障类型及原因之后,维修单位可以拥有更加宽裕的时间,从容的安排维修计划,能够进一步减少成本,提高利益[3]。对于原始数据,需要采取组均值均等性检验,确认数据与模型相适应。根据结果表明,故障原因Y,概率為99.9%,自变量X1、X2、X3,存在差异明显的均值。所以,利用判别分析法,可以分析本文数据。在判别分析法当中,根据不同的判别标准,主要包括了贝叶斯判别法、距离判别法、Fisher判别法等,其中,后两种判别方法相对较为常用。
在Fisher判别法当中,运用了投影的知识点,在P维空间中,一个线性函数y(x)=Cjxj,使空间中的一点x可以降为一维数值。利用这一线性函数,转换P维空间中求知類别归属样本、已知类别总体样本,使其成为一维数据。然后综合亲疏程度,判定位置归属样本点的归属。参数利用SPSS软件计算,可获取分类函数关系。结果表明,在因变量中,三个类别判别函数可以表示为:F1=19.087x1+8.563x2+5.517x3-57.247;F2=15.225x1+6.844x2+3.686x3-33.101;F3=9.833x1+4.608x2+2.694x3-33.101。例如,7月份有一架波音737-700飞机起飞,经过北京,则可以设定自变量x1=2,x2=1,x3=3。分别带入三个判别函数中,能够得出F1=6.041,F2=15.251,F3=16.765。因此能够在第三类发生雷达收发机故障类别中纳入这一判定结果。维修部门可以利用这一结果,提前对雷达收发机故障维修需要的航材进行准备,同时对维修计划提前安排妥当。
距离判别法,主要根据距离进行计算,公式为Di=观测点坐标值设为(X,Y),第i类结果质心坐标值为(Xi,Yi),观测值和第i类结果质心距离大小,则用Di表示。如果距离越近,则距离越小,所以判定类别选择了最小数值的类别[4]。在确定观测测点坐标值后,利用SPSS分析,获取典型判别式函数系数,根据结果得出,X=1.760x1+0.5752x2+0.583x3-7.728,Y=0.881x1+0.326X2-0.139x3-1.124。利用上述函数可计算观测点坐标值。利用SPSS计算获取质心函数坐标,进而得出质心坐标,带入距离公式对各个观测点中每一类结果质心距离进行计算。
2.2 多元Logistics回归分析
取得的所有变量,都是定性变量,对分类预测结果获取之后,采用多元Logistics回归的方法加以分析,进而对判别结果的相关作用影响因素进行分析。判定原始数据,确认能够利用多元Logistics回归模型处理,可以使用SPSS软件似然对比检验。根据检验结果能够得出,一些显著水平趋近于零,显著性较高。最大的显著水平在0.16以下,也就是说数据通过检验的概率是84%,证明可以利用该模型处理数据。因此,在本文原始数据处理中,可利用多元Logistics回归方法分析。采用多元Logistics回归模型分析数据,其中显著水平指的是判定结果受到某个因素的影响程度,如果显著水平越高,则说明具有越小作用和影响[5]。根据分析结果能够得知,比较第一类和第二类结果显示,机型因素具有最大的影响程度,其后依次是区域、时间。比较第一类和第三类结果显示,机型因素仍然具有最大的影响程度,其后依次是时间、区域。比较第二类和第三类结果显示,时间因素具有最大的影响程度,其后依次是机型、区域。
结论:在当前社会中,航空运输是一种重要的交通运输方式,近年来得到了极大的发展。随着航班架次的增加,飞机维修工作量也大大增加,产生的各类飞机维修数据也越来越多。为了更好的挖掘利用这些数据,需采用统计分析方法,将非结构化数据转变为结构化数据。利用判别分析法预测可能发生的故障类型及故障原因,便于提前做好维修准备工作。利用多元Logistics回归分析,确定主要的故障影响因素,进而更有针对性的安排维修工作,使飞机维修效率得到提升。
参考文献:
[1]宋杰, 谢海宁, 杨增辉,等. 基于多源异构数据挖掘的配电网故障信息统计分析[J]. 电力系统保护与控制, 2016, 44(3):141-147.
[2]罗秦, 王艳波. 一种基于历史数据统计的起飞前航迹预测分析算法[J]. 电脑知识与技术, 2015(21):175-177.
[3]潘秋银, 马良宵, 杨洋,等. 基于数据挖掘方法的针刺得气与疗效的关系分析[J]. 中国针灸, 2017, 37(6):668-672.
[4]姚凌虹, 高峰娟, 于向阳. 一种基于专家系统的飞参判据设计与应用[J]. 设备管理与维修, 2017(4):119-121.
[5]景博, 徐光跃, 黄以锋,等. 军用飞机PHM技术进展分析及问题研究[J]. 电子测量与仪器学报, 2017, 31(2):161-169.
关键词:统计分析方法;飞机维修;数据挖掘
前言:近年来,随着社会经济的快速发展,航空运输领域取得了很大的进步,航空业市场快速发展,因而相关工作量也都大大增加。在飞机维修方面,航空维修数据越来越多,利用传统方法难以高效处理。对此,可以利用统计分析方法挖掘飞机维修数据,从而为维修计划安排、航材储备等加以安排。在航空维修数据分析当中,现有的维修故障数据,大多以非结构化数据为主,需要经过结构化转换后,才可用于数据挖掘分析。
1 维修数据整理转化
1.1 故障特征参数选择
对原始条目信息摘录后,取得故障发生机型、故障发生区域、故障发生时间等故障特征参数[1]。在时间方面,对故障发生频率分析,确认故障发生日期,从而对故障多发季节分析判断。利用空间角度,对故障发生频率加以分析,取得故障发生地区信息。另外,通过分析故障发生不同机型分析,了解故障多发飞机机型,从而在日常维修中加以注意。
1.2 故障因变量选择
将因变量作为发生故障的原因,主要包括了使用年限过长而正常发生的自发性故障,雷达收发机方面的故障,以及冰雹、雷击、鸟击等外物冲击故障。经相关研究表明,外物冲击是引发故障的主要原因,其次是雷达收发机故障引发的问题。
1.3数据结构转化
在数据分类完成之后,针对各类数据,采取相应方法加以转换,将非结构化数据转变为结构化数据。在各个变量中,使用数据表示变量下的各个类别,得到以阿拉伯数字为主的数据形式[2]。使用SPSS统计学软件,分析得到的数据。在相应的数字对应关系选择中,并没有固定规则,可以根据实际情况进行选择,唯一需要注意的,就是要明确各个类别所对应的数字。在处理后,原有的非结构化数据,转变为结构化数据,同时满足和定性变量数据的要求。
2 飞机维修数据挖掘分析
2.1 判别分析
在统计分析当中,判别分析是一种常用方法,利用这一方法,综合机型、空间、时间等信息,能够较为准确的预测飞机容易发生的故障及原因,从而提前做好可能的航材保障、维修计划,以降低维修人员的工作压力,提高飞机维修工作效率。在预测可能的故障类型及原因之后,维修单位可以拥有更加宽裕的时间,从容的安排维修计划,能够进一步减少成本,提高利益[3]。对于原始数据,需要采取组均值均等性检验,确认数据与模型相适应。根据结果表明,故障原因Y,概率為99.9%,自变量X1、X2、X3,存在差异明显的均值。所以,利用判别分析法,可以分析本文数据。在判别分析法当中,根据不同的判别标准,主要包括了贝叶斯判别法、距离判别法、Fisher判别法等,其中,后两种判别方法相对较为常用。
在Fisher判别法当中,运用了投影的知识点,在P维空间中,一个线性函数y(x)=Cjxj,使空间中的一点x可以降为一维数值。利用这一线性函数,转换P维空间中求知類别归属样本、已知类别总体样本,使其成为一维数据。然后综合亲疏程度,判定位置归属样本点的归属。参数利用SPSS软件计算,可获取分类函数关系。结果表明,在因变量中,三个类别判别函数可以表示为:F1=19.087x1+8.563x2+5.517x3-57.247;F2=15.225x1+6.844x2+3.686x3-33.101;F3=9.833x1+4.608x2+2.694x3-33.101。例如,7月份有一架波音737-700飞机起飞,经过北京,则可以设定自变量x1=2,x2=1,x3=3。分别带入三个判别函数中,能够得出F1=6.041,F2=15.251,F3=16.765。因此能够在第三类发生雷达收发机故障类别中纳入这一判定结果。维修部门可以利用这一结果,提前对雷达收发机故障维修需要的航材进行准备,同时对维修计划提前安排妥当。
距离判别法,主要根据距离进行计算,公式为Di=观测点坐标值设为(X,Y),第i类结果质心坐标值为(Xi,Yi),观测值和第i类结果质心距离大小,则用Di表示。如果距离越近,则距离越小,所以判定类别选择了最小数值的类别[4]。在确定观测测点坐标值后,利用SPSS分析,获取典型判别式函数系数,根据结果得出,X=1.760x1+0.5752x2+0.583x3-7.728,Y=0.881x1+0.326X2-0.139x3-1.124。利用上述函数可计算观测点坐标值。利用SPSS计算获取质心函数坐标,进而得出质心坐标,带入距离公式对各个观测点中每一类结果质心距离进行计算。
2.2 多元Logistics回归分析
取得的所有变量,都是定性变量,对分类预测结果获取之后,采用多元Logistics回归的方法加以分析,进而对判别结果的相关作用影响因素进行分析。判定原始数据,确认能够利用多元Logistics回归模型处理,可以使用SPSS软件似然对比检验。根据检验结果能够得出,一些显著水平趋近于零,显著性较高。最大的显著水平在0.16以下,也就是说数据通过检验的概率是84%,证明可以利用该模型处理数据。因此,在本文原始数据处理中,可利用多元Logistics回归方法分析。采用多元Logistics回归模型分析数据,其中显著水平指的是判定结果受到某个因素的影响程度,如果显著水平越高,则说明具有越小作用和影响[5]。根据分析结果能够得知,比较第一类和第二类结果显示,机型因素具有最大的影响程度,其后依次是区域、时间。比较第一类和第三类结果显示,机型因素仍然具有最大的影响程度,其后依次是时间、区域。比较第二类和第三类结果显示,时间因素具有最大的影响程度,其后依次是机型、区域。
结论:在当前社会中,航空运输是一种重要的交通运输方式,近年来得到了极大的发展。随着航班架次的增加,飞机维修工作量也大大增加,产生的各类飞机维修数据也越来越多。为了更好的挖掘利用这些数据,需采用统计分析方法,将非结构化数据转变为结构化数据。利用判别分析法预测可能发生的故障类型及故障原因,便于提前做好维修准备工作。利用多元Logistics回归分析,确定主要的故障影响因素,进而更有针对性的安排维修工作,使飞机维修效率得到提升。
参考文献:
[1]宋杰, 谢海宁, 杨增辉,等. 基于多源异构数据挖掘的配电网故障信息统计分析[J]. 电力系统保护与控制, 2016, 44(3):141-147.
[2]罗秦, 王艳波. 一种基于历史数据统计的起飞前航迹预测分析算法[J]. 电脑知识与技术, 2015(21):175-177.
[3]潘秋银, 马良宵, 杨洋,等. 基于数据挖掘方法的针刺得气与疗效的关系分析[J]. 中国针灸, 2017, 37(6):668-672.
[4]姚凌虹, 高峰娟, 于向阳. 一种基于专家系统的飞参判据设计与应用[J]. 设备管理与维修, 2017(4):119-121.
[5]景博, 徐光跃, 黄以锋,等. 军用飞机PHM技术进展分析及问题研究[J]. 电子测量与仪器学报, 2017, 31(2):161-169.