论文部分内容阅读
数据科学家正在分析列车和基础设施故障,以支持预测性维护.
伦敦交通局(TfL,Transport for London)正在利用数据科学找出伦敦地铁列车和基础设施中断的原因,并预测这些故障什么时候会出现,从而提高服务质量。
为帮助伦敦交通局实现“让伦敦跑起来”的宣传口号,所有列车、车站、信号、轨道和自动扶梯每天都要投入运营。其中任何一个出现小问题都有可能导致大的中断。
为提高其可靠性并降低维护成本,一个由三个数据科学家组成的团队以及可靠性分析人员小组一直在研究故障原因,怎样减少故障。
他们正在研究预测性维护怎样降低成本,改进服务。目前在中心线路上正在进行的一个项目分析地铁事件,以预测发动机什么时候会出现故障。
伦敦交通局的数据科学家Akis Tsiotsios在一次人工智能大会上解释说:“预计每年能节约300万英镑,这极其重要,因为这类故障成本非常高,已经采取了很多计划维护措施,以防止发生故障。”
老地铁继续运行
1863年在帕丁顿(Paddington)和法灵顿街(Farringdon Street)之间开通了世界上的第一条地铁,现在它已成为环线、中心线、汉默史密斯线和城市线的一部分。
它仍然是世界上最繁忙的地铁网络之一。每天早上,538趟列车运行在270个车站之间,预计该网络今年将运送14亿人次,覆盖8600万公里,相当于110次往返月球。
需要定期维护维多利亚时代的基础设施和老化的车厢,以避免停运。
大概一半的延误是由伦敦交通局资产问题引起的,其维护成本占总预算的59%。
外部因素也会导致服务中断。在一个数据科学项目中,伦敦交通局通过找出故障与温度、湿度和降雨之间的关系,研究了天气条件怎样影响列车编组的可靠性。
研究小组考虑了一个汇合了所有系统的失败概率模型,但决定应该有更强大的选项来确定单个子系统组件是否更容易出现故障。
分析结果产生了热图,显示每一因素对每一系统和组件的影响。
发现高温是导致故障的主要原因。低温也有显著的影响。
研究人员将这些反馈给相关方,帮助他们围绕维护和更新做出决策。
他们的最终目的是查明导致所有资产故障的原因,以便进行预防性维护。
选择最佳数据分析模型
为了了解故障的原因,研究小组研究了伦敦交通局资产、故障、维护、服务操作和天气等外部问题的数据集。故障发生的因素包括温度、出发地点、使用率和维修率。
他们分析了每一因素对故障率的影响,基于故障发生频率的影响程度,以及与故障相关的成本。
Tsiotsios说:“这样使我们能够大概了解不同因素的影响,对其进行对比以便知道应采取什么措施来进行缓解。”
其难点包括信息孤岛、数据丢失、由于伦敦交通局不断更新其资产而导致时间受限,以及故障出现频率较低而使得数据比较稀疏,等等。
伦敦交通局是非常依赖于安全关键应用的大企业,因此数据科学团队需要与不同的部门合作,实施有效的时间表。
Tsiotsios说:“我们想让相关方尽可能的参与进来,因为这些项目每一个都涉及很多不同的部门,我们对工作人员的期望以及我们要努力实现的目标都有一些时间要求。”
工作人员采取的维修决策应尽可能减少故障和维护成本。
他们可以根据里程或者运行时间进行维护,但这可能最终会因为过度维护资产而浪费资金,也有可能因维护不足而导致出现太多的故障。
数据科学家认为更好的选择是分析历史故障和维护数据,以确定故障概率。这样他们才能查明可能的原因。
然后,他们可以评估故障成本,确定有多少是可以接受的,设置固定的维护频率。
这种选择是一个进步,但仍然不是最佳的,因为有一些故障是不可避免的,而很多故障则可以通过维护来避免。
Tsiotsios说:“我们要做的是,在某一资产即将出现故障之前,独立地维护每一项资产。
“我们讨论的是预测性维护,这里的问题是当某一类系统要出现故障时,我们怎样才能预测出来。”
伦敦交通局的预测性维护
伦敦交通局通过分析已经收集的远程状态监测数据,进行预测性维护。
伦敦交通局某些资产上的传感器不断监测基本状态,确认轨道上发生的事件。
有成百上千的这类事件,从车门关闭到列车以一定速度经过等。
例如,如果车门出现故障,那么故障出现前就会有相应的征兆。
Tsiotsios说:“这里的想法是,出现故障之前的事件模式应该反映这些征兆。
“换句话说,故障前的事件模式应该与正常或者健康运行的事件模式有明显的不同。”
为了对所有这些数据进行建模,他们开发了一个机器学习分类器,可以区分这些不同的模式。
然后,算法可以评估在前几天或者几小时内发生的事件的模式,然后预测是否会发生故障。
机器学习模型被应用于数据,以预测是否会发生故障,预计将出现故障的资产很快就会出现在工程师的显示屏上。在出现故障之前,就会把有问题的资产从服务中撤出并进行维护。
伦敦交通局的数据科学项目
伦敦交通局正在进行一些数据分析实验以改进地铁服务,包括上述的中心线路项目。
这使用了每天从制造商状态监控系统下载到服务器上的数据。然后算法评估过去五天里的事件模式,预测第二天是否会出现故障。
他们还在维多利亚线路上进行了概念验证,通过异常检测来预测车门故障,还有一些其他项目来分析传感器产生的信号,持续监测性能。
另一个数据科学项目则支持伦敦交通局开展监测并改进其数据质量的工作。
很多伦敦交通局的数据都有错误,或者丢失了信息。数据科学小组正在使用自由文本字段,工程师利用这些字段输入关于故障征兆的详细信息,以及为解决问题所采取的行动,训练机器学习分类器,这些分类器分析文本中的模式以预测哪些组件会出现故障。
到目前为止,该算法在识别组件时已被证明正确率达到75%。
任何被标记的组件都会由专家进行检查。
Tsiotsios说:“我們的目标不是建立一款自动为我们填充数据的机器学习工具。我们不想用一个也会出错的工具来代替我们工程师的专业知识。
“我们想开发一款质量保证工具来监控数据质量,以便自动检测什么时候记录了错误的数据,并建立一个过程,在此过程中我们会向输入团队提供反馈,这样,将来会变得越来越好。”
伦敦交通局(TfL,Transport for London)正在利用数据科学找出伦敦地铁列车和基础设施中断的原因,并预测这些故障什么时候会出现,从而提高服务质量。
为帮助伦敦交通局实现“让伦敦跑起来”的宣传口号,所有列车、车站、信号、轨道和自动扶梯每天都要投入运营。其中任何一个出现小问题都有可能导致大的中断。
为提高其可靠性并降低维护成本,一个由三个数据科学家组成的团队以及可靠性分析人员小组一直在研究故障原因,怎样减少故障。
他们正在研究预测性维护怎样降低成本,改进服务。目前在中心线路上正在进行的一个项目分析地铁事件,以预测发动机什么时候会出现故障。
伦敦交通局的数据科学家Akis Tsiotsios在一次人工智能大会上解释说:“预计每年能节约300万英镑,这极其重要,因为这类故障成本非常高,已经采取了很多计划维护措施,以防止发生故障。”
老地铁继续运行
1863年在帕丁顿(Paddington)和法灵顿街(Farringdon Street)之间开通了世界上的第一条地铁,现在它已成为环线、中心线、汉默史密斯线和城市线的一部分。
它仍然是世界上最繁忙的地铁网络之一。每天早上,538趟列车运行在270个车站之间,预计该网络今年将运送14亿人次,覆盖8600万公里,相当于110次往返月球。
需要定期维护维多利亚时代的基础设施和老化的车厢,以避免停运。
大概一半的延误是由伦敦交通局资产问题引起的,其维护成本占总预算的59%。
外部因素也会导致服务中断。在一个数据科学项目中,伦敦交通局通过找出故障与温度、湿度和降雨之间的关系,研究了天气条件怎样影响列车编组的可靠性。
研究小组考虑了一个汇合了所有系统的失败概率模型,但决定应该有更强大的选项来确定单个子系统组件是否更容易出现故障。
分析结果产生了热图,显示每一因素对每一系统和组件的影响。
发现高温是导致故障的主要原因。低温也有显著的影响。
研究人员将这些反馈给相关方,帮助他们围绕维护和更新做出决策。
他们的最终目的是查明导致所有资产故障的原因,以便进行预防性维护。
选择最佳数据分析模型
为了了解故障的原因,研究小组研究了伦敦交通局资产、故障、维护、服务操作和天气等外部问题的数据集。故障发生的因素包括温度、出发地点、使用率和维修率。
他们分析了每一因素对故障率的影响,基于故障发生频率的影响程度,以及与故障相关的成本。
Tsiotsios说:“这样使我们能够大概了解不同因素的影响,对其进行对比以便知道应采取什么措施来进行缓解。”
其难点包括信息孤岛、数据丢失、由于伦敦交通局不断更新其资产而导致时间受限,以及故障出现频率较低而使得数据比较稀疏,等等。
伦敦交通局是非常依赖于安全关键应用的大企业,因此数据科学团队需要与不同的部门合作,实施有效的时间表。
Tsiotsios说:“我们想让相关方尽可能的参与进来,因为这些项目每一个都涉及很多不同的部门,我们对工作人员的期望以及我们要努力实现的目标都有一些时间要求。”
工作人员采取的维修决策应尽可能减少故障和维护成本。
他们可以根据里程或者运行时间进行维护,但这可能最终会因为过度维护资产而浪费资金,也有可能因维护不足而导致出现太多的故障。
数据科学家认为更好的选择是分析历史故障和维护数据,以确定故障概率。这样他们才能查明可能的原因。
然后,他们可以评估故障成本,确定有多少是可以接受的,设置固定的维护频率。
这种选择是一个进步,但仍然不是最佳的,因为有一些故障是不可避免的,而很多故障则可以通过维护来避免。
Tsiotsios说:“我们要做的是,在某一资产即将出现故障之前,独立地维护每一项资产。
“我们讨论的是预测性维护,这里的问题是当某一类系统要出现故障时,我们怎样才能预测出来。”
伦敦交通局的预测性维护
伦敦交通局通过分析已经收集的远程状态监测数据,进行预测性维护。
伦敦交通局某些资产上的传感器不断监测基本状态,确认轨道上发生的事件。
有成百上千的这类事件,从车门关闭到列车以一定速度经过等。
例如,如果车门出现故障,那么故障出现前就会有相应的征兆。
Tsiotsios说:“这里的想法是,出现故障之前的事件模式应该反映这些征兆。
“换句话说,故障前的事件模式应该与正常或者健康运行的事件模式有明显的不同。”
为了对所有这些数据进行建模,他们开发了一个机器学习分类器,可以区分这些不同的模式。
然后,算法可以评估在前几天或者几小时内发生的事件的模式,然后预测是否会发生故障。
机器学习模型被应用于数据,以预测是否会发生故障,预计将出现故障的资产很快就会出现在工程师的显示屏上。在出现故障之前,就会把有问题的资产从服务中撤出并进行维护。
伦敦交通局的数据科学项目
伦敦交通局正在进行一些数据分析实验以改进地铁服务,包括上述的中心线路项目。
这使用了每天从制造商状态监控系统下载到服务器上的数据。然后算法评估过去五天里的事件模式,预测第二天是否会出现故障。
他们还在维多利亚线路上进行了概念验证,通过异常检测来预测车门故障,还有一些其他项目来分析传感器产生的信号,持续监测性能。
另一个数据科学项目则支持伦敦交通局开展监测并改进其数据质量的工作。
很多伦敦交通局的数据都有错误,或者丢失了信息。数据科学小组正在使用自由文本字段,工程师利用这些字段输入关于故障征兆的详细信息,以及为解决问题所采取的行动,训练机器学习分类器,这些分类器分析文本中的模式以预测哪些组件会出现故障。
到目前为止,该算法在识别组件时已被证明正确率达到75%。
任何被标记的组件都会由专家进行检查。
Tsiotsios说:“我們的目标不是建立一款自动为我们填充数据的机器学习工具。我们不想用一个也会出错的工具来代替我们工程师的专业知识。
“我们想开发一款质量保证工具来监控数据质量,以便自动检测什么时候记录了错误的数据,并建立一个过程,在此过程中我们会向输入团队提供反馈,这样,将来会变得越来越好。”