预测性维修作为工业互联网中的最核心应用,无论是早期的探索者还是新进的工业互联网平台都将它作为主要切入口。当我们谈到应用落地时,可能很多企业会有这样的误解或疑问:“是不是将设备装上传感器就能开展预测性维修”、“我的工厂现在能不能部署预测性维修”。本文尝试从数据的角度(抛开人员因素、管理因素等影响)来寻找这些问题的答案。
通过我的上一篇文章(机器学习(13):飞机发动机的故障预测),我们知道进行故障预测的前提假设是设备故障遵循某种与时间相关的模式,也就是说设备会随着使用时间的增加而出现性能下降、健康衰减、零件磨损等问题,最终这些问题积累到一定程度后导致设备故障的发生。故障预测的过程是使用设备历史数据进行训练,得到一个可以识别隐藏的设备故障模式的模型,然后将实时的数据扔到模型中以识别到故障发生的概率。我们采用机器学习来进行模型训练,要求我们的训练数据既有设备的特征X又要有故障标签Y,经过训练的模型可以获得特征X与目标预测值Y之间的关联关系,这是机器学习最擅长的东西。
为了训练得到一个可用的机器学习模型,要求训练数据中包含的特征确实与故障存在某种隐藏的相关性。我们有没有满足这些要求的数据,可以作为评估是否可以开展预测性维修的最重要指标。通常我们可以看是否存在以下这些与故障具有相关性的数据:
1)故障记录:为了构建预测模型进行故障预测,机器学习需要通过训练过程学习设备的正常运行模式(正例)和故障模式(负例),那么训练数据集中要有足够数量的两种不同类别的样本。通常我们可以从故障报告、因故障导致的维修记录、或备件更换历史中可以提取出故障信息,故障记录明细包括设备ID、故障时间、故障描述、故障位置、故障代码等。
2)维修记录:设备的维修记录是预测维修解决方案的重要数据,因为维修活动会影响设备的可靠性。维修记录包括定期的保养、测试、翻新、技术改造等计划性维修活动,以及故障检修、停机检修等非计划性维修活动。维修记录明细应该包含设备ID、维修时间、维修类型、维修内容、更换的备件等信息。在很多企业,维修记录会通过ERP、EAM、Field Service等软件进行管理。
3)运行状态:设备的健康状况在运行中随着时间而逐渐衰弱,为了预测设备的故障,我们需要有随着时间变化的特征来捕捉设备的老化模式。通过部署传感器、边缘计算和IOT平台,可以从不同传感器中获取设备的运行状态参数,比如电动设备的实时温度、消耗电流、转速、功率、振动等。对于需要获取哪些传感器数据,主要需要依靠行业领域专家根据设备的机理、行业经验进行识别。因此在开始构建预测性模型之初,就要向业务专家了解数据相关性要求,根据行业领域知识有选择地进行传感器部署。
4)异常信息:首先要将设备故障与设备异常区分开来,设备故障是指设备不能正常运行,致使生产中断或效率降低而影响生产,比如电源开关未合闸导致的压缩机组不运转;设备异常是指设备在正常运行过程中出现某些指标偏离正常范围的现象,比如压缩机的排气温度过高。设备异常通常是故障发生的前兆,这些异常信息是建立故障预测模型的重要特征,往往与故障具有很高的相关性。我们借助机器学习的聚类算法等工具可以从运行状态数据中检测出异常信息。
5)设备属性:主要包括设备的制造商属性,比如制造商、型号、制造日期等,不同制造商生产的设备、不同型号的设备,在设备的材料、设计、工艺上都会存在很大的差异性,从而决定了设备出厂时的可靠性水平。
6)运营环境:运营环境对设备的使用寿命、可靠性等会产生较大的影响,比如发动机的飞行环境:航线类型(如高原航线、平原航线)、安装的飞机型号(如CFM56发动机装在A320还是B737上);再比如机房服务器设备所处的环境包括机房温度、机房湿度、机房空气含尘量等。
为了得到一个较好的模型,我们总是希望训练时间中有足够数量的故障记录,但是通常在实际应用中,故障事件在总体样本中是占少数的,这就引出一个常见问题“我们需要多少故障数据来训练一个预测模型?”,这个问题没有明确的答案。在大部分的预测性分析场景,通常要由数据的质量来确定多少数据量是可以接受的。如果数据集不包含与故障预测相关的特征,那么尽管有很多数据,构建一个可用的预测模型也是不可能的。不过通常情况下,我们的基本原则是故障事件越多,预测模型的效果越好。因此需要多少数量的故障样本是因不同应用场景、不同数据质量来确定的。
回到开始提到的问题,很显然实现预测性维修不是部署传感器拿到实时数据这么简单,同时企业可以参考上面提及的数据类型,评估自身已具有哪些故障相关的数据、还需要收集哪些数据、收集这些数据需要进行多少投入等,来判断是否适合开展预测性维修。
现在有越来越多的厂商杀入工业互联网领域,这从2017年全国召开的各类智能制造或工业互联网会议就可窥见。我们对预测性维修的平台、价值的讨论已经太多了,企业客户其实会感到焦虑和迷茫,接下来需要行业内更多地关注落地,引导企业理性思考,共同寻找那些具有良好数据基础的应用场景,先行先试。唯有这样我们才能在新一轮工业革命中实现弯道超车!
文末彩蛋:12月初我在一个工业服务联盟微信群里,发起了预测性维修这个讨论话题,我将群里产业界的人士发表的观点整理如下,希望可以给读者带来一些启发:
1. 论数据:有用的数据获取难
1)预测性维修对数据要求很高,历史故障数据的积累是长期的过程
2)针对单个工厂,每一类设备的故障事件都是低频的
3)数据不是越多越好,只有与故障具有相关性的数据才是有价值的
4)把所有数据都采集上来浪费资源,而应该智能地过滤掉“无用的”数据
5)判断需要采集什么数据很重要,否则还没有获得价值,就已经陷入大量数据的泥潭
2. 论场景:找到适合的应用场景最重要
1)投入大量的精力去收集数据,然后去监控和分析,值得这样去做的场景不是很多
2)数据不会直接告诉你答案,必须分析,必须用,必须干
3)实际上在生产前的设备疲劳性实验数据比结果大数据预测分析的结果要准确的多
4)同一种设备加工不同的产品,对故障的定义也不同,设备故障模式的差异性很大
5)主要问题在于找到适合的应用场景,结合技术与算法,才能产生价值
6)讨论预测性维护时,必须加入某个特定场景才有意义,比如数字化冷库、叉车车队管理等
3. 论应用:预测性维修不能取代人的决策
1)预测性维修不可能代替事后维修
2)基于过往故障记录的预测只能是方向性的,基于具体设备检查诊断分析才可能准确
3)对设备熟悉程度在某种程度上决定了预测的结果,所以人在预测性维修中起了主导作用
4)预测的结果直接用于维修决策还不成熟,只能作为故障诊断的辅助手段
5)不是有故障就需要立即维修,还要分析故障带来的影响,如果不是安全敏感部件,可以带病运行
4. 论管理:管理要与技术同步提升
1)数字运维再好,必须落地;落地,必须人员跟上,必须引导企业团队建设与智能智造同步发展
2)管理必须与技术结合,技术必须与管理互补
3)没有与智能制造技术同步成长的管理水平,必败
4)越是质量好、控制技术好的设备,在一个设备管理水平差的企业中,导致的后果越严重
领取专属 10元无门槛券
私享最新 技术干货