运维日志就是风电场运维值班人员对日常运维活动的记录。
各个风场,甚至不同的值班人员都有自己的方式;有的是严格按照时间记录的流水帐,有的是记录重要的事务或要点。
日志的内容一般都是以自然文本的方式,在早期用笔写在特定的值班记录本上的比较多,现在应该是电子形式更为普遍了。
这些日志的内容一般都会存档,以备需要时查看。
随着时间的推移,一个风场积累下来的运维日志里其实包含了大量有价值的信息,如果人工去回顾、翻阅和总结这些日志的内容会非常耗费人力,并且不一定有好的效果。
自然语言处理技术简称 NLP ,可以在这里派上用场。
NLP 是计算机科学领域与人工智能领域中的一个重要方向,是一门融语言学、计算机科学、数学于一体的学科。NLP 一个重要技术领域就是自然语言理解。
如何应用 NLP 技术从运维值班日志挖掘有价值的信息呢?
首先,我们要为 NLP 建立一个与我们的风电场运维有关的专业词库。因为很多专业词汇在通用的语言模型里并不存在,比如变流器、变桨等这些不常见的词汇。
有了特定的专业词库之后,NLP 就可以对运维进行分词、语义分析和语义理解等这样的分析。
比如,我们可以统计在日志中那些设备、那些部件被经常提到,在此基础上,可以挖掘更多维度的信息,比如和各个部件相关的维护频次;我们还可以用语义理解的方法提取除各类运维活动的更为详细的信息等。
如果我们积累的日志足够多,我们可以用日志系统训练一个运维记录问答系统。这个系统可以回答诸如这样的问题:最近发生的变流器类的故障发生在那一天?上一周有多少次故障停机?昨天有没有主轴轴承超温?等等。
另外,也可以对日志内容本身的质量进行评估,可以进行自动错别字排查等等。
总之,如果你积累了大量的运维日志文本,用 NLP 技术可以得到很多有价值的信息。简单地讲,就是把沉默的信息唤醒创造价值。
版权声明:微信公众号请按平台规则转载。微信平台以外的媒体,未经授权不得转载,已委托「维权骑士」全网维权。当然,读者朋友完全有权利转发本文到自己的朋友圈!
领取专属 10元无门槛券
私享最新 技术干货