前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >智能运维探索 | 云系统中的异常检测方法

智能运维探索 | 云系统中的异常检测方法

原创
作者头像
嘉为蓝鲸
发布于 2022-01-10 06:27:47
发布于 2022-01-10 06:27:47
1K0
举报

云系统异常检测背景

随着云技术的飞速发展,云系统的复杂性和规模不断增加,云系统的稳定性受到了极大挑战。为了解决运维问题,运营商会通过指标(Metrics)、日志(Logs)等多个维度信息来了解云系统的运行状态。

本文介绍的方法是通过分析系统指标(如CPU 使用率、I/O 请求数、网络吞吐量等)对云系统进行异常检测。

对于这些指标数据,研究人员提出了单变量的时间序列异常检测方法。但随着云系统复杂性的增加,运维人员可以收集的指标越来越多,该方法往往无法反映云系统整体的异常情况。

基于此种情况,研究人员又提出了多元时间序列异常检测,这种方法虽然考虑了云系统中多个指标,但没有将云系统中的组织结构考虑进来,适用性也不太好。

在复杂的云系统中我们以系统拓扑结构为基础,获得系统状态的基于图的表示,进而进行异常检测。随着深度神经网络的迅速发展,研究人员提出了基于深度学习的异常检测方法,将图神经网络与RNN和CNN一起应用来同时考虑空间和时间关系,对云系统中数据以及拓扑结构进行建模。

01. 常用的异常检测方法

1. 传统异常检测方法

静态阈值:原指标超过阈值即异常。

3sigma:计算当前值是否偏离历史均值且偏离程度达3个标准差。

基于分类的方法,例如支持向量机。

基于最邻近方法,例如局部异常因子。

2. 深度学习方法

充分利用指标中的时序信息进行异常检测。

基于预测的方法:

基于重构的方法:

基于深度学习的方法是根据历史数据利用深度学习模型进行建模,对需要检测的数据进行预测或重构,误差大则判定为异常。

02. TopoMAD 方法特点详析

1. TopoMAD引入了图神经网络(GNN),与传统DNN相比有如下优势:

▲ GNN相比DNN的优势
▲ GNN相比DNN的优势

2. TopoMAD引入了拓扑信息:

● 图神经网络的特征提取器共享于来自不同组件的同类指标之间,有助于在统一的特征学习下捕获相同指标类型之间的相似模式。

● 通过图神经网络,组件可以由与其他组件之间的连接来定义,这为对系统中所有组件的模式和行为进行端到端学习提供了便利。

● 拓扑信息可以引导模型将注意力集中在现实中具有直接连接的组件的交互上,这有助于防止我们的模型过度拟合。

3. 相比于其他方法的阈值选择,引入无监督的方式来生成阈值,不需要对阈值进行调参,可以减少模型的调参难度。

03. TopoMAD 方法介绍

本文介绍一种基于变分自动编码器(VAE)设计的异常检测器。

这是一种拓扑感知多元时间序列的异常检测器(TopoMAD),它结合了图神经网络(GNN)、长短期记忆 (LSTM) 和变分自动编码器VAE为云系统执行无监督异常检测。

TopoMAD方法主要有以下几个方面的特点:

● TopoMAD是一种无监督异常检测方法,该方法考虑了云系统的拓扑信息。我们将此拓扑信息与云系统中收集的指标相结合,构建了基于图的异常检测表示。

● TopoMAD将图神经网络和 LSTM 作为 VAE 的基本结构粘合在一起,在拓扑时间序列中进行异常检测。图神经网络提取云系统的空间拓扑信息,LSTM随着时间窗口从滑动窗口提取信息。

● TopoMAD利用随机模型VAE以完全无监督的方式对云系统进行异常检测,在包括正常和异常的数据上训练模型,同时还提出了一种无监督的阈值选择方法。

TopoMAD的整体流程如下:

▲ TopoMAD总体结构
▲ TopoMAD总体结构

数据集成和处理

通过数据标准化转换从不同节点收集的不同数据,获得从每个节点收集的指标X和描述系统拓扑的数组E。

模型训练

以离线批处理的方式使用历史数据训练模型。模型训练好后,我们根据训练数据的异常分数分布选择一个阈值。

阈值选择

该方法以无监督方法选择了一个阈值,该阈值使正常数据和异常数据集合之间的距离最大化。

在线异常检测

使用这个经过适当训练的模型计算新观察的异常分数。如果观察的异常分数高于我们选择的阈值,则会触发警报。

① 数据集成和预处理

数据预处理期间,我们通过数据标准化过程转换从不同节点收集的不同指标,然后在这些集合和处理后的数据中取出一定长度的滑动窗口作为输入。

输入数据有两类:

● X为指标矩阵,横坐标是节点(Node),纵坐标是指标(Metric),矩阵每行表示节点各个指标的数值。

● E为系统的拓扑结构,系统拓扑中两个具有相关关系的节点为一条边,每条边构成E的一个列向量。

▲ 输入数据样例
▲ 输入数据样例

② 模型设计

TopoMAD方法中模型的架构流程如下:

● 整个网络是一个随机seq2seq自动编码器,输入系统拓扑结构E和系统各个节点的指标信息X,通过GraphLSTM来获取系统的拓扑信息,进一步经过编码-解码的方式输出重构序列。

● 通过进一步计算X_t的异常分数可以判断异常,当异常分数高于阈值时,就会检测到异常。

● 提出了一种阈值选择方法,通过此阈值切割训练数据集,使正常和异常两个区域距离最大。

③ 基本单元GraphLSTM

GraphLSTM是编码器和解码器中的一部分,是图神经网络和LSTM的组合。将LSTM中的全连接层替换为图神经层即可得到GraphLSTM,它的结构如下:

▲ GraphLSTM的总体结构
▲ GraphLSTM的总体结构

④ 在线异常检测过程

TopoMAD在线异常检测流程如此下:

▲ TopoMAD在线异常检测流程
▲ TopoMAD在线异常检测流程

04. 总结

本文介绍的方法较已有的方法主要更多关注系统的拓扑信息,将系统拓扑信息融入到系统检测的过程中,主要有以下几个方面优点

● 在传统的LSTM中使用图神经网络(GNN)的方法引入了拓扑的信息,综合考虑多维时间序列的时空信息,将云系统组件间的联系考虑进来,有助于在统一的特征学习下捕获相同指标类型之间的相似模式。

● 通过VAE+Seq2Seq的形式,增加模型的学习能力,相比于传统方法模型效果更好。

● 该方法是一种无监督异常检测方法,不需要带标注的数据就能进行异常检测,同时以无监督的方式计算阈值,相比于有监督方法对样本要求更低,计算更简单。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
造车新势力下的“血本”能对冲涨价吗?
特斯拉车主小张续保时发现,他的车险居然比去年还要贵,刚买的新车没有出过险,但是返点之后续保价格却从第一次购买保险的四千元变成了六千多元,上涨了2000元左右。
用户2908108
2022/03/15
3430
造车新势力下的“血本”能对冲涨价吗?
蔚来、小鹏、吉利走到了跨界分叉口
如今,国内整个汽车行业逐渐进入了一个加速洗牌时期,各大车企为了占得更多的市场份额,纷纷开始在产品、技术、营销等多个方面下功夫。在巨大的竞争压力之下,绝大多数车企也不再满足于发展单一业务,而是在主业之外搞起了“副业”,一时之间跨界似乎成为了整个造车企业的潮流。
刘旷
2022/09/04
2450
从不被看好到逆袭成王 小鹏P7“神车”的逆行缩影
2022年初,备受关注的新势力车企们就陆续公布了去年的交付量成绩,引发市场持续热议。
刘旷
2022/01/18
1250
威马招股书拆解:电动竞争已结束,智能排位赛刚开始
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 这场IPO不会普普通通过去。 这个行业,这家公司,在这个时间,有无数话题。 威马汽车,刚刚向港交所递交招股书。 它是和蔚小理同时创业的新势力,曾一度并称“四小龙”,甚至早期更加被资本和业内看好。 从招股书来看,增长也是威马过去和未来几年的主旋律。 但威马发展轨迹却和其他新势力完全不同。 创始团队出身老牌车企,代表对智能纯电汽车的另一种理解,这也让威马早于任何新势力解决25万年产能、甚至还早于任何“智能汽车”首发L4级自主泊车功能… 但在各家销量、增
量子位
2022/06/16
2240
威马招股书拆解:电动竞争已结束,智能排位赛刚开始
国产岚图入局高端智能电动车,对标特斯拉,放话一年内量产
但就在两个月前,一个新“拳手”正式登台,宣布入局中国高端新能源汽车战场。它就是岚图。
量子位
2020/09/30
4630
国产岚图入局高端智能电动车,对标特斯拉,放话一年内量产
小鹏VPA实测:地下的自动泊车场景,怕是比你想象中更复杂
Auto Byte报道 作者:曹锦、George.W 地下停车场,在大家的印象中,可能都是电影中那种「开阔得足够飞车枪战」的场地——行人不多、划线清晰、指示明显,也不具备路面上的复杂路况,看似对于自动驾驶车辆来说难度不大。但其实,目前能给出这「最后一公里」解决方案并实现普遍应用的汽车品牌,仍然没有几家。 去年9月,威马汽车就曾推出一项名为「AVP无人泊车」的功能,但根据测评,该功能无法脱离人工监管,与记忆泊车几乎没有差别,而且仅支持最长150米的记忆路线,并且路线上限只有五条。更重要的是,AVP并不支持避障
机器之心
2023/03/29
8760
小鹏VPA实测:地下的自动泊车场景,怕是比你想象中更复杂
多少万以内最好不知道,但智能车「水桶」就是它了
贾浩楠 发自 凹非寺 量子位 | 公众号 QbitAI 谁才是2022年智能车中的「水桶车」?各项性能全部拉满,没有明显短板的六边形战士? 比如车辆工程、动力性能、座舱水平,以及智能驾驶能力等等方面。 小鹏G9,或许目前最接近这种六边形特性。 虽然还没上市,智能化能力已经迫不及待放了出来。 算力508TOPS,智能驾驶贯通泊车和行车域,未来还能OTA城市道路上的领航辅助,量产速度领先所有主机厂。 而且,很早就被车企挂在嘴边的超高压充电技术,G9完全不打折扣实现量产。800V高压SiC平台,充电5分钟,续航
量子位
2022/09/14
5370
多少万以内最好不知道,但智能车「水桶」就是它了
互联网巨头造车三步走:资本布局、技术支持、亲自下场
2020年就要过去了,回首望去,今年最大的赢家,可能并不是一开始大家所预料的在线教育或者在线办公,而是去年最惨的新能源汽车行业。
刘旷
2021/01/01
1970
汽车智能化的冰与火:平台级领导者Apollo正改写游戏规则
一向喜欢围观的王兴,在听到华为智能驾驶总裁苏箐给出“车就是一个大计算机加个壳子”的观点后,忍不住留下了一句神评论:“特斯拉终于遇到一个技术实力和忽悠能力旗鼓相当的对手了。”
Alter聊科技
2023/01/12
2650
前有特斯拉,后有比亚迪:新能源车企市值狂舞
预热良久,比亚迪“汉”终于在7月12日线上发布了,这款预售价在22万-28万元的新车被寄予厚望。比亚迪“汉”被比亚迪董事长王传福认为是其旗下电动汽车迈向“智能化”的关键性产品,新车的发售,吸引了大量的外界目光,更将连月以来比亚迪上涨的市值推向新高。
刘旷
2020/07/16
4410
前有特斯拉,后有比亚迪:新能源车企市值狂舞
高端、智能:传统车企的两道必解题
由于车机体验一直备受车主诟病,前几天吉利旗下极氪汽车宣布免费为所有老车主升级高通8155智能座舱芯片,根据媒体估算,本次升级仅物料成本就达4000万。
金融外参
2022/07/19
1590
蔚来、理想、小鹏终有一战
作为一个被外界一致认定是未来趋势的行业,新能源汽车前几年在市场中丝毫没有一点“明日之子”的样子,反倒是众望所归的眼神中坐上了过山车,尝尽了起起落落。
刘旷
2020/11/23
2950
蔚来、理想、小鹏终有一战
智能汽车的高端盛宴
经过几年的发展演进,造车新势力日渐发展壮大,其在行业中的影响力也越来越大。它们的崛起一方面极大地加快了国内汽车行业的电动化进程,另一方面也迫使传统车企向电动化转型提速。
刘旷
2021/01/12
5480
2020年造车新势力:几家欢喜,几家愁
资本追捧、技术加持,加之在赛道上的坚守,这些原本只想活下去的造车新势力们,最终在年底收到了回报。
镁客网
2020/12/18
3440
蔚来、小鹏过冬术:昔日死敌,今日亲兄弟
《蔚来李斌,2019年最惨的人》刷爆朋友圈之际,小鹏汽车创始人何小鹏在微博上对李斌发出如下鼓励和感概。
刘旷
2019/12/27
4770
蔚来、小鹏过冬术:昔日死敌,今日亲兄弟
BBA不下牌桌
而虎嗅发布的一篇关于电车汽车市场接受度调研显示,特斯拉、小鹏、蔚来成为电动车消费主力人群的品牌首选,占比分别为26.7%、23.3%、10%,BBA(笔者注:奔驰、宝马、奥迪)却意外不在榜单之中。
镁客网
2022/02/10
2300
BBA不下牌桌
威马进入ICU,蔚小理慌不慌?!
近日,据报道,威马汽车温州工厂处于全线停摆状态。该报道称,威马温州基地目前几乎没有人,工厂前台考勤表显示,自2022年11月以来,工厂已处于半停工状态,特别是12月上半月,只有5天有员工打卡,每次一人,停留时间约半小时左右。
数据猿
2023/03/03
3500
威马进入ICU,蔚小理慌不慌?!
融资百亿打破行业记录,未上市的威马一举成为“头马”
受疫情影响,2020年创投市场迎来资本寒冬,虎博搜索数据显示,一级市场表现疲软,2020上半年投资笔数与金额均有明显缩水,完成投资仅827笔,公开披露的总投资金额3115亿元,皆不足2019年数据的1/3。
罗超频道
2020/09/24
5840
融资百亿打破行业记录,未上市的威马一举成为“头马”
电动车企的2023:抱团活下去
今年以来在诸多政策助推之下,上半年国内的新能源汽车销量,并未出现业内预想的大幅下滑,反而一路上扬再创新高,国内自主品牌的市占率和品牌影响力持续扩大。与此同时,行业头部车企与尾部车企之间的差距,也在进一步拉大。
刘旷
2023/09/05
2000
造车=抢人?2021互联网造车之高管流动史
同样是造车,曾经被冠以“新势力”之名的蔚来小鹏理想等已经成为“旧”势力,百度、小米、华为等则以不同的方式成为“新势力”。
镁客网
2021/06/08
3220
推荐阅读
相关推荐
造车新势力下的“血本”能对冲涨价吗?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档