这是财富信用卡公司的核心系统上线之后的6周障害情况,希望通过对障害的分析,帮助财富信用卡公司合理的安排维护人员的情况。对于数据的分析,主要是要找到数据的变化规律,异常数据,以及数据之间的关系。信用卡的业务主要是以月为周期变化,如用户的账单日、还款日、会计日以及月末处理等;另外,信用卡持卡人在用卡过程中,产生疑问也会通过客服的方式进行咨询,这也许会导致业务人员发起调查申请,并发现系统新的问题。对维护人员来讲,每周的周一或者特殊的业务日之后,会有大量的工作投入到系统调查工作中。接下来,将会使用Python对这6周的数据进行分析,并发现相应的规律,来帮助财富信用卡公司来合理的安排运维工作。
本次分析过程中,使用的数据是从财富信用卡公司的障害管理系统中到处的Excel文件,在Python中导入Excel文件,并初步整理数据。在分析过程中,将数据可视化,通过图表的方式来展示数据,是有效的对数据进行分析的手段。在这里使用pandas来导入,并处理数据,pyecharts来展示数据。在实际进行数据分析之前,首先配置Python环境,使用pip来管理安装包,pandas的安装命令如下:
安装pyecharts的命令如下:
Python的环境配置完成后,就可以使用Python进行数据分析。首先,导入在分析过程中需要用到的类库,如下:
首先,从文件系统导入障害数据,并对简单查看一下数据的签5条记录,初步了解数据中都包含什么信息。
简单查看数据后,发现State项存在Cancel数据,那么进一步分析一下,该项目总共有几个类别,来确认哪些需要分析。
通过计算发现,Cancel的数据总共有69条,Closed的有3313条,Open的有569条。将这个数据用柱状图表现出来,对比会更加明显。
这其中Closed将会作为进行障害分析的对象,首先选取数据。
查看一下,总共有多少数据,结果如下:
那么,这些障害是怎么在什么系统里的呢?
看一下各个Team负责的障害都有多少,是什么类型的。
所有B开头的Team都是同一个系统的,与其他的Team比较,没有太大的价值,在这里抽取所有B开头Team的数据进行分析。
接下来通过柱状图来对比一下,首先看一下,各种类型的障害,在不同Team间的分布:
再看一下各个Team中,不同种类障害的比较:
看一下,障害随着时间的分布状况,如下:
系统的业务有很强的周期性,在这里周期是按照周分布的,查看各州的分布情况:
在信用卡的业务中,有几个特殊的业务日,如账单日,还款日,以及会计日等。在这几个业务日的当天,关注系统的运行是否正常,在业务日的翌日,客户的咨询可能会变多,因此,在这里也关注一下业务日的翌日的情况。首先,对数据整理将这几个特殊的日子标记出来。在这里的特殊日子分别是,账单日每月10号,翌日为11号;会计日为每月3号,翌日为4号;还有一个月末日,就是每月的最后一天,它的翌日是次月1号;
不同的障害类型,是什么情况呢?使用雷达图来显示一下,看看各个分布什么状况:
领取专属 10元无门槛券
私享最新 技术干货