11月27日,多地司乘用户反映,某头部网约车平台司乘两端App疑似故障,出现显示网络异常、无法定位、地图无法加载、扣费异常、无法打车、小程序无法登录等情况。
此次,该头部网约车平台系统崩溃接近12个小时,不仅用户端无法正常使用,司机端以及企业内网同样出现了问题。
媒体预测,系统崩溃12小时,或损失千万订单、4亿元成交额。
这并非该平台第一次出现系统崩溃,在此前的2019年10月、2016年7月和2015年10月,同样发生过系统故障。
对此次长时间系统崩溃的原因,目前官方尚未有明确回复,但业内已有诸多猜测。
有业内人士推测,原因可能有二:一是可能遭受外部攻击,系统被打穿;二底层系统本身存在有缺陷。
有互联网从业者在社交平台爆料称,是系统半夜被攻击所致。“服务器没有物理隔离,物理攻击后台服务全挂,dc都上不去。”
有资深IT技术负责人分析称,网约车平台这种复杂LBS(基于位置的服务)服务,不同的业务板块之间应该是有隔离的,打车、共享单车等多个系统全挂,说明问题出在更加底层的基础设施上。
有网络安全专家表示,如果是来自外部的黑客攻击,公司一般会在第一时间进行声明。他的猜测更集中于平台发生了内部重大业务调整,或有新业务接入原系统,但没有做好预案,导致关联业务或关联系统出现重大故障,这是大公司系统故障最常见的原因。
也有业内人士表示,系统80%以上的故障都是变更导致的。一起大型故障往往是多个层面失守叠加的影响,导致整体防线被击穿。
此外,很多IT技术同学说,和 “降本增效” 有关。
根据该平台财报,连续5个季度,收入持续上涨,销售费用、运营费用同步增长,唯一持续下降的就是研发费用。
对互联网科技公司来说,一般研发费用的70%左右属于员工薪酬成本。研发费用减少,意味着裁员/降薪以及服务器等相关费用的压缩。
有经验的技术人员被“开猿节流”,系统熵增的问题很难得到快速解决。
单纯的技术问题往往只是表象。
海因里希事故因果理论认为,一个事故的发生,是由一系列因果关系相互连接而成的,而不是单一原因导致的结果。
经营压力下的降本增效,技术人员的流失和管理的缺位,牵一发而动全身,值得深思。
领取专属 10元无门槛券
私享最新 技术干货