今天出了点大事故,覆盖用户量100%……实在是有点惨痛……
所以今天就是想总结,管理一个产品的潜在风险,一定要控制好以下几点:
1、客户端尽量不接外部SDK,人家导致你崩溃,你一点办法都没有,不发版本没有任何办法
2、通信链路中,尽量不要让任何第三方来参与,人家断一下你,你哭都来不及
3、机房问题,但凡有啥维护啊、网络割接啊,一定要非常重视,不然就是大片用户被影响
4、能加预警加预警,服务器网络状况、接口连通情况(超时、报错预警)、流量监测,量出现急速下滑、甚至完全没有了
5、所有服务,尽量不要依赖三方,可以用,但是不要在业务流程的主线路上
总之就是,不要把不可控的事,放在你的主流程上。如果实在没办法,请一定要找个最靠谱的服务。
不要信任所有看起来很稳定的东西,请做好backup和监控。
不信的话,就等着悲剧吧……
领取专属 10元无门槛券
私享最新 技术干货