“如果某个实体表现出以下任何一种特性,它就具备自主性:自我修复、自我保护、自我维护、对目标的自我控制、自我改进。” —— 凯文·凯利
iOS App 有时可能遇到启动必 crash 的绝境:每次打开 App 都闪退,无法正常使用App。
为了尝试解决这个问题,微信读书开发了 iOS 连续闪退保护工具:GYBootingProtection,检测连续闪退,在连续闪退出现时,尝试自修复 App:
本文探讨了连续闪退问题的产生原因、检测、修复机制,以及如何在你的项目中引入、测试和使用 GYBootingProtection。
首先要检测用户 App 出现了连续闪退的情况,有两种检测方法,捕获异常和计时器。
检测连续闪退,可以通过捕获异常来实现,异常有以下种类:
在念茜的漫谈 iOS Crash 收集框架一文中详细介绍了 Mach 异常和 Unix 信号捕获 crash 的机制。简单来说,异常一般产生自 iOS 的微内核 Mach,然后在 BSD 层转换成 UNIX SIGABRT 信号,以标准 POSIX 信号的形式提供给用户。NSException 是使用者在处理 App 逻辑时,用编程的方法抛出。
通过以下方法捕获异常:
Crash 上报工具如 PLCrashReporter 通过注册 Mach 异常 + UNIX信号 的 handler 达到检测的目的,对用户提供了处理异常的接口。
可以利用 PLCrashReporter 这类工具来检测连续闪退:
通过 Mach 异常、Unix 信号、NSException 异常来检测闪退,能获得更多的 crash 上下文,但由于 crash 收集框架多使用这些方法,可能会有这样的风险:与第三方 crash 收集框架冲突导致漏检测。另外,可能会与 App 已有的异常处理代码产生耦合。
除了通过捕获异常的方式检测连续闪退,还可以通过计数器方法来检测:
而计数器方法逻辑简单,与原有的代码耦合小。虽然有误报可能(在启动后立即被 kill 掉,误认为 crash),但是可以通过设置阈值来减小误报的误报率。
综上权衡,我们使用计时器方法检测连续闪退。
如果你的项目使用了 crash 收集框架,把源代码中的 [GYBootingProtection addCrashCount]
移动到 crash handler
,即可实现捕获异常方法计数。
检测到连续闪退后,接下来要尝试对闪退进行修复,这里先分析可能的闪退原因,再结合微信读书的例子说明修复流程。
连续闪退,可能是 App 启动关键路径中执行了必 crash 的代码,原因可能有:
@try...catch
,损坏文件会抛出 NSException
导致 crash-objectAtIndex
方法会产生 crash: unknow selector send to object;
,或返回破损的 Tar 包,在解压失败导致 crash。针对 1,可以通过工具修复数据库,或者删除 DB。针对2,可以删除文件来进行修复。对于 3 和 4,我们需要具体地分析 crash 案例,通过 JSPatch 来进行修复。
为了应对上述导致连续闪退的原因,微信读书的修复流程为:
这里是为了解决上述第4点 - 代码 bug 导致的闪退,使用 JSPatch [github]可以进行热修复。在 didFinishLaunching 时,会卡住界面发请求检查是否有可用的 JSPatch 脚本,如果有则加载执行,解决代码 bug 导致的闪退。
Documents
/ Library
/ Caches
目录下的所有文件这里直接删除了所有用户数据,适用于微信读书这种所有数据都在云端,删除后可以完全从云端恢复。如果你的 App 不属于这种场景,那么应该在 repairBlock 中自定义修复逻辑,比如:
a. 不删除文件,只修复数据库 b. 修复前把用户数据备份到云端 c. 收集 crash 样本,查明原因,定制 JSPatch 修复补丁并下发
连续闪退检测 + 保护流程如图所示:
检测和连续 crash 并修复需要修改原 -application:didFinishLaunchingWithOptions:
逻辑,有几种方法:
-application:didFinishLaunchingWithOptions:
方法。SubAppDelegate
类来继承 AppDelegate
,覆盖 -application:didFinishLaunchingWithOptions:
方法,然后把 main()
函数中的 AppDelegate
替换为 SubAppDelegate
AppDelegate
扩展,然后用 method swizzle 的方法替换 -application:didFinishLaunchingWithOptions:
方法。上述三种方案,对现有项目改动代价是 1 > 2 > 3。因此,我们使用对源码修改代价最小的方案 3 来替换 -application:didFinishLaunchingWithOptions:
。
检测的逻辑 GYBootingProtection 已经处理好,修复的处理预留了接口,可以由用户自定义,把自定义的修复流程传入 repairBlock 即可。
src
目录下所有文件拖拽到你的 Xcode 项目
AppDelegate+GYBootingProtection.m
的 onBeforeBootingProtection
方法中添加检测前需要执行的代码,比如设置crash上报:
12345678910 | - (void)onBeforeBootingProtection { [GYBootingProtection setLogger:^(NSString *msg) { // setup logger NSLog(@"%@", msg); }]; [GYBootingProtection setReportBlock:^(NSInteger crashCounts) { // setup crash report }];} |
---|
onBootingProtection
方法中添加修复逻辑,比如删除文件:
1 2 3 4 5 6 7- (void)onBootingProtection { // 检查 JSPatch 更新 ... // 删除 Documents Library Caches 目录下所有文件 [GYBootingProtection deleteAllFilesUnderDocumentsLibraryCaches]; ... } 如需执行异步的修复逻辑,在 onBootingProtectionWithCompletion:
方法添加修复逻辑,并在完成修复后调用 completion :
1 2 3 4 5 6 7 8- (void)onBootingProtectionWithCompletion:(BoolCompletionBlock)completion { [self onBootingProtection]; // 异步修复 [self asyncRepairWithCompletion:^(void) { // 正常启动流程 if (completion) completion(); }]; } 启动后 5 秒内,双击 Home 通过上划手势 kill 掉 App,重复多次。(也可以在代码里人为制造crash)