我们都在使用敏捷开发,敏捷测试,维护着我们的项目,我们写着少量的 test case,甚至不写一条 case,敏捷宣言其中一条原则是工作的软件 “高于” 详尽的文档,详解文档包括各种计划书,总结报告,详尽测试用例等,我们将大量时间用在自动化测试以及手工探索性测试上面,而我们的用例则以 BDD 形式存在于代码之中,这样来帮助尽可能早的发现问题。
但最近我发现几个客户在质量问题,存在一些共性,这些基于黑盒测试的项目在测试过程中存在以下几个共同的问题:
(1)大量的黑盒测试用例,有的项目甚至用例数超过 5w,测试工作大都是手工为主,受主观人为因素影响太大:每次版本发布,QA 全凭个人经验来确定改动对系统影响范围,通常情况,要么测试范围定小了,造成漏测,要么测试范围过大,付出的代价过高,造成项目不能如期按时交付。
(2)代码与测试没有数据可衡量:没有单元测试,其他类型测试对代码覆盖程度,质量高低,没有数据能够衡量,例如我们说 api 测试覆盖率是 100%,这个数据大多都是根据用例业务场景估算出的。QA 只能增加更多的黑盒测试,而实际功能测试覆盖率随着时间和用例增多,便会触达覆盖率的天花板,更多的是重复的无效测试。
(3)自动化测试无法发挥作用:对于 web/api 或 app 后端服务系统,测试人员对除手工测试外,我们将大量的时间与精力投放在 api 接口测试的实现上,随着项目的迭代,自动化用例积累越来越多,从几百到上千,这时候我们需要考虑测试稳定性,运行时长,大量重复测试场景与代码,整个测试 ROI 并不是随着用例数增多而上升,反而维护和排查问题成为 QA 日常工作的重担,疲于应付,没有精力将时间投入到更有用的探索性测试和分析工作中,进而造成 bug 频出,整个团队便对自动化失去信任,直至废弃,这也是很多传统行业无法规模化实施敏捷测试原因之一。
那么如何帮助团队树立信心,准确定位到变更影响的范围?精准测试。这个概念是最近几年逐渐兴起的话题。
定义:利用技术手段对测试过程产生的数据进行采集存储,计算,汇总,可视化最终帮助团队提升软件测试的效率、并对项目整体质量进行改进和优化的这一系列操作。通俗点讲:核心基于源代码变更分析,结合分析算法,确定影响范围,提升测试效率。精准测试并没有改变传统的软件测试方法论,只不过是帮助我们将测试用例与程序代码之间的逻辑映射关系建立起来, 而这个过程则是通过算法和工具去采集测试过程执行的代码逻辑及测试数据,在测试过程加入采集过程,形成正向和逆向的追溯。
上图是我基于业界通用精准测试架构画出的架构图与流程图。这套精准测试架构既可以用作手工测试,也可用在任意自动化测试上。整个架构分为以下几部分:
目前建立用例与代码之间的关系通过统计调用产生的覆盖率与路径进行关联。
目前通用的解决方案是利用 Jacocoon-the-fly 模式基于 On-the-fly 方式无须入侵应用服务代码,启动脚本时,只需在 JVM 中通过 -javaagent 参数指定 jar 文件以启动 Instrumentation 的代理程序,该代理程序通过 Class Loader 装载一个 class 前判断是否需要注入 class 文件,再将统计代码插入 class ,测试覆盖率分析就可以在 JVM 执行测试的过程中完成。Jacoco 提供了自己的 Agent,完成插桩的同时,还提供了丰富的 dump 输出机制,如 File,Tcp Server,Tcp Client。
覆盖率信息可以通过文件或是 Tcp 的形式输出。通过外部服务在任意机器上通过 api 请求获取被测程序的覆盖率与执行路径。对功能测试用例,我们可以通过执行单个用例,经过上述步骤后拿到该条用例影响代码的覆盖率与执行路径。在通过关联服务,将具体用例的 ID 与生成的覆盖率信息(类,方法,行等)建立映射关系,最后将关联数据存到数据库中保存。基于 Jacocoon-the-fly 模式获取单个用例覆盖率建立映射关系的流程如下:
以上是基于 java 语言来关联用例与代码直接的关系,前端也有类似原理的工具,利用 istanbul-middleware 也可以实现同样的功能,具体请查阅一下这两篇文章,这里不再复述。
利用 AOP 原理,在自动化框架的执行器加一个拦截器,在覆盖率收集开关打开时,请求执行前,这个过程类似于测试框架中的 before hook:reset 被测服务桩数据,也就是上一次测试产生的 dump 文件,请求执行后,这个过程类似于测试框架中的 after hook:用 api 导出内存中的覆盖率数据,我们利用反射拿到用例方法名,利用关联服务将之与对应的 dump 结果关联起来,实现自动插桩功能,快速帮助我们建立自动化用例与覆盖率之间的关系。
在测试前先对文件进行插桩,然后生成插过桩的 class 或 jar 包,测试插过桩 的 class 和 jar 包后,会生成动态覆盖信息到文件,最后统一对覆盖信息进行处理,并生成报告。Offline 模式适用于以下场景:
我们有了代码与用例直接的关系的映射,我们需要将之用在开发流程中,首先我们需要得知我们的改动是什么,最直接的是通过 git diff 得知具体改动代码,但过于繁重,且太多干扰例如注释,空行等,最好的方法是实现比对算法,经过降噪处理,消除干扰,进而拿到处理后变更数据。
我们有了用例与代码之间的关系映射,有了提交增量代码差异记录,就可以实现逆向回溯。利用代码的差异,通过查询服务就可以在上面提到关联关系数据库中反推影响的用例,以及上层的业务。这样可以帮助 QA 快速划分测试范围,减少过度测试。
但事物总是存在对立面的,获得巨大的收益同时,必然相应的存在缺点。否则也应当像 UI 自动化测试一样流行于各个公司以及团队中。
精准测试不是银弹,需要巨大的投入,用的好,能够成倍的提升质量,生产效率,用不好的话,就成了领导的 KPI 项目,弃之可惜,食之无味,鸡肋也。
作者介绍:
齐磊,前 Thoughtworks 高级质量分析师,现任 HSBC 测试咨询专家,擅长敏捷测试,测试开发,devops 等领域。
本文转载自:ThoughtWorks 洞见(ID:TW-Insights)
原文链接:精准测试二三谈
领取专属 10元无门槛券
私享最新 技术干货