开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何在生产环境中测试错误边界？

在生产环境中测试错误边界是确保系统在异常情况下能够正常运行的重要步骤。以下是一些常用的方法和技术：

异常输入测试：通过输入无效、不合法或超出预期范围的数据来测试系统的鲁棒性。例如，对于一个接受用户输入的表单，可以尝试输入特殊字符、过长的字符串或空值来测试系统的处理能力。
边界值测试：测试系统在边界条件下的行为。例如，如果一个函数接受一个整数参数，可以测试参数为最小值、最大值、边界值的前后值以及边界值的加减一等情况。
异常处理测试：测试系统对异常情况的处理能力。例如，模拟网络连接中断、数据库故障或其他外部资源不可用的情况，观察系统是否能够正确地处理并恢复。
负载测试：通过模拟高负载情况来测试系统的性能和稳定性。例如，增加并发用户数、请求频率或数据量，观察系统的响应时间和资源利用情况。
容错测试：测试系统在出现错误时的容错能力。例如，模拟硬件故障、软件错误或其他系统组件失效的情况，观察系统是否能够自动恢复或提供备用方案。
监控和日志分析：在生产环境中设置监控和日志记录，以便及时发现和分析错误边界的问题。通过监控系统的性能指标、错误日志和异常报告，可以快速定位和解决问题。

对于以上测试方法，腾讯云提供了一系列相关产品和服务，包括：

腾讯云云服务器（CVM）：提供可靠的虚拟服务器实例，可用于搭建生产环境和进行各类测试。
腾讯云云监控（Cloud Monitor）：提供全面的监控和报警功能，可监控服务器性能、网络流量、存储使用等指标。
腾讯云日志服务（CLS）：提供日志收集、存储和分析的能力，可用于记录系统的运行日志和异常信息。
腾讯云负载均衡（CLB）：提供高可用的负载均衡服务，可用于分发请求和增加系统的容量。
腾讯云弹性伸缩（Auto Scaling）：根据系统负载自动调整资源规模，确保系统在高峰期仍能正常运行。

以上是一些常用的方法和腾讯云相关产品，用于在生产环境中测试错误边界。通过综合运用这些方法和工具，可以提高系统的稳定性和可靠性，确保系统在异常情况下仍能正常运行。

相关搜索:mongoid如何为测试和生产环境创建索引生产环境中的Symfony缓存预热错误 Nuxt生产环境中存在404个错误在生产环境中请求验证错误，而不是在本地如何在生产环境中禁用Laravel Php单元测试 Composer install在生产环境中显示以下错误如何在Sylius中运行生产环境？如何在K8s中拥有开发/测试/证书/生产环境？如何在node.js中添加生产、开发和测试环境我的Android应用程序如何知道我是在生产环境中运行还是在测试环境中运行在生产环境中运行JUnit集成测试的最佳方式 Phoenix-framework :生产环境中的Mysql连接错误请求GET方法在本地获取镜像作品，而不是在测试/生产环境中，在直播环境中需要考虑什么？如何在生产环境中运行Tabler 如何在生产环境中实现Sinch 在测试环境中单击url会出现路由错误导出到.xls在开发环境中工作，但不在生产环境中工作/失败-网络错误单元测试中的错误多于生产代码中的错误 Spring框架如何保证测试代码不会在生产环境中执行？如何在Android应用程序中设置测试标志，以区分在测试环境和生产环境中运行应用程序？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

通过去中心化测试提升开发速度

正如我在最近的一篇文章中讨论过的那样，集中化测试会干扰开发者的速度。在以微服务为导向的模式中，集中化测试已成为发布流程中的一个“瓶颈”，因为开发代码和管理生产操作已经被有效地民主化并且它们的功能被隔离在更小的团队中。问题不在于工具本身。事实上，现代测试工具赋予团队惊人的能力，可以检测到以前会由最终用户发现的问题。问题在于太多问题没有在最终端到端(E2E)测试和验收测试之前被发现。

01

都是脏数据惹的祸

“还是数据问题！之前做的一个功能有一部分数据迁移工作没有做好，导致生产环境有脏数据，委托人的联系人已经不为该委托人服务了，应该移除掉的……”

01

开发高质量软件的5大原则

多少次的惨痛教训告诉我们，在软件应用发布维护版本或者补丁之前，应该避免使用其最新版本。虽然每个人都知道初始发布版本V和稳定发布版本V.n之间存在软件质量鸿沟，这个问题却一直没有得到解决。本文将会讨论5个具有可操作性的原则，以帮助开发团队跨越质量鸿沟 1. 使用代码覆盖率反映测试完整性软件测试的目的都是为了保证软件能在最终用户使用时是正常运行的。然而，软件测试面临着挑战，如何保证测试的完整性？很多开发组织会制定测试规程去匹配需求文档或者用户文档。这种测试方法可以验证正常操作路径，但是测试边界、错误场景都无

07

为复杂混沌的微服务生产环境设计韧性系统

阿里云在那天，至少挂半小时。“我们在运维上的一个操作失误，导致一些客户访问阿里云官网控制台和使用部分产品功能出现问题，引发了大量吐槽。”

02

生产环境中进行自动化测试

大多数功能测试用例和自动化测试用例在测试环境中以速度验证通过，但是很难保证这些用例在生产环境中具有相同的效果。特别是跨浏览器测试，则需要确保跨各种操作系统，运行在不同操作系统上的各种浏览器，浏览器版本无缝呈现Web应用程序。毕竟，在您实际进行生产测试之前，您可能永远都不知道用户会采用哪种鬼一样的搭配组合访问网站，对吗？

01

混沌工程实践

一个系统的复杂性往往是无法预知的，而且这种状态是很难琢磨，因为任何的系统总是在确定性的状态下存在一种不可预知的非确定性，这样的案例可以说是有很多的，比如XX城市的X系统由于网络故障导致系统不可用，可以说这样的案例太多。所以针对每个系统而言都是存在稳定状态和不稳定状态，很说明确的说混沌与不确定性是一回事。其实在系统的边界而言，或者是从系统最初设计以及保障角度而言，混沌状态它首先代表的是系统是处于一个稳定性的状态，只是系统在运行的过程中由于局部技术问题以及可能存在的全局技术问题导致系统出现不稳定的状态，虽然我们很清楚这种现状是客观存在并且可能是无法改变的，但是作为技术团队，需要站在系统的高可用，可靠性，稳定性等等角度，需要最大寻求系统的确定性以及让系统的运行始终在可以掌控的范围内。混沌工程的核心需要解决的是模拟现实中可能会出现的不可预知的情况以及本身客观存在的情况，比如网络故障，云服务器大面积出现瘫痪等情况了，那么在这种情况发生后，如何能够使用成熟的技术方案保障产品的可用性以及保存数据的完整性，而不至于在现实中真的出现该问题的时候表现的束手无策。

02

如何通过热图发现图片分类任务的数据渗出

文末GitHub链接提供了生成以下图片所需的数据集和源代码。本文的所有内容都可以在具有1G内存GPU的笔记本电脑上复现。

01

《SRE google 运维解密》读书笔记（五）

每个测试都有成本，通常来说单元测试时间成本低如果要将完整的功能架设起来测试，通常需要几个小时。关注测试成本，是软件提升效率的重要因素。

01

《SRE google 运维解密》读书笔记（六）

每个测试都有成本，通常来说单元测试时间成本低如果要将完整的功能架设起来测试，通常需要几个小时。关注测试成本，是软件提升效率的重要因素。

03

如何通过分解和增量更改将单体迁移到微服务？

服务迁移不是一个小更改。你必须搞清楚它是否真的能解决你的问题，否则你可能会创建一个会杀死你的、乱糟糟的实体。单体有不同类型，其中一些可能是有效的，足以满足业务需求。单体不是一个应该被杀死的敌人。微服务关乎独立部署。有一些分解和增量更改模式可以帮助你评估并迁移到微服务架构。当你开始使用微服务时，你会意识到随之而来的是一系列非常复杂的挑战。所以不应该将微服务作为默认选择。你得仔细考虑它们是否适合你。

01

基于Devops的厘米秀项目实践经验分享

基于现在研发变革的大背景，可能需要每个技术同学有更多的新思路特别是在测试方面会接受比较大的挑战，上半年在思考如何能更好让手头上的工作跟公司的整体相契合，一直没有很好的思路或者方向。在前辈的相关引领和沟通下，参加了一些介绍课程和评委工作对devops有了初步了解，也强迫自己学习一些理论并开始一步一步的展开实践。此文章主要是跟大家介绍下devops的理论和具体项目的实践开展过程，希望给其他同学有一些帮助和引导。

01

K8s Clinic：如何安全高效地运行 K8s

随着容器的应用，软件打包越来越左移，这意味着（取决于我们的团队组织）开发人员正在承担应用程序容器化的责任。开发人员可能还负责 Kubernetes 配置的某些部分。随着该流程向左转移，开发人员需要支持才能为组织做出正确的决策，以便安全高效地运行 Kubernetes。

06

Vue环境变量配置指南：如何在开发、生产和测试中设置环境变量

Vue.js是一个流行的JavaScript框架，它提供了许多工具和功能来帮助开发人员构建高效、可维护的Web应用程序。其中一个重要的工具是环境变量，它可以让你在不同的环境中配置不同的参数和选项。在这篇博客中，我们将介绍如何在Vue应用程序中设置环境变量，以及如何在开发、生产和测试环境中使用它们。

07

Trifork 公司如何利用NVIDIA Jetson减少机场的行李延误

世界各地的机场每天都有成千上万的行李丢失，但 CPH 机场希望找到一种更节省成本和时间的方法来优化他们当前的行李跟踪基础设施，从而确保乘客的旅程更加顺畅。

01

K8s Clinic：如何安全高效地运行 K8s

随着容器的应用，软件打包越来越左移，这意味着（取决于我们的团队组织）开发人员正在承担应用程序容器化的责任。开发人员可能还负责 Kubernetes 配置的某些部分。随着该流程向左转移，开发人员需要支持才能为组织做出正确的决策，以便安全高效地运行 Kubernetes。

05

JavaScript 应用程序中的有效错误处理

了解 JavaScript 中的错误处理是非常重要的，它有助于提升用户体验并简化开发人员的调试过程。在这篇文章中，我们将探讨 JavaScript 应用程序中的错误处理的各个方面，包括常见错误、处理策略以及确保顺利运行的最佳实践。

00

Spring Boot(04)：让你的Spring Boot应用“火力全开”，从零开始学习starter

Spring Boot是一款非常流行的Java开发框架，其具有快速开发、自动化配置、内嵌服务器、易于扩展等特点，因此备受开发者欢迎。在日常开发中，我们经常需要在不同的环境中进行测试和部署，此时，如何实现开发、测试、生产环境的快速切换，成为了我们需要解决的问题。本文将介绍如何使用Spring Boot的starter入门，以及如何轻松实现开发、测试和生产环境的切换。

03

推进微服务落地的 7 个步骤

微服务实施常被忽视的 5 个难点中描述了实施微服务常见的主要阻碍。本文针对前文提到的5个难点提出了 7 个步骤。每个步骤分别包含了管理和技术两方面的建议。

02

浅析：如何构建稳定的系统

作者：Jesper L. Andersen 原文：How to build stable systems 译者：孙薇准备工作第一个决策是最简单却最为重要的，属于意识形态的一种：那就是软件是由开发者控制的。开发者需要控制软件，而不是反过来，让管理者、产生负责人控制软件。唯一能控制软件的人就是编写它们的人。第二个决策就是必须拥有能够掌控的小型工作单元。先解决整个问题的一小部分，并部署到生产环境中，显然比让整个大型项目挂掉要好得多。将初期的小型工作单元作为后面探索的测试平台。开发者有责任一直掌控软件，

06

前端老手 10 年心得，JavaScript/TypeScript 项目保养实用指南

有时候，JavaScript（甚至带有类型检查的 TypeScript）会因为其不可预测的特性和缺乏约定而遭到批评。对于那些知道 JavaScript 是为 web 浏览器设计的脚本语言的人来说，这就不足为奇了。

01

从一次数据迁移项目里，我得到的四个经验教训

不久前我经历了一次数据迁移项目。前几天，我跟一位架构师探讨了一下当时的各个步骤，和我所选择并进一步开发的解决方案。我觉得我应该告诉他一些信息，避免他日后迁移数据时踩坑。

03

【Python】已解决：WARNING: This is a development server. Do not use it in a production deployment. Use a p

已解决：WARNING: This is a development server. Do not use it in a production deployment. Use a production WSGI server instead.

01

译《On Designing and Deploying Internet-Scale Services》

“系统-管理员”的比例通常粗略的作为了解大规模服务中管理成本的指标。在低自动化水平的服务中这个比例可能低到2:1，而在行业领先的高度自动化的服务中，这个比例可以达到2500:1。在微软的众多服务之中，Autopilot经常被认为是Windows Live Search团队成功提高“系统-管理员”比的原因。自动化管理非常重要，但更重要的还是服务本身。服务是否能高效的进行自动化？是否是运维友好的（operations-friendly）？运维友好的服务几乎不需要人工的干预，除了极个别的故障外其他情况都可以被自动的检测并恢复。本文总结MSN和Windows Live在支撑一些超大型服务过程中多年积累下来的最佳实践。

02

前端工程师生产环境 debugger 技巧

开发环境 debug 是每个程序员上岗的必备技能。生产环境呢？虽然生产环境 debug 是一件非常不优雅的行为，但是由于种种原因，我们又不得不这么干。

04

我在实施蓝绿部署后遇到的问题和解决方法

前几周，我被迫拒绝“批准”了 GitLab 项目的合并请求。我不喜欢他们提出的解决方案，即，对我们的应用程序代码库进行特定的更改，以支持蓝绿发布。它向我发出了一个代码更改的警告：将部署与代码绑定了；在环境应该是不可见和可互换的情况下，以编写代码来支持环境。创建这些类型的依赖将我们与特定的平台和发布方法绑定了，而额外的代码会导致各种可能的缺陷和错误，这些缺陷和错误可能会因环境而异，因此极难测试。

04

CrystalNet：超逼真地仿真大型生产网络

译者注：在第26届ACM年度操作系统和原理研讨会上，微软介绍了一种名为CrystalNet的新技术，这是一种高保真、云规模的网络仿真器。CrystalNet由微软花费两年时间构建，在公示时，其已在微软内部应用6个月时间。本论文为CrystalNet发表的学术研究成果中文翻译版，仅供学习研究之用。后续微软曾公开表示要将CrystalNet开源，并更名为Open Network Emulator（ONE），目前尚无正式开源的日程计划。

04

企业快速创新公式——用友YonBIP ｜ Q推荐

根据埃森哲发布的《2020 中国企业数字转型指数研究》，中国企业数字转型指数整体得分升至 50 分，2020 年，转型成效显著的领军企业占比由 2018 年的 7% 上升到 11%。在企业如火如荼的数智化转型过程中，我们发现技术架构成为了企业生产力提升的瓶颈。企业往往会面临各种各样的难题，比较共性的问题是在处于跨平台异构环境中的数据难以打通，存在数据孤岛问题；面对不可预测的访问需求、高并发场景时，企业 IT 架构往往无法快速扩展，承接瞬时并发的流量；在竞争激烈的市场环境中，为了更高效的服务客户，企业往往

01

在生产环境中重新思考测试

在生产环境中进行测试长期以来一直被认为是一项风险较大的尝试，经常在开发人员、测试人员和利益相关者之间引起争议。

01

4.17-线上-技术沙龙问题汇总答疑

本周六晚受邀，参加了由数列科技主办的线下直播技术沙龙——高可用&性能技术沙龙。分享过程中，参与沙龙的同学们提了很多问题，碍于很多问题口头描述解释不清，因此写了这篇文章，对这些同学提出的问题做一个解答。当然，回答仅限于我个人的角度，仅供参考。

05

从服务混乱到服务网格

嘉宾文章作者：Rob Richardson（@rob_rich），技术布道者，MemSQL；KavyaPearlman（@KavyaPearlman），全球网络安全策略师，Wallarm

01

混沌工程中数据库调用延迟

混沌工程的核心是通过实验的方式来验证系统在稳定下下它的不稳定性，从而通过混沌工程实验的方式来模拟这种情况并给出合理的解决方案，所以它最重要的不是混沌实验，而是实验背后的解决方案。业内最早实践混沌工程的公司是Netfix，混沌工程具体它的定义为：“混沌工程是一门在系统上进行实验的科学，目的是建立系统抵御生产环境中失控情况的能力以及信心”。比如在生产环境中数据库的实例突然瘫痪，云服务器的实例突然消失以及底层服务出现雪崩等等一系列的故障情况下，这个时候整个系统层面需要考虑的是出现这种极端以及很平常的故障下，如何使用技术的手段来保障系统依然能够给客户提供价值从而保障系统的可用性，特别是在分布式架构下服务复杂的调用链以及涉及众多中间件，更加需要考虑在异常的情况下系统的伸缩性和高可用性。

03

支付功能、支付平台、支持渠道如何测试？

有学员提问：作为一个支付平台，接入了快钱、易宝或直连银行等多家的渠道，内在的产品流程是自己的。业内有什么比较好的测试办法，来测试各渠道及其支持的银行通道呢？

02

如何在两个OpenShift集群间迁移有状态应用

Portworx是一个支撑K8S有状态应用的持久存储和数据管理平台。通过Portworx，它为有状态应用提供了一个单一的数据管理层，从而用户可以在任何底层架构上运行类似数据库这样的有状态应用。

03

John Willis：Docker 与实现 DevOps 的三种方式

作者简介 John Willis，Docker 布道师，已经在 IT 管理行业浸淫 30 余年，之前在 Socketplane（被Docker 收购）和 Enstratius（被 Dell 收购）担任解决方案副总裁。他创建了 Gulf Breeze Software，专注于为企业部署 Tivoli 技术。他著有 6 本 IBM Redbook，也是 Chain Bridge System 的创始人和首席架构师。

04

机器学习工程化，企业 AI 的下一个起点

作者 | Tina 机器学习在行业中的应用变得越来越流行，从而成为了软件开发的常规武器。行业的关注点，也逐渐从机器学习能做什么，过渡到如何有效地管理机器学习项目的交付流程上来。然而相对于传统软件开发，例如 Web 服务或者 Mobile 应用来说，这类程序的开发、部署和持续改进也更加的复杂。但好在经过不断的实践，行业总结出了一套敏捷的工程化流程，供大家在持续交付时遵循和参照。在 Thoughtworks 技术雷达峰会上，徐昊就《机器学习的工程化》发表了主题演讲，InfoQ 也借此机会对徐昊进行了采访，

02

生产环境下的Docker：成功、挫败和教训

Docker在2014年迎来了迅猛的发展，不过在年底传出了围绕Docker的一些声音，声称容器服务基础设施已达到了准备用于生产环境的程度。今年，Gartner等调研公司已经列出了Docker部署到企业中分布式应用程序中的安全挑战，不过都相当支持Docker总体的发展方向。新年伊始，已经出现了好几个例子，它们证明了使用容器以便持续改进和日常部署在生产环境中的准备就绪状况。用户们的体验不一而足：有的用户坚信可以使用Docker大规模部署分布式Web应用程序;有的用户已把Docker整合到生产环境中;有的用户决

08

生产环境权限管理参考方案

当应用系统经过多个安全团队加固、护网评审后，终于堵上了安全漏洞，防住了外面黑客，大家以为可以高枕无忧了。

04

后端工程师都应该知道的最佳实践

《On Designing and Deploying Internet-Scale Services》是一篇非常经典的论文，例举了设计和部署互联网规模的服务要注意的方方面面，其核心内容是自动化、轻依赖、可监控且信息准确、可应急。

02

DBA生存警示：主备环境误操作案例及防范建议

编辑手记：对于资深的老DBA们，他们在漫长的职业生涯中养成了很多稀奇古怪的守则，以在复杂多变的环境中“幸存”，这源于无数血泪的教训，我曾经在《数据安全警示录》一书收录了大量现实案例，现在整理分享给大家

07

vue2本地开发环境正常，生产环境下this.$router.push({ name: ‘login‘ })不跳转

如果在Vue.js 2中在本地开发环境下正常运行，但在生产环境下使用this.$router.push({ name: 'login' })不起作用，可能有几个原因需要检查和解决：

00

Netflix正在搞的混沌工程到底是什么？终于有人讲明白了

导读：与任何新概念一样，混沌工程时常被误解。本文会探讨混沌工程是什么以及不是什么。

04

预上线环境失败的原因

经常会发生这样的情况：尽管拥有测试环境的测试，但最终未能从中完全避免在生产环境发现BUG。不禁让人思考：质量检查环境中出了什么问题？为什么在测试环境中已经完全通过的新功能在迁移到生产后又出现BUG？

04

npm run dev启动报错：TypeError: Cannot read property 'upgrade' of undefined

描述：给vue项目增加了本地代理，也就是给vue.config.js增加了devServer之后，启动项目报错：Vue ERROR TypeError: Cannot read property ‘upgrade’ of undefined

01

使用 Rust 极致提升 Python 性能：图表和绘图提升 24 倍，数据计算提升 10 倍

Vortexa 公司的首席 GIS 工程师。不写代码的时候，他忙着跑步机、山地自行车、建筑、修理东西，以及油画。

03

灰度发布，链接 Dev 与 Ops 的正确姿势

序言在软件吞噬时间的时代，在IT基础设施多样性与分布式趋势中，部署的复杂性与规模日益增加，而大部分的软件崩溃都发生在部署过程中。目前提高部署效率与稳定性成为了一个严峻的挑战。本文讨论在原生云应用的场

生产环境出问题了,研发要不要罚钱？

这是一个很常见也很有意思的一个话题, 在不同的角度看待这个问题都能得到不同的结果, 公有公的理婆有婆的理。大多数公司都是采用罚款的制度, 我之前经历过的公司也不例外,

04

单元测试、日志与Debug: 如何有效地定位问题

测试是软件开发过程中至关重要的一部分。它有助于保证我们的代码能够正常工作，并且可以检测出代码中的错误和问题。其中，单元测试和集成测试是两种非常常见的测试方法。

01

打造企业级自动化运维平台系列（二）：DevOps、CI、CD、CT 详解

一个软件从零开始到最终交付，大概包括以下几个阶段：规划、编码、构建、测试、发布、部署和维护，基于这些阶段，我们的软件交付模型大致经历了以下几个阶段。

01

ZLJ卖场-全链路压测演进

原ZLJ卖场的压测流程，是依托于阿里云PTS工具，团队自身缺乏性能测试能力自建，缺少性能分析和数据沉淀，测试场景单一，只有单接口和多接口压测，缺少场景和链路压测，不能相对合理的评估系统性能承载能力，机器扩容只凭借经验进行增加调整，缺乏评估依据。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭