测试 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签测试

#测试

60年码龄的老程序员：别读agent的代码

用户11563501 2小时前2026-07-28 12:46:31

Uncle Bob Martin 写了快60年代码。他最近在网络上分享了一个操作，原话：

100

我把程序员全给「裁」了，然后用这套极蠢的做法，一个人干完了一个部门的活。。。

小机学AI智能体 2小时前2026-07-28 12:42:10

范围（做什么）+ 约束（用什么技术/已有代码）+ 完成标准（怎么算做完）三个缺一不可，否则 AI 会开始"发挥创意"，而那通常意味着你要多花两倍时间 debu...

100

AI 编程提效后，什么值得做

FunTester 2小时前2026-07-28 12:41:02

讨论 AI 编程时，最常见的问题是：它能让开发效率提升多少？是 20%、30%，还是翻倍？

000

龙虾的“超能力”，藏在每一次极致执行里

逍遥憩馆 2小时前2026-07-28 12:25:54

昨晚，傅盛一场关于AI智能体“龙虾”（三万）的直播，刷爆了科技圈和职场人的朋友圈。没有花哨的噱头，没有刻意的营销，全程围绕龙虾的真实执行场景展开，却让所有人直观...

800

Mirror：大语言模型元认知校准分层基准

CreateAMind 3小时前2026-07-28 11:10:24

我们介绍了 MIRROR，这是一个包含跨越四个元认知水平的八个实验的基准，旨在评估大型语言模型是否能利用自我知识做出更好的决策。我们使用五个独立的行为测量通道，...

400

Signal #22：代码生成越便宜，理解系统越稀缺

梯度不陡 3小时前2026-07-28 11:05:51

代码正在变得越来越容易生成和修改。一个任务可以在 Loop 中持续推进：测试失败后，Agent 会读取结果、继续修改并再次验证；多个 Agent 还可以围绕不同...

400

Claude Code、Antigravity、Codex三足鼎立：一线工程师该怎么选

AI智享空间 17小时前2026-07-27 21:26:16

2026年年中，AI编程Agent工具的格局已经相当清晰。Claude Code凭借深度代码理解在复杂重构场景站稳脚跟，OpenAI的Codex在年初完成了从“...

1200

Harness由浅入深：CI/CD流水线里的质量门禁怎么设计

AI智享空间 17小时前2026-07-27 21:25:57

做过几年持续交付的人大概都有过这样的经历：流水线跑了半天全绿，信心满满地点了发布，结果线上一上去就炸了。要么是某个边界用例没覆盖到，要么是第三方依赖出了安全漏洞...

2810

AI写代码为什么越改越乱？企业如何用约束驾驭Agent开发

heidsoft 17小时前2026-07-27 21:25:25

功能看起来都能用，代码也可能通过编译。但几轮对话以后，同一个概念出现两套命名，两条路由和三种默认值。下一位开发者已经说不清哪一个才是事实来源。

2710

AI 说“我做完了”，你敢信吗？

Henry Zhang 17小时前2026-07-27 21:07:27

和 AI 打交道时间久了，我有种感觉：AI 真正难的不是“会不会做”，而是“做完以后，我们敢不敢相信它”。

2500

经理不提需求，代码就不能改？

曹犟 18小时前2026-07-27 20:37:35

前两天在群里面，一个自己创业做 To B 业务的朋友吐槽：他们之前和一家兄弟公司合作做一项新业务，双方加起来只有几个人，做了大半年之后，内部已经基本用起来，也开...

1000

比 Boltz-2 快十倍: Nesso-1 的粗粒化共折叠路线

DrugIntel 18小时前2026-07-27 20:28:57

Nesso-1 是一个面向结合亲和力预测的粗粒化共折叠模型。它删除了 Boltz-2 一类模型中计算最昂贵的全原子扩散生成模块，用蛋白残基中心、配体重原子及其成...

2500

模型之上，工程为先：Agent 从会写代码到可控交付

Wangzy 22小时前2026-07-27 16:09:52

如果再严格一点，验证层可以分成四类：API 测试、功能验收、回归测试、工程验证。API 测试看功能正确性、权限控制和数据校验；功能验收用 Playwright ...

4100

传统代码评审为什么在AI时代失效？一个7层门禁方案

用户10377957 23小时前2026-07-27 15:27:55

他不是在赌运气。他后面跟了一长串条件：单元测试、Gherkin 验收测试、QA 流程、质量度量、变异测试、测试覆盖率……

600

YOLO26 vs RF-DETR默认训练配方，谁更适合工业小数据？

javpower 1天前2026-07-27 14:44:32

Stage-0 只做一件事：两边都用官方默认配方，同一数据、同一硬件、同一 held-out 测试，立下后续所有优化文章都要对齐的基线。

2100

开放词汇 0%，1 张标注也能翻盘？

javpower 1天前2026-07-27 14:25:50

这篇专门做「翻盘实验」：固定同一批 held-out 测试图，用 1 张 / 5 张金属条标注微调 YOLOv8s，看命中率能不能从 0 拉起来。

2400

定位之后，怎么判缺陷？PatchCore 在金属条上的无监督异常检测

javpower 1天前2026-07-27 14:21:38

25 正常训练 · 42 测试 · WRN50-2 · RTX 5060 Ti · 2026.07

2700

Agentic Coding 的监督机制

FunTester 1天前2026-07-27 14:17:19

例如，开发者可能会让 AI 生成一组单元测试，但仍然要判断这些测试是否覆盖了关键边界；会让 AI 修复一个 Bug，但仍然要确认修复是否破坏其他路径；会让 AI...

3510

理解 Agent 团队协作

FunTester 1天前2026-07-27 14:15:35

在 AI 编程工具刚开始普及时，大多数人的使用方式都很直接：向一个模型提出问题，然后等待它给出答案。比如让它写一个函数、解释一段代码、生成一个测试用例，或者帮忙...

3910

QE 落地：角色、门禁与指标

FunTester 1天前2026-07-27 14:05:32

质量工程强调共同负责，但责任必须具体到活动。产品人员负责澄清业务规则、异常路径和验收条件；开发人员负责单元测试、组件测试和可测试性；质量工程师负责风险模型、测试...

2900

#测试

60年码龄的老程序员：别读agent的代码

我把程序员全给「裁」了，然后用这套极蠢的做法，一个人干完了一个部门的活。。。

AI 编程提效后，什么值得做

龙虾的“超能力”，藏在每一次极致执行里

Mirror：大语言模型元认知校准分层基准

Signal #22：代码生成越便宜，理解系统越稀缺

Claude Code、Antigravity、Codex三足鼎立：一线工程师该怎么选

Harness由浅入深：CI/CD流水线里的质量门禁怎么设计

AI写代码为什么越改越乱？企业如何用约束驾驭Agent开发

AI 说“我做完了”，你敢信吗？

经理不提需求，代码就不能改？

比 Boltz-2 快十倍: Nesso-1 的粗粒化共折叠路线

模型之上，工程为先：Agent 从会写代码到可控交付

传统代码评审为什么在AI时代失效？一个7层门禁方案

YOLO26 vs RF-DETR默认训练配方，谁更适合工业小数据？

开放词汇 0%，1 张标注也能翻盘？

定位之后，怎么判缺陷？PatchCore 在金属条上的无监督异常检测

Agentic Coding 的监督机制

理解 Agent 团队协作

QE 落地：角色、门禁与指标

热门专栏

腾讯云中间件的专栏

WeTest质量开放平台团队的专栏

腾讯开源的专栏

腾讯云服务器团队的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐