首页
学习
活动
专区
圈层
工具
发布

#zero

DeepSpeed v0.19.0 重大更新:训练稳定性、ZeRO、FPQuantizer、DeepCompile、Sequence Parallelism 全面增强,20 位贡献者带来 28 次提交

福大大架构师每日一题

如果你正在关注 DeepSpeed 的最新版本,那么 v0.19.0 绝对值得重点解读。 这次更新覆盖范围非常广,从 版本号更新、Transpose 重构、进程...

15110

Agent Zero:你的AI“数字分身”,一个会自我进化的个人智能体框架

沈宥

在AI领域,我们已经习惯了向模型提问并获得答案。但如果我们能拥有一个真正理解我们、能代表我们行动、并在过程中不断学习成长的“数字分身”呢?

18310

unity给物体添加可以包裹所有子物体的BoxCollider

用户12298955

8010

25:Few-Shot到Zero-Shot的自动化转换技巧

安全风信子

作者: HOS(安全风信子) 日期: 2026-04-02 主要来源平台: GitHub 摘要: 本文深入探讨Few-Shot到Zero-Shot的自动化...

13510

三星Zero-ETL:计算下沉存储,告别数据搬家

数据存储前沿技术

在大数据和AI时代,海量数据如洪水般涌来,你是否还在为传统ETL流程中数据反复跨网络传输的I/O瓶颈和天价TCO买单?三星Zero-ETL架构横空出世,以“近数...

15710

DeepSpeed v0.18.8 发布:稳定性、Evoformer、多架构构建与ZeRO优化全面升级详解

福大大架构师每日一题

DeepSpeed v0.18.8 于 2026 年 3 月 13 日 正式发布,这是一次以“修复问题 + 提升稳定性 + 改善开发与构建体验”为核心目标的补丁...

34110

神器分支OpenClaw-Zero-Token,告别 Token 账单

灬沙师弟

在 AI 开发领域,API Token 费用始终是绕不开的成本痛点——学生党尝鲜怕超支、中小企业高频调用成本高、个人开发者长期投入压力大。

2.4K22

优化DeepSpeed ZeRO,让大模型训练更经济

用户11764306

现代自然语言处理应用大多建立在预训练语言模型之上,这些模型编码了整门语言的词序列概率。随着时间的推移,这些模型变得越来越大,达到数十亿甚至数万亿参数的规模。在合...

24510

DeepSpeed v0.18.5 发布:PyTorch 2.9 适配、ZeRO-3 优化与多项关键修复全面升级!

福大大架构师每日一题

2026 年 2 月 1 日,DeepSpeed 官方团队正式发布 v0.18.5 版本。本次更新带来了大量功能改进与稳定性增强,进一步完善了在多设备(尤其是 ...

81710

ZeRO-offload内存卸载|CPU内存不该"躺平"

AI老马

zero-offload 主要结合了zero-2的训练策略,每个GPU上保留一份参数副本,将梯度和优化器分片后,由不同的GPU进行通信和更新。

42210

大模型训练|ZeRO三阶段显存"压榨"指南

AI老马

混合精度训练过程中显存占用主要来自参数、梯度、优化器和中间激活值。仅参数、梯度和优化器占用内存为参数量的16倍,假如全参训练一个7.5B的模型,至少要120G的...

45810

大模型-零冗余优化器zero

AI老马

在训练过程中显存的用一般是四部分组成参数,梯度,优化器和中间激活值,前三项和参数量的的关系约为16倍。假如一个3B的模型,至少要48G的显存,加上中间激活着占用...

23110

ZeRo零冗余优化器参数更新过程和通信量计算

AI老马

策略:将模型的梯度和优化器状态进行分片。每个GPU上,保存一份完整的参数副本,以及分片后的梯度和优化器状态。

24010

Zero-Drift Op 在精密小电流中采集的优势

云深无际

下面那个 RSENSE = 1kΩ 串在负载回路的地线上,是一个 低端电流采样电阻。(这个低端的意思是一段接在地)

26010

解决MySQL-sql_mode=only_full_group_by报错

用户4128047

具体报错:[Err] 1055 - Expression #1 of ORDER BY clause is not in GROUP BY clause and...

56610

go-zero v1.9.3 版本更新:一致性哈希负载均衡、gRPC优化、链路追踪修复、ORM完善等重要提升

福大大架构师每日一题

go-zero 发布了 v1.9.3 版本,本次更新在可靠性、性能以及与行业最佳实践的对齐方面做出了多项重要增强。包括一致性哈希负载均衡器、gRPC 连接默认行...

30710

DeepSpeed v0.18.1 发布:新增 DataStates 异步检查点引擎,优化 Zero 优化器与存储共享机制

福大大架构师每日一题

DeepSpeed v0.18.1 在性能优化、功能扩展与稳定性方面进行了多项改进,尤其在优化器灵活性、学习率控制、检查点引擎以及 HF Accelerate ...

44010

DeepSpeed v0.18.0 更新详解:DeepCompile、SuperOffload 与 ZeRO 优化全面升级

福大大架构师每日一题

DeepSpeed 发布了 v0.18.0 版本,本次更新在分布式训练性能优化、内存管理、日志系统、模型检查点等方面进行了大量改进和修复,重点增强了 DeepC...

42810

go-zero v1.9.2 发布:修复 go-redis 依赖版本回撤问题,提升阻塞型 Redis 操作的稳定性

福大大架构师每日一题

在 2025年10月11日,go-zero 发布了 v1.9.2 版本。本次更新并没有带来新的功能或重大改动,而是针对一个关键依赖问题进行修复,目的是保证整个项...

22010

go-zero v1.9.1 发布:日志增强、REST/SSE稳定性优化及性能提升详解

福大大架构师每日一题

2025年10月2日,go-zero 正式发布了 v1.9.1 版本。本次更新带来了日志系统的增强、REST/SSE 的稳定性与可操作性的改善、诊断能力提升以及...

25310
领券