微软DeepSpeed团队再度发力,推出v0.16.7版本!本次更新虽是小版本迭代,但包含多项关键修复与优化,尤其针对AMD GPU兼容性、DeepCompile稳定性及内存管理进行了重要升级,助力你的大模型训练更高效、更稳定!
📌 核心更新亮点
OpBuilder
中jit_load
的with_cuda
参数传递问题,确保CUDA依赖的算子正确编译加载。contiguous_grad_buffer
)的卸载逻辑,防止None
值引发错误,提升显存利用率。🔧 开发者必看细节
version.txt
以匹配0.16.6发布状态。💡 为什么你需要升级?
📢 立即行动
pip install --upgrade deepspeed
或访问GitHub仓库查看完整更新日志:DeepSpeed v0.16.7 Release[1]
[1]
DeepSpeed v0.16.7 Release:https://github.com/microsoft/DeepSpeed