

2025年9月26日,lmdeploy v0.10.1 正式发布。本次更新为开发者带来了包括 ROCm 支持、FP8(B)F16 GEMM、GLM-4.5 兼容* 在内的一系列新功能,同时在性能优化、Bug 修复等方面也有明显提升。以下是本次版本的详细更新内容。
stop_str,方便控制输出边界。include_stop_str_in_output 时,返回最后一个 token 的 logprobs、logits 和 last_hidden_states。lmdeploy v0.10.1 在新功能扩展、性能优化和兼容性方面均有显著提升。特别是新增了 ROCm 支持,让 AMD GPU 用户也能高效使用,同时针对 GLM-4.5、InternVL3.5-Flash 等最新模型的兼容为开发者提供了更多选择。本次更新还修复了多个潜在问题,并完善了安装指南与依赖配置,进一步提升了部署与推理的稳定性与易用性。
我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。