首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >2核2G服务器跑270M LLM模型[测试]

2核2G服务器跑270M LLM模型[测试]

作者头像
MGS浪疯
发布2026-02-07 00:08:07
发布2026-02-07 00:08:07
1930
举报
概述
本文通过多组压力测试,系统评估了轻量级大语言模型 `gemma3:270m` 在 2 核 2GB 低配云服务器上的推理性能与并发承载能力。结果表明:单并发下模型运行稳定,但并发数超过 5 时延迟急剧上升、生成速度骤降,100 并发直接导致服务不可用。测试为资源受限环境下的 LLM 部署提供了实用参考。
文章被收录于专栏:MGS浪疯 BlogMGS浪疯 Blog

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档