首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >可本地部署使用的大模型显存资源估算工具

可本地部署使用的大模型显存资源估算工具

作者头像
AlphaHinex
发布于 2025-02-19 15:53:11
发布于 2025-02-19 15:53:11
23700
代码可运行
举报
文章被收录于专栏:周拱壹卒周拱壹卒
运行总次数:0
代码可运行

🤗 Model Memory Calculator[1]🤗 Accelerate[2] 库提供的一个模型显存计算工具,可估算模型训练或推理时所需的显存大小。

但目前该在线工具无法正常使用,即使使用默认的模型名称,也会报在 Hub 中无法找到该模型:

在该 space 的 discussions[3] 中也有不少人遇到了此问题。

本文提供一种本地化部署运行此工具的方法,还可通过指定 HF_ENDPOINT 避免无法访问 Hugging Face 的问题。

本地部署

hotfix 版本

直接部署 https://huggingface.co/spaces/hf-accelerate/model-memory-usage/tree/main 中的内容会遇到一些问题,可使用 hotfix[4] 分支的版本,主要改动内容如下:

  1. requirements.txt 中增加 gradio==4.43.0 依赖。使用 README.md[5] 中设定的 Gradio SDK 版本 4.36.0 可能会遇到 与 pydantic 版本不匹配导致的报错[6],故升级至 4.43.0 版本。
  2. 修改 src/app.pyget_results 方法,修复官方应用中无法在 Hub 中找到模型的问题。
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
diff --git a/src/app.py b/src/app.py
index 7a5e23e..500023a 100644
--- a/src/app.py
+++ b/src/app.py
@@ -7,6 +7,8 @@ from model_utils import calculate_memory, get_model


 def get_results(model_name: str, library: str, options: list, access_token: str):
+    if access_token == "":
+        access_token = None
     model = get_model(model_name, library, access_token)
     # try:
     #     has_discussion = check_for_discussion(model_name)

与原始版本具体区别可见 diff[7]

Python 3.8

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# conda create -n mmu-env python=3.8 -c https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
$ conda create -n mmu-env python=3.8
$ conda activate mmu-env

conda 环境安装可参照 miniconda[8]

部署

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
$ git clone https://github.com/AlphaHinex/model-memory-usage.git
$ cd model-memory-usage

# pip install -r requirements.txt -i http://192.168.1.200/local/proxy/pypi/web/simple --trusted-host 192.168.1.200
# pip install -r requirements.txt
$ pip install -r requirements.txt -i https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple

# python src/app.py
$ HF_ENDPOINT=https://hf-mirror.com python src/app.py

Model Name or URL 处输入 deepseek-ai/DeepSeek-R1-Distill-Qwen-32B,在 Model Precision 选择要估算的精度,点击 Calculate Memory Usage

参考资料

[1]

🤗 Model Memory Calculator: https://huggingface.co/spaces/hf-accelerate/model-memory-usage

[2]

🤗 Accelerate: https://github.com/huggingface/accelerate

[3]

discussions: https://huggingface.co/spaces/hf-accelerate/model-memory-usage/discussions

[4]

hotfix: https://github.com/AlphaHinex/model-memory-usage

[5]

README.md: https://huggingface.co/spaces/hf-accelerate/model-memory-usage/blob/main/README.md

[6]

与 pydantic 版本不匹配导致的报错: https://blog.csdn.net/qq_38463737/article/details/142825145

[7]

diff: https://github.com/AlphaHinex/model-memory-usage/compare/main...hotfix

[8]

miniconda: https://alphahinex.github.io/2024/01/14/jupyter-lab-in-action/

JupyterLab 实战
JupyterLab 实战

JupyterLab 实战

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 周拱壹卒 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
985 博士真的会舍弃华为年薪接近 100 万 offer,去选择年薪 20 万的公务员吗?
喜欢做学术并且博士期间学术做得比较有成就的同学会选择做学术,其他同学(也有学术巨牛逼的,比如手握十几篇顶会,一作大几篇的)基本上都会选择业界就职,包括华为,Google,MSRA 这种技术公司和量化(国内 top 量化九坤的创始人就是我们院前辈,所以我们去九坤的很多),还有前几年比较好的区块链币圈或者美元基金。当然今年就业形势很差,选择华为的会比较多
用户6983566
2023/01/14
3.7K0
985 博士真的会舍弃华为年薪接近 100 万 offer,去选择年薪 20 万的公务员吗?
某大厂码农被裁员,找不到工作,妻子随即提出离婚。。。
新粉请关注我的公众号 今天读公众号文章看到这个事,说是某大城市的某互联网大厂里的某码农,在大厂工作了8年之久。结果这一轮疫情影响下,公司决定裁员。这位工作8年之久的老将,没逃脱裁员,被HR叫到办公室里面去开会协商,然后领了包裹走人了。 裁员这事情发生以后,他告诉了自己的妻子和父亲,但是没敢告诉更多的人。毕竟人到中年,上有小下有老,还有房贷在,压力大。 然后他很努力找了几周工作,但是结果却不太好。几周下来,投简历投下去,水花都没飘起来,完全没人搭理。于是压力就更大了。 这个时候他妻子过来提出离婚。妻子说,因为
用户1564362
2022/06/13
8200
某大厂码农被裁员,找不到工作,妻子随即提出离婚。。。
中国IT行业盛行,互联网行业已饱和!程序员“过多”是主要原因?
简单算个账:近十多年来,中国的各种大学每年有30万计算机相关专业毕业生,加上其他行业的转入,编程岗位每年新增超过20万人,全国的规模大约300万。平均每人年15万成本,大约需要4500亿成本。市场有多
xcbeyond
2020/03/25
2.3K0
中国IT行业盛行,互联网行业已饱和!程序员“过多”是主要原因?
面试了一个 39 岁程序员后,我被骂了……
https://mp.weixin.qq.com/s/uzMVaCEp7YtDKjDM8m_kwg
Java技术栈
2020/10/09
7020
面试了一个 39 岁程序员后,我被骂了……
为什么中国会有这么多程序员
警告:这篇文章是黑程序员的,内容口味较重, 阅读时如感不适, 请停止。 现在的一二线城市的公交或地铁上, 一棒砸死十个人估计一半程序员, 为什么现在这种职业会这么火爆? 主要原因应该有两个,第一,从业门槛低;第二,相对其它职业,收入高, 因此,大批人往这个行业里跳 在一些传统的行业中,如护士、银行、会计、老师之类, 是必须得老老实实的学习考试,或者还需要特定环境的历练才可以上岗, 不然的话, 还真的干不了。 更别说是医生律师或者金融这些高端行业了, 不得念个博士硕士的, 而且还要是名校毕业才能吃的开。 当程
用户1608022
2018/04/11
7700
为什么中国会有这么多程序员
学 Java 还是 Go,这事儿很简单!
网上的讨论五花八门,有人说 Java 过时了,Go 才是未来;还有人因为自己或朋友学 Go 找到工作了就觉得 Go 真香,觉得学 Go 竞争更少、机会更多。
程序员鱼皮
2025/06/11
1340
学 Java 还是 Go,这事儿很简单!
计算机应届生月薪大多是多少?
月薪4k,6k,8k,10k的各占百分之多少呢,好对自己有个定位,现在听听那些亲身经历者说一说。
磐创AI
2020/03/05
6.1K0
互联网就业系列文(三)——教练,我想去最赚钱的行业
作为一名普通人,也曾有过理想,只是后来被现实打败。如今每日祈祷,愿能有一位富婆,看穿我的坚强。
HZFEStudio
2021/06/27
4050
互联网就业系列文(三)——教练,我想去最赚钱的行业
杭州程序员从互联网跳央企,晒一天工作和收入,网友:待一年就废
说到互联网,有些人兴奋有些人恐惧,这几年相信不少人都听说过,很多互联网行业的人都挣到了人生第1桶金,可是现在不少的互联网行业人纷纷都跳槽, 就比如接下一位男子,从互联网跳槽到了央企,而他分享的央企一天工作日常,更是让网友吐槽,到底怎么回事?请往下看。 原来是一位程序员,分享了自己从互联网跳槽到央企之后的工作流程,男子说自己是211本科外硕士,有3年工作经验,而从这个表格可以看出了, 他9:15到公司露面,就直接去公司食堂吃早餐,然后9:30~11:00一个半小时查看公司邮件,和处理各种邮件,而11:00
程序猿DD
2022/06/07
7550
杭州程序员从互联网跳央企,晒一天工作和收入,网友:待一年就废
大三了想走IT这条路,下一年是自学还是培训?
PS :从轻松的校园走到社会时,多少人面临这巨大的落差,社会需要的,完全不是学校教的,按部就班的学习已经造成了巨大的能力与认知差异,这种差异必须要有坚定的意志,多次的跌打滚爬才能弥补。
IT架构圈
2018/07/02
5470
大三了想走IT这条路,下一年是自学还是培训?
啥是全栈程序员?更厉害?更有钱途?
大家好,我是鱼皮,我相信学编程的朋友都经常听到 “全栈” 这样一个词,但是你了解什么是全栈么?
程序员鱼皮
2021/06/09
1.2K0
【知乎提问:“程序员应该走什么路线?”】-我的回答
二年啊,这就是刚入行的程度。就是努力干活,多学、多练、多程序,想任何其它的都是白费工夫,因为你没有积累。
web前端教室
2019/09/19
9600
【知乎提问:“程序员应该走什么路线?”】-我的回答
程序员30岁前月薪达不到30K,该何去何从
前端自08年左右兴盛已来,无数年轻人投入其中,但是这2年不知道身为前端的你,有没有感觉到求一份靠谱的前端的工作变的很难,同样企业求一名靠谱的前端也觉得很难,其实并不是因为求职者太过挑剔,也不是企业给不起工资,而是因为这两年大前端的发展无论从技术深度和广度都跟以前大不一样,前端不再是页面仔,而是指能够使用JavaScript和相关H5技术开发iOS、Android、AR、VR、IoT、PC、Server、WebApp、3D甚至AI的综合性技术人才。很多同学的计算机基础相对薄弱,导致了知识直接断层。才会出现咫尺天涯的这种怪象。
疯狂的技术宅
2019/03/27
6381
程序员30岁前月薪达不到30K,该何去何从
知乎精选 | 长远看算法岗真的比开发岗香吗?
链接:https://www.zhihu.com/question/409815271/answer/2851056492
Houye
2023/03/01
4.4K0
知乎精选 | 长远看算法岗真的比开发岗香吗?
降薪,延长工时,没年终奖,裁员的2018
我在公众号上提失业裁员大潮,提程序员应该注意点什么,已经很多次了。之前不可避免的有很多否定的意见出来。最近终于各种消息接踵而来。我的公众号在过去两个月里,对裁员失业的话题基本没涉及了。原因就是我觉得等事情真的接踵而来发生的时候,写这些就是蹭热点了。
用户1564362
2019/03/07
4980
大规模裁员后,计算机会成为下一个土木吗?
每天给你送来NLP技术干货! ---- 整理:DASOU 最近互联网裁员,有网友热议:2022年大规模裁员后,计算机专业会不会成为下一个土木? 有个匿名网友写了这样一个回答,我认为挺好的,想跟大家分享一下。 https://www.zhihu.com/question/521800974/answer/2443221482 我学了10年计算机现在还在找工作,我爸干了一辈子土木现在也在找工作。我觉得计算机不会成为下一个土木。至于是不是49年入国军,我觉得楼主的眼光可以看长远一点,就是你这辈子到底想从事什么职
zenRRan
2022/06/10
8700
大规模裁员后,计算机会成为下一个土木吗?
美国大厂码农薪资曝光:年薪18万美元,够养家,不够买海景房
---- 新智元报道   编辑:袁榭 【新智元导读】在脸书、亚马逊这些全世界头等数码大厂里干三四年码农,到底能不能像传说中一样买得起加州海景房? 全球数字经济中的头等大厂们—FAANG(脸书Facebook、亚马逊Amazon、苹果Apple、网飞Netflix、谷歌Google),在码农业界与小白公众中有着种种神奇的传说。 FAANG干三年,能在加州买房? 比如其中的产品经理个个魔武双修、身怀绝艺,觉得公司内部开发工具不行,就自己转码开始改造。 再比如即使初级入门码农(entry level),
新智元
2022/03/14
5040
如果我大一的时候能看到就好了。
这段时间刚好一些准大学生们也开始陆陆续续的收到录取通知书了,即将进入大学,步入新的人生阶段。
why技术
2023/08/23
3630
如果我大一的时候能看到就好了。
20届算法学长有话说
我们都是20届算法学长,秋招之路已经结束,收获与打击的同时,对于算法是否应该早些转开发的问题,我们发表不同观点。
用户9831583
2022/06/16
3300
一周播报 | 大公司反而给高薪?3年前端开口要37K,被拒后竟进了阿里?!
今年(2017年)面了个小朋友,有3年的前端经验,开口要月薪37K,当时吓得快从凳子上摔下来。
养码场
2018/08/13
6360
推荐阅读
相关推荐
985 博士真的会舍弃华为年薪接近 100 万 offer,去选择年薪 20 万的公务员吗?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档