腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(4533)
视频
沙龙
2
回答
将参数传
递给
.sh
脚本
中
的
注释
、
我是.sh
脚本
的
初学者,所以请原谅我
的
无知。这是我
的
问题:#!/bin/sh ########## Begin
Slurm
header ###########
SBATCH
--job-name=blabla########### End
Slu
浏览 0
提问于2021-09-17
得票数 3
回答已采纳
1
回答
使用依赖项链接多个
SLURM
作业
、
在previous question中,我询问
如何
将作业B排队,使其在作业A之后开始,这是通过
sbatch
--dependency=after:123456:+5 jobB.
slurm
其中123456
sbatch
jobA.
slurm
将返回Submitted batch job 123456,我需要将作业id传
递给
除了第一个作业之外
的
所有依赖项
的
调用。由于我使用
的
是一个繁忙
的
集群,我不能依赖于将作业ids递增1
浏览 86
提问于2021-01-12
得票数 1
回答已采纳
1
回答
当程序在
SLURM
集群上学习时收到时间限制时保存模型权重
、
、
、
、
我使用用pytorch_lightning (pytorch)编写
的
深度学习模型,并在
slurm
集群上对它们进行训练。我像这样提交作业:
sbatch
--gpus=1 -t 100
python
train.py 当请求
的
GPU时间结束时,
slurm
会终止我
的
程序,并显示以下消息: Epoch 0: : 339itslurmstepd: error: *** JOB 375083 ON cn-007 CANCELLED AT 2021-10-04T22:20:54 D
浏览 332
提问于2021-10-04
得票数 1
回答已采纳
1
回答
在
SBATCH
/
SLURM
中使用ptemcee ( Monte包)运行
python
脚本
、
、
、
、
我需要使用
sbatch
/
slurm
运行
python
脚本
,
脚本
工作到必须使用ptemcee
的
步骤(即运行monte马尔可夫链)。在这个步骤中,什么都不会发生(就像
脚本
落入无限循环中一样)。我知道
脚本
中没有错误,因为当我从
slurm
中运行它时,它工作正常。有人知道我应该
如何
在S批/
slurm
中运行ptemcee (或emcee)? #!/usr/bin
浏览 5
提问于2021-11-21
得票数 0
1
回答
在调用
slurm
sbatch
之前为日志文件创建目录
、
Slurm
sbatch
将stdout和stderr定向到由-o和-e标志指定
的
文件,但如果文件路径包含不存在
的
目录,则无法这样做。是否有办法自动生成我
的
日志文件
的
目录?让作业名称
的
变化存在于文件名中,而不是目录中,这会造成大量
的
、组织不良
的
日志,当我需要检查我
的
作业做得
如何
时,我必须对其进行排序。我找到这样做
的
唯一方法是将对
sbatch
的
调用封
浏览 0
提问于2019-01-25
得票数 9
1
回答
如何
在
slurm
集群上启用
python
提交
脚本
?
、
我可以使用
slurm
访问集群,并希望将其扩展为使用
python
来编写批处理提交
脚本
。我该怎么做?#!/bin/
python
#!/usr/bin/env
python
为了完成,这里是我
的</e
浏览 13
提问于2020-03-27
得票数 0
2
回答
Python
环境和
Slurm
的
问题(srun/
sbatch
)
、
、
、
当我试图在Ubuntu上设置一个虚拟环境时,使用"virtualenv -系统站点-packages myenv",并试图使用
slurm
(srun/
sbatch
)运行
python
脚本
时,我遇到了一个问题尽管我以前运行代码时没有问题,但在这一点上,当我
的
环境被激活(源代码./myenv/bin/activate)运行时,我得到了一个"ModuleNotFoundError"。我注意到,虽然我可以在当前环境激活
的</em
浏览 5
提问于2020-10-03
得票数 2
1
回答
为什么我不能在
SLURM
中模拟运行同一
python
脚本
的
多个实例
、
、
、
我一直在努力尝试让
python
脚本
的
多个实例在
SLURM
上运行。在我
的
登录节点中,我已经安装了
python
3.6,并且我有一个
python
脚本
"my_script.py“,它接受一个文本文件作为输入来读取运行参数。/slurmd/job00130/
slurm
_script: line 9:
python
3.6: command not 当我尝试以数组
的</
浏览 2
提问于2018-10-24
得票数 0
1
回答
将参数传递到
slurm
脚本
、
、
、
、
我使用
slurm
脚本
在集群上运行用于Matlab计算
的
数组。每个
脚本
都使用一个数组来循环matlab参数。例如,我
的
slurm
文件当前看起来像Shell
脚本<
浏览 0
提问于2019-06-18
得票数 2
回答已采纳
1
回答
如何
将
SLURM
脚本
的
配置参数保存/记录到输出文件中?
、
我对HPC和
SLURM
特别陌生。下面是我用来运行
python
脚本
的
示例代码:#
SBATCH
--mem 0 --num_nodes 4 \现在,每当我使用
sbat
浏览 5
提问于2021-04-11
得票数 2
回答已采纳
1
回答
Slurm
数组为同一任务生成多个任务
、
、
、
因此,我有一个使用多处理
的
python
脚本
,它有4种运行方式,这取决于它在运行时读取
的
环境变量APP_TYPE。
python
script started
浏览 1
提问于2021-05-28
得票数 0
1
回答
如何
将我
的
Python
脚本
传
递给
Slurm
sbatch
?
、
、
、
我已经写了一个
python
脚本
,我打算将它传递到我
的
大学
的
Slurm
sbatch
系统上进行计算。我已经编写了一个简短
的
shell
脚本
,它应该只是将
python
脚本
输入到
sbatch
系统中,但我得到了一个错误,内容是:
python
:无法打开文件“”Retrie.py“”:Errno 2没有这样
的
文件或目录即使在网上阅读了很多关于该系统
的
内容后,
浏览 22
提问于2021-03-08
得票数 0
2
回答
在
Slurm
集群上运行TensorFlow?
、
、
、
、
我可以访问一个计算集群,特别是一个具有两个12核心CPU
的
节点,它与一起运行。有谁有关于这个主题
的
想法、教程或任何来源吗?
浏览 8
提问于2016-01-16
得票数 20
回答已采纳
3
回答
将参数传
递给
SLURM
批处理
脚本
中
的
python
脚本
、
、
我已经编写了一个需要两个参数
的
python
脚本
,当我在命令行中使用以下命令运行它时,该
脚本
工作得很好:我需要在
SLURM
批处理
脚本
中运行它,但是每当我这样做时这是我使用
的
脚本
的
一个示例:#
SBATCH
--ntasks-per-node=1 #
SBATCH
--cpus-per-tas
浏览 1
提问于2015-07-06
得票数 5
2
回答
如何
在
slurm
中导入cv2?
、
、
、
我有一个运行在
slurm
上
的
python
程序。我
的
python
程序正在导入不同
的
包。当我尝试import cv2时,我面临以下错误:ImportError: No module named 'cv2'#!/bin/bash#
SBATCH
--account=default #
浏览 5
提问于2017-04-26
得票数 2
回答已采纳
1
回答
如何
在
slurm
中设置ntask或ntasks per-node,以便在pytorch中运行多节点分布式训练?
、
我想运行官方视频分类
脚本
here。 我计划在
slurm
机器上运行它。如果我想在2个节点上运行这个
脚本
,每个节点都有8个V100 GPU,我不确定
如何
正确设置
SBATCH
参数--ntasks或--ntasks-per-node。
浏览 446
提问于2021-01-25
得票数 1
2
回答
在包装
脚本
中处理bash系统变量和
slurm
环境变量
、
、
、
Problem:在这个
的
启发下,我尝试编写一个包装器
脚本
来提交带bash变量
的
SLURM
数组作业。但是,我遇到了像$
SLURM
_ARRAY_TASK_ID这样
的
SLURM
环境变量
的
问题,因为它是一个空变量。我怀疑这与test_wrapper.sh
如何
解析尚未定义
的
SLURM
变量有关,但我似乎找不到解决方案。下面我提供了一个简单
python
脚本
的
工
浏览 45
提问于2022-09-16
得票数 0
回答已采纳
1
回答
调用其他
SLURM
的
主
SLURM
脚本
、
、
我是一名癌症研究人员,我们想知道你们中是否有人知道
如何
编写一个调用其他
SLURM
的
SLURM
脚本
。如果上一个
脚本
成功完成,则继续执行下一个调用。也就是说,类似于:#
SBATCH
--nodes=1 #
SBATCH
--time=24:00:00 #
SBATCH
--mem=40GB?#
SBATCH
浏览 7
提问于2018-12-07
得票数 2
1
回答
用于请求时间
的
Slurm
环境变量
对于
slurm
作业,环境变量$
SLURM
_JOB_NUM_NODES提供请求
的
节点数。#!/bin/bash#
S
浏览 7
提问于2022-01-28
得票数 2
回答已采纳
点击加载更多
相关
资讯
我如何使用Flit将我的第一个Python包发布到PyPi
Python大神教你如何简易打造属于自己的脚本——Wifi-Thief!
我是如何使用Python脚本分析CPU使用情况的?
我是如何使用Python脚本分析CPU使用情况的?
MOMAP2019B版本更新说明
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券