腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
kubernetes
和
slurm
,
这是
正确
的
设置
吗
?
、
、
、
我看到一些人使用
Kubernetes
和
slurm
共存,我只是好奇为什么你需要
kubernetes
和
slurm
?
kubernetes
和
slurm
之间
的
主要区别是什么?
浏览 624
提问于2019-07-31
得票数 5
1
回答
单节点
SLURM
服务器:限制交互式CPU
的
使用
、
、
、
、
我在一个节点上
设置
了
SLURM
,这也是一个“登录节点”。我想限制交互式CPU
的
使用,例如在调度系统之外。我找到了以下建议使用cgroup
的
文章:https://rolk.github.io/2015/04/20/
slurm
-cluster/etc/cgconfig.conf400000;}
浏览 0
提问于2020-03-24
得票数 1
2
回答
无法在
SLURM
中强制执行内存限制
、
我在单个节点(控制
和
计算)上使用
Slurm
,似乎无法
正确
限制内存。该脚本似乎使用小内存值(3G)调用SBATCH,但我看到顶部
的
值超过25G。Sacct给了我
正确
的
值: squeue -o "%C %m"2 3G
这是
我
的
slurm
.conf: ###JobFileAppend=0
浏览 395
提问于2020-11-05
得票数 1
回答已采纳
1
回答
不可能
的
CPU核心/线程配置
我正在尝试
设置
slurmd
的
测试实例,但似乎无法让它接受我
的
CPU。
这是
lscpu
的
输出: CPU op-mode(s): 32-bit, 64-bit
设置
我想我确实尝试过
浏览 9
提问于2022-07-14
得票数 0
2
回答
Kubernetes
和
MPI
、
、
我想在我
的
Kubernetes
集群上运行一个MPI作业。上下文是,我实际上正在运行一个现代
的
,很好
的
封装应用程序,但是工作负载
的
一部分是一个遗留
的
MPI作业,不会在短期内重新编写,我想尽可能地将它融入
kubernetes
的
“世界观”。关于如何进行,我有几个想法: 包含
slurm
和
应用程序代码->
的
胖容器用容器启动时对等端
的
适当信息填充
slurm
.conf
浏览 3
提问于2016-06-29
得票数 20
1
回答
Dask worker似乎已死,但无法找到worker日志以找出原因
、
我有一段在本地机器上运行
的
DASK代码,它90%
的
时间都在工作,但有时会卡住。卡住了。没有崩溃,没有错误,打印输出不是cpu使用率。永远不会结束。 我在谷歌上搜索了一下,想可能是因为某个员工死了。但是我找不到我
的
工作日志。我去编辑config.yaml来添加日志记录,但是仍然看不到来自stderr
的
任何东西。然后我转到仪表板-->信息-->日志,看到空白页面。它卡住
的
代码是X_test = df_test.to_dask_array(lengths=True)或proba = y_pred_p
浏览 0
提问于2019-08-23
得票数 2
1
回答
如何使用带
SLURM
批处理
的
变量来
设置
输出/错误文件名?
我们刚刚切换到使用
SLURM
,我想使用循环
和
sbatch提交一系列作业。以前,我可以使用一个变量作为输出文件名
的
一部分。我一直试图在sbatch中使用--export传递变量,但无法获得要对std错误/输出文件名进行内插
的
变量。不过,我认为它适用于作业名称(-J)
和
--wrap部件。--output='$i.eo%j' \--wrap="fastq_trim_single.sh ${i}" \ ; d
浏览 0
提问于2018-03-01
得票数 0
2
回答
SLURM
数组如何与SBATCH资源分配接口?
、
、
/bin/bash#SBATCH -n 4#SBATCH --array=1- 我正在尝试启动一个阵列,对于阵列中
的
每个任务,我希望它使用RM共享分区上
的
4个核心。我这样做是否
正确
,或者
这是
否指定通过
的
阵列输出
的
所有任务必须共享4个核心?我将为此提出一个单独
的
问题,但由于某种原因,当我运行此命令时,$
SLURM
_ARRAY_TASK_ID变量为空…
浏览 56
提问于2021-06-10
得票数 0
1
回答
slurm
批处理队列任务,但不执行
、
我在AWS集群上使用
slurm
,并编写了一个执行脚本,该脚本似乎不起作用。如果我单独运行这个脚本,它就运行得很好。但是,在使用sbatch运行时,它不起作用。我使用以下代码调用sbatch: do sudo /opt/
slurm
/bin/sbatch ./
slurm
_script.sh $sample; done 脚本
slurm
_script.sh包含一个非常长
的
浏览 0
提问于2019-01-24
得票数 0
回答已采纳
1
回答
Dask.distributed集群管理
、
、
我正在工作中
设置
Dask集群(30台机器,平均每个核心8台)。人们只使用一部分
的
CPU能力,因此dask-workers将在低优先级
的
背景上运行。所有工作人员都在我
的
主节点上收听dask-scheduler。如果我使用它的人使用它,那么它
的
工作非常完美,但是它将被几个人以并发
的
方式使用-所以我需要能够管理这个集群: 限制每个作业
的
计算超时杀了任何管理员
的</e
浏览 0
提问于2019-01-11
得票数 0
1
回答
旧聚类中
Slurm
(
和
PBS)
的
oneAPI误码
、
、
、
、
最近,我安装了Intel OneAPI,包括c编译器、FORTRAN编译器
和
mpi库,并使用它编写了VASP。:ld版本为2.20,同时需要更高
的
版本。有一台主计算机与集群中
的
30个计算节点连接。计算
的
执行方式有三种: 当我在主程序中进行计算时,它是完全可以
的
。当我用rsh命令手动登录节点时,登录节点中
的
计算也没有问题。但是通常我从主节点(使用
slurm
或pbs)提交计算脚本,然后在节点中进行计算。我只在oneAPI编译
的
代码中遇到了这个错误,但是编译
浏览 13
提问于2022-05-21
得票数 0
2
回答
监视在
slurm
作业上运行
的
OpenFOAM模拟
的
CPU使用情况
、
、
我已经为
slurm
分配了6个节点解算器运行平稳,没有任何错误。 我
的
模拟是加载所有节点,还是在一个或两个节点上运行,其余<e
浏览 1
提问于2018-02-01
得票数 0
1
回答
SLURM
控制器无法连接到工作人员
和
状态,则
设置
为未知。
、
、
、
我正在尝试
设置
一个小型集群,使用
SLURM
进行管理。控制器也是一个计算节点。/etc/
slurm
/
slurm
.conf中
的
配置是: NodeName=controller,node[01-02] RealMemory=250000 Sockets=1 CoresPerSocket我已经允许所有机器上
的
端口6817
和
6818 (默认
的
slurm
端口)(对于TCP,我认为
这是
协议)。我还检查
浏览 5
提问于2022-06-15
得票数 0
1
回答
如何在不同
的
组中访问同一主机
的
组变量?
、
、
这是
我
的
ansible库存文件:
slurm
-gpu-0 ansible_host=192.168.0.24 ansible_connection=local 我有两个分区- "
slurm
_partition_gpu“
和
"
浏览 4
提问于2020-05-15
得票数 1
1
回答
单节点
slurm
设置
需要munge
吗
?
我在一台服务器上安装
slurm
,用于一小群人
的
调度。现在没有,也永远不会有扩大到这个单一节点之外
的
意图。 在这种情况下,munge仍然是安全
的
要求还是
slurm
管理
的
多节点集群特别需要
的
?
浏览 0
提问于2022-11-08
得票数 5
1
回答
将参数传递到
slurm
脚本(matlab)
、
、
、
我正在使用
slurm
向大学超级计算机提交工作。我
的
matlab函数有一个参数:我
的
slurm
文件是(我不确定它是否
正确
)。我知道如何在
slurm
文件中定义参数
的
值,但是我想将该值传递给
slurm
文件,因为我需要使用参数
的
不同值多次运行matlab函数): matlab -nodisplay -nodesktop -nosplash
浏览 8
提问于2022-02-27
得票数 1
回答已采纳
2
回答
如何修复
slurm
中
的
"slurmd.service: Can't open PID file“错误
、
、
、
尽管
SLURM
可以很好地用于作业提交、运行
和
排队,但我在下面得到了一个小错误。slurmd这个问题可能来自于
slurm
.conf文件
的
所有权?
这是
我
的
slur*.pid
的</em
浏览 6
提问于2019-06-12
得票数 2
1
回答
如何在集群中通过
slurm
运行python脚本?
、
、
、
在使用
slurm
的
服务器上配置jupyter
的
正确
方法是什么?在阅读完之后,我通过
slurm
执行我
的
python脚本,如下所示(我不确定
这是
否有效):然后,我得到了:当我这样做
的
时候: (b
浏览 178
提问于2021-06-10
得票数 1
回答已采纳
1
回答
Slurm
作业已排队但未运行
我正在尝试在运行Ubuntu
的
Virtualbox上安装
slurm
。我们使用它通过web界面运行长时间运行
的
作业,并使用
slurm
对作业进行排队
和
运行。我已经
设置
了
slurm
,但是当我将一个作业排入队列并运行squeue时,我得到: $ squeue JOBID PARTITION NAME USER ST0 n/a 是的,它显示节点为0,但输出在我
的
实际硬件上是相同
的
,并且
浏览 729
提问于2021-10-14
得票数 2
回答已采纳
1
回答
如何从
slurm
加载anaconda虚拟环境?
、
、
、
我在安装
slurm
的
VM上
设置
了anaconda,如下所示。base /root/anaconda3conda info --envs source activate upload 但是,与我
设置
的</
浏览 279
提问于2021-06-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
2019年多家开源公司改变了方向,这是正确的举动吗?
十年前我们开始从SOAP转向REST,但你相信这是正确的方向吗?
熊出没:光头强小时候和爸爸玩过的游戏,这是你们的童年吗?
圣诞的正确过法,你以为圣诞只有红帽子和圣诞树吗?
区块链的主链和侧链有什么关系?最长的区块链就是正确的吗?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券