腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
您
如何
检查
SLURM
或
MOAB
/
Torque
在
环境
中
是否
可用
?
、
、
、
、
我正在寻找一个命令行测试,以
检查
SLURM
或
MOAB
/
Torque
是否
也
可用
于提交作业。 我的想法是
检查
命令qstat
是否
以退出代码结束,或者squeue
是否
以退出代码0结束。
浏览 35
提问于2021-09-16
得票数 1
回答已采纳
1
回答
MPI程序CPU内核动态分配的解决方案
在
应用程序结束时,20个进程
中
的大多数已经完成,
在
等待最后一个进程完成时,我的12个线程中有11个处于空闲状态。我希望利用这些闲置的核心,
在
不等待当前的工作完成的情况下,开始下一个工作。我希望动态分配这些CPU核心,使CPU始终保持
在
100%。
浏览 0
提问于2017-10-30
得票数 0
回答已采纳
1
回答
如何
升级
Slurm
?
、
我
在
Debian7.0喘息集群(1个主节点+8个节点)上有一个
Slurm
2.3.4。我没有安装它,所以我对
如何
做到这一点以及
如何
在不破坏任何东西的情况下进行操作感到有点困惑。我想至少升级到Jessie (Debian 8),但是
Slurm
呢?我仔细阅读了文档的升级部分(https://
slurm
.schedmd.com/quickstart_admin.html),例如,我看到升级必须以增量方式完成,而不是从2.3.4跳转到17。我仍然不清楚
如何</
浏览 0
提问于2017-10-03
得票数 1
2
回答
使用C++获取
SLURM
下的
可用
内存
、
、
、
我
在
HPC
环境
中
工作,并使用
SLURM
将我的作业提交到队列
中
。我正在编写自己的内存缓存机制,因此我想知道每个节点有多少内存
可用
,以便我可以扩展
或
重用空间。 有没有办法知道有多少内存
可用
。
SLURM
是否
设置了任何
环境
变量。
浏览 6
提问于2018-03-23
得票数 1
5
回答
下一个调度器是什么?
、
、
、
从存储克隆/快照到针对数据库的报告到每天的系统报告到监视
检查
,所有东西都通过cron调度
在
几百台服务器上。我看到了其他的选项,比如
SLURM
、Oracle Grid Engine、
Torque
/Maui、Quartz、Maui、Condor,它们似乎面向更大、更同质的集群
环境
,其任务可以在任意数量的类似节点上运行我们的
环境
相当复杂(各种Linux、AIX和FreeBSD),我们需要在不同类型的系统之间创建依赖关系(例如,Linuxes上的作业可能需要确定AIX机器上的
浏览 0
提问于2011-06-07
得票数 30
回答已采纳
1
回答
是否
有可能,以及
如何
从
slurm
中
获得我的mpi作业运行的核心列表?
、
、
、
问题是:
是否
有可能,如果是的话,
如何
获得我的mpi工作
在
特定时刻运行的核心列表?很容易列出任务分配到的节点,但经过几个小时的互联网调查,我开始怀疑
slurm
以任何方式公开了核心列表(为什么不困难呢?)问题是,我想再次
检查
我正在处理的集群
是否
真的像我要求的那样
在
节点、核心(如果可能的话,还有套接字)上传播我的工作进程(如果你愿意的话,可以叫我偏执)。请注意,hwloc不是对我的问题的回答,我问
是否
有可能从
slurm
,而不是从我的程序内部
浏览 0
提问于2017-06-16
得票数 0
回答已采纳
4
回答
参数用于使用qsub启动的shell脚本。
、
、
、
如何
将网格上执行的shell脚本参数化(从qsub开始)?我有一个shell脚本,其中我使用getopts读取参数。
浏览 2
提问于2010-08-17
得票数 49
回答已采纳
1
回答
在
Linux上从R
中
的列表堆叠栅格时出错
、
、
、
、
在
创建栅格时间序列之前,我
在
堆叠列表
中
的栅格时遇到问题。当我
在
R
环境
中使用示例数据直接执行此操作时,它工作得很好。此外,我
如何
摆脱我的列表
中
完全是NA的文件?我怀疑这可能也是一个问题。
浏览 2
提问于2015-07-21
得票数 0
2
回答
在
SLURM
中
在
多个目录上运行一个脚本的首选方法
、
我最典型的用例是
在
多个目录(通常是R
或
Matlab)上运行一个脚本。我可以访问一个高性能的计算
环境
(基于
SLURM
)。从我目前的研究来看,我不清楚以下哪种方法是最有效地利用
可用
CPU/核心的方法。我还想确保我没有不必要地占用系统资源,所以我想再次
检查
以下两种方法
中
哪一种最合适。
浏览 1
提问于2018-08-03
得票数 1
回答已采纳
1
回答
如何
同时提交多份R工作?
、
、
、
我通常提交重复的工作,例如5次,每次10个文件,通过改变R-脚本
中
的数字。那么,我怎样才能一次提交5份工作而不提交5次呢?此外,我希望更新每个作业的<>default.out和错误文件。
浏览 0
提问于2021-05-22
得票数 1
1
回答
如何
检查
我的代码
是否
在
SLURM
环境
中
运行?
、
、
、
我正在使用Snakemake开发一个工作流,这个工作流应该可以移植到任何基于Linux的系统上,但主要是为了
在
使用
SLURM
的hpc上运行。为了进行优化,
在
使用
SLURM
时,我想
检查
代码
是否
在
SLURM
环境
中
运行,然后稍微修改任务以改进资源管理。我的第一个想法是尝试通过os.path.expandvars解析
环境
变量os.path.expandvars,但在我看来,这有点脏,那么
是否</em
浏览 1
提问于2020-08-07
得票数 1
回答已采纳
5
回答
如何
在不可靠的集群上分发程序?
、
、
如果
您
给出了一个软件的例子,那么请告诉我们上面的功能有哪些。
浏览 15
提问于2009-05-30
得票数 3
2
回答
监视
在
slurm
作业上运行的OpenFOAM模拟的CPU使用情况
、
、
我想监视CPU的使用情况,看看我分配的所有6个节点
是否
都以类似的方式加载。说,您可以使用sacct
或
sstat命令来监视
slurm
作业的CPU时间和内存使用情况。所以我的问题是 我在运行正确的命令吗?如果是的话,这些数字意味着什么?它们
如何
表示每个节点的CPU使用情况?如果不是,那么对于sacct和/
或
sstat (或者其他
slurm
命令)来说,什么才是获得CPU
浏览 1
提问于2018-02-01
得票数 0
1
回答
如何
在MPI
中
列出每个节点的
可用
资源?
、
这是一个纯粹的,干净的局域网集群,没有
SLURM
或
任何东西,除了OpenMP,mpicc,mpirun安装。我有sudo的权利。可访问和已配置的MPI节点都列
在
/etc/hosts
中
。我可以编译和运行MPI程序,但
如何
获得有关MPI集群功能的信息:所有
可用
内核、处理器信息、总内存、当前正在运行的任务? 一般来说,我会搜索
在
MPI
环境
下可以工作的和的模拟?
浏览 14
提问于2016-08-17
得票数 0
回答已采纳
1
回答
分配给
SLURM
作业的核心
、
、
假设我想提交一个
slurm
作业,只分配任务总数(--ntasks=someNumber),而不指定节点数量和每个节点的任务。
在
已启动的
slurm
脚本
中
,
是否
有一种方法可以知道
slurm
为每个保留节点分配了多少个核心?我需要知道这个信息才能正确地为我正在启动的程序创建一个机器文件,它的结构必须如下所示: 在其输出
中
,
浏览 2
提问于2020-05-30
得票数 2
回答已采纳
1
回答
将参数传递到
slurm
脚本
、
、
、
、
我使用
slurm
脚本
在
集群上运行用于Matlab计算的数组。每个脚本都使用一个数组来循环matlab参数。例如,我的
slurm
文件当前看起来像 #!这意味着我将提交作业(S批处理exampleScript.
slurm
),编辑文件,将'Person24‘更新为'Person25',然后重新提交作业。当我有大量文件要处理时,这是相当低效的。我可以创建一个shell脚本
浏览 0
提问于2019-06-18
得票数 2
回答已采纳
1
回答
使用
slurm
在
可用
的GPU上分发MPI线程程序
、
、
B是从单独的DLL加载的,并且能够
在
CPU
或
GPU上运行,具体取决于它的链接方式。当启动主程序时,它创建A的一个实例,该实例又创建B的一个实例(然后
在
本地
可用
的GPU
或
第一个GPU上工作)。当使用mpirun (
或
通过
slurm
启动mpirun)启动程序时,为每个MPI rank创建A的一个版本,该版本又为其自身创建B的一个版本。当系统
中
只有一个GPU时,将使用此GPU,但如果系统中有多个GPU,会发生什么情况?无论
是否
有多个GPU<
浏览 3
提问于2019-08-06
得票数 0
1
回答
HPC:启动节点是接口节点的克隆吗?
、
当提交请求多个节点的
SLURM
批处理作业时,启动的节点
是否
是接口计算机的克隆?他们会复制界面计算机
中
的所有内容吗?在这里,接口计算机是我ssh到,存储文件和提交作业的计算机。特别是
在
IO上下文中,假设我从名为data_N.dat的文本文件
中
读取数据,其中N是进程级别。换句话说,每个进程(节点)读取它自己的唯一文件。当我提交
SLURM
作业时,
是否
所有这些文件都被复制到启动的节点?或者节点从接口计算机逐行读取输入文件?
浏览 2
提问于2018-11-09
得票数 0
2
回答
如何
修复
slurm
中
的"slurmd.service: Can't open PID file“错误
、
、
、
尽管
SLURM
可以很好地用于作业提交、运行和排队,但我在下面得到了一个小错误。slurmd这个问题可能来自于
slurm
.conf文件的所有权?这是我的slur*.pid的
slurm
.conf和所有权 #
slurm
.con
浏览 6
提问于2019-06-12
得票数 2
点击加载更多
相关
资讯
技术介绍 | 基于Snakemake的ChIP-seq分析流程
将 Claude Code 添加到VSCode、JetBrains IDEs等IDE编程工具的方式!
如何在 RHEL 中使用订阅管理器启用软件仓库
如何使用 SFC和DISM 命令修复损坏的 Windows 系统文件
检查你的Linux PC是否受Meltdown和Spectre安全缺陷影响
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券