我是Condor的新手,正在尝试在Condor上运行我的Python程序,但有一个困难。我找到的所有教程都假定使用一个文件Python程序,但是我的Python程序由多个包和文件组成,并且还使用了其他库,如numpy和scipy。在这种情况下,我如何让Condor运行我的程序?我应该把程序转换成某种可执行文件吗?或者,有没有办法将Python源代码转移到Condor机器中,并使Python on Condor运行源代码?
谢谢,
我正在尝试提交我的condor作业,但它一直给我一个错误,说:
ERROR: Can't find address of local schedd
我是一个初学者,我不太确定这是什么意思。
另外,当我键入condor_q时,我得到以下错误消息:
Error: Can't find address for schedd (name)
Extra Info: You probably saw this error because the condor_schedd is not running on the machine you are trying to query. If
我试图在HTCondor上运行一个Python2.7程序,但是在提交作业并使用'condor_q‘评估作业状态后,我看到该作业被置于'held’状态。
使用'condor_q -analyse jobNo‘查询后。错误消息是"Hold reason: error from Ubuntu: Failed to execute '/var/lib/condor/execute/dir_12033/condor_exec.exe':(errno=8:'Exec format error')。
我不确定如何解决这个错误,任何帮助将不胜感激
如何在出现模式后追加字符串??我知道字符串是不可变的。但如果有办法的话?
例如..。投入:
condor t airline airline
eight n 0 flightnumber
nine n 0 flightnumber
five n 0 flightnumber
hallo t 0 sentence
预期产出:
<s> <callsign> <airline> condor </airline>
<flightnumber> eight nine five <
在运行秃鹰作业后,我试图使用电子邮件选项。我试过这个:
Executable = executable.sh
Log = file.log
Output = file.stdout
Error = file.stderr
# Use this to make sure 1 gpu is available. The key words are case insensitive.
REquest_gpus = 1
# Note: to use multiple CPUs instead of the default (one CPU), use
当我从中央管理器运行命令condor_status时,它没有显示其他节点,我可以在中央管理器中运行作业,并通过SSH连接到其他节点,但在condor配置文件中似乎缺少一些东西,我将中央管理器设置为condor主机,并允许每个人都可以写入和读取。我将守护进程主进程STARTD保存在工作节点的守护进程列表中。
当我在中央管理器中运行condor_status时,它只显示中央管理器,而当我在计算节点上运行它时,它给我一个错误"CEDAR:6001:Failed to connect to“,后面跟着中央管理器的IP和端口号。
我正在尝试使用python API从一台没有安装condor的机器上提交作业,但是我遇到了很多麻烦。
我确实'pip install htcondor‘,当我导入它时,我得到:
>>> import htcondor
Neither the environment variable CONDOR_CONFIG,
/etc/condor/, /usr/local/etc/, nor ~condor/ contain a condor_config source.
Either set CONDOR_CONFIG to point to a valid config s
我有一个计算任务,它被分成几个独立的程序执行,并有依赖关系。我正在使用Condor 7作为任务调度器(对于香草宇宙,由于对程序的限制超出了我的能力范围,所以不涉及检查点),所以DAG看起来是一个自然的解决方案。然而,有些程序需要在同一主机上运行。我在Condor手册中找不到关于如何做到这一点的参考资料。
DAG文件示例:
JOB A A.condor
JOB B B.condor
JOB C C.condor
JOB D D.condor
PARENT A CHILD B C
PARENT B C CHILD D
我需要表达的是,B和D需要在同一计算机节点上运行,而
我想在我们的HTCondor池上运行不同批的作业。假设Type1有10个作业,Type2有20个作业等等。这些作业类型中的每一种都应该在当前作业完成后获得新的作业。
对于一种类型,我只使用一个简单的查询,是否所有作业都完成了,或者整个作业批处理的时限是否过了。如果满足了其中一个需求,则将x作业的下一次迭代提交到集群。
这是通过一个小函数(用Lua编写的,对于这个问题并不是很重要)来完成的:
function WaitForSims(CheckupDelay)
while io.popen([[condor_q -format "%d\n" clusterid]]):re