torque相关内容

PBS 作业保持排队('Q' 状态)但使用 qrun 运行

在我的完整本地扭矩安装 (torque-6.1.1) 上,我提交的所有作业都停留在“Q"状态,我必须使用 qrun 强制执行它们. >qstat -f 141作业 ID:141.localhostJob_Name = script.pbsJob_Owner = michael@localhost作业状态 = Q队列 = 批次服务器 = 本地主机检查点 = uctime = 2017 年 8 月 ..
发布时间:2021-06-30 19:32:40 其他开发

如何在一次 PBS 作业提交中运行多个命令

我写了一个只需要 1-4 个 CPU 的代码.但是当我在集群上提交作业时,我必须至少采用一个节点,每个作业具有 16 个内核.所以我想对我提交的每个作业在每个节点上运行几次模拟.我想知道是否有办法在一项工作中并行提交模拟. 这是一个例子:我的代码需要 4 个 CPU.我为一个节点提交了一个作业,我希望该节点运行我的代码的 4 个实例(每个实例具有不同的参数)以获取所有 16 个内核. ..
发布时间:2021-06-14 18:53:09 其他开发

修改PBS作业的属性(包括队列)

我想更改群集上计划的几个(空闲)作业的属性(挂墙时间和队列). 当我这样做时(其中1234是工作ID): qalter -l walltime=24:00:00 -q newQueue 1234 我收到以下错误: qalter: illegally formed job identifier: newQueue 我该怎么办? 解决方案 您需要分两个步骤进行操作: ..
发布时间:2020-07-11 02:42:13 其他开发

PBS编程

关于PBS的一些简短而愚蠢的问题: 1-我使用 提交工作 qsub job_file 是否可以在作业文件中提交(子)作业? 2-我有以下脚本: qsub job_a qsub job_b 对于启动job_b,最好在job_a的结果完成之前完成.是否可以设置某种障碍或其他解决方法,以便在job_a完成之前不启动job_b? 谢谢 解决方案 第一个问题的答案 ..
发布时间:2020-07-11 02:42:09 其他开发

PBS批处理系统是否可以跨节点移动多个串行作业?

如果我需要“并行"运行许多串行程序(因为问题很简单但很耗时-我需要为同一程序读取许多不同的数据集),则解决方案很简单使用一个节点.我要做的就是在每条命令后都用&号提交串行作业,例如在工作脚本中: ./program1 & ./program2 & ./program3 & ./program4 可以自然地在不同处理器上运行每个串行程序.这在登录服务器或独立工作站上非常有效,当然,对于仅要 ..
发布时间:2020-07-11 02:41:58 其他开发

如何等待扭矩作业阵列完成

我有一个脚本,可将数据结构分成多个块.这些块使用扭矩作业数组进行处理,然后合并回一个结构中. 合并操作取决于作业阵列的完成情况.如何使合并操作等待扭矩作业阵列完成? $ qsub --version Version: 4.1.6 我的脚本如下: # Splits the data structure and processes the chunks qsub -t 1-100 ..
发布时间:2020-07-11 02:41:57 其他开发

设置扭矩/摩押集群,以单个回路在每个节点上使用多个核心

这是[我有一个内存受限的脚本,该脚本仅使用1个foreach循环,但我希望在node1上运行2个迭代,在node2上运行2个迭代.上面的链接问题允许您为外部环路的每个节点启动一个SOCK群集,然后为内部环路的MC群集启动一个SOCK群集,我认为没有利用每个节点上的多个内核. 我收到警告消息 Warning message: closing unused connection 3 ( ..
发布时间:2020-07-11 02:40:54 其他开发

可以使pbs输出错误消息实时归档

在完成扭矩pbs作业之后,将错误和结果写入* .err(PBS -e)和* .out(PBS -o)文件. 在作业运行时,扭矩pbs可以将错误消息实时输出到* .err吗? 在作业运行时,扭矩pbs可以将输出消息实时输出到* .out吗? 如何配置pbs_server或其他内容? 谢谢. 解决方案 方法是设置 $spool_as_final_name true ..
发布时间:2020-07-11 02:40:50 其他开发

用qsub/tork提交作业时排除某些节点?

使用qsub提交批处理作业时,是否可以通过主机名排除某个节点? 类似 # this is just a pseudo command: qsub myscript.sh --exclude computer01 解决方案 取决于您希望有多少个节点,有两种选择. 您可以通过名称指定可以接受的特定节点: qsub -l nodes=n006+n007 例如要排除组中的 ..
发布时间:2020-07-11 02:40:47 其他开发

使用qsub可以提交连续且独立的作业有多快?

此问题与繁忙时pbs作业无输出有关.即,当PBS/扭矩“忙碌"时,我提交的某些作业不会产生任何输出.我想当许多工作一个接一个地提交时比较忙,而且碰巧的是,以这种方式提交的工作中,我经常会得到一些不产生任何输出的工作. 这里有一些代码. 假设我有一个名为"x_analyse.py"的python脚本,它将包含一些数据的文件作为输入,并分析了存储在该文件中的数据: ./x_analy ..
发布时间:2020-07-11 02:39:44 Python

如何将作业提交到PBS中的特定节点

如何将作业发送到PBS/TORQUE中的特定节点? 我认为您必须在节点之后指定节点名称. #PBS -l nodes=abc 但是,这似乎不起作用,我不确定为什么. 在 PBS上提出了这个问题,并指定要使用的节点 这是我的示例代码 #!/bin/bash #PBS nodes=node9,ppn=1, hostname date echo "This is a script ..
发布时间:2020-07-11 02:39:41 其他开发

PBS,刷新标准输出

我的Torque/PBS工作时间很长,我想监视输出.但是仅在作业完成后才复制日志文件.有没有办法说服PBS刷新它? 解决方案 不幸的是,AFAIK在PBS/Torque中是不可能的-stdout/stderr流在执行主机上本地后台处理,然后在之后传输到提交主机工作已经完成.如果您想在执行期间监视程序,则可以将程序的标准输出重定向到文件(仅在执行和sumit主机共享一个公共文件系统时才有意义 ..
发布时间:2020-05-24 21:04:30 其他开发

在open-mpi/mpi-run中加载共享库

我正在尝试通过使用mpi run的扭矩计划程序来运行我的程序.虽然在我的pbs文件中,我通过 加载了所有库 export LD_LIBRARY_PATH=/path/to/library 但是它给出了错误 error while loading shared libraries: libarmadillo.so.3: cannot open shared object file: ..
发布时间:2020-05-12 19:58:28 其他开发