hpc相关内容

在具有不同体系结构的群集上应指定哪个AVX和行军?

我目前正在尝试使用Intel编译器来编译用于HPC-Cluster的软件.登录节点是我编译和准备计算的地方,使用英特尔至强E5-2660 v3 / Intel Xeon Gold 6138 ). 据我从上面的链接了解,我的登录节点支持Intel SSE4.2,Intel AVX,Intel AVX2和Intel AVX-512,但我的计算节点仅支持Intel AVX2(Haswell)或In ..
发布时间:2021-04-12 20:54:36 其他开发

如何在多线程HPC集群中运行二进制可执行文件?

我有一个来自complete genomics的名为cgatools的工具( http://cgatools. sourceforge.net/docs/1.8.0/).我需要在高性能计算集群中运行一些基因组分析.我尝试运行分配超过50个内核和250gb内存的作业,但是它仅使用一个内核并将内存限制为小于2GB.在这种情况下,我最好的选择是什么?有没有一种方法可以在HPC群集中运行二进制可执行文件, ..
发布时间:2020-11-23 22:04:29 其他开发

使用指定数量的节点启动Slurm阵列作业

我正在尝试使用Slurm版本14.03.0在我们的HPC上对齐168个序列文件.我一次最多只能使用9个计算节点,以使某些节点对其他人开放. 我更改了文件名,以便可以在sbatch中使用数组函数.序列文件如下所示: Sequence1.fastq.gz,Sequence2.fastq.gz,…Sequence168.fastq.gz 我似乎无法弄清楚如何告诉它一次运行全部168个文件.我 ..
发布时间:2020-11-23 22:04:25 其他开发

如何运行Catalyst/Paraview代码示例?

您好,我想花一会儿时间来解决目录主义者和paraview的问题.我试图在我的视线范围内运行这些示例,但没有成功. https://github.com/Kitware/ParaViewCatalystExampleCode 我想象至少python代码将与python shell一起运行.但这似乎也不起作用.我在网上查看了所有套件教程和其他一些教程.但是仍然没有进展.感谢您的帮助. 解决方案 ..
发布时间:2020-11-23 22:04:11 Python

单线程程序的C#事件订阅限制

我试图监视在单个线程程序中并行运行的许多HPC作业的状态,我订阅的是OnJobState引发的事件,当监视多达三个作业时,事件状态更改将丢失并且作业卡住了. 我假设每个工作都需要一个线程来捕获所有事件,但是我无法在单个线程程序中找到有关事件下标限制的任何信息. 我本以为.net平台会将所有这些排队,但事实并非如此. 解决方案 我制作了这个问题更笼统地消除了对HPC的困惑,似乎我 ..
发布时间:2020-11-23 22:04:10 C#/.NET

FLOPS包括哪些所有操作?

FLOPS表示每秒浮点运算,我对什么是浮点数有所了解.我想知道这些操作是什么? +, -, *, /是唯一的操作还是像取logarithm(),exponential()这样的操作也是FLO? 两个浮点数的+和*是否花费相同的时间?如果他们花费的时间不同,那么我应该从以下陈述中得出什么解释:性能为100 FLOPS .一秒钟内有多少+和*. 我不是计算机科学专业的人,所以请尽量减少技术 ..
发布时间:2020-11-23 22:03:05 其他开发

Java中的Infiniband

众所周知,OFED的Socket Direct协议已已弃用,而OFED的3.x版本确实完全不附带SDP.因此,Java的 SDP 也无法正常工作.我想知道用Java编程infiniband的正确方法是什么?除了编写JNI代码以外,还有其他便携式解决方案吗? 我的要求是在众多infiniband动力机器中实现 RDMA . 解决方案 jVerbs 可能就是您要找的东西. ..
发布时间:2020-11-23 22:02:51 Java开发

"WindowsError:[错误206]文件名或扩展名太长".用子进程运行程序很多次之后

我的python程序在Windows HPC 2008环境中准备输入,运行外部FORTRAN代码并处理输出.除非代码在1042-1045次之间执行外部程序(通常问题会更早收敛),否则它会很好地工作.在这些情况下,我会得到一个例外: WindowsError:[错误206]文件名或扩展名太长 但是,文件名的路径不是 随时间增长.它只是清理目录并再次运行. 这是代码: inpF ..
发布时间:2020-11-23 22:02:48 Python

如何在教堂中添加稀疏域

我正在使用在CSV上读取的循环在Chapel中填充稀疏数组. 我想知道什么是最好的模式. var dnsDom = {1..n_dims, 1..n_dims}; var spsDom: sparse subdomain(dnsDom); for line in file_reader.lines() { var i = line[1]:int; var j = line[ ..
发布时间:2020-11-23 22:00:39 其他开发

SLURM是否每个节点提交多个任务?

我发现了一些非常相似的问题,这些问题帮助我得出了一个似乎有效的脚本,但是我仍然不确定我是否完全理解为什么,因此这个问题. 我的问题(示例):在3个节点上,我想在每个节点上运行12个任务(所以总共有36个任务).另外,每个任务都使用OpenMP,并且应使用2个CPU.在我的情况下,一个节点具有24个CPU和64GB内存.我的脚本是: #SBATCH --nodes=3 #SBATCH - ..
发布时间:2020-11-23 22:00:38 其他开发

如何通过并行化的Python代码在集群上使用多个节点/核心

我有一段Python代码,我在其中使用 joblib 和我最近了解到,我可以访问具有100+ 20个核心节点的HPC集群.集群使用 SLURM 作为工作负载管理器. 第一个问题是:是否可以在集群上运行并行化的Python代码? 如果可能, 是否需要更改我要在集群上运行的Python代码,并且 需要在作业提交文件中放入什么#SBATCH指令以告知代码的并行化部分应在四个内核( ..
发布时间:2020-11-23 22:00:34 Python

GNU parallel --jobs选项在群集上使用多个节点,每个节点具有多个cpus

我正在使用gnu并行在每个节点有2个CPU的高性能(HPC)计算群集上启动代码.该集群使用TORQUE便携式批处理系统(PBS).我的问题是澄清在这种情况下GNU parallel的--jobs选项如何工作. 当我运行不带--jobs选项的,调用GNU parallel的PBS脚本时,如下所示: #PBS -lnodes=2:ppn=2 ... parallel --env $PBS_ ..
发布时间:2020-11-23 22:00:30 其他开发

为什么我的超便携式笔记本电脑CPU无法在HPC中保持最高性能

我开发了一个高性能 Cholesky因式分解例程,该例程在单个CPU(无超线程)上应具有约10.5 GFLOP的峰值性能.但是,当我测试其性能时,有些现象是我不理解的.在我的实验中,我测量了矩阵尺寸N从250增加到10000时的性能. 在我的算法中,我应用了缓存(具有调整的阻塞因子),并且在计算过程中始终以步幅访问数据,因此缓存性能是最佳的.消除了TLB和寻呼问题; 我有8GB的可用RAM ..
发布时间:2020-11-23 21:59:27 其他开发

大规模分布系统中的日志文件

我在网格和HPC空间中进行了大量工作,而在数百个(有时甚至数千个)服务器中分布的系统所面临的最大挑战之一就是分析日志文件。 当前日志文件本地写入每个刀片上的磁盘,但我们也可以考虑使用UDP Appender发布日志信息并集中收集。 鉴于目标是能够尽可能接近实时地发现问题,我们该怎么办? 解决方案 首先,使用NTP同步系统中的所有时钟。 第二,如果要在单个位置收集日志( ( ..
发布时间:2020-10-22 19:02:15 其他开发

vCPU是否可以使用来自两台不同硬件计算机的不同CPU

我已经对此进行了搜索,但是我似乎没有一个公正的答案。 可以说我不想创建一个具有vCPU的虚拟机,并且该vCPU必须具有10个内核,但是我只有2台计算机,每个计算机具有5个物理CPU内核。 是否可以通过中继这两个物理CPU来创建一个vCPU,使其表现像常规的一个物理CPU? 更新1:假设我正在使用virtualBox,而术语vCPU指的是虚拟cpu,这是一个众所周知的术语。 更新 ..
发布时间:2020-10-10 23:55:50 其他开发

口齿不清:也使用控制节点进行计算

我在我们的实验室中建立了一个小型集群(9个节点)以进行计算。目前,我正在使用一个节点作为Slurm控制器,即未将其用于计算。 我也想使用它,但是我不想分配全部CPU,我想为调度和其他与主节点相关的任务留出2个CPU。 是否可以在 slurm中编写类似的内容.conf : NodeName = master NodeHostname = master CPUs = 10 Real ..
发布时间:2020-10-08 01:58:21 其他开发

在单一容器中将conda环境容器化

我遇到过许多实例,将conda环境容器化以实现长期可重复性确实很有帮助。由于我通常在高性能计算系统中运行,因此出于安全考虑,它们必须是奇异容器。 解决方案 首先,您需要为特定的conda环境获取环境YML。 p> conda激活your_env conda env导出>环境.yml 以下是示例奇点配方(在与环境相同目录中名为“奇点”的文件中.yml'): ..
发布时间:2020-10-07 21:51:03 其他开发