parallel-processing相关内容

使用多核时tm_map变换函数的行为不一致

这篇文章的另一个潜在标题可能是R中的并行处理,核心数、循环块大小和对象大小之间的比率重要吗?"; 我有一个语料库,我正在使用tm包运行一些转换。由于语料库很大,我使用的是多并行程序包的并行处理。 有时转换会执行任务,但有时不会。例如,tm::removeNumbers()。语料库中的第一个文档的内容值为&n417";。因此,如果预处理成功,则此文档将转换为仅&q;n&q ..
发布时间:2022-08-28 20:35:02 其他开发

并行执行git子模块Foreach(&Q)

有没有办法并行执行git submodule foreach命令,类似于--jobs 8参数与git submodule update的工作方式? 例如,我们参与的一个项目涉及近200个子组件(子模块),我们大量使用foreach命令对其进行操作。我想加快速度。 PS:在解决方案涉及脚本的情况下,我在Windows上工作,大多数情况下使用git-bash。 推荐答案 我为您 ..
发布时间:2022-06-14 14:10:32 其他开发

OpenMP的效率与优化级别

我是Open MP的新手,但我已经对此困惑了几天,在网上找不到任何答案。希望这里有人能给我解释一下这个奇怪的现象。 我想比较同一程序的顺序版本和并行版本之间的运行时。当我在GCC-10上用-O或更高级别编译它们时,并行版本的运行速度比顺序版本(~5倍)快得多(但不同级别之间的差异相当小)。 但是,当我使用-O0编译这两个程序时,情况并非如此。事实上,当使用-O0计算这两个版本时,顺序版本甚 ..

受控并行任务执行使用什么

我在一些对象上运行并行任务,为了加快速度,它们并行运行4个。 现在有了一个新要求,我需要执行一项任务,该任务需要一次执行一个任务,而其他任务必须等待(其他任务不能执行其他任务)。 我无法使测试同步。 请检查下面的图像,以便更好地解释。 已经完成了一次执行一个对象,但我想使用一个信号量来等待开始和结束时的4个对象。 问题是信号量并不是为了让另一个信号量进入而等到所有信号量都完成。 ..
发布时间:2022-05-11 20:44:23 C#/.NET

.NET-如何使用信号灯将一段代码一次仅限制为200个线程

我已经开发了一个.Net核心Web API,并且有一个场景,其中我有一个包含大约1000条记录的列表,其中每条记录都将被循环并调用第三方API。第三方API有一个限制,同时只能发送200个请求。因此,我使用了SemaphoreSlim,并将使用此代码块的线程数量限制在200个,并且运行良好。 如果有多个用户或多个请求进入此终结点,则第三方API将引发错误。 如何将SemaphoreSl ..
发布时间:2022-05-11 20:30:48 其他开发

WebView2在异步任务中的并行使用

我有一个简单的默认Windows桌面表单Form1和一个按钮btn_Go作为测试。 我想运行多个并行的WebView2实例,并处理呈现页面中的html代码。 要并行运行WebView2,我使用了SemaphoreSlim(设置为并行2)。另一个SemaphoreSlim用于等待WebView2呈现文档(有一些时间延迟)。 但我的代码落在await webBrowser.EnsureCore ..
发布时间:2022-05-11 19:10:28 C#/.NET

更快/更好:循环遍历数据帧的每一行或将其拆分成一个长度为`nrow`,R

我只是在想,这是否是一个应该考虑的严重权衡。 假设您在R中有一个数据帧,并且想要对每个观测(行)执行一个操作。 我知道迭代行已经是一个微妙的问题,所以我只是想知道三个选项中的哪一个: 每行上正常的for循环 将数据帧拆分成nrow元素列表,对每个元素进行操作并将结果绑定在一起 并行执行上述操作 在没有任何基准测试的情况下,这基本上就是我用伪代码要求的: library(fu ..
发布时间:2022-04-17 22:13:37 其他开发

用于线程和进程的Python3锁定(&Q)

我一直在尝试在python3中编写缓存代码,我希望避免线程和进程的并发问题。 我一直使用threading表示线程安全代码,使用multiprocessing表示进程安全。 我可以同时使用Lock Fromthreading和Lock Frommultiprocessing来解决问题。 但我想知道是否有一种“通用”锁来做这件事或类似的事情。 提前感谢;-) 推荐答案 ..

检查远程错误时出错(VAL):5个节点生成错误:找不到对象

我正在尝试进行10次交叉验证,并通过使用并行处理(ParLApply)来评估联合模型的模型性能。我正在尝试找出我收到错误消息的原因: “检查ForRemoteErrors(Val)时出错:五个节点产生错误:找不到对象‘Week’” 代码如下: # Validation using 10-fold CV library("parallel") set.seed(123) ..
发布时间:2022-04-17 12:32:13 其他开发

为什么这个多处理代码比串行码慢?

我在集群计算设施上尝试了以下Python程序,既有顺序版本,也有并行版本。我可以清楚地看到(使用top命令)为并行程序启动的更多进程。但当我给它计时时,似乎并行版本花了更多的时间。可能的原因是什么?随函附上代码和计时信息。 #parallel.py from multiprocessing import Pool import numpy def sqrt(x): return numpy ..
发布时间:2022-04-10 21:13:33 Python

如何在Python中使用多处理来加速循环执行

我有两个列表。清单A包含500个单词。清单B包含10000个单词。我正在尝试为列表A查找与B相关的相似单词。我正在使用Spacy的相似性函数。 我面临的问题是需要很长时间才能计算出来。我不熟悉多进程用法,因此请求帮助。 如何在python中通过多处理来加速for循环部分的执行? 以下是我的代码。 ListA =['Dell', 'GPU',......] #500 word ..

Os.sched_getapherity(0)与os.cpu_count()

所以,我知道标题中这两种方法的区别,但不知道实际意义。 据我所知:如果您使用的NUM_Worker多于实际可用的内核,您将面临巨大的性能下降,因为您的操作系统不断来回切换以保持并行。我不知道这是不是真的,但我是从某个比我聪明的人那里读到的。 在os.cpu_count()的文档中写着: 返回系统的CPU数量。如果未确定,则返回NONE。此数量不等于 当前进程可以使用。可以获得可用 ..

如何在R中构造一个并行版本的嵌套for循环来计算方阵的值,其中函数依赖于i和j?

我有一个将i和j作为参数并返回单个值的函数,目前我还有一个嵌套循环,用于为方阵中的每个条目计算一个值。但从本质上讲,因为每个单独的值都可以并行计算。在这种情况下,我有没有办法申请LAPPLE?生成的矩阵必须为N X N,并且该函数依赖于i和j。谢谢 for ( i in 1:matrixRowLength ) { for ( j in 1:matrixColLength ) { ..
发布时间:2022-04-09 23:05:28 其他开发

在工作完成后终止DASK工人

我正在尝试使用集群上的Dask.我有兴趣在所有工作完成后立即终止所有工作。 我试着用退休工人的方法来做到这一点,但这似乎并没有杀死工人。 这里有一个例子。 import time import os from dask.distributed import Client def long_func(x): time.sleep(2) return 1 if __name_ ..
发布时间:2022-03-30 21:55:26 Python

在OpenCL内核中,如何在内存位置定位导致异常CL::Error的源代码行?

在Windows10上的OpenCL1.2程序中,在我将内核排队几秒钟之后,提示显示ucrtbase.dll中的内存位置有一个未处理的异常。因此,我使用";try和catch";来获取有关该异常的更多信息。然后我得到了这个: Microsoft C++异常:内存位置0x00000076482F5A28处的CL::错误。 我的内核中的内存读/写可能有问题。但是内核程序包含 ..
发布时间:2022-03-27 19:21:30 其他开发