multiprocessing相关内容

Gevent Monkeypatching破坏多处理

我正在尝试使用多重处理池来运行一组进程,每个进程都将运行一个greenlet的gevent池.原因是网络活动很多,CPU活动很多,因此要最大化带宽和所有CPU核心,我需要多个进程以及gevent的异步猴子补丁程序.我正在使用multiprocessing的管理器来创建一个队列,进程将访问该队列以获取要处理的数据. 这是代码的简化片段: import multiprocessing f ..
发布时间:2020-05-13 19:26:24 Python

multiprocessing.freeze_support()

为什么多处理模块需要调用特定的功能在“冻结"以生成Windows可执行文件时可以工作? 解决方案 原因是Windows上缺少fork()(这是 完全不正确).因此,在Windows上,通过创建一个 new 进程来模拟,该进程在其中运行在子进程中运行的代码(在Linux上).由于代码将在技术上不相关的流程中运行,因此必须先将其交付到那里,然后才能运行.交付的方式是先对其进行酸洗,然后通过管道 ..
发布时间:2020-05-13 19:26:22 Python

熊猫多处理申请

我正在尝试对pandas数据框使用多重处理,即将数据框分为8个部分.使用Apply将某些功能应用于每个部件(每个部件在不同的过程中进行处理). 编辑: 这是我终于找到的解决方案: import multiprocessing as mp import pandas.util.testing as pdt def process_apply(x): # do some stuf ..
发布时间:2020-05-13 19:26:20 Python

什么时候在进程上调用.join()?

我正在阅读有关Python中的多处理模块的各种教程,并且在理解为什么/何时调用process.join()时遇到了麻烦.例如,我偶然发现了以下示例: nums = range(100000) nprocs = 4 def worker(nums, out_q): """ The worker function, invoked in a process. 'nums' is a ..
发布时间:2020-05-13 19:26:17 Python

Python:使用多处理池时,写入具有队列的单个文件

我有成千上万的文本文件,希望通过各种方式进行解析.我想将输出保存到单个文件中,而不会出现同步问题.我一直在使用多处理池来节省时间,但是我不知道如何结合使用池和队列. 以下代码将保存文件名和文件中连续"x"的最大数目.但是,我希望所有进程都将结果保存到同一文件中,而不是像示例中那样保存到不同文件中.任何帮助,将不胜感激. import multiprocessing with open ..
发布时间:2020-05-13 19:26:14 Python

带有工作进程的python池

我正在尝试使用Process对象在python中使用工作池.每个工作程序(一个进程)都进行一些初始化(花费很短的时间),传递一系列的工作(理想情况下使用map()),然后返回一些内容.除此之外,没有必要进行任何沟通.但是,我似乎无法弄清楚如何使用map()使用工人的compute()函数. from multiprocessing import Pool, Process class Wo ..
发布时间:2020-05-13 19:26:09 Python

如何在多核Intel CPU中共享高速缓存?

我对多核CPU或多处理器系统中使用的高速缓存有一些疑问. (尽管与编程没有直接关系,但是它在为多核处理器/多处理器系统编写软件时会产生很多影响,因此请在这里询问!) 在多处理器系统或多核处理器(Intel Quad Core,Core两个Duo等)中,每个cpu核/处理器是否都有自己的缓存(数据和程序缓存)? 一个处理器/核心可以访问彼此的缓存,因为如果允许它们访问彼此的缓存,那么在这 ..
发布时间:2020-05-13 19:26:06 其他开发

Python 3.4中的多处理与多线程与异步

我发现在Python 3.4中,用于处理/线程处理的库很少:多重处理与线程与但是我不知道要使用哪个,或者是“推荐的".他们做的是同一件事还是不同?如果是这样,则将哪一个用于什么?我想编写一个在计算机上使用多核的程序.但是我不知道我应该学习哪个图书馆. 解决方案 它们旨在(略有)不同的目的和/或要求. CPython(一种典型的主线Python实现)仍然具有全局解释器锁,因此是多线程应用程序 ..

在HPC上使用scikit-learn函数的并行选项的简便方法

在scikit-learn的许多函数中,实现了用户友好的并行化.例如在 sklearn.cross_validation.cross_val_score您只需在n_jobs参数中传递所需数量的计算作业即可.对于带有多核处理器的PC,它将非常好用.但是,如果我想在高性能群集中使用此类选项(已安装OpenMPI软件包,并使用SLURM进行资源管理)?据我所知,sklearn使用joblib进行并行化, ..

如何在多处理器系统上生成并行子进程?

我有一个Python脚本,希望用作另一个Python脚本的控制器.我有一台具有64个处理器的服务器,因此想产生第二个Python脚本的64个子进程.子脚本称为: $ python create_graphs.py --name=NAME 其中NAME类似于XYZ,ABC,NYU等. 在我的父控制器脚本中,我从列表中检索名称变量: my_list = [ 'XYZ', 'ABC ..
发布时间:2020-05-13 19:25:56 Python

python struct.error:'i'格式要求-2147483648< =数字< = 2147483647

问题 我愿意使用多处理模块(multiprocessing.Pool.starmap()进行特征工程. 但是,它给出以下错误信息.我猜这个错误消息大约是输入的大小(2147483647 = 2 ^ 31 − 1?),因为相同的代码对于输入数据帧(train_scala,test,ts)的一部分(frac=0.05)均能顺利工作.我将数据帧的类型转换为最小,但是并没有变好. anacon ..
发布时间:2020-05-13 19:25:54 Python

将Twisted Python与多处理功能混合在一起?

我需要用Python编写类似程序的代理,其工作流程与网络代理非常相似.该程序位于客户端和服务器之间,接受客户端向服务器发送的请求,处理该请求,然后将其发送到原始服务器.当然,使用的协议是使用TCP的专用协议. 为了最大程度地减少工作量,我想使用Twisted Python处理请求的接收(该部分充当服务器)和重新发送(该部分充当客户端). 为了最大化性能,我想使用python多处理(线程 ..
发布时间:2020-05-13 19:25:51 Python

urllib2的多处理没用吗?

我最近尝试使用多处理模块(和它的工人池).我在这里阅读了一些有关多线程(与标准的非线程版本相比,它使整个过程变慢了)和多处理的讨论,但是我找不到一个(可能非常简单的)问题的答案: 您可以通过多处理来加速url调用吗,还是不是像网络适配器那样的瓶颈?我看不到urllib2-open-method的哪一部分可以并行化以及应该如何工作... 编辑:这是我要加快的请求,也是当前的多处理设置: ..
发布时间:2020-05-13 19:25:48 Python

在python多重处理中修改对象

我有很多自定义对象,需要对它们执行独立(可并行化)的任务,包括修改对象参数.我试过同时使用Manager().dict和'sharedmem'ory,但都没有用.例如: import numpy as np import multiprocessing as mp import sharedmem as shm class Tester: num = 0.0 name ..
发布时间:2020-05-13 19:25:42 Python

在Pandas中通过多处理读取csv文件的最简单方法

这是我的问题. 与一堆.csv文件(或其他文件).熊猫是读取它们并保存为Dataframe格式的简便方法.但是当文件数量巨大时,我想通过多处理读取文件以节省一些时间. 我的早期尝试 我手动将文件分成不同的路径.多次使用: os.chdir("./task_1) files = os.listdir('.') files.sort() for file in files: ..
发布时间:2020-05-13 19:25:36 Python

适用于并行进程的Python多处理

对于某些人来说这太简单了,我感到抱歉,但是我仍然无法理解python的多处理技巧.我读过 http://docs.python.org/dev/library/multiprocessing http://pymotw.com/2/multiprocessing/basics.html 以及Google提供给我的许多其他教程和示例...很多也是从这里开始的. 好吧,我的情况是我必须计算许 ..
发布时间:2020-05-13 19:25:34 Python