joblib相关内容

可以用Joblib倾倒多个对象吗?

我有这个代码。我可以使用joblib.ump将‘pca’和‘svm_clf’保存到一个文件吗?如果没有,还有其他方法吗? from sklearn.svm import SVC from sklearn.externals import joblib from sklearn import decomposition from sklearn import svm X = [[1,3,4, ..
发布时间:2022-04-07 23:15:26 Python

Joblib.在Windows上挂起的Spyder中并行运行

我工作时在Windows Server 2013上运行的是Python3.5.1。我有一些令人尴尬的并行任务,它们似乎可以用基本相同的代码在Python2.7上运行,但我不知道如何让它在Python3.5.1上运行。 我使用的是蟒蛇2.4.1 代码如下...我已经把它减到了最低限度。 ->main.py apackage ->__init__.py ->amodule.py ..
发布时间:2022-04-05 19:57:33 Python

delay() 函数有什么作用(在 Python 中与 joblib 一起使用时)

我已经阅读了 文档,但我不明白这是什么意思:延迟函数是一个简单的技巧,可以使用函数调用语法创建元组(函数、args、kwargs). 我正在使用它来遍历我想要操作的列表(allImages),如下所示: def joblib_loop():并行(n_jobs=8)(延迟(getHog)(i)对于所有图像中的 i) 这会返回我想要的 HOG 功能(并使用我所有的 8 个内核来提高速度),但 ..
发布时间:2022-01-12 13:04:17 Python

在 Python 中并行化四个嵌套循环

我有一个相当简单的嵌套 for 循环,它遍历四个数组: 对于 a_grid 中的 a:对于 b_grid 中的 b:对于 c_grid 中的 c:对于 d_grid 中的 d:do_some_stuff(a,b,c,d) # 执行计算并写入文件 也许这并不是在 4D 网格上执行计算的最有效方式.我知道 joblib 能够并行化两个嵌套的 for 循环,例如 this,但我无法将其推广到四个嵌套 ..
发布时间:2022-01-12 12:42:31 Python

如何从 Google Cloud Storage 存储桶加载保存在 joblib 文件中的模型

我想从 Google Cloud Storage 存储桶加载一个保存为 joblib 文件的模型.当它在本地路径时,我们可以如下加载它(考虑到model_file是系统中的完整路径): loaded_model = joblib.load(model_file) 我们如何使用 Google Cloud Storage 完成相同的任务? 解决方案 我认为这不可能,至少是直接的.我想过一种 ..
发布时间:2021-12-25 14:43:03 Python

如何在并行处理期间重用 selenium 驱动程序实例?

为了抓取 URL 池,我使用 joblib 并行处理 selenium.在这种情况下,我面临两个挑战: 挑战 1 是加快这一过程.目前,我的代码为每个 URL 打开和关闭一个驱动程序实例(理想情况下每个进程一个) 挑战 2 是摆脱 CPU 密集型 while 循环,我认为我需要在空结果上continue(我知道这很可能是错误的) 伪代码: URL_list = [URL1, URL ..
发布时间:2021-07-17 18:42:01 Python

使用 joblib 在 sklearn 中重用由 cross_val_score 拟合的模型

我在 python 中创建了以下函数: def cross_validate(算法,数据,标签,cv=4,n_jobs=-1):打印“交叉验证使用:"对于 alg,算法中的预测变量:打印算法打印# 计算所有交叉验证折叠的准确度分数.分数 = cross_val_score(算法,数据,标签,cv=cv,n_jobs=n_jobs)# 取分数的平均值(因为我们对每一折都有一个)打印乐谱print( ..
发布时间:2021-07-16 20:01:36 Python

多处理支持的并行循环不能嵌套在线程下

joblib 中出现此类问题的原因是什么?'多处理支持的并行循环不能嵌套在线程下,设置 n_jobs=1'我应该怎么做才能避免这种问题? 实际上我需要实现 XMLRPC 服务器,它在后台线程中运行大量计算并通过 UI 客户端轮询报告当前进度.它使用基于 joblib 的 scikit-learn. 附:我只是将线程的名称更改为“MainThread"以避免此类警告,并且一切看起来都很好 ..
发布时间:2021-07-16 19:50:44 其他开发

Python joblib 性能

我需要运行一个令人尴尬的并行 for 循环.快速搜索后,我找到了python的包joblib.我做了一个简单的测试,如软件包网站上发布的那样.这是测试 from math import sqrt从 joblib 导入并行,延迟导入多处理%timeit [sqrt(i ** 2) for i in range(10)]结果:每个循环 3.89 µs ± 38.9 ns(7 次运行的平均值 ± 标准 ..
发布时间:2021-06-14 18:54:13 Python

在 Python 中优化数据处理的最佳方法

我在 Python 3.8 中有以下数据处理管道: 大约 1.3TB 的原始数据存储在 SSD 上,细分为大约 80 个不同的独立类别,进一步细分为单独的 300mb 压缩 csv.gz 3 个主要类,一个将原始数据清理为可读格式,第二个聚合所述数据并进行我需要的数学运算,第三个导入前 2 个,读取每个 csv,运行所有这些进程并保存结果,遍历 csvs.我有约束,因为它是时间序列数据,所 ..
发布时间:2021-06-04 20:21:21 Python

线程 QueueManagerThread 中的异常 - scikit-learn

当我设置 n_jobs=-1 我得到错误,如果我设置 n_jobs 等于 big value (n_jobs=100),但是如果设置较小的值(例如 n_jobs=32),它工作正常.我试过重新安装 scikit-learn 和 joblib 包,但无济于事.此外,它 (n_jobs=-1) 之前工作正常,但突然出错. 来自 sklearn 导入数据集从 sklearn.model_selecti ..
发布时间:2021-06-04 20:04:24 Python