dask-ml相关内容
我是新来达斯克的,如果你觉得这个问题很愚蠢,请原谅。在DASK中,我正在使用一个包含大约50 GB数据的DASK数据帧。这些数据是字符串数据,我需要在将其提供给机器学习算法(使用线程进行快速处理)之前对其进行预处理(使用进程进行快速处理)。现在的问题是,当我根据进程设计集群时,数据帧操作是快的,但相对于线程来说,它是慢的(但线程使用机器学习是快的)。因此,我正在寻找一种可以从进程切换到线程环境的解
..
我正在我的 dask worker 上运行一个简单的程序.下面是程序. 将 numpy 导入为 np从 dask.distributed 导入客户端导入作业库从 sklearn.datasets 导入 load_digits从 sklearn.model_selection 导入 RandomizedSearchCV从 sklearn.svm 导入 SVC客户端 = 客户端('127.0.0.1
..
我正在加载预先训练的keras模型,然后尝试使用dask并行化大量输入数据吗?不幸的是,我与此有关的一些问题与如何创建我的dask数组有关.任何指导将不胜感激! 设置: 首先,我从此存储库中克隆了 https://github.com/sanchit2843/dlworkshop.git 可复制代码示例: import numpy as np import pandas a
..