如何查看Dask计算任务的进度? [英] How to see progress of Dask compute task?

查看:32
本文介绍了如何查看Dask计算任务的进度?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

当我使用 Dask 运行计算任务时,我想在 Jupyter 笔记本上看到一个进度条,我正在计算一个 +4GB 大型 csv 文件中 id 列的所有值,所以有什么想法吗?

I would like to see a progress bar on Jupyter notebook while I'm running a compute task using Dask, I'm counting all values of id column from a large csv file +4GB, so any ideas?

import dask.dataframe as dd

df = dd.read_csv('data/train.csv')
df.id.count().compute()

推荐答案

如果您使用的是单机调度程序,请执行以下操作:

If you're using the single machine scheduler then do this:

from dask.diagnostics import ProgressBar
ProgressBar().register()

http://dask.pydata.org/en/latest/diagnostics-本地.html

如果您使用分布式调度程序,请执行以下操作:

If you're using the distributed scheduler then do this:

from dask.distributed import progress

result = df.id.count.persist()
progress(result)

或者只是使用仪表板

http://dask.pydata.org/en/latest/diagnostics-分布式.html

这篇关于如何查看Dask计算任务的进度?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆