从Dask中具有多个值的列创建虚拟对象 [英] Create dummies from column with multiple values in dask

查看:9
本文介绍了从Dask中具有多个值的列创建虚拟对象的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我的问题类似于此帖子Create dummies from column with multiple values in pandas

目标:我想在下面产生类似的结果,但使用DASK

在 pandas 中

import pandas as pd
df = pd.DataFrame({'fruit': ['Banana, , Apple, Dragon Fruit,,,', 'Kiwi,', 'Lemon, Apple, Banana', ',']})
df['fruit'].str.get_dummies(sep=',')

它将输出以下内容:

          Apple  Banana Dragon Fruit    Banana  Kiwi    Lemon
0     1      1        0            1         1     0        0
1     0      0        0            0         0     1        0
2     0      1        1            0         0     0        1
3     0      0        0            0         0     0        0

上面的Get_Dummies()的类型为<;anda as.core.strings.StringMethods>;

现在的问题是,对于DASK等效<;dask.dataframe.accessor.StringAccessor>;

,没有Get_Dummies()

如何使用DaskTM解决我的问题?

推荐答案

显然,这在dask中是不可能的,因为我们事先不知道输出列。请参阅https://github.com/dask/dask/issues/4403

这篇关于从Dask中具有多个值的列创建虚拟对象的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆