从Dask中具有多个值的列创建虚拟对象 [英] Create dummies from column with multiple values in dask
本文介绍了从Dask中具有多个值的列创建虚拟对象的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我的问题类似于此帖子Create dummies from column with multiple values in pandas
目标:我想在下面产生类似的结果,但使用DASK
在 pandas 中
import pandas as pd
df = pd.DataFrame({'fruit': ['Banana, , Apple, Dragon Fruit,,,', 'Kiwi,', 'Lemon, Apple, Banana', ',']})
df['fruit'].str.get_dummies(sep=',')
它将输出以下内容:
Apple Banana Dragon Fruit Banana Kiwi Lemon
0 1 1 0 1 1 0 0
1 0 0 0 0 0 1 0
2 0 1 1 0 0 0 1
3 0 0 0 0 0 0 0
上面的Get_Dummies()的类型为<;anda as.core.strings.StringMethods>;
现在的问题是,对于DASK等效<;dask.dataframe.accessor.StringAccessor>;,没有Get_Dummies()如何使用DaskTM解决我的问题?
推荐答案
显然,这在dask中是不可能的,因为我们事先不知道输出列。请参阅https://github.com/dask/dask/issues/4403。
这篇关于从Dask中具有多个值的列创建虚拟对象的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文