如何在 pandas 中向下转换数字列? [英] How to downcast numeric columns in Pandas?

查看:0
本文介绍了如何在 pandas 中向下转换数字列?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

如何优化数据帧内存占用并为数值列找到最优(最小)数据类型dtypes。例如:

   A        B    C         D
0  1  1000000  1.1  1.111111
1  2 -1000000  2.1  2.111111

>>> df.dtypes
A      int64
B      int64
C    float64
D    float64

预期结果:

>>> df.dtypes
A       int8
B      int32
C    float32
D    float32
dtype: object

推荐答案

您可以在to_numeric中使用参数downcast,通过DataFrame.select_dtypes选择整型和浮点型列,它使用的是 pandas 0.19+,就像提到的@Anurag,谢谢:

fcols = df.select_dtypes('float').columns
icols = df.select_dtypes('integer').columns

df[fcols] = df[fcols].apply(pd.to_numeric, downcast='float')
df[icols] = df[icols].apply(pd.to_numeric, downcast='integer')

print (df.dtypes)
A       int8
B      int32
C    float32
D    float32
dtype: object

这篇关于如何在 pandas 中向下转换数字列?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆