如何在数据框中强制转换列? [英] How to cast a column in dataframe?

查看:92
本文介绍了如何在数据框中强制转换列?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在从hbase提取数据并将其转换为dataframe.现在,我在数据框中有一列是string数据类型.但是我需要将其数据类型转换为Int.

I am taking data from hbase and converted it to dataframe. Now, I have a column in data-frame which is string datatype.But i need to convert its datatype to Int.

尝试下面的代码,但它使我出错

Tried below code but its throwing me an error

df.withColumn("order", 'order.cast(int)')

我面临的错误在下面

error:col should be column

我在这里给了适当的列名,我是否需要在pyspark中更改上述代码的语法?

I have given proper column name here, Do i need to change the syntax of above mentioned code in pyspark?

推荐答案

任一:

df.withColumn("order", df.order.cast("int"))

from pyspark.sql.functions import expr

df.withColumn("order", expr("CAST(order AS INTEGER)"))

这篇关于如何在数据框中强制转换列?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆