如何在数据框中强制转换列? [英] How to cast a column in dataframe?
本文介绍了如何在数据框中强制转换列?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我正在从hbase提取数据并将其转换为dataframe.现在,我在数据框中有一列是string
数据类型.但是我需要将其数据类型转换为Int
.
I am taking data from hbase and converted it to dataframe. Now, I have a column in data-frame which is string
datatype.But i need to convert its datatype to Int
.
尝试下面的代码,但它使我出错
Tried below code but its throwing me an error
df.withColumn("order", 'order.cast(int)')
我面临的错误在下面
error:col should be column
我在这里给了适当的列名,我是否需要在pyspark中更改上述代码的语法?
I have given proper column name here, Do i need to change the syntax of above mentioned code in pyspark?
推荐答案
任一:
df.withColumn("order", df.order.cast("int"))
或
from pyspark.sql.functions import expr
df.withColumn("order", expr("CAST(order AS INTEGER)"))
这篇关于如何在数据框中强制转换列?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文