JavaPackage对象不可调用错误:Pyspark [英] JavaPackage object is not callable error: Pyspark

查看：924 发布时间：2020/7/4 20:29:52 apache-spark pyspark python-3.4 apache-zeppelin py4j

本文介绍了JavaPackage对象不可调用错误:Pyspark的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

诸如dataframe.show()，sQLContext.read.json之类的操作工作正常，但大多数功能都给出了"JavaPackage对象不可调用错误". 例如:当我这样做

Operations like dataframe.show() , sQLContext.read.json works fine , but most functions gives "JavaPackage object is not callable error" . eg : when i do

dataFrame.withColumn(field_name, monotonically_increasing_id())

我得到一个错误

File "/tmp/spark-cd423f35-9572-45ee-b159-1b2732afa2a6/userFiles-3a6e1729-95f4-468b-914c-c706369bf2a6/Transformations.py", line 64, in add_id_column
    self.dataFrame = self.dataFrame.withColumn(field_name, monotonically_increasing_id())
  File "/home/himaprasoon/apps/spark-1.6.0-bin-hadoop2.6/python/pyspark/sql/functions.py", line 347, in monotonically_increasing_id
    return Column(sc._jvm.functions.monotonically_increasing_id())
TypeError: 'JavaPackage' object is not callable

我正在使用apache-zeppelin解释器，并将py4j添加到python路径中.

I am using apache-zeppelin interpreter and have added py4j to python path.

我这样做

import py4j
print(dir(py4j))

导入成功

['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', 'compat', 'finalizer', 'java_collections', 'java_gateway', 'protocol', 'version']

当我尝试

print(sc._jvm.functions)

在pyspark外壳中进行打印

in pyspark shell it prints

<py4j.java_gateway.JavaClass object at 0x7fdaf9727ba8>

但是当我在解释器中尝试此操作时，它会打印

But when I try this in my interpreter it prints

<py4j.java_gateway.JavaPackage object at 0x7f07cc3f77f0>

JavaPackage对象不可调用错误:Pyspark [英] JavaPackage object is not callable error: Pyspark

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

JavaPackage对象不可调用错误:Pyspark [英] JavaPackage object is not callable error: Pyspark

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭