py4j相关内容

如何使用 AWS Glue 运行任意/DDL SQL 语句或存储过程

是否可以从 AWS Glue python 作业执行任意 SQL 命令,例如 ALTER TABLE?我知道我可以用它从表中读取数据,但是有没有办法执行其他数据库特定的命令? 我需要将数据摄取到目标数据库中,然后立即运行一些 ALTER 命令. 解决方案 因此,在进行了广泛的研究并在 AWS 支持下打开了一个案例后,他们告诉我目前无法从 Python shell 或 Glue pys ..
发布时间:2021-12-22 21:24:22 其他开发

在 PySpark 中运行自定义 Java 类

我正在尝试在 PySpark 中运行自定义 HDFS 读取器类.这个类是用 Java 编写的,我需要从 PySpark 访问它,无论是从 shell 还是通过 spark-submit. 在 PySpark 中,我从 SparkContext (sc._gateway) 中检索 JavaGateway. 假设我有一堂课: package org.foo.module公共类 Foo { ..
发布时间:2021-12-22 21:22:35 Java开发

在 Windows 上使用 pyspark 不起作用 - py4j

我使用 在 Windows 上安装了 Zeppelin本教程和this.我还安装了 java 8 以避免出现问题. 我现在可以启动 Zeppelin 服务器,并且我正在尝试运行此代码 - %pysparka=5*4打印(“值= %i" % (a))版本 我收到此错误,与 py4j 相关.我之前遇到过这个库的其他问题(与 此处 相同),为了避免它们,我将计算机上 Zeppelin 和 Sp ..
发布时间:2021-11-14 23:52:57 其他开发

如何在 Python 中从 pySpark 添加 SparkListener?

我想创建一个 Jupyter/IPython 扩展来监控 Apache Spark 作业. Spark 提供了一个 REST API. 但是,我希望通过回调发送事件更新,而不是轮询服务器. 我正在尝试注册一个 SparkListener 与 SparkContext.addSparkListener().此功能在 Python 中的 PySpark SparkContext 对象 ..
发布时间:2021-11-12 05:41:08 其他开发

如何添加第三方 Java JAR 文件以在 PySpark 中使用

我有一些用 Java 编写的第三方数据库客户端库.我想通过 访问它们 java_gateway.py 例如:通过 Java 网关使 Python 客户端可以使用客户端类(不是 JDBC 驱动程序!): java_import(gateway.jvm,“org.mydatabase.MyDBClient") 不清楚在哪里将第三方库添加到 JVM 类路径.我试图添加到文件 compute-c ..
发布时间:2021-11-12 05:33:36 Python

如何使用AWS Glue运行任意/DDL SQL语句或存储过程

是否可以从AWS Glue python作业执行任意SQL命令(如ALTER TABLE)?我知道我可以用它来读取表中的数据,但是有没有一种方法可以执行其他特定于数据库的命令? 我需要将数据提取到目标数据库中,然后立即运行一些ALTER命令. 解决方案 因此,在进行了广泛的研究并在AWS支持下打开了一个案例之后,他们告诉我目前无法通过Python shell或Glue pyspark ..
发布时间:2021-04-13 18:34:11 其他开发

如何添加第三方Java JAR文件以在PySpark中使用

我有一些Java第三方数据库客户端库.我想通过 访问它们 java_gateway.py 例如:通过Java网关使客户端类(不是JDBC驱动程序!)对Python客户端可用: java_import(gateway.jvm,"org.mydatabase.MyDBClient") 尚不清楚将第三方库添加到JVM类路径的位置.我试图添加到文件 compute-classpath.s ..
发布时间:2021-04-08 19:21:50 Python

Py4j无法连接到Java服务器

我试图编写一个简单的程序来使用py4j在python和java之间建立连接.我写了以下两行,希望所有内容都能正常运行,因为我没有进行任何更改 from py4j.java_gateway import JavaGateway, GatewayParameters gateway = JavaGateway(gateway_parameters=GatewayParameters(port=2 ..
发布时间:2020-07-04 20:30:55 Python

在Windows上使用pyspark无法正常工作-py4j

我使用在Windows上安装了Zeppelin本教程和此. 我还安装了Java 8以避免出现问题. 我现在能够启动Zeppelin服务器,并且我正在尝试运行此代码- %pyspark a=5*4 print("value = %i" % (a)) sc.version 我遇到了与py4j有关的错误.之前我对此库有其他问题(与此处)一样,为了避免出现这种情况,我将计算机上的Zeppe ..
发布时间:2020-07-04 20:29:44 其他开发

Java InputStream转Python(PY4J)

我正在使用PY4J在python中运行Java代码( http://py4j.sourceforge.net/ ). 我的java函数返回一个InputStream,我想在我的python代码中对其进行操作: Java代码: public InputStream getPCAP(key) { InputStream inputStream = cyberStore ..
发布时间:2020-07-04 20:28:40 Java开发

从Python连接和测试JDBC驱动程序

我正在尝试使用Python在我们的JDBC驱动程序上进行一些测试. 最初弄清楚JPype,我最终设法连接了驱动程序并执行了这样的选择查询(再现了通用代码段): from __future__ import print_function from jpype import * #Start JVM, attach the driver jar jvmpath = 'path/to/li ..
发布时间:2020-07-04 20:28:32 Python