Apache Spark读取S3:无法腌制thread.lock对象 [英] Apache Spark reads for S3: can't pickle thread.lock objects

查看：122 发布时间：2020/5/13 21:06:56 python multithreading apache-spark amazon-s3 pyspark

本文介绍了Apache Spark读取S3:无法腌制thread.lock对象的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

所以我想让我的Spark应用程序从Amazon的S3中读取一些文本.我写了以下简单的脚本:

So I want my Spark App to read some text from Amazon's S3. I Wrote the following simple script:

import boto3
s3_client = boto3.client('s3')
text_keys = ["key1.txt", "key2.txt"]
data = sc.parallelize(text_keys).flatMap(lambda key: s3_client.get_object(Bucket="my_bucket", Key=key)['Body'].read().decode('utf-8'))

当我执行data.collect时，出现以下错误:

When I do data.collect I get the following error:

TypeError: can't pickle thread.lock objects

，我似乎在网上找不到任何帮助.也许有人设法解决了上述问题?

and I don't seem to find any help online. Have perhaps someone managed to solve the above?

Apache Spark读取S3:无法腌制thread.lock对象 [英] Apache Spark reads for S3: can't pickle thread.lock objects

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

Apache Spark读取S3:无法腌制thread.lock对象 [英] Apache Spark reads for S3: can&#39;t pickle thread.lock objects

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

Apache Spark读取S3:无法腌制thread.lock对象 [英] Apache Spark reads for S3: can't pickle thread.lock objects

登录关闭