Pig本地模式，组或联接= java.lang.OutOfMemoryError:Java堆空间 [英] Pig local mode, group, or join = java.lang.OutOfMemoryError: Java heap space

查看：85 发布时间：2020/9/3 20:04:08 apache-pig

本文介绍了Pig本地模式，组或联接= java.lang.OutOfMemoryError:Java堆空间的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

使用 Apache Pig版本0.10.1.21 (已报告)， CentOS 6.3版(最终版)，jdk1.6.0_31(Virtualbox上的Hortonworks Sandbox v1.2，具有3.5 GB RAM)

Using Apache Pig version 0.10.1.21 (reported), CentOS release 6.3 (Final), jdk1.6.0_31 (The Hortonworks Sandbox v1.2 on Virtualbox, with 3.5 GB RAM)

$ cat data.txt
11,11,22
33,34,35
47,0,21
33,6,51
56,6,11
11,25,67

$ cat GrpTest.pig
A = LOAD 'data.txt' USING PigStorage(',') AS (f1:int,f2:int,f3:int);
B = GROUP A BY f1;
DESCRIBE B;
DUMP B;

pig -x local GrpTest.pig

[Thread-12] WARN  org.apache.hadoop.mapred.JobClient - No job jar file set.  User classes may not be found. See JobConf(Class) or JobConf#setJar(String).
[Thread-12] INFO  org.apache.hadoop.mapreduce.lib.input.FileInputFormat - Total input paths to process : 1
[Thread-13] INFO  org.apache.hadoop.mapred.Task -  Using ResourceCalculatorPlugin : org.apache.hadoop.util.LinuxResourceCalculatorPlugin@19a9bea3
[Thread-13] INFO  org.apache.hadoop.mapred.MapTask - io.sort.mb = 100
[Thread-13] WARN  org.apache.hadoop.mapred.LocalJobRunner - job_local_0002
java.lang.OutOfMemoryError: Java heap space
    at org.apache.hadoop.mapred.MapTask$MapOutputBuffer.<init>(MapTask.java:949)
    at org.apache.hadoop.mapred.MapTask$NewOutputCollector.<init>(MapTask.java:674)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:756)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:212)
[main] ERROR org.apache.pig.tools.pigstats.PigStatsUtil - 1 map reduce job(s) failed!
[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1066: Unable to open iterator for alias B

每次在本地模式下执行的Pig脚本中使用GROUP或JOIN时，都会发生 java.lang.OutOfMemoryError:Java堆空间错误.在HDFS上以mapreduce模式执行脚本时没有错误.

The java.lang.OutOfMemoryError: Java heap space error occurs each time I use GROUP or JOIN in a pig script executed in local mode. There is no error when the script is executed in mapreduce mode on HDFS.

问题1 :当数据样本很小且本地模式使用的资源少于HDFS模式时，为什么会出现内存不足错误?

Question 1: How come there is an OutOfMemory error while the data sample is minuscule and local mode is supposed to use less resources than HDFS mode?

问题2 :是否有解决方案可以在本地模式下以GROUP或JOIN成功运行小型猪脚本?

Question 2: Is there a solution to run successfully a small pig scripts with GROUP or JOIN in local mode?

推荐答案

解决方案:强制Pig为java属性io.sort.mb分配更少的内存我在这里设置为10 MB，错误消失了.不确定什么是最好的值，但至少可以在本地模式下练习Pig语法

Solution: force pig to allocate less memory for the java property io.sort.mb I set to 10 MB here and the error disappears. Not sure what would be the best value but at least, this allow to practice pig syntax in local mode

$ cat GrpTest.pig
--avoid java.lang.OutOfMemoryError: Java heap space (execmode: -x local)
set io.sort.mb 10;

A = LOAD 'data.txt' USING PigStorage(',') AS (f1:int,f2:int,f3:int);
B = GROUP A BY f1;
DESCRIBE B;
DUMP B;

这篇关于Pig本地模式，组或联接= java.lang.OutOfMemoryError:Java堆空间的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

Pig本地模式，组或联接= java.lang.OutOfMemoryError:Java堆空间 [英] Pig local mode, group, or join = java.lang.OutOfMemoryError: Java heap space

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

Pig本地模式，组或联接= java.lang.OutOfMemoryError:Java堆空间 [英] Pig local mode, group, or join = java.lang.OutOfMemoryError: Java heap space

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭