如何输出hadoop结果csv格式 [英] How can i output hadoop result in csv format

查看:1273
本文介绍了如何输出hadoop结果csv格式的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我需要输出我的hadoop结果.csv格式。
我将如何做到这一点?
我的代码: https://github.com/studhadoop/xml/ blob / master / XmlParser11.java

I need to output my hadoop result in .csv format. how will i do this? My code :https://github.com/studhadoop/xml/blob/master/XmlParser11.java

我应该在我的代码中包含csvoutputFormat。
我正在使用mapreduce API

should i simply include csvoutputFormat in my code. I am using mapreduce API

myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

解决方案

SOLUTION

ys i在cat

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv


推荐答案

TextOutputFormat。默认键/值分隔符是制表符字符。您可以通过在驱动程序中设置属性mapred.textoutputformat.separatorText来更改分隔符。

You can use TextOutputFormat. The default key/ value separator is a tab character. You can change the separator by setting the property "mapred.textoutputformat.separatorText" in your driver.

conf.set("mapred.textoutputformat.separatorText", ",");

这篇关于如何输出hadoop结果csv格式的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆