如何输出hadoop结果csv格式 [英] How can i output hadoop result in csv format
问题描述
我需要输出我的hadoop结果.csv格式。
我将如何做到这一点?
我的代码: https://github.com/studhadoop/xml/ blob / master / XmlParser11.java
I need to output my hadoop result in .csv format. how will i do this? My code :https://github.com/studhadoop/xml/blob/master/XmlParser11.java
我应该在我的代码中包含csvoutputFormat。
我正在使用mapreduce API
should i simply include csvoutputFormat in my code. I am using mapreduce API
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita\ Vidyalayam\,\ Karwar_Class\ 1\ B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
解决方案
SOLUTION
ys i在cat
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
推荐答案
TextOutputFormat。默认键/值分隔符是制表符字符。您可以通过在驱动程序中设置属性mapred.textoutputformat.separatorText来更改分隔符。
You can use TextOutputFormat. The default key/ value separator is a tab character. You can change the separator by setting the property "mapred.textoutputformat.separatorText" in your driver.
conf.set("mapred.textoutputformat.separatorText", ",");
这篇关于如何输出hadoop结果csv格式的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!