更新hadoop HDFS文件 [英] Updating a hadoop HDFS file

查看:178
本文介绍了更新hadoop HDFS文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我是Hadoop的新手。我一直在阅读HDFS,主要是关于一次写作,随时阅读。我有一个用例,我可能需要修改HDFS中存储的文件。我一直在研究是否有任何方法可以做到这一点。



我的问题是可以将HDFS文件加载到HBase中,进行修改并保存回到HDFS中,并删除原始文件。如果这是可行的,请让我。 解决方案

您仍然可以通过TableInputFormat和TableOutputFormat在MR作业中使用HBase表。如果你想附加数据,你可以使用任何支持hdfs append的hadoop版本,例如0.20.205.0。


I am a newbie to Hadoop. I have been reading that HDFS is mostly about "writing once, reading any times". I have a use case where I may have to make modifications to the files stored in HDFS. I have been researching if there are any ways of doing this.

My question is will it be possible to load the HDFS file into HBase, do the modifications, and save it back in HDFS, and deleting the original file. Please let me if this feasible.

解决方案

If you need to update values in a file you are much better of using HBase. You can still use your HBase table in your MR jobs via the TableInputFormat and TableOutputFormat. If you want to append data you can use any of the hadoop versions that support hdfs append such as 0.20.205.0.

这篇关于更新hadoop HDFS文件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆