如何使用hadoop Map reduce处理/提取.pst [英] How to process/extract .pst using hadoop Map reduce

查看：85 发布时间：2020/5/5 15:42:34 hadoop mapreduce mapi apache-tika pst

本文介绍了如何使用hadoop Map reduce处理/提取.pst的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在使用 MAPI 工具(其Microsoft lib和.NET)，然后使用 apache TIKA 库来处理和提取 pst 交换服务器，这是不可扩展的.

I am using MAPI tools (Its microsoft lib and in .NET) and then apache TIKA libraries to process and extract the pst from exchange server, which is not scalable.

我如何使用MR方式处理/提取pst ... java是否有可用的工具和库供我在MR作业中使用.任何帮助将是全力以赴.

How can I process/extracts pst using MR way ... Is there any tool, library available in java which I can use in my MR jobs. Any help would be great-full .

Jpst Lib内部使用:PstFile pstFile = new PstFile(java.io.File)

Jpst Lib internally uses: PstFile pstFile = new PstFile(java.io.File)

问题出在 Hadoop API 上，因为我们没有与java.io.File接近的东西.

And the problem is for Hadoop API's we don't have anything close to java.io.File.

以下选项始终存在，但效率不高:

Following option is always there but not efficient:

  File tempFile = File.createTempFile("myfile", ".tmp");
  fs.moveToLocalFile(new Path (<HDFS pst path>) , new Path(tempFile.getAbsolutePath()) );
  PstFile pstFile = new PstFile(tempFile);

如何使用hadoop Map reduce处理/提取.pst [英] How to process/extract .pst using hadoop Map reduce

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

如何使用hadoop Map reduce处理/提取.pst [英] How to process/extract .pst using hadoop Map reduce

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭