如何使用 hadoop Map reduce 处理/提取 .pst [英] How to process/extract .pst using hadoop Map reduce

查看：30 发布时间：2021/11/14 23:46:09 hadoop mapreduce mapi apache-tika pst

本文介绍了如何使用 hadoop Map reduce 处理/提取 .pst的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在使用 MAPI 工具(它的 microsoft lib 和 .NET)，然后使用 apache TIKA 库来处理和提取 pst交换服务器，不可扩展.

I am using MAPI tools (Its microsoft lib and in .NET) and then apache TIKA libraries to process and extract the pst from exchange server, which is not scalable.

我如何使用 MR 方式处理/提取 pst ......是否有任何工具，Java 中可用的库，我可以在我的 MR 工作中使用.任何帮助都会很棒.

How can I process/extracts pst using MR way ... Is there any tool, library available in java which I can use in my MR jobs. Any help would be great-full .

Jpst Lib 内部使用:PstFile pstFile = new PstFile(java.io.File)

Jpst Lib internally uses: PstFile pstFile = new PstFile(java.io.File)

问题在于 Hadoop API 的我们没有任何接近 java.io.File 的东西.

And the problem is for Hadoop API's we don't have anything close to java.io.File.

以下选项总是存在但效率不高:

Following option is always there but not efficient:

  File tempFile = File.createTempFile("myfile", ".tmp");
  fs.moveToLocalFile(new Path (<HDFS pst path>) , new Path(tempFile.getAbsolutePath()) );
  PstFile pstFile = new PstFile(tempFile);

如何使用 hadoop Map reduce 处理/提取 .pst [英] How to process/extract .pst using hadoop Map reduce

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

如何使用 hadoop Map reduce 处理/提取 .pst [英] How to process/extract .pst using hadoop Map reduce

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭