使用 Tika 从大型 pdf 中提取文本 [英] Extract text from a large pdf with Tika

查看：42 发布时间：2021/11/14 23:46:38 java pdf extract apache-tika

本文介绍了使用 Tika 从大型 pdf 中提取文本的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我尝试从一个大的 pdf 中提取文本，但我只得到了第一页，我需要将所有文本传递给一个字符串变量.

I try to extract text from a large pdf, but i only get the first pages, i need all text to will be passed to a string variable.

这是代码

public class ParsePDF {
    public static void main(String args[]) throws Exception {


    try {

      File file = new File("C:/vlarge.pdf");

      String content = new Tika().parseToString(file);

      System.out.println("The Content: " + content);

        }
        catch (Exception e) {
          e.printStackTrace();
        }
    }
}

使用 Tika 从大型 pdf 中提取文本 [英] Extract text from a large pdf with Tika

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录关闭

使用 Tika 从大型 pdf 中提取文本 [英] Extract text from a large pdf with Tika

问题描述

推荐答案

相关文章

Java开发最新文章

热门教程

热门工具

登录 关闭

登录关闭