PDFBOX字体的TrueType原因stripper.getText()错误 [英] pdfbox Font TrueType cause stripper.getText() error

查看:3039
本文介绍了PDFBOX字体的TrueType原因stripper.getText()错误的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一些PDF需要提取文本
只有一个PDF格式是TrueType字体
它会导致以下错误:

I have some pdf need to extract to text only one pdf is truetype and it cause following error :

Exception in thread "main" java.lang.NoSuchMethodError: org.apache.fontbox.ttf.TrueTypeFont.getAdvanceWidth(I)I
at org.apache.pdfbox.pdmodel.font.PDTrueTypeFont.getFontWidth(PDTrueTypeFont.java:677)
at org.apache.pdfbox.pdmodel.font.PDSimpleFont.getFontWidth(PDSimpleFont.java:231)
at org.apache.pdfbox.util.PDFStreamEngine.processEncodedText(PDFStreamEngine.java:411)
at org.apache.pdfbox.util.operator.ShowText.process(ShowText.java:45)
at org.apache.pdfbox.util.PDFStreamEngine.processOperator(PDFStreamEngine.java:557)
at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:268)
at org.apache.pdfbox.util.PDFStreamEngine.processSubStream(PDFStreamEngine.java:235)
at org.apache.pdfbox.util.PDFStreamEngine.processStream(PDFStreamEngine.java:215)
at org.apache.pdfbox.util.PDFTextStripper.processPage(PDFTextStripper.java:460)
at org.apache.pdfbox.util.PDFTextStripper.processPages(PDFTextStripper.java:385)
at org.apache.pdfbox.util.PDFTextStripper.writeText(PDFTextStripper.java:344)
at org.apache.pdfbox.util.PDFTextStripper.getText(PDFTextStripper.java:257)

我检查API源$ C ​​$ c和仍然无法通过它。
有什么我可以做什么?
或2.0版本解决了这个问题。

I check the api source code and still can't get through it. Is there something I can do? or the 2.0 version solve this problem.

推荐答案

这不是一个大问题,但一些微小的失误

It's not an big issue but some tiny mistake

由于MKL和蒂尔曼Hausherr

Thanks to mkl and Tilman Hausherr

这是唯一的构建路径问题

首先,我必须fontbox的穆蒂版本,我没有不知道的。

First , I have muti versions of fontbox that I didn't aware of.

只是再次检查,并检查它很难!

Just check it again and check it hard !

如果别人有同样的错误,检查依赖

If others have same error, check the dependencies

pdfbox-1.x.x.jar
fontbox-1.x.x.jar

他们需要的是一样的!

这篇关于PDFBOX字体的TrueType原因stripper.getText()错误的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆