pdfbox相关内容

添加了无法为Acrobat加载正确的pdfbox的字体

我正在尝试使用以下代码嵌入字体, 基于Stackoverflow和PDFBOX-2661: 作为Helvetica的替代字体嵌入的字体为DejaVuSans。 // given: PDDocument document, PDAcroForm acroForm InputStream font_file = ClassLoader.getSystemResourceAsStream( ..
发布时间:2022-07-18 15:56:47 Java开发

按原样获取PDF的文本层并将其传递给另一个PDF

下午好,我的项目有一个问题,这是PDF压缩,过程如下: 从PDF中提取图像 挂起OCR 压缩库存 每页OCR+合并图像和转换PDF 将所有生成的pdf与OCR、OCR PDFcon One组合成最终产品。 我的原始文件大小为11 MB,压缩后为4.2 MB。 整个过程运行得很完美,但我遇到的问题是OCR过程的速度。我在网上查看,我看到了一种方法来规避这个过程,那就是获得原始PDF的文本层,并将其传 ..
发布时间:2022-07-18 15:52:28 其他开发

PDFBox-如何点击PDF文件中的链接以移动到另一个页面并为其中的特定文本加下划线?

在Adobe Acrobat中,我可以在PDF文件中定义一个链接,并在单击该链接时设置一个JavaScript操作,以转到另一个页面并在该页面中的特定单词下划线,如下图所示: 我想使用Java的PDFBox库做同样的事情。我已经成功地定义了一个链接,但如何设置该链接的JavaScript代码以移动到另一页并在该页中的特定单词下划线? 以下是我当前的代码: PDAnnotation ..
发布时间:2022-07-18 15:46:46 前端开发

如何从PDF文件中删除图像?

您好,感谢您回答我的问题。这个问题困扰了我很长时间。 我已经搜索这个QS很长时间了,我在堆栈溢出和Google上读了很多文章,但那些文章过时了或碎片化了,所以我不得不寻求帮助。 我希望有人能帮帮我。 public class TEST04 { public static void main(String[] args) throws IOException { Sy ..
发布时间:2022-07-18 15:35:45 Java开发

使用pdfbox,为什么可以提取文本,但不能提取图像

我正在使用pdfbox从pdf中提取图像和文本。我有以下提取文本的代码: PDFTextStripper p = new PDFTextStripper(); String thistext=p.getText(document); ,它正确地提取文本。然而,当我尝试使用ExtractImages类从同一个pdf中提取图像时,生成的图像是pdf的所有页面,而不是实际的图像。这是因为p ..
发布时间:2022-04-25 20:15:24 Java开发

打开内容流会将保存的内容清空吗?

我正在尝试通过向每个页面的页眉添加一些文本来修改现有的PDF。但是,即使我下面的简单示例代码最终也会生成一个空白PDF作为输出: document = PDDocument.load(new File("c:/tmp/pdfbox_test_in.pdf")); PDPage page = (PDPage) document.getDocumentCatalog().getAllPa ..
发布时间:2022-04-25 20:03:40 其他开发

COSStream已关闭,无法读取

我的项目中有下一个代码,它不时地落在COSStream has been closed and cannot be read. Perhaps its enclosing PDDocument has been closed? 它发生在不同的时间和不同的工作量,所以我想解决它。 提前谢谢。 public void transferBankActPagesToPdfFile(List ..
发布时间:2022-04-25 19:49:49 Java开发

检测签名之间对已签名PDF所做的更改

我正在开发一个应该验证pdf文件签名的应用程序。应用程序应在应用每个签名之前检测对文件内容进行的更新的完整历史记录。 例如: 签名者%1签署了纯pdf文件 签名者2向签名文件添加了注释,然后对其签名 应用程序如何检测到签名者2在其签名之前添加了注释。 我已经尝试使用itext和pdfbox 推荐答案 已经在comment中解释过,iText和PDFBox都没有提供高 ..
发布时间:2022-04-25 19:33:46 Java开发

使用PdfBox将PDF转换为图像

当使用Pdfbox将PDF(可填充)转换为Jpeg时。复选框中的勾号将转换为方框字符 警告[org.apache.pdfbox.rendering.Type1Glyph2D]代码52没有字形 (A20)字体为ZapfDingbats 公共静态空Main(字符串[]args)引发异常{ try (final PDDocument document = PDDocument. ..
发布时间:2022-04-25 19:12:56 其他开发

是否使用PDFBox将FormXObject内容从资源添加到内容流?

我的page1下有FormXObject-&>资源-&>X对象->;FM0,FM1,FM2.. 因此它不是Contents->;Contentstream下不可用的直接内容流。因此,我想将的内容流从fm0-&>内容流移动到page1-&>内容-&>内容流。 当我们像这样并行移动内容流时,我们必须将FM0相关资源转移或复制到页面级资源。 1.内容流需要复制到页面级内容下。 ..
发布时间:2022-04-25 18:55:41 Java开发

用PDFbox绘制饼图

我正试着用PDFbox绘制饼图,但切片之间有白线,有人能帮我吗?是否有此选项? 附上我正在使用的绘制圆弧的代码: while (start smallArc = PdfUtils.createSmallArc(a, b, radius, start, start + 2.0944 > stop ? stop : st ..
发布时间:2022-04-25 18:32:11 Java开发

PDFBox 1.8 PrintTextLocations多页文本位置位置高度错误pdf

我正在运行PDFBox提供的示例,以获取每个TextPosition的宽度/高度。当我通过一页pdf时,它会给我准确的结果。但如果我使用多页pdf,我得到的高度不正确。 这是我做的实验,我拿了一个5页的pdf作为参数传入(为每个文本位置获取了错误的高度)。接下来,我使用MacOSX预览将相同的pdf分成5个单页pdf,然后逐一浏览(我得到了正确的高度)。 package printte ..
发布时间:2022-04-25 18:25:00 其他开发

Java-PDFbox:为带标签的PDF中的线条和下划线创建构件标签

我正在从标记的pdf创建辅助功能PDF。它显示";路径对象未标记&q;错误。PDF有线条和带下划线的文本。因此,我正在尝试为未添加标签的行项目添加";artiture";标记。我可以从PDFGraphicsStreamEngine获得这些行。有人能帮我这个忙吗? PDF页面 PAC3错误 推荐答案 您可以使用PdfContentStreamEditor中的 ..
发布时间:2022-04-25 18:15:38 Java开发

在PDF文档中嵌入OTF字体

有没有办法使用ApachePDFBox(2.0)在PDF文档中包含OTF字体? 此库似乎只支持TTF字体。 以下是我尝试加载OTF字体时遇到的异常: PDType0Font font = PDType0Font.load(pdf, new File("/home/ben/.fonts/SourceSansPro-Regular.otf")); 抛出: java ..
发布时间:2022-04-25 17:56:52 Java开发

如何使用PDFBox创建链接,我可以单击该链接转到同一文档中的另一个页面

我正在尝试使用PDFBox创建一个链接,我可以单击该链接转到同一文档中的另一个页面。 从这个问题(How to use PDFBox to create a link that goes to *previous view*?)我知道这应该很容易做到,但是当我尝试这样做时,我得到了这个错误:在线程“main”java.lang.IlLegalArgumentException:GoTo操作的 ..
发布时间:2022-04-25 17:41:51 Java开发

带有PDFBox的PDF中指向页面的Java Create链接

我的程序将PDF文件中的位置链接到同一文件中的另一个页面。因此,您可以单击文件中定义的位置,您将被链接到另一个页面。 我使用PDRectangle来定义位置。遗憾的是,该矩形在文档中可见。我希望创建不带可见边框的链接。 我的代码: PDActionGoTo action = new PDActionGoTo(); action.setDestination(desti ..
发布时间:2022-04-25 17:19:58 Java开发

用PDFBox在PDF文件中绘制自动调整大小的图像

我的目标是用一个空白页面(DIN A4)在PDF文件上绘制一个我不知道其尺寸的上传图像。对于水平图像,我有一个包含一个水平空白页面的PDF文件,对于垂直图像,我有一个包含一个垂直页面的PDF文件。 这是我到目前为止的代码: File image = convertMultipartFileToFile(file); //I get a MultipartFile from my Req ..
发布时间:2022-04-25 16:56:00 Java开发

Java:使用PDFBox 1库从图像创建PDF页面

我需要将图像(主要是JPEG)直接转换为PDF文档的PDF页面。 可能是图像大小不同。 每个PDF页面应具有与图像完全相同的尺寸。 因此,每页仅包含全分辨率图像。 将页面设置为图像/内容的尺寸,如何实现这一点? 因为我看到的PDF文件具有不同的页面大小和方向,但如何使用PDFBox做到这一点? 推荐答案 注意(评论者:Valentin Waeselynck:从起,您现 ..
发布时间:2022-04-25 16:37:40 Java开发