pdfbox相关内容

使用pdfbox从单独的pdf(不同页面大小)添加页面作为图层

如果页面大小不同,如何将外部pdf文档中的页面添加到目标pdf? 以下是我想要完成的事情: 我尝试使用LayerUtility(就像在这个例子中一样 PDFBox LayerUtility - 将图层导入现有PDF ,但是一旦我从外部pdf导入页面,该过程就会挂起: PDDocument destinationPdfDoc = PDDocument.load(fileInputSt ..
发布时间:2018-12-07 13:44:29 Java开发

如何使用pdfbox在pdf中添加超链接

我想在使用 PDFBOX 创建的PDF中添加超链接,这样我点击一些文字示例'点击此处'将重定向到网址。我尝试使用 PDAnnotationLink 和 PDActionURI ,但是如何将其添加到 contentstream ? PDBorderStyleDictionary borderULine = new PDBorderStyleDictionary(); borderULin ..
发布时间:2018-12-07 13:26:39 Java开发

无法使用PDFBox将图像添加到pdf

我正在编写一个使用pdfbox库从头开始创建pdf的java应用程序。 我需要在页面中放置一个jpg图像。 我正在使用此代码: PDDocument document = new PDDocument(); PDPage page = new PDPage(PDPage.PAGE_SIZE_A4); document.addPage(page); PDPageCon ..
发布时间:2018-12-07 13:01:37 Java开发

Java:Apache PDFbox提取突出显示的文本

我正在使用Apache PDFbox库从PDF文件中提取突出显示的文本(即黄色背景)。我对这个库完全是新手,并且不知道它用于此目的的哪个类。 到目前为止,我已使用以下代码从评论中提取文本。 PDDocument pddDocument = PDDocument.load(new文件( “检验.pdf”)); 列出allPages = pddDocument.getDocumentCat ..
发布时间:2018-12-06 14:52:24 Java开发

将BufferedImage添加到PDFBox文档

在我当前的项目中,我尝试将 BufferedImage 添加到PDFBox文档中。更具体地说,我使用 JFreeChart 中的图像。我的代码如下所示: public void exportToPDF(JFreeChart chart,String filePath){ PDDocument doc = null; PDPage page = null; PDXObjectIma ..
发布时间:2018-12-06 14:43:51 Java开发

如何使用Apache PDFBox创建表

我们计划将我们的pdf生成实用程序从iText迁移到PDFBox(由于iText中的许可问题)。通过一些努力,我能够编写和定位文本,绘制线条等。但创建表格中嵌入文本的表格是一个挑战,我通过文档,示例,谷歌,Stackoverflow找不到一个东西。想知道PDFBox是否为创建带有嵌入文本的表提供本机支持。我的最后一招是使用此链接 https://github.com/eduardohl/Pagin ..
发布时间:2018-12-06 13:48:37 Java开发

将PDF文件转换为图像

我想将PDF文档转换为图像。我使用的是Ghost4j。 问题: Ghost4J在运行时需要gsdll32.dll文件,我不想要使用dll文件。 问题1:有没有什么方法,在ghost4j中转换图像而没有dll? 问题2:我在PDFBox API中找到了解决方案。 org.apache.pdfbox.pdmodel.PDPagep 有方法 convertToImage()`将PDF ..
发布时间:2018-12-06 13:36:19 Java开发

使用pdfbox从pdf中删除不可见的文本

链接到pdf 当我尝试从上面的pdf中提取文本时,我得到了一个在evince查看器中看不见的文本混合文本以及可见的文本。此外,一些所需的文本缺少观众中没有遗漏的字符,例如“FALCONS”中的“S”和许多缺少的“½”字符。我认为这是由于隐形文本的干扰,因为在查看器中突出显示pdf时,可以看到隐藏文本与可见文本重叠。 有没有办法删除不可见的文字?或者还有其他解决方案吗? 代码: ..
发布时间:2018-12-05 11:37:16 Java开发

如何使用pdfbox提取文本内容的字体样式?

我正在使用pdfbox库从pdf文件中提取文本内容。我可以提取所有文本,但找不到提取字体样式的方法。 解决方案 这不是提取字体的正确方法。要读取字体,必须遍历pdf页面并提取字体,如下所示: PDDocument doc = PDDocument.load(“C: /mydoc3.pdf“); 列表 pages = doc.getDocumentCatalog( ..
发布时间:2018-12-05 11:33:46 Java开发

pdfBox - 签名有效性复选标记在Acrobat阅读器中不可见

我使用此作为参考向pdf添加视觉签名 - https://stackoverflow.com/a/27940667/7103795 我能够正确打印详细信息。但是,在Acrobat中打开时,pdf不会显示绿色勾号,尽管它是“已签名且所有签名都有效”。在签名面板中。 这是我需要的一个例子: 如何确保出现有效性标志? 我正在使用pdfBox版本2.0.1 解决方案 在 - ..
发布时间:2018-12-04 13:45:20 Java开发

如何使用PDFBox drawString插入换行符

我必须用表制作PDF。到目前为止它工作正常,但现在我想添加一个包装功能。所以我需要插入换行符。 contentStream.beginText(); contentStream.moveTextPositionByAmount(x,y); contentStream.drawString(“要插入表中的一些文本。”); contentStream.endText(); ..
发布时间:2018-12-04 12:51:29 Java开发

使用PDFBox从PDF文档中读取特定页面

如何使用PDFBox从PDF文档中读取特定页面(给定页码)? 解决方案 这应该work: PDPage firstPage =(PDPage)doc.getAllPages()。get(0); 如教程的BookMark部分 更新2015,版本2.0.0 SNAPSHOT 似乎已将其删除并放回(?)。 getPage 位于2.0.0 g ..
发布时间:2018-12-04 12:18:56 Java开发

如何使用pdfbox从pdf中提取粗体文本?

我正在使用Apache pdfbox来提取文本。我可以从pdf中提取文本,但我不知道如何知道这个词是否是粗体??? (代码建议会很好!!!) 以下是从pdf中提取纯文本的代码,该代码工作正常。 PDDocument document = PDDocument .load(“/ home / lipu / workspace / MRCPTester / test.pdf”); d ..
发布时间:2018-12-04 12:01:27 Java开发

用PDFBOX写阿拉伯语并使用正确的字符表示形式而不分开

我正在尝试使用PDFBox Apache生成包含阿拉伯语文本的PDF,但文本生成为单独的字符,因为Apache将给定的阿拉伯字符串解析为一系列通用的“官方”Unicode字符,这些字符等同于孤立形式的阿拉伯字符。 以下是一个示例: 目标文本以PDF格式写入“应该是PDF文件中的预期输出” - >جملةبالعربي 我在PDF文件中得到的结果 - > 我尝试了一些方法,但 ..
发布时间:2018-11-29 19:20:10 Java开发

将PDF转换为多页tiff(第4组)

我正在尝试转换由org.apache.pdfbox.pdmodel.PDDocument类和icafe库( https://github.com/dragon66/icafe/ )使用4组压缩和300 dpi的倍数tiff。示例代码适用于我288 dpi,但奇怪的是不是300 dpi,导出的tiff仍然只是白色。有谁知道这里的问题是什么? 我在示例中使用的示例pdf位于: http://ww ..
发布时间:2018-11-28 20:22:36 Java开发

pdfbox 2.0.2>调用PageDrawer.processPage方法捕获异常

作为pdfbox 2.0.2的新手( https://github.com/apache /pdfbox/tree/2.0.2 )用户,我想得到一个页面(PDPage)的所有描边线(例如,表的列和行边框),因此我创建了以下类: package org.apache.pdfbox.rendering; import java.awt.geom.GeneralPath; import j ..
发布时间:2018-11-28 00:12:01 Java开发

使用PDFBox将UTF-8编码的字符串写入PDF

我无法使用PDFBox将unicode字符写入PDF。下面是一些生成垃圾字符而不是输出“š”的示例代码。我可以添加什么来获得对UTF-8字符串的支持? PDDocument document = new PDDocument(); PDPage page = new PDPage(); document.addPage(page); PDPageContentStream co ..
发布时间:2018-11-27 12:58:29 Java开发

使用PDFBox解析PDF文件(尤其是表格)

我需要解析包含表格数据的PDF文件。我正在使用 PDFBox 提取文件文本以便稍后解析结果(字符串)。问题是文本提取不像我期望的表格数据那样工作。例如,我有一个包含这样的表的文件(7列:前两个总是有数据,只有一个Complexity列有数据,只有一个Financing列有数据): + ------------------------------------ ---------------- ..
发布时间:2018-11-27 12:33:09 Java开发