pdfbox相关内容

如何在java pdfbox中按结果拆分pdf文件

我有一个pdf文件,其中包含60页。在每个页面中,我都使用Apache PDFBOX独特且重复发票编号。 import java.io. *; import org.apache.pdfbox.pdmodel。*; import org.apache.pdfbox.util。*; import java.util.regex。*; 公共类PDFtest1 { publi ..
发布时间:2018-12-19 21:24:06 Java开发

无法读取跨行突出显示的确切文本

我正在使用PDBox阅读PDF文档中突出显示的内容。我能够以单行和多个单词的形式阅读突出显示的文本。但是,我无法阅读突出显示的文字。请查看以下示例代码以阅读突出显示的文本。 PDDocument pddDocument = PDDocument.load(new File(“C:\\pdf-sample.pdf”)); 列出allPages = pddDocument.getDocume ..
发布时间:2018-12-17 09:48:15 Java开发

用PDFBOX写阿拉伯字符

更新1 我正在尝试使用pdfbox在pdf文档中写一些阿拉伯字符。结果我得到了一些奇怪的角色。您可以在下面找到我用于测试的代码段。请注意,相同的代码用于打印拉丁字符没有任何问题。 public static void main(String [] args)throws例外{ PDDocument document = new PDDocument(); PDPage ..
发布时间:2018-12-12 19:25:12 Java开发

使用pdfbox从pdf中删除加密,如qpdf

使用qpdf,您可以简单地从pdf中删除限制/加密,如下所示: qpdf --decrypt infile outfile 我想用Java中的PDFBox做同样的事情: PDDocument doc = PDDocument.load(inputFilename); if(doc.isEncrypted()) { //删除加密以更改文档 } ..
发布时间:2018-12-12 18:55:44 Java开发

使用PDFBOX API创建新的PDF文档

我需要创建一个PDF来保存执行状态报告,其中状态将在表结构中。是否可以使用PDFBOX api生成pdf表格式? 以下是一些用于创建新PDF文档的示例代码: import java.awt.Color; import java.io.IOException; import org.apache.pdfbox.exceptions.COSVisitorException; ..
发布时间:2018-12-12 00:11:46 Java开发

如何使用PDFBox对动态创建的PDF文档进行数字签名?

请原谅我!我在java中很穷。 请在任何我错的地方纠正我并改善我穷人的地方! 我正在尝试使用PDFBox对动态创建的PDF进行数字签名使用以下程序: 程序中的任务: (i)创建模板PDF (ii)更新ByteRange,xref,startxref (iii)为签名创建构建原始文档 (iv)创建独立的包络数字签名 ( v)通过连接原始文档部分构建数字签名 ..
发布时间:2018-12-11 22:29:34 Java开发

PDF查看文本是否带下划线或表格单元格

我一直在玩PdfBox和PDFTextStripperByArea方法。 如果文字是粗体或 italic ,但我无法获得下划线信息。 据我所知,在PDF中,下划线是通过绘制线条完成的。所以从理论上讲,我应该能够获得有关文本周围某些行的某些信息。根据这些信息,我可以找出是否有下划线或表格。 这是我到目前为止的代码: 列表 textPos = ch ..
发布时间:2018-12-10 23:44:22 Java开发

从文件摘要创建pkcs7签名

目前我有一个客户端 - 服务器应用程序,给定PDF文件,签名(使用服务器证书),将签名附加到原始文件并将输出返回给客户端(所有这些都是通过PDFBox实现的)。 我有一个签名处理程序,这是我的外部签名支持(其中内容是PDF文件) public byte [] sign(InputStream content)抛出IOException { try { System.out.pri ..
发布时间:2018-12-10 23:37:59 Java开发

PDFBox:如何使用指定的打印机打印pdf?

我想使用PDFBox打印由iText创建的PDF文件。我已经使用PDDocument类及其方法print()成功地尝试了这个。您可以在此处找到文档: http://pdfbox.apache.org/apidocs/ 。 (我正在使用此代码:) public static void printPDF(String fileName) 抛出IOException,PrinterExce ..
发布时间:2018-12-10 21:44:33 Java开发

如何使用PDFBox居中文本

我的问题非常简单:如何使用 PDFBox 将PDF文本居中? 我事先不知道字符串,我找不到中间的试用版。字符串并不总是具有相同的宽度。 我需要: 一种可以使文本居中的方法,例如 addCenteredString(myString) 一种可以给我宽度的方法字符串的像素。然后我可以计算中心,因为我知道PDF的尺寸。 欢迎任何帮助! 解决方案 好的,我自己找到了答案。 ..
发布时间:2018-12-10 21:14:38 Java开发

PDFBox - 删除不可见的文本(通过剪辑/填充路径问题)

链接到示例PDF:点击此处。在这里您可以看到左侧的许多标签被剪裁(因为一些剪辑说明) 当我使用PDFTextStripper时,它会打印所有实际剪切/隐藏的文本示例PDF文件。我已经尝试过这里的解决方案,但它的价值甚至是值得的删除顶部的大量文本+每行开头的一些文本。 有没有其他方法只显示可见字符,并使用PDFBox跳过所有重叠的?或者是否有任何其他工具只能返回可见文本? 提前致谢。 ..
发布时间:2018-12-10 11:17:08 Java开发

动态调整jframe /图像的大小或滚动

正如本问题所述(将图像包装到Jframe ),我需要一个jframe来匹配提供的确切图像(图像本身最初是一个已经转换为图像的PDF) 提供的解决方案确实构建了一个jframe到我的图像尺寸,但我实际上无法看到所有的图像。我需要能够调整jframe的大小,图像动态调整为新的jframe大小。如果失败了,我想如果我只是滚动jframe甚至放大或缩小,我至少可以到达我目前看不到的图像部分。 ..
发布时间:2018-12-10 10:21:36 Java开发

如何使用pdfbox将unicode文本写入pdf?

我尝试使用 Apache PDFBox 1.8.6 在 Java 中创建PDF。 (见下面的代码) 如果我写字符串:你好! 123abcäöüß一切正常。 但是如果我添加一个€符号或它的等价\ u20ac字符串搞砸了: þÿ你好 ! 1 2 3abcäöü߬¬| 我认为这与编码有关,因为像OpenOffice这样的程序可以用€或其他Unicode符号导出pdf而不用问题。 ..
发布时间:2018-12-07 19:51:48 Java开发

Radiobutton显示PDFBox的问题

我使用了这个问题答案中的代码来创建我的radiobuttons: 如何使用PDFBox 2.0创建单选按钮组 创建PDF并尝试阅读后从(以编程方式)选择的值,此代码工作正常: PDDocumentCatalog catalog = doc.getDocumentCatalog(); PDAcroForm form = catalog.getAcroForm(); 列表 ..
发布时间:2018-12-07 19:12:53 Java开发

如何使用Apache PDFBox拆分PDF?

我正在使用Apache PDFBox来处理我的Java应用程序中的PDF文件。我想在每个页面上拆分一个PDF文档。 是否可以在Apache PDFBox中执行此操作?如果是这样,怎么做? 解决方案 这可以使用 Splitter 。 这是一个示例代码,它将在每个页面上拆分文档: PDDocument文档= PDDocument.load(myPDF); Splitte ..
发布时间:2018-12-07 18:47:14 Java开发

使用PDFBox获取文本颜色

我刚开始使用PDFBox,提取文本等等。我感兴趣的一件事是我正在提取的文本本身的颜色。但是我似乎无法找到获取该信息的任何方法。 是否可以使用PDFBox获取文档的颜色信息,如果可以,将如何使用我这样做了吗? 非常感谢。 解决方案 全部颜色信息应存储在类 PDGraphicsState 中,使用的颜色(描边/非描边等)取决于使用的文本呈现模式(通过pdfbox邮件列表)。 ..
发布时间:2018-12-07 17:56:00 Java开发

PDFBox:提取文本时维护PDF结构

我正在尝试从充满表格的PDF中提取文本。 在某些情况下,列是空的。 当我从PDF中提取文本时,emptys列被滑动并被空格替换,因此,我的常规表达式无法弄清楚在这个位置有一个没有信息的列。 图片以便更好地理解: 我们可以看到在提取的文本中没有遵守列 从我的代码中提取文本的示例PDF: PDFTextStripper reader = new PDFTextStripp ..
发布时间:2018-12-07 17:52:23 Java开发

在PDFBox中,如何更改PDRectangle对象的原点(0,0)?

情境: 在PDFBox中,PDRectangle对象的默认原点(0,0)似乎是页面的左下角。 例如,以下代码在页面的左下角为您提供一个方格,每边长度为100个单位。 PDRectangle rectangle = new PDRectangle(0,0,100,100); 问题: 是否可以将原点更改为UPPER-LEFT转角,例如,上面的代码会在页面的 ..
发布时间:2018-12-07 13:46:56 Java开发

如何知道字段是否在特定页面上?

PDFbox内容流是按页面完成的,但这些字段来自目录中的表格,该表格来自pdf文档本身。所以我不确定哪些字段在哪些页面上,以及它导致将文本写入错误的位置/页面。 ie。我正在处理每页的字段,但不确定哪些字段在哪些页面上。 有没有办法告诉哪个字段在哪个页面上?或者,有没有办法只获取当前页面上的字段? 谢谢! Mark 代码段: PDDocument pdfDoc ..
发布时间:2018-12-07 13:44:50 Java开发