pdfbox相关内容

使用 PDFBox 合并页面?

我知道我可以使用 PDFBox 将多个 PDF 合并为一个 PDF.但是有没有办法合并页面?例如,我在 PDF 中有一个标题,并希望将其插入到组合 PDF 的第一页顶部并将所有内容向下推.有没有办法使用 PDFBox API 来做到这一点? 解决方案 下面是一些代码,用于将两个文件复制到一个合并的文件中,每个文件都有多个副本.它按页复制.这是我在回答这个问题时得到的信息:使用 PDFBox ..
发布时间:2021-06-15 18:36:48 其他开发

如何使用 PDFBox 从 PDF 中删除特定图像

我需要根据其元数据从 PDF 文件中删除特定图像.可悲.我在互联网上找到的所有例子都使用了废弃的方法. 我是这样写的: try (PDDocument doc = PDDocument.load(new ByteArrayInputStream(pdf))) {doc.getPages().forEach(page ->{PDResources 资源 = page.getResources ..
发布时间:2021-06-15 18:36:45 Java开发

使用 PDFBOX 读取 pdf 文本偶尔会返回 \r\n

我目前正在使用 PDFBox 阅读我继承的一组 pdf 的文本. 我只对阅读文本感兴趣,而不对文件进行任何更改. 适用于大多数文件的代码是: 文件 pdfFile = myPath.toFile();PDDocument 文档 = PDDocument.load(pdfFile);Writer sw = new StringWriter();PDFTextStripper 剥离器 ..
发布时间:2021-06-15 18:36:42 Java开发

PdfBox 将多个图像添加到 pdf

我尝试使用 pdfbox 2.0.8 将多个图像添加到 pdf 中,但目前只会添加一个.我有两个不同的图像,它们应该附加到两个不同的 acrofields 上,但只会添加我列表中的最后一个. 这是我的测试函数: @Test公共无效 attachBulkImageToField(){列表数据 = 新的 ArrayList();data.add(new ImageData(signatureA ..
发布时间:2021-06-15 18:36:39 Java开发

PDFBOX 支持的 PDF 版本

我一直在寻找 Apache PDFBOX 支持的所有 PDF 版本.我使用的是 PDFBOx 0.7.3 版本,实际上我能够处理 1.5 及更早版本的所有 PDF,但我需要处理较新的版本(1.6、1.7 等).您知道升级 PDFBOX 是否可以解决此问题?还有没有升级PDFBOX的指南?如果可以,你能提供吗?您推荐哪个版本? 解决方案 感谢您的回复,实际上我决定将 PDFBox 升级到 1 ..
发布时间:2021-06-15 18:36:27 其他开发

PDDocument 无法使用 addPage() 添加 PDPage 列表

使用 1.8.9 我想使用裁剪工具将 PDF 页面剪切为多页 PDF.但是当我向我的 PDDocument 添加多个页面时,它根本不会添加它. 代码示例(原来的PDPage是我函数的一个参数): private static void splitPage(int nbOfCrops, PDPage myPage) 抛出 IOException{PDDocument pdfSplit ..
发布时间:2021-06-15 18:36:23 Java开发

将 PDF 复制到新的 PDF,但没有文档的某些部分

我正在尝试做一些我知道不是 100% 可靠的事情,但我已经阅读了相关内容,据我所知,我在尝试从文本中删除某些文本时面临的唯一问题是PDF文件是我无法替换的. 我想要做的是获取 PDF 文件的内容,然后将该内容复制到另一个 PDF 文件,但没有找到正则表达式.我在我的 PDF 文件中找到了这些表达式,并且它有效. 但是,我想不出删除它们的方法.有没有办法说像 //删除此列表中的所有 T ..
发布时间:2021-06-15 18:36:20 Java开发

使用 PDFbox 从 PDF 文件中删除图像

我正在尝试使用 java 和 PDFbox 从 PDF 中删除图像.图像不是内嵌的,PDF 没有图案或表格.pdf 文件包含 2 张图像.PDFdebugger 工具显示 Resources >>XObject >>IM3 和 IM5.问题是:我显示输出的pdf文件并且图像没有被删除. 公共类 DeleteImage {public static void removeImages(String ..
发布时间:2021-06-15 18:36:17 Java开发

如何修复 PDFBox 设置的 PDF/A 元数据(使用 Docx4j 和 XDocReport)

为了达到 PDF/A-1A 的辅助功能级别,我使用 PDFBox v2.0.13 在 PDF 上设置 XMP 元数据.在设置元数据之前,我将文件从 .docx 转换为 pdf.我尝试了两种方法来进行转换:一种使用 XDocReport v.2.0.1,另一种使用 Docx4j v.6.1.0. 在 Java 类中,我有以下代码: PDDocumentInformation info = p ..
发布时间:2021-06-15 18:36:14 其他开发

PDFBox:如何将注释从一个 pdf 正确复制到另一个

我正在尝试将注释从一个 pdf 复制到另一个.但是即使复制 1 个注释也会使输出 pdf 文件的大小加倍. 请在下面找到简单的代码示例: PDDocument pdf = PDDocument.load(new File("test1.pdf"));PDDocument pdf2 = PDDocument.load(new File("test/test1.pdf"));列表 ..
发布时间:2021-06-15 18:36:11 Java开发

为什么pdf只包含一个字段大约是500Kb

在这里您可以下载pdf,其中包含一个acroform 字段和他的大小正好是 427Kb 如果我删除这个唯一字段,文件只有 3Kb,为什么会发生这种情况?我尝试使用 PDF Debugger 进行分析,对我来说没有什么奇怪的. 解决方案 acroform 默认资源中有一个内嵌的“Arial"字体,见Root/AcroForm/DR/Font/Arial/FontDescriptor/F ..
发布时间:2021-06-15 18:36:08 Java开发

如何在 PDFBox 2.0 中创建 PageDrawer 实例?

当有高边距时,我无法替换 PDF 文档中的 PDF 页面.如何使用 pdfbox2.0 调整 PDF 页面大小? 如果 pdf 页面内容(在输入 pdf 文档中)为 6" x 8" - 那么我想将页面大小设为 5" x 7" 并保存 pdf 文档 解决方案 假设你有一个 PDPage 对象: PDRectangle mediaBox = page.getMediaBox();if ..
发布时间:2021-06-15 18:36:04 Java开发

文字方向和页面旋转调整坐标有什么区别?

TextPosition 类引用的“页面旋转调整坐标"和“文本方向调整坐标"有什么区别?直观的解释可能是最好的. 解决方案 PDFBox 文本提取允许在这两个坐标系中轻松访问文本字形的坐标: 页面旋转调整坐标 每个 PDF 页面都可以有一个 Rotate 属性,允许的值为 0、90、180 和 270.PDF 查看器通常会获取页面内容并按该角度旋转显示它们.例如.您查看的横向页 ..
发布时间:2021-06-15 18:36:02 其他开发

pdf文件中的页数

我正在使用“pdfbox"阅读 pdf 文件;我没有得到 pdf 文档中的总页数..我不知道为什么会这样. 尝试{parser = new PDFParser(new FileInputStream(file));parser.parse();cosDoc = parser.getDocument();pdfStripper = new PDFTextStripper();pdDoc = 新的 ..
发布时间:2021-06-15 18:35:59 Java开发

PDFBOX acroForm 已填充,但在 Acrobat 阅读器中打开时,值消失

我有 PDF 表格,我想用 PDFBOX 填写它.它有效,表单已填写,我用其他阅读器或浏览器打开,我可以看到值,但是当我尝试在 Adob​​e Reader 中打开时,值消失了,我尝试了各种可能的方法来找出原因但值不可见. 我有模板表单,我使用它并填写数据、重命名字段并将其合并到其他文档中,然后重做该过程,直到填写完所有表单. 我不确定这是否与我的代码或 Adob​​e 阅读器有关. ..
发布时间:2021-06-15 18:35:56 Java开发

在java中提取PDF的页脚数据

我能够从字符串中的 pdf 页面获取数据.但除此之外,还提取了页脚数据.我想从pdf的所有页面中删除那些.我怎样才能删除它我使用了 Rectangle2D 但坐标没有给出数据 解决方案 OP 在评论中表示他使用了此代码: PDDocument doc = PDDocument.load("xyz.pdf");PDPage 页面 = (PDPage)doc.getDocumentCatal ..
发布时间:2021-06-15 18:35:50 Java开发