pdfbox相关内容

pdfBox 返回错误的编码字符

我有一个 pdf http://www.persianacademy.ir/UserFiles/File/fe1394.pdf我想从中提取单词(包含波斯语单词.).我使用 PDFBox 库来获取单词.这是我的代码: package ir.blog.stack;导入 java.io.File;导入 java.io.IOException;导入 org.apache.pdfbox.cos.COSDo ..
发布时间:2021-06-15 18:33:43 其他开发

用于注释的pdfbox嵌入子集字体

我正在尝试使用 Apache PDFBOX v2.0.21 来修改现有的 PDF 文档,添加签名和注释.这意味着我正在积极使用增量保存模式.我还嵌入了 LiberationSans 字体以容纳一些 Unicode 字符.对我来说使用 PDF 嵌入字体的子集功能是有意义的,因为完整嵌入 LiberationSans 会使 PDF 文件的边长增加约 200+ KB. 经过多次试验和错误,我终于设 ..
发布时间:2021-06-15 18:33:40 Java开发

PdfBox 将字体嵌入到现有文档中

我有一个 pdf 文件,它在 Okular(或任何 PDF 查看器)中显示字体属性,如下所示: 名称:Helvetica类型:Type1文件:/usr/share/fonts/truetype/liberation2/LiberationSans-regular.ttf嵌入式:否 我想将 Helvetica 嵌入 PDFBox 2xx 而不 修改文件内容(文本)本身,以便它始终可用于文件.有可 ..
发布时间:2021-06-15 18:33:37 Java开发

PDFBox setOpenAction 打印

我是 PDFBox 的新手,我需要在打开 PDF 时将其发送到打印机.我们正在使用 PDFBox api 来生成 PDF.我使用以下代码尝试在打开时设置操作,但没有任何效果.请帮忙.我使用过不同的 javascript,比如 window.print();this.print();打印(); PDDocument doc = new PDDocument();PDActionJavaScrip ..
发布时间:2021-06-15 18:33:29 Java开发

为什么 PDFBox PDFRenderer 很慢?

我想使用 PDFBox 2.x 和 PDFRenderer 类将 PDF 转换为 TIFF. 但与 ghostscript 相比,它的运行速度非常慢. 这是我的示例代码 公共类SpeedTest{static long startTime = System.currentTimeMillis();公共静态无效日志时间(字符串味精){long now = System.currentT ..
发布时间:2021-06-15 18:33:26 Java开发

在pdfbox中打印汉字

我正在使用以下设置: Java 11.0.1 pdfbox 2.0.15 目标:渲染包含汉字的pdf 问题:java.lang.IllegalArgumentException:U+674E 在此字体的编码中不可用:WinAnsiEncoding 我已经试过了: 使用不同的字体来支持汉字.最新的是 NotoSansCJKtc-Regular.ttf 按照此 ..
发布时间:2021-06-15 18:33:17 Java开发

如何使用 Apache PDFBox 从 PDF 中的按钮图标中提取图像?

我想使用 java netbeans 从 pdf 中的按钮获取图像图标,并将其放入某个面板中.然而,我在这里撞到了一块砖.我使用 PDFBox 作为我的 PDF 导出器,但我似乎不太理解.我已经成功地从表单字段中读取,但是只要我尝试在 PDFBox 中找到它,就没有按钮提取器.我应该怎么做?是否可以使用这种方法,或者是否有其他方法.提前致谢. 编辑:我已经发现使用此代码使用示例实用程序中的图 ..
发布时间:2021-06-15 18:33:14 Java开发

如何使用pdfbox获取字体大小

有谁知道 TextPosition 中的 getFontSize 方法是否总是返回一个,我应该只使用 getFontSizeInPt 来获取字体的大小吗?我遇到的问题是 getFontSizeInPt 有时会为相同大小的文本返回不同的值(对于相同大小的同一段落中的文本,我得到了 12 和 11 返回值. 解决方案 有谁知道TextPosition中的getFontSize方法是否总是返 ..
发布时间:2021-06-15 18:33:11 其他开发

PDFBox:提取图像位置(错误的 x 和 y)

再次问候各位程序员. 我可以正确提取 PDF 文本坐标及其格式.但我不能用图像来做到这一点.我可以获得正确的宽度和高度,但它给了我错误的 x 和 y. 我正在使用 Photoshop 检查我是否得到了正确的 x、y、width、height 坐标,但只有 width 和 height 是正确的 这是我的代码: @Overridepublic void processOperat ..
发布时间:2021-06-15 18:33:08 Java开发

PDFBox - 如何创建目录

有没有办法使用 Java PDFBox 库创建目录? 目录应该是可点击的(跳转到正确的页面) 谢谢. 解决方案 没有简单的方法可以做到这一点,但这里有一个方法.我还没有弄清楚如何将链接直接附加到文本,所以我的方法意味着您必须将注释分别绘制为矩形和文本.边缘有点粗糙,但很管用. //还有其他类型的目的地,选择合适的PDPageXYZDestination dest = new ..
发布时间:2021-06-15 18:33:05 Java开发

了解 PDFBox 2.0 中字体的加载

我终于成功地让 PDFBox 打印了我的 unicode.但是现在,我想了解我提出的解决方案.下面的代码有效并将 ≥ 打印到页面. 有两件事不起作用: 改变PDType0Font.load(documentMock, systemResourceAsStream, true);至PDType0Font.load(documentMock, systemResourceAsStream, ..
发布时间:2021-06-15 18:33:02 其他开发

PDFBox 嵌入的 TTF 字体不起作用

我正在使用 PDFBox 从现有的 PDF 模板构建文档,因此它会打开文件,向其中添加文本并保存.它运行良好,除非尝试使用外部 TTF 字体.我尝试了不同的方法并搜索了 2 天的解决方案,但 PDFBox 上的内容并不多. 这是一些代码,使用字体 "Tardy Kid" 因为它不会被误认为是其他任何东西,也不可能是任何标准库的一部分. 代码执行良好,显示 println 中的“Tard ..
发布时间:2021-06-15 18:32:59 Java开发

PDFbox 中的计算字符串宽度似乎只计算字符?

我有以下问题.我尝试计算 PDFbox 中字符串的宽度,使其以矩形为中心.现在我的问题是,12 的宽度与 32 的宽度相同,但 1 小于 3,因此我的文本是 12 不居中.我该如何解决这个问题? 谢谢! 解决方案 来自 这个问题: PDFont font = PDType1Font.HELVETICA_BOLD;//或者你想要的任何字体.int fontSize = 16;//或者 ..
发布时间:2021-06-15 18:32:56 Java开发

由于其中的 JBIG2 图像,PDF 框生成空白图像

让我先向您介绍一下我的项目.我有一个 pdf,我需要使用 PDFBox API 将其转换为图像(一页图像),并使用 PDFBox API 本身将所有这些图像写入新的 pdf.基本上,就是将 pdf 转换成 pdf,我们称之为 PDF 转码. 对于某些包含 JBIG2 图像的 pdf,convertToImage() 方法的 PDFbox 实现无声无息地失败,没有任何异常或错误,最后生成一个 ..
发布时间:2021-06-15 18:32:53 其他开发

获取 java.lang.NoClassDefFoundError: org/pdfbox/pdfparser/

以下是我正在使用的代码,我提供了一个 pdf 文件和一个文本文件作为命令行的输入. import org.pdfbox.cos.COSDocument;导入 org.pdfbox.pdfparser.PDFParser;导入 org.pdfbox.pdmodel.PDDocument;导入 org.pdfbox.pdmodel.PDDocumentInformation;导入 org.pdfbo ..
发布时间:2021-06-15 18:32:51 Java开发

Apache PDFBox - 无法解密 PDF

我在使用 Apache PdfBox (v1.8.2) 库解密 PDF 文档时遇到问题.加密有效,但使用相同密码解密会引发异常.(Java 1.6) package com.test;导入 org.apache.pdfbox.pdmodel.PDDocument;导入 org.apache.pdfbox.pdmodel.encryption.AccessPermission;导入 org.apa ..
发布时间:2021-06-15 18:32:47 Java开发

获取所有颜色为黑色的文本操作符,pdfBox

在解析已经存在的 pdf 时,我正在使用if(op.getOperation().equals("TJ")) 来获取文本操作符,我想要做的是只定位那些颜色为黑色(或其他指定颜色)的操作符.我无法在 pdfBox 文档中找到相同的方法. 编辑:基本上我想要做的是在pdf上只保留黑色文本,并删除/删除任何其他不符合条件的文本运算符. 谁能分享一个解决方案? 谢谢! 解决方案 ..
发布时间:2021-06-15 18:32:44 Java开发