pdfbox相关内容

PDFBox 2.0:旋转页面上的不可见线条 - 剪辑路径问题

文件示例:点击此处 使用 this 主题中的出色解决方案我尝试提取可见文本.附件的文本非常小,这可能会导致此剪辑路径问题,其中某些部分的字母可能被隐藏.对于这样的旋转文本,我从链接问题中稍微更改了代码: @Overrideprotected void processTextPosition(TextPosition text) {PDGraphicsState gs = getGraph ..
发布时间:2021-06-15 18:32:41 Java开发

无法在 PDF 文档中找到 ColorSpace 对象的位置

我想识别 PDF 中的 ColorSpace 对象并获取它们在页面中的位置(颜色空间的坐标、宽度和高度).我尝试遍历 Contents.ContentContext.Resources.ColorSpaces 中的 BaseDataObject,我可以识别文件中的 Pantone 色彩空间(如截图所示),但无法找到有关对象位置(x,y,w and h)的信息. 在哪里可以找到可见对象(打开文 ..
发布时间:2021-06-15 18:32:38 C#/.NET

PDFBox 2.0 和 TTC 字体

由于 TTC 支持的可用性,我正在尝试使用 PDFBox 2.0(20151009 的快照).但我还没有找到任何关于如何使用此功能的文档.我在这里找到了一张票 https://issues.apache.org/jira/browse/PDFBOX-2752,我找到了如何加载 TTC 文件: InputStream is = MyClass.class.getResourceAsStream( ..
发布时间:2021-06-15 18:32:35 Java开发

PDFBox 使文本不可见

我正在使用 将一些文本写入现有的 PDF 文件 PDPage page = document.getPage(pgNo);PDFont 字体 = PDType1Font.TIMES_ROMAN;PDPageContentStream contentStream = new PDPageContentStream(document, page, true, false);contentStre ..
发布时间:2021-06-15 18:32:31 Java开发

PDFBox 避免是否要在关闭前保存更改

我目前正在尝试向现有的 pdf 页面添加一个按钮,单击该按钮会关闭当前选项卡.我使用 PDFbox 2.0.15 通过以下代码实现了这一点... 尝试{InputStream pdfInput = new FileInputStream(new File("C:\\Users\\justi\\Desktop\\test\\real.pdf"));PDDocument doc = PDDocume ..
发布时间:2021-06-15 18:32:28 Java开发

使用 PDFBox 从单个 PDF 页面中提取多个嵌入图像

朋友们,我使用的是 PDFBox 2.0.6.我已经成功地从 pdf 文件中提取图像,但现在它正在为单个 pdf 页面创建图像.但问题是可以有任何不.pdf 页面中的图像,我希望每个嵌入的图像都应该被提取为单个图像本身. 这是代码, import java.awt.image.BufferedImage;导入 java.io.File;导入 javax.imageio.ImageIO;导入 ..
发布时间:2021-06-15 18:32:25 Java开发

如何使用 PDFBOX 从 PDF 表单中获取当前页码?

如何使用 PDFBOX 从 PDF 表单中获取当前页码? 有没有办法获取特定字段的页码?例如,如果一个名为 First name 的文本框出现在 PDF 表单的第 4 页上,是否可以将当前页码检索为 4? 对可能的解决方案有任何见解吗? 谢谢 解决方案 我通常在 pdf 构建期间在每个新页面上填写页码信息.这意味着我知道当前是最后一页的已编辑页面的页码. private ..
发布时间:2021-06-15 18:32:22 Java开发

在 PDFBox 2.0 中使用叠加

我在这里要做的是创建文本并将其放置在空白页面上.然后将该页面叠加到另一个文档上,然后将其另存为一个文档.在 1.8 中,我能够在 PDF 中创建一个空白的 PDPage,根据需要向其中写入文本,然后将该 PDF 与另一个重叠,然后使用以下代码在屏幕上保存或查看 - overlayDoc = new PDDocument();页 = 新的 PDPage();overlayDoc.addPage(p ..
发布时间:2021-06-15 18:32:19 Java开发

PDFBox 2.x 检测签名后更改的文档

我想弄清楚如何检测文档在签名后是否已更改.我似乎找不到一个好的解决方案. 有人知道吗? 编辑 仅使用“ShowSignature.java"做了一些额外的测试.这是我到目前为止发现的.如果我通过 PDFBox 更改文档,Adobe Reader 和PDFBox 将检测损坏的签名.如果我使用 Adob​​e 产品(在本例中为 Adob​​e Illustrator)更改文档,Adobe ..
发布时间:2021-06-15 18:32:13 其他开发

访问“替代文本"通过 PDFBox 获取图像

是否有某种方法可以使用 PDFBox 为特定图像提取“替代文本"? 我有一个 PDF 文件,如 http://www.w3.org/WAI/GL/2011/WD-WCAG20-TECHS-20110621/pdf.html#PDF1,已将替代文本添加到图像中.使用 PDFBox 我可以通过 PDFDocument.getDocumentCatalog().getAllPages() [ite ..
发布时间:2021-06-15 18:32:06 Java开发

使用 PDFBox ETSI 验证填充签名

我使用 PDFBOX 创建了一个 PDF PAdES 签名,并且我正在使用 ETSI 在线验证器 1(它需要注册),现在我在报告中只有两个错误,但我对它们是什么或如何修复它们有点迷茫. 这是etsi在线验证器报告: 这是我用来签名的代码: @Overridepublic byte[] sign(InputStream content) 抛出 IOException {尝试 {CMSS ..
发布时间:2021-06-15 18:32:00 Java开发

使用pdf框区分上标和下标

我是 pdfbox 的新手在使用 pdfbox 库从 pdf 中提取文本时或在提取文本后,有什么方法可以将上标和下标文本与普通文本区分开来,谢谢.. 解决方案 检查此链接是否有帮助 https://svn.apache.org/repos/asf/pdfbox/trunk/examples/src/main/java/org/apache/pdfbox/examples/util/P ..
发布时间:2021-06-15 18:31:57 Java开发

如何调用 pypdfocr 函数以在 python 脚本中使用它们?

最近我下载了 pypdfocr,但是,在文档中没有关于如何调用 pypdfocr 作为的示例一个库,有人可以帮我调用它只是为了转换单个文件吗?我刚刚找到了一个终端命令: $ pypdfocr 文件名.pdf 解决方案 如果您正在寻找源代码,它通常位于您的 Python 安装目录 site-package 下.更重要的是,如果您使用的是 IDE(即 Pycharm),它将帮助您找到目录和文件. ..
发布时间:2021-06-15 18:31:54 Python

如何跟踪 PDPageContentStream 文本输出的位置?

我正在使用 Java 将输出写入 PDDocument,然后将该文档附加到现有文档,然后再将其提供给客户端. 大部分都运行良好.我在写入 PDDocument 时尝试处理内容溢出只有一个小问题.我想跟踪文本插入文档的位置,以便当“光标"可以说超过某个点时,我将创建一个新页面,将其添加到文档中,创建一个新的内容流,并照常继续. 以下是一些代码,显示了我想做的事情: //大 try 块P ..
发布时间:2021-06-15 18:31:51 Java开发

在java中使用pdfbox将文本覆盖到先前创建的pdf文档上

我已经创建了多个 PDF 文档.我试图做的是使用 PDFBox.我需要将文本放在这些创建的文档上的多个位置,但我不想修改这些区域内的文本.例如,可能有一个部分如下 - 姓名:______________________________ 我会将文本放入该区域,但我需要下划线保持相同的长度.我相信最好的解决方案是创建一个文本框或类似的文本框,使其位于该区域上方,以便线条保持相同的长度. ..
发布时间:2021-06-15 18:31:48 Java开发

PDFBox U+00A0 在此字体的编码中不可用

我在调用 PDField 的 setValue 方法并尝试设置包含特殊字符的值时遇到问题. field.setValue("TEST-BY (TEST)") 详细来说,如果我的值包含 U+00A0 字符,则会出现以下异常: Caused by: java.lang.IllegalArgumentException: U+00A0 is not可用此字体的编码:WinAnsiEncodin ..
发布时间:2021-06-15 18:31:45 Java开发

在 PDFBox 中,如何使用“翻转"创建链接注释/“鼠标悬停"效果?

问题: 使用 PDFBox,如何创建具有“鼠标悬停"颜色效果(又名鼠标悬停/鼠标悬停)的链接注释? 这意味着当我将鼠标光标悬停在 PDF 文件中的链接上(不单击它)时,该链接会更改为不同的颜色.如果我将光标移开,链接就会变回原来的颜色. 例如: 我正在寻找的效果类似于stackoverflow网站上的链接.当您将鼠标光标悬停在(不单击)“提问"按钮上时,链接会从灰色变为橙色 ..
发布时间:2021-06-15 18:31:39 Java开发

如何解决“...在此字体的编码中不可用"?

所以我使用 PDFBox 来填写一些 pdf.到目前为止一切都很好 - 我用 Avenir Light 字体在 pdf 中创建了一个表单,我可以填写它.但是,刚刚出现的问题是,当我尝试使用诸如 ł, ą, ć ... 我收到以下错误: U+0142 在此字体的编码中不可用:MacRomanEncoding 有差异 不同的数字. 现在,我的问题是 - 我该如何解决这个问题,以便我可以自动填 ..
发布时间:2021-06-15 18:31:36 Java开发