pdfbox相关内容
我有一个 pdf http://www.persianacademy.ir/UserFiles/File/fe1394.pdf我想从中提取单词(包含波斯语单词.).我使用 PDFBox 库来获取单词.这是我的代码: package ir.blog.stack;导入 java.io.File;导入 java.io.IOException;导入 org.apache.pdfbox.cos.COSDo
..
我正在尝试使用 Apache PDFBOX v2.0.21 来修改现有的 PDF 文档,添加签名和注释.这意味着我正在积极使用增量保存模式.我还嵌入了 LiberationSans 字体以容纳一些 Unicode 字符.对我来说使用 PDF 嵌入字体的子集功能是有意义的,因为完整嵌入 LiberationSans 会使 PDF 文件的边长增加约 200+ KB. 经过多次试验和错误,我终于设
..
我有一个 pdf 文件,它在 Okular(或任何 PDF 查看器)中显示字体属性,如下所示: 名称:Helvetica类型:Type1文件:/usr/share/fonts/truetype/liberation2/LiberationSans-regular.ttf嵌入式:否 我想将 Helvetica 嵌入 PDFBox 2xx 而不 修改文件内容(文本)本身,以便它始终可用于文件.有可
..
我正在尝试设置一些文本(经典的匈牙利假人:árvíztűrő tükörfúrógép): contentStream.showText(text); 使用 PDFBOX 2.0.7 的方法,我得到了 U+0151 ('odblacute') 在此字体中不可用 Times-Roman 编码:WinAnsiEncoding 适用于所有 PDType1Font 类型的 őűŐŰ 字符.其他重音
..
我是 PDFBox 的新手,我需要在打开 PDF 时将其发送到打印机.我们正在使用 PDFBox api 来生成 PDF.我使用以下代码尝试在打开时设置操作,但没有任何效果.请帮忙.我使用过不同的 javascript,比如 window.print();this.print();打印(); PDDocument doc = new PDDocument();PDActionJavaScrip
..
我想使用 PDFBox 2.x 和 PDFRenderer 类将 PDF 转换为 TIFF. 但与 ghostscript 相比,它的运行速度非常慢. 这是我的示例代码 公共类SpeedTest{static long startTime = System.currentTimeMillis();公共静态无效日志时间(字符串味精){long now = System.currentT
..
我试图以 pdf 格式获取所有可用字段,但在使用 PDFBox 调用 acroform.getFields() 时遇到了 NullPointerException. 示例: pdDoc = PDDocument.load(fileName);PDAcroForm 表单 = pdDoc.getDocumentCatalog().getAcroForm();如果(形式!=空){列表field
..
我有一个代码可以将文件附加到 PDF 文件. PDDocument doc = new PDDocument();PDPage 页面 = 新的 PDPage();doc.addPage(页面);//读取附件文件File file = new File("/Users/TMac/Projects/Web/dir/index.html");FileInputStream inputStream =
..
我正在使用以下设置: Java 11.0.1 pdfbox 2.0.15 目标:渲染包含汉字的pdf 问题:java.lang.IllegalArgumentException:U+674E 在此字体的编码中不可用:WinAnsiEncoding 我已经试过了: 使用不同的字体来支持汉字.最新的是 NotoSansCJKtc-Regular.ttf 按照此
..
我想使用 java netbeans 从 pdf 中的按钮获取图像图标,并将其放入某个面板中.然而,我在这里撞到了一块砖.我使用 PDFBox 作为我的 PDF 导出器,但我似乎不太理解.我已经成功地从表单字段中读取,但是只要我尝试在 PDFBox 中找到它,就没有按钮提取器.我应该怎么做?是否可以使用这种方法,或者是否有其他方法.提前致谢. 编辑:我已经发现使用此代码使用示例实用程序中的图
..
有谁知道 TextPosition 中的 getFontSize 方法是否总是返回一个,我应该只使用 getFontSizeInPt 来获取字体的大小吗?我遇到的问题是 getFontSizeInPt 有时会为相同大小的文本返回不同的值(对于相同大小的同一段落中的文本,我得到了 12 和 11 返回值. 解决方案 有谁知道TextPosition中的getFontSize方法是否总是返
..
再次问候各位程序员. 我可以正确提取 PDF 文本坐标及其格式.但我不能用图像来做到这一点.我可以获得正确的宽度和高度,但它给了我错误的 x 和 y. 我正在使用 Photoshop 检查我是否得到了正确的 x、y、width、height 坐标,但只有 width 和 height 是正确的 这是我的代码: @Overridepublic void processOperat
..
有没有办法使用 Java PDFBox 库创建目录? 目录应该是可点击的(跳转到正确的页面) 谢谢. 解决方案 没有简单的方法可以做到这一点,但这里有一个方法.我还没有弄清楚如何将链接直接附加到文本,所以我的方法意味着您必须将注释分别绘制为矩形和文本.边缘有点粗糙,但很管用. //还有其他类型的目的地,选择合适的PDPageXYZDestination dest = new
..
我终于成功地让 PDFBox 打印了我的 unicode.但是现在,我想了解我提出的解决方案.下面的代码有效并将 ≥ 打印到页面. 有两件事不起作用: 改变PDType0Font.load(documentMock, systemResourceAsStream, true);至PDType0Font.load(documentMock, systemResourceAsStream,
..
我正在使用 PDFBox 从现有的 PDF 模板构建文档,因此它会打开文件,向其中添加文本并保存.它运行良好,除非尝试使用外部 TTF 字体.我尝试了不同的方法并搜索了 2 天的解决方案,但 PDFBox 上的内容并不多. 这是一些代码,使用字体 "Tardy Kid" 因为它不会被误认为是其他任何东西,也不可能是任何标准库的一部分. 代码执行良好,显示 println 中的“Tard
..
我有以下问题.我尝试计算 PDFbox 中字符串的宽度,使其以矩形为中心.现在我的问题是,12 的宽度与 32 的宽度相同,但 1 小于 3,因此我的文本是 12 不居中.我该如何解决这个问题? 谢谢! 解决方案 来自 这个问题: PDFont font = PDType1Font.HELVETICA_BOLD;//或者你想要的任何字体.int fontSize = 16;//或者
..
让我先向您介绍一下我的项目.我有一个 pdf,我需要使用 PDFBox API 将其转换为图像(一页图像),并使用 PDFBox API 本身将所有这些图像写入新的 pdf.基本上,就是将 pdf 转换成 pdf,我们称之为 PDF 转码. 对于某些包含 JBIG2 图像的 pdf,convertToImage() 方法的 PDFbox 实现无声无息地失败,没有任何异常或错误,最后生成一个
..
以下是我正在使用的代码,我提供了一个 pdf 文件和一个文本文件作为命令行的输入. import org.pdfbox.cos.COSDocument;导入 org.pdfbox.pdfparser.PDFParser;导入 org.pdfbox.pdmodel.PDDocument;导入 org.pdfbox.pdmodel.PDDocumentInformation;导入 org.pdfbo
..
我在使用 Apache PdfBox (v1.8.2) 库解密 PDF 文档时遇到问题.加密有效,但使用相同密码解密会引发异常.(Java 1.6) package com.test;导入 org.apache.pdfbox.pdmodel.PDDocument;导入 org.apache.pdfbox.pdmodel.encryption.AccessPermission;导入 org.apa
..
在解析已经存在的 pdf 时,我正在使用if(op.getOperation().equals("TJ")) 来获取文本操作符,我想要做的是只定位那些颜色为黑色(或其他指定颜色)的操作符.我无法在 pdfBox 文档中找到相同的方法. 编辑:基本上我想要做的是在pdf上只保留黑色文本,并删除/删除任何其他不符合条件的文本运算符. 谁能分享一个解决方案? 谢谢! 解决方案
..