pdfbox相关内容
文件示例:点击此处 使用 this 主题中的出色解决方案我尝试提取可见文本.附件的文本非常小,这可能会导致此剪辑路径问题,其中某些部分的字母可能被隐藏.对于这样的旋转文本,我从链接问题中稍微更改了代码: @Overrideprotected void processTextPosition(TextPosition text) {PDGraphicsState gs = getGraph
..
我想识别 PDF 中的 ColorSpace 对象并获取它们在页面中的位置(颜色空间的坐标、宽度和高度).我尝试遍历 Contents.ContentContext.Resources.ColorSpaces 中的 BaseDataObject,我可以识别文件中的 Pantone 色彩空间(如截图所示),但无法找到有关对象位置(x,y,w and h)的信息. 在哪里可以找到可见对象(打开文
..
由于 TTC 支持的可用性,我正在尝试使用 PDFBox 2.0(20151009 的快照).但我还没有找到任何关于如何使用此功能的文档.我在这里找到了一张票 https://issues.apache.org/jira/browse/PDFBOX-2752,我找到了如何加载 TTC 文件: InputStream is = MyClass.class.getResourceAsStream(
..
我正在使用 将一些文本写入现有的 PDF 文件 PDPage page = document.getPage(pgNo);PDFont 字体 = PDType1Font.TIMES_ROMAN;PDPageContentStream contentStream = new PDPageContentStream(document, page, true, false);contentStre
..
我目前正在尝试向现有的 pdf 页面添加一个按钮,单击该按钮会关闭当前选项卡.我使用 PDFbox 2.0.15 通过以下代码实现了这一点... 尝试{InputStream pdfInput = new FileInputStream(new File("C:\\Users\\justi\\Desktop\\test\\real.pdf"));PDDocument doc = PDDocume
..
朋友们,我使用的是 PDFBox 2.0.6.我已经成功地从 pdf 文件中提取图像,但现在它正在为单个 pdf 页面创建图像.但问题是可以有任何不.pdf 页面中的图像,我希望每个嵌入的图像都应该被提取为单个图像本身. 这是代码, import java.awt.image.BufferedImage;导入 java.io.File;导入 javax.imageio.ImageIO;导入
..
如何使用 PDFBOX 从 PDF 表单中获取当前页码? 有没有办法获取特定字段的页码?例如,如果一个名为 First name 的文本框出现在 PDF 表单的第 4 页上,是否可以将当前页码检索为 4? 对可能的解决方案有任何见解吗? 谢谢 解决方案 我通常在 pdf 构建期间在每个新页面上填写页码信息.这意味着我知道当前是最后一页的已编辑页面的页码. private
..
我在这里要做的是创建文本并将其放置在空白页面上.然后将该页面叠加到另一个文档上,然后将其另存为一个文档.在 1.8 中,我能够在 PDF 中创建一个空白的 PDPage,根据需要向其中写入文本,然后将该 PDF 与另一个重叠,然后使用以下代码在屏幕上保存或查看 - overlayDoc = new PDDocument();页 = 新的 PDPage();overlayDoc.addPage(p
..
我想弄清楚如何检测文档在签名后是否已更改.我似乎找不到一个好的解决方案. 有人知道吗? 编辑 仅使用“ShowSignature.java"做了一些额外的测试.这是我到目前为止发现的.如果我通过 PDFBox 更改文档,Adobe Reader 和PDFBox 将检测损坏的签名.如果我使用 Adobe 产品(在本例中为 Adobe Illustrator)更改文档,Adobe
..
我想使用命令 java -jar pdfbox-app-2.y.z.jar PDFSplit [OPTIONS] 将一个 PDF 拆分为多个其他 PDF.但是我发现有一个问题:拆分的PDF是“ActiveMQ In Action(Manning-2011).pdf",大小为14.1MB.但是当我跑 java -jar pdfbox-app-2.0.2.jar PDFSplit -split
..
是否有某种方法可以使用 PDFBox 为特定图像提取“替代文本"? 我有一个 PDF 文件,如 http://www.w3.org/WAI/GL/2011/WD-WCAG20-TECHS-20110621/pdf.html#PDF1,已将替代文本添加到图像中.使用 PDFBox 我可以通过 PDFDocument.getDocumentCatalog().getAllPages() [ite
..
我使用 PDFBOX 创建了一个 PDF PAdES 签名,并且我正在使用 ETSI 在线验证器 1(它需要注册),现在我在报告中只有两个错误,但我对它们是什么或如何修复它们有点迷茫. 这是etsi在线验证器报告: 这是我用来签名的代码: @Overridepublic byte[] sign(InputStream content) 抛出 IOException {尝试 {CMSS
..
我是 pdfbox 的新手在使用 pdfbox 库从 pdf 中提取文本时或在提取文本后,有什么方法可以将上标和下标文本与普通文本区分开来,谢谢.. 解决方案 检查此链接是否有帮助 https://svn.apache.org/repos/asf/pdfbox/trunk/examples/src/main/java/org/apache/pdfbox/examples/util/P
..
最近我下载了 pypdfocr,但是,在文档中没有关于如何调用 pypdfocr 作为的示例一个库,有人可以帮我调用它只是为了转换单个文件吗?我刚刚找到了一个终端命令: $ pypdfocr 文件名.pdf 解决方案 如果您正在寻找源代码,它通常位于您的 Python 安装目录 site-package 下.更重要的是,如果您使用的是 IDE(即 Pycharm),它将帮助您找到目录和文件.
..
我正在使用 Java 将输出写入 PDDocument,然后将该文档附加到现有文档,然后再将其提供给客户端. 大部分都运行良好.我在写入 PDDocument 时尝试处理内容溢出只有一个小问题.我想跟踪文本插入文档的位置,以便当“光标"可以说超过某个点时,我将创建一个新页面,将其添加到文档中,创建一个新的内容流,并照常继续. 以下是一些代码,显示了我想做的事情: //大 try 块P
..
我已经创建了多个 PDF 文档.我试图做的是使用 PDFBox.我需要将文本放在这些创建的文档上的多个位置,但我不想修改这些区域内的文本.例如,可能有一个部分如下 - 姓名:______________________________ 我会将文本放入该区域,但我需要下划线保持相同的长度.我相信最好的解决方案是创建一个文本框或类似的文本框,使其位于该区域上方,以便线条保持相同的长度.
..
我在调用 PDField 的 setValue 方法并尝试设置包含特殊字符的值时遇到问题. field.setValue("TEST-BY (TEST)") 详细来说,如果我的值包含 U+00A0 字符,则会出现以下异常: Caused by: java.lang.IllegalArgumentException: U+00A0 is not可用此字体的编码:WinAnsiEncodin
..
加载文档后: public static void main(String[] args) 抛出 IOException {PDDocument doc = PDDocument.load(new File("blah.pdf")); 如何从 PDDocument 中逐页获取打印颜色意图?我阅读了文档,但没有看到报道. 解决方案 这将获得输出意图(您将通过高质量的 PDF 文件获得这些
..
问题: 使用 PDFBox,如何创建具有“鼠标悬停"颜色效果(又名鼠标悬停/鼠标悬停)的链接注释? 这意味着当我将鼠标光标悬停在 PDF 文件中的链接上(不单击它)时,该链接会更改为不同的颜色.如果我将光标移开,链接就会变回原来的颜色. 例如: 我正在寻找的效果类似于stackoverflow网站上的链接.当您将鼠标光标悬停在(不单击)“提问"按钮上时,链接会从灰色变为橙色
..
所以我使用 PDFBox 来填写一些 pdf.到目前为止一切都很好 - 我用 Avenir Light 字体在 pdf 中创建了一个表单,我可以填写它.但是,刚刚出现的问题是,当我尝试使用诸如 ł, ą, ć ... 我收到以下错误: U+0142 在此字体的编码中不可用:MacRomanEncoding 有差异 不同的数字. 现在,我的问题是 - 我该如何解决这个问题,以便我可以自动填
..