pdfbox相关内容

将pdf转换为svg

我想将 PDF 转换为 SVG,请推荐一些能够有效执行此操作的库/可执行文件.我已经使用 apache PDFBox 和 Batik 库编写了自己的 java 程序 - PDDocument 文档 = PDDocument.load( pdfFile );DOMImplementation domImpl =通用DOMImplementation.getDOMImplementation();/ ..
发布时间:2021-12-14 15:51:22 其他开发

将 PDF 转换为多页 tiff(第 4 组)

我正在尝试转换由 org.apache.pdfbox.pdmodel.PDDocument 类和 icafe 库(https://github.com/dragon66/icafe/) 到第 4 组压缩和 300 dpi 的多页 tiff.示例代码适用于 288 dpi,但奇怪的是不适用于 300 dpi,导出的 tiff 仍然只是白色.有人知道这里的问题是什么吗? 我在示例中使用的示例 p ..
发布时间:2021-12-14 15:49:40 Java开发

PDFBox:将 pdf 页面转换为图像的问题

我的任务非常简单:将 pdf 文件的每一页都转换为图像.我尝试使用icepdf开源版本来生成图像,但他们没有用正确的字体生成图像.所以我开始使用 PDFBox.代码如下: PDDocument document = PDDocument.load(new File("testing.pdf"));列表pages = document.getDocumentCatalog().getAllPage ..
发布时间:2021-12-14 15:44:29 Java开发

适用于 Android 的 PDF 库 - PDFBox?

有哪些库可用于在 Android 上绘制 PDF 文件? 我找到了 PDFBox,这是一个 JSE 库,想知道它是否可以用于在 Android 上绘制 PDF. 我知道 Android 将标准字节码转换为 Dalvik 字节码,但是它如何转换框架可以将 PDF 文件转换为 BufferedImage 之类的类? 任何建议都是有帮助的,即使对于付费图书馆也是如此. 解决方案 ..
发布时间:2021-12-14 15:42:59 移动开发

如何将 PDFBox 添加到 Android 项目或建议替代方案

我正在尝试打开一个现有的 pdf 文件,然后从 Android 应用程序中将另一个页面添加到 pdf 文档.在添加的页面上,我需要添加一些文字和图片. 我想试试 PDFBox.由于许可条款/价格,iTextPDF 等其他解决方案不适合我们公司. 我有一个包含主要代码库的库项目,以及引用该库项目的完整和精简项目. 我已经从 http://pdfbox.apache.org/down ..
发布时间:2021-12-14 15:35:59 移动开发

使用 PDFBOX 以正确的字符呈现形式书写阿拉伯语而无需分隔

我正在尝试使用 PDFBox Apache 生成包含阿拉伯语文本的 PDF,但文本生成为分隔字符,因为 Apache 将给定的阿拉伯语字符串解析为一系列通用的“官方"Unicode 字符,相当于阿拉伯字符. 这是一个例子: 要在 PDF 中写入的目标文本“应该在 PDF 文件中输出"-> جملة بالعربي 我在 PDF 文件中得到的内容 -> 我尝试了一些方法,但没有用,以 ..
发布时间:2021-12-14 15:31:45 Java开发

如何使用PDFBOX确定文本的人工粗体样式、人工斜体样式和人工轮廓样式

我正在使用 PDFBox 来验证 pdf 文档.有一定的要求检查 PDF 中存在的以下类型的文本 人工粗体文本 人工斜体样式文本. 人工轮廓样式文本 我确实在PDFBOX api列表中搜索过,但找不到这种api. 谁能帮助我并告诉我如何使用 PDFBOX 确定要在 PDF 中出现的不同类型的人工字体/文本样式. 解决方案 一般程序和一个PDFBox问题 理论上应 ..
发布时间:2021-12-14 15:28:08 其他开发

使用 PDFBox 加水印

我正在尝试专门使用 PDFBox 向 PDF 添加水印.我已经能够让图像出现在每个页面上,但它失去了背景透明度,因为它看起来好像 PDJpeg 将它转换为 JPG.也许有一种方法可以使用 PDXObjectImage 来做到这一点. 以下是我目前所写的: public static void watermarkPDF(PDDocument pdf) 抛出 IOException{//加载水 ..
发布时间:2021-12-14 15:25:48 Java开发

使用 PDFBox 将 UTF-8 编码的字符串写入 PDF

我在使用 PDFBox 将 unicode 字符写入 PDF 时遇到问题.这是一些生成垃圾字符而不是输出“š"的示例代码.我可以添加什么来获得对 UTF-8 字符串的支持? PDDocument document = new PDDocument();PDPage 页面 = 新的 PDPage();document.addPage(page);PDPageContentStream conten ..
发布时间:2021-12-14 15:19:37 Java开发

pdfBox - 签名有效性复选标记在 Acrobat 阅读器中不可见

我正在使用此作为参考向 pdf 添加视觉签名 - https://stackoverflow.com/a/27940667/7103795 我能够正确打印详细信息.但是在 Acrobat 中打开该 pdf 时,它不会显示绿色勾号,尽管它写着“已签名且所有签名均有效".在签名面板中. 这是我需要的示例: 如何确保显示有效标志? 我使用的是 pdfBox 2.0.1 版 ..
发布时间:2021-12-14 15:17:55 Java开发

如何使用 pdfbox 在另一个 PDPage 中插入一个 PDPage

我使用处理等不同的工具来创建矢量图.这些图被写成单页或多页 pdf.我想使用 pdfbox 将这些图包含在一个类似报告的 pdf 中. 我当前的工作流程将这些 pdf 作为图像包含在以下伪代码中 PDDocument inFile = PDDocument.load(file);PDPage firstPage = (PDPage) inFile.getDocumentCatalog(). ..
发布时间:2021-12-14 15:17:11 Java开发

使用 PDFBox 解析 PDF 文件(尤其是表格)

我需要解析一个包含表格数据的 PDF 文件.我正在使用 PDFBox 提取文件文本以稍后解析结果(字符串).问题是文本提取不像我对表格数据所期望的那样工作.例如,我有一个文件,其中包含一个这样的表(7 列:前两列总是有数据,只有一个 Complexity 列有数据,只有一个 Financing 列有数据): +------------------------------------------- ..
发布时间:2021-12-12 23:33:52 Java开发

如何使用 Java PDFBox 2.0.8 库创建可访问的 PDF,该库也可使用 PAC 2 工具进行验证?

背景 我在 GitHub 上有一个小项目,我试图在其中创建一个符合 508 节 (section508.gov) 的 PDF,其中包含复杂表格结构中的表单元素.推荐用于验证这些 PDF 的工具位于 http://www.access-for-all.ch/en/pdf-lab/pdf-accessibility-checker-pac.html 和我程序的输出 PDF 确实通过了这些检查中的 ..
发布时间:2021-11-26 19:13:49 Java开发

使用 PDFBox 标记的 PDF

是否可以使用 PDFBox 创建带标签的 PDF(PDF/UA)?看起来 PDFBox 有一个 API(包 org.apache.pdfbox.pdmodel.documentinterchange.taggedpdf),但我找不到任何教程或代码示例. 使用下面的代码,我生成了一个包含图像的 PDF 文件,屏幕阅读器 NVDA(在我的例子中)识别它并读取“...图形替代描述".但是,可访问性 ..
发布时间:2021-11-26 19:11:14 Java开发

如何使用Apache pdfbox在PDF中生成多行

我正在使用 Pdfbox 使用 Java 生成 PDF 文件.问题是当我在文档中添加长文本内容时,它无法正确显示.仅显示其中的一部分.这也是在一行中. 我希望文本在多行中. 我的代码如下: PDPageContentStream pdfContent=new PDPageContentStream(pdfDocument, pdfPage, true, true);pdfConten ..
发布时间:2021-11-25 19:17:47 Java开发

如何以编程方式基于视觉差异比较两个 PDF?

我需要比较并获取两个 PDF 文件中的所有视觉差异.我知道在堆栈溢出时有一些与此相关的问题,但它们不能满足我的需要. 我目前正在使用 PDFBox 为 PDF 中的页面生成图像并比较图像的字节数. 通过这种方法,我能够知道特定页面是不同的. 但我需要了解一些更精细的细节,例如某些文本的字体大小,例如 - “文本"的页码不同,例如 PDF 中的 6. 不仅是文本,我还需要处理 ..
发布时间:2021-11-14 23:47:19 Java开发

使用 POI 或 Tika 提取文本,流到流,无需在内存中加载整个文件

我正在尝试单独使用 Apache POI 和 PDFBox,或者在 Apache Tika 的上下文中,从 MASSIVE Microsoft Office 和 PDF 文件(即在某些情况下数百兆)中提取和处理纯文本.此外,我的应用程序是多线程的,因此我将同时解析许多这些大文件. 在这种规模下,我必须以流式方式处理文件.在此过程中的任何步骤都不能将整个文件保存在主内存中. 我见过许多通 ..
发布时间:2021-11-14 23:46:45 Java开发

使用java比较两个pdf文件(方法)

我需要编写一个java类来比较两个pdf文件并指出差异(文本/位置/字体的差异)使用某种突出显示.我最初的方法是使用 pdfbox 使用 pdfbox 解析文件,并将提取的文本存储在一些有助于我进行比较的数据结构中.是否有任何可以提取文本、保留格式、帮助我进行索引和比较的 Java 库.我可以为此使用 tika/google 的 diff-match.tika 以 xhtml 的形式提取文本,但如 ..
发布时间:2021-11-14 23:46:26 Java开发