pdfbox相关内容

使用 pdfbox (1.7) 在包含图像的 pdf 上添加水印

我使用了以下建议的代码: PDFBox 叠加失败 为现有的pdf添加水印.不幸的是,生成的 pdf 已损坏.当我打开文档时,pdf 阅读器抱怨:“此页面上存在错误.Acrobat 可能无法正确显示页面.请联系创建 PDF 文档的人员以更正问题". 文档已打开,但未显示图像. 似乎所有 pdf 都会发生这种情况.值得一提的是,它也发生在仅使用 Overlay 类的不同实现中. ..
发布时间:2021-06-15 18:35:47 其他开发

如何在PDFBox中添加多个页面

我想使用 PDFBox 在我的 PDF 中写入一些内容.一旦页面高度小于边距,我需要创建另一个页面.我想保留光标信息.我有一种方法可以获取光标信息,例如光标所在的位置,这样我就可以从光标位置减去边距并向其添加另一个页面.现在我做了这样的事情 PDRectangle rect = page.getMediaBox();浮动位置Y = rect.getWidth();positionY = posi ..
发布时间:2021-06-15 18:35:44 Java开发

方法 getKids() 对于 PDField 类型未定义

https://issues.apache.org/jira/browse/PDFBOX-2148 当有多个具有相同字段名称的副本时,PDField 对象列表中每个孩子的 getFullyQualifiedName 返回父级的名称,后跟 .null.因此,如果父字段被称为 Button2 并且它有 4 个实例,则打印出所有名称的结果将是: Button2.nullButton2.nullB ..
发布时间:2021-06-15 18:35:41 其他开发

如何使用 PDFBOX 生成动态页数

我必须根据某些输入生成一个 pdf 文件.每次运行代码时,输​​入的长度可能会有所不同,因此如何根据我的输入内容动态地将页面添加到文档中. 公共类pdfproject{静态 int lineno=768;public static void main (String[] args) 抛出异常{PDDocument 文档 = 新的 PDDocument();PDPage 页面 = 新的 PDPag ..
发布时间:2021-06-15 18:35:34 Java开发

字体 Helvetica 中没有 U+000D 的字形

如何为带有 boxable 的 pdfbox 解决这个问题. 我进入 table.draw Helvetica 字体中没有 U+000D 的字形 怎么办.我正在用可装箱的东西搭建桌子 解决方案 该错误告诉您用于填充表格的字符串包含 CR(回车)字符. 不要在这些字符串中使用控制字符(如 CR、LF、TAB、...),因为您的软件堆栈不会将它们解释为换行符之类的意思; ..
发布时间:2021-06-15 18:35:32 其他开发

PDFBox:在 tomcat 上运行时无法保存 pdf

这个 PDFBOX 示例 当我从主要方法运行时 &运行java应用程序然后它成功保存pdf文档.但是,如果在 Tomcat 服务器上从 servlet 的 doGet 方法运行时使用相同的代码,则它不会保存 pdf 文件.很困惑你能帮我为什么吗?我是否需要添加一些外部库来支持 Tomcat 服务器,请帮忙.. 注意: 我已经调试了 doGet 方法,它的获取调用没有抛出任何 异常 ..
发布时间:2021-06-15 18:35:28 服务器开发

PDFBox 打乱文本

我一直在尝试编辑 PDF 文档以预填表单条目.我已经让它工作了(有点).我添加的文字,很好.但是,已经存在的其他文本似乎已被替换为“&%£!£! 符号.我发现它与下面代码中的“contentStream"部分有关.它似乎是“setFont"行.如果我删除它,页面仍然可以...除了不再显示“Hello Richard"文本! 请帮忙! 打包pdfboxtest;导入 java.awt.Col ..
发布时间:2021-06-15 18:35:25 Java开发

PdfBox 文本提取无法正常工作

PDFTextStripper stripper = new PDFTextStripper();PDDocument 文档 = PDDocument.load(inputStream);String text = stripper.getText(document); 提取文本:http://pastebin.com/BXFfMy0z 问题 pdf:http://www.iwb.ch/m ..
发布时间:2021-06-15 18:35:23 Java开发

PDFBox 未返回正确的图像大小

我是 PDFBox 的新手,一直在寻找以英寸为单位的图像高度.经过几次搜索,这是我正在使用的代码: PDResources 资源 = aPdPage.findResources();graphicsState = new PDGraphicsState(aPdPage.findCropBox());pageWidth = aPdPage.findCropBox().getWidth()/72;p ..
发布时间:2021-06-15 18:35:20 其他开发

如何使用 PDFBox 将标准字体嵌入到生成的 PDF 中

我需要使用 Java 的 Apache PDFBox 库向 PDF/A 文件添加一些文本.问题是,因为它需要是一个有效的 PDF/A 文件,所以必须将所有使用的字体嵌入其中.我知道我可以使用 PDFBox 嵌入 TTF 字体,但我想避免必须为应用程序提供字体文件,所以我想知道是否有办法嵌入 PDFBox 中可用的标准字体之一,就好像它一样是外部的. 例如,当我使用其中一种标准字体编写内容时, ..
发布时间:2021-06-15 18:35:17 Java开发

PDFbox - 如何将内容添加到图层?

我使用的是 pdfbox 2.0.8 - 需要创建一个图层并在那里添加一些图形. 我从我如何制作对 pdf 中现有图层(可选内容组)的修改? 然而,它基于 1.8.我尝试适应 2.0 并设法创建图层,但完全不清楚如何创建新资源并将其添加到图层 - 即 props.putMapping(resourceName, layer);必须重写 1.8 中的内容 解决方案 等效于 OP ..
发布时间:2021-06-15 18:35:14 Java开发

使用 pdfBox 禁用 pdf 文本搜索

我有一个 pdf 文档(无格式),我想在其中禁用使用 pdfBox (java) 的文本搜索.我可以想象以下可能性: 拼合文本 删除文本信息(不删除文本本身) 向文档添加叠加层. 目前我不知道如何实现.有没有人知道如何解决这个问题? 解决方案 非常感谢您在这里提供的帮助.我想我找到了一种符合要求的方法.(老实说,不是很干净): 将矩形添加到地址部分 将 PDF 转换 ..
发布时间:2021-06-15 18:35:11 Java开发

使用pdfbox从pdf中提取文本时出错

示例pdf 示例pdf是一份中文简历,3页,使用下面的标准代码 PDDocument 文档 = PDDocument.load(new File(path));PDFTextStripper 剥离器 = new PDFTextStripper();text = stripper.getText(document); 提取结果如下图,只有几个字 解决方案 如果您运行文本提取代码并启 ..
发布时间:2021-06-15 18:35:08 Java开发

PDFBox:将图像从 JAR 资源加载到 PDF 中

下午好.我有一个 JAR 文件,我将一些图像作为资源附加到一个名为 logos 的文件夹中.由于安全限制,我被告知要这样做(我们不希望图像文件与 JAR 在同一文件夹中公开).我首先尝试加载这些图像,就好像它们是 File 对象一样,但这显然不起作用.我现在正在尝试使用 InputStream 将图像加载到所需的 PDImageXObject 中,但图像没有渲染到 PDF 中.这是我正在使用的代码 ..
发布时间:2021-06-15 18:35:05 Java开发

用 Java 中的 PDFbox 替换或删除 PDF 中的文本

我正在尝试使用 PDFBOX 2.0 来替换空白或删除文本模式(在我的情况下,我想从所有 PDF 中删除所有“[QR]"字词),但我找不到任何内容对我有用. 我试过 itext,但还是一样,没有任何效果. “[QR]"我的 pdf 中的字符串是在创建 PDF 后编辑的,也许这就是为什么它们不显示为 tj 运算符? 我的主要内容: replaceText(documentoPDF ..
发布时间:2021-06-15 18:35:02 Java开发

如何修复由 pdfBox 创建的 PDF 中不一致的父树映射

我们正在使用 pdfBox 在 Java 中创建 pdf 文档.由于屏幕阅读器应该可以访问它们,因此我们使用标签并设置父树并将其添加到文档目录中. 请在此处找到示例文件.> 当我们使用 PAC3 验证器检查生成的 pdf 时,由于结构父树中的条目不一致,我们得到 25 个错误. 结果相同,但 Adob​​e 预战语法错误检查中有更多详细信息.错误信息是 结构元素不一致的Parent ..
发布时间:2021-06-15 18:34:58 其他开发

java-旋转文件提取?

我正在使用 PDFBox 从 PDF 文件中简单地提取单词.然后它将这些单词插入到数据库中的表中.根据我的测试,当我尝试提取单词时,PDF 中顺时针旋转 90 度的文本会产生乱码. 例如,文件中的 database 将产生 atabase 和 database 本身作为两个不同的词.很明显,atabase 不存在于 PDF 文件中. 我尝试将原始文件转换为直立旋转并进行提取,它按预期完 ..
发布时间:2021-06-15 18:34:52 Java开发

图像数据不足(PDF 文件生成)

我正在使用 PDFBox 生成 PDF 文件,但是当我尝试绘制从字节数组接收的图像时,出现以下错误: 图像数据不足 这是我的代码的基本结构: public ByteArrayOutputStream generatePDF() {.. 变量声明//创建文档文档 = 新的 PDDocument();//创建页面for(int i = 0; i ..
发布时间:2021-06-15 18:34:49 Java开发