pdf相关内容

使用pdfbox,为什么可以提取文本,但不能提取图像

我正在使用pdfbox从pdf中提取图像和文本。我有以下提取文本的代码: PDFTextStripper p = new PDFTextStripper(); String thistext=p.getText(document); ,它正确地提取文本。然而,当我尝试使用ExtractImages类从同一个pdf中提取图像时,生成的图像是pdf的所有页面,而不是实际的图像。这是因为p ..
发布时间:2022-04-25 20:15:24 Java开发

是否使用PDFBox将FormXObject内容从资源添加到内容流?

我的page1下有FormXObject-&>资源-&>X对象->;FM0,FM1,FM2.. 因此它不是Contents->;Contentstream下不可用的直接内容流。因此,我想将的内容流从fm0-&>内容流移动到page1-&>内容-&>内容流。 当我们像这样并行移动内容流时,我们必须将FM0相关资源转移或复制到页面级资源。 1.内容流需要复制到页面级内容下。 ..
发布时间:2022-04-25 18:55:41 Java开发

用PDFbox绘制饼图

我正试着用PDFbox绘制饼图,但切片之间有白线,有人能帮我吗?是否有此选项? 附上我正在使用的绘制圆弧的代码: while (start smallArc = PdfUtils.createSmallArc(a, b, radius, start, start + 2.0944 > stop ? stop : st ..
发布时间:2022-04-25 18:32:11 Java开发

PDFBox 1.8 PrintTextLocations多页文本位置位置高度错误pdf

我正在运行PDFBox提供的示例,以获取每个TextPosition的宽度/高度。当我通过一页pdf时,它会给我准确的结果。但如果我使用多页pdf,我得到的高度不正确。 这是我做的实验,我拿了一个5页的pdf作为参数传入(为每个文本位置获取了错误的高度)。接下来,我使用MacOSX预览将相同的pdf分成5个单页pdf,然后逐一浏览(我得到了正确的高度)。 package printte ..
发布时间:2022-04-25 18:25:00 其他开发

Java-PDFbox:为带标签的PDF中的线条和下划线创建构件标签

我正在从标记的pdf创建辅助功能PDF。它显示";路径对象未标记&q;错误。PDF有线条和带下划线的文本。因此,我正在尝试为未添加标签的行项目添加";artiture";标记。我可以从PDFGraphicsStreamEngine获得这些行。有人能帮我这个忙吗? PDF页面 PAC3错误 推荐答案 您可以使用PdfContentStreamEditor中的 ..
发布时间:2022-04-25 18:15:38 Java开发

在PDF文档中嵌入OTF字体

有没有办法使用ApachePDFBox(2.0)在PDF文档中包含OTF字体? 此库似乎只支持TTF字体。 以下是我尝试加载OTF字体时遇到的异常: PDType0Font font = PDType0Font.load(pdf, new File("/home/ben/.fonts/SourceSansPro-Regular.otf")); 抛出: java ..
发布时间:2022-04-25 17:56:52 Java开发

带有PDFBox的PDF中指向页面的Java Create链接

我的程序将PDF文件中的位置链接到同一文件中的另一个页面。因此,您可以单击文件中定义的位置,您将被链接到另一个页面。 我使用PDRectangle来定义位置。遗憾的是,该矩形在文档中可见。我希望创建不带可见边框的链接。 我的代码: PDActionGoTo action = new PDActionGoTo(); action.setDestination(desti ..
发布时间:2022-04-25 17:19:58 Java开发

用PDFBox在PDF文件中绘制自动调整大小的图像

我的目标是用一个空白页面(DIN A4)在PDF文件上绘制一个我不知道其尺寸的上传图像。对于水平图像,我有一个包含一个水平空白页面的PDF文件,对于垂直图像,我有一个包含一个垂直页面的PDF文件。 这是我到目前为止的代码: File image = convertMultipartFileToFile(file); //I get a MultipartFile from my Req ..
发布时间:2022-04-25 16:56:00 Java开发

Java:使用PDFBox 1库从图像创建PDF页面

我需要将图像(主要是JPEG)直接转换为PDF文档的PDF页面。 可能是图像大小不同。 每个PDF页面应具有与图像完全相同的尺寸。 因此,每页仅包含全分辨率图像。 将页面设置为图像/内容的尺寸,如何实现这一点? 因为我看到的PDF文件具有不同的页面大小和方向,但如何使用PDFBox做到这一点? 推荐答案 注意(评论者:Valentin Waeselynck:从起,您现 ..
发布时间:2022-04-25 16:37:40 Java开发

使用ApachePDFBox从PDF文件中删除加密

使用QPDF,您可以简单地从PDF文件中删除限制/加密,如下所示: qpdf --decrypt infile outfile 我想用Java中的PDFBox做同样的事情: PDDocument doc = PDDocument.load(inputFilename); if (doc.isEncrypted()) { // remove the encryption to ..
发布时间:2022-04-25 16:00:07 Java开发

从单个Sphinx配置生成多个不同pdf的任何方法

我有一个很好的关于项目的Sphinx文档,我想对它进行扩展,以生成规范等文档。我希望spec-for-foo.rst生成spec-for-foo.pdf 推荐答案 解决方案是编辑latex_documents文件中的latex_documents条目,该条目包含由生成的所有文件的描述符。 此配置项包含一个双精度列表,该列表包含:(源文件、目标TeX文件、文档标题、作者和文档类: ..
发布时间:2022-04-20 22:29:32 Python

是否阻止Ghost脚本栅格化文本?

我正在尝试将PDF转换为PCL(使用ghost脚本,但我希望听到其他建议),每个驱动程序(ghost脚本设备),包括所有内置和gutenprint生成的PCL文件比输入的PDF大许多倍。(这就是问题所在-我需要我的PCL和输入一样小)。 由于文本没有显示在PCL文件中,我猜Ghost脚本正在栅格化文本。有没有一种方法可以防止GS,或者只是Gutenprint,这样做呢?我宁愿让它嵌入字体,或 ..
发布时间:2022-04-12 19:27:28 其他开发

在FPDF(Python)中不正确显示阿拉伯单词

问题: 我正在尝试生成一个包含阿拉伯语段落的PDF文件使用FPDF库。阿拉伯语单词显示不正确(应该是从右到左),但它们从左到右显示为英语。 我尝试的方法:1-下载支持阿拉伯字母的字体2-对.txt文件进行编码,然后解码回pdf格式(使用UTF-8) 注意:运行后,txt变量(编码为‘utf-8’)正确地包含了.txt文件中的单词,问题仅存在于pdf:)中。 pdf = fpdf ..
发布时间:2022-04-05 21:53:51 Python