pdfbox相关内容
我有阿拉伯语的PDF文件,当我使用PDFBox提取文本时,文本字体为Type3,有些字符为空,字体等于null?我想知道这是什么问题? 代码: protected void processTextPosition(TextPosition text){ String character = text.getCharacter(); //为空 String font = text.
..
我正在使用PDFBOX和itextsharp dll并处理pdf。 这样我就可以得到矩形内文本的文本坐标。使用itextsharp.dll提取矩形坐标。 基本上我从itextsharp.dll获取矩形坐标,其中itextsharp使用坐标系统作为左下角。我从PDFBOX获取pdf页面文本,其中PDFBOX使用坐标系统作为左上角。 我需要帮助将坐标从左下角转换为左上角 提前致谢 更
..
是否可以使用Java从PDF文件中提取图像并将其导出到特定文件夹而不会丢失其原始创建和修改日期?我试图通过使用IText和PDFBox来实现这一目标,但没有成功。欢迎提出任何想法或示例。 解决方案 图像不包含元数据,并存储为需要将其组合成图像的原始数据。我写了两篇博客文章,解释图像数据如何存储在PDF文件中 http://www.jpedal.org/PDFblog/2010/04/und
..
我想在我的PDF文档中添加时间戳(没有数字签名)。我该怎么做? 我可以使用Itext进行数字签名(我这里有TSAClient): MakeSignature.signDetached(外观,摘要,签名,链,null,null,tsa,0,subfilter); 但如何在没有数字签名的情况下做同样的事情?使用Bouncy Castle或Itext或Pdfbox ...
..
我想在现有的PDF文件中插入不可见的文字,以便进行搜索。 我应该使用哪个库? 我希望能够使用特定 API方法的链接。 免费,理想的开源。 非常感谢! (对于好奇:我想在Alfresco存储库中自动OCR传入扫描的文件并使其可以搜索到它们) 解决方案 3个选项。 文字渲染模式3:“没有笔画,没有填充”。 myPdfContentByte.setTextRe
..
我使用itextpdf在pdf文件中完成了水印文本,但是当我复制pdf文件的实际文本时,它也允许我们复制水印文本。无论如何我们可以将水印文本限制为不可选择吗? 图像watermark_image = Image.getInstance(imageFile.getAbsolutePath( )); while(i
..
我想选择 pdf 文件的路径 private static final int DIALOG_LOAD_FILE = 1000; 我有两个按钮,一个用于获取pdf文件的路径,另一个用于提取文本的文本: 按钮b1 =(按钮)x.findViewById(R.id.buttonStripText); 按钮按钮=(按钮)x.findViewById(R.id.pick
..
我见过基于图像DPI使用PDFBox提取图像的代码,如下所示 PDDocument document = PDDocument.load(路径); PDFImageWriter writer = new PDFImageWriter(); boolean success = writer.writeImage(document,“jpg”,“”,1,1, “C:\\ Image Q
..
我不再使用PDFBox了。我需要的是将一个带旋转的图像添加到现有的PDF中!我知道如何添加图像,但我的问题是如何旋转图像!我已经看过一些关于AffineTransform和Matrix的东西,但我不知道它是什么以及它是如何工作的! 我真的很感激传递一些示例代码,谢谢提前! 最好的问候 解决方案 有助于了解“简单”图像显示方法的来源: public void drawXO
..
我已编码创建html页面包含图像,以pdf文档提取页面。 我曾尝试从pdf中提取图像,然后我成功从pdf中提取图像并使用PDFBox lib将图像应用于html页面。但我没有在html页面中提取图像坐标。 如此搜索如何提取pdf中的图像坐标,我尝试使用PDFBox库提取pdf中的图像坐标。 代码如下: public static void main(String [] a
..
我想从pdf文件生成图像(缩略图),就像 WhatsApp 一样,如下所示 我试过了 PDFBox ( https://github.com/TomRoush/PdfBox-Android ) Tika (编译'org.apache.tika:tika-parsers:1.11') AndroidPdfViewer ( https://github.com/barteksc/And
..
我正在使用java pdfBox库来验证带有嵌入图像的单页pdf文件。 我知道pdf文件本身不包含DPI信息。 然而,文档中具有相同尺寸的图像在提取后具有不同的像素大小,并且没有dpi元信息。 那么有可能以某种方式计算相对于pdf页面的图像大小,或使用pdfBox提取带有dpi信息的图像(对于png或jpeg图像文件)? 谢谢! 解决方案 从PDFBOX src下载
..
寻找一种在pdf中压缩图像并输出pdf进行存档的方法。我无法在创建之前压缩图像,因为它会影响打印质量。 每个pdf的大小约为8MB,其中大部分由2个图像组成。图像采用png格式,并在生成期间生成pdf(使用第三方生成器) 有没有办法在不使用第三方工具的情况下在java中压缩这些。我试过pdfbox,itext和第三方exe(neevia),第三方工具是迄今为止给我任何结果的唯一一个(下
..
我需要仅从PDF中提取条形码(使用矩形),而不是将整个PDF转换为图像。 图像格式可以是jpg / png。 解决方案 你可以使用Pdfbox List pages = document.getDocumentCatalog()。getAllPages(); Iterator iter = pages.iterator(); while(iter.hasNext())
..
我的任务非常简单:将pdf文件的每一页转换为图像。我尝试使用icepdf开源版本来生成图像,但它们不会生成具有正确字体的图像。所以我开始使用PDFBox。代码如下: PDDocument document = PDDocument.load(new File(“testing.pdf”)); 列表 pages = document.getDocumentCatalog(
..
我正在尝试使用PDFBox专门为PDF添加水印。我已经能够让图像显示在每个页面上,但它会失去背景透明度,因为它看起来好像PDJpeg将其转换为JPG。也许有一种方法可以使用PDXObjectImage。 这是我到目前为止所写的: public static void watermarkPDF(PDDocument pdf)throws IOException { //加载水印
..
我试图使用pdfbox从pdf中提取图像。示例pdf 此处 但我只是获得空白图片。 我正在尝试的代码: - public static void main(String [] args){ PDFImageExtract obj = new PDFImageExtract(); try { obj.read_pdf(); } catch(IOException ex)
..
我目前正在实现解析一组pdf以检索每个pdfs元数据的功能。然后通过在每个pdf中引用另一个pdf的地方添加超链接链接来链接这些。我能够创建绝对超链接。但是将这些pdf上传到服务器后,可以将它们从服务器下载到任何本地机器路径。我希望这些超链接在下载到不同的位置后工作。那么,如何创建相对于pdfs组的超链接? 解决方案 以下是解决我问题的代码: PDActionRemoteGoTo
..
我可以像这样插入简单文本: document = new PDDocument(); page = new PDPage(PDPage.PAGE_SIZE_A4); document.addPage(page); PDPageContentStream content = new PDPageContentStream(document,page); content.beg
..
我的目标是打开PDF文档,填写一些表单字段,然后将其渲染为图像。我正在使用PDFBox与Java来做到这一点。我开始使用2.0.2版本(最新版本)并填写表单字段。当我保存并用PDF阅读器打开它时,表单字段具有值。但是当我将它渲染到图像中时,表单域具有黑色边框并且没有文本。然后我用1.8.12试了同样的东西,它工作。然而,我真的很想使用2.x中的新功能。 PDF只有AcroForms,没有XF
..