使用 Java 从 PDF 中提取图像 [英] Extract Image from PDF using Java
本文介绍了使用 Java 从 PDF 中提取图像的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我只需要从 PDF 中提取条形码(使用矩形),而不是将整个 PDF 转换为图像.
I need to extract bar-code from PDF only (using rectangle), not converting the whole PDF into image.
图片格式可以是jpg/png.
The image format can be jpg/png.
推荐答案
可以使用 Pdfbox
You can use Pdfbox
List pages = document.getDocumentCatalog().getAllPages();
Iterator iter = pages.iterator();
while( iter.hasNext() )
{
PDPage page = (PDPage)iter.next();
PDResources resources = page.getResources();
Map images = resources.getImages();
if( images != null )
{
Iterator imageIter = images.keySet().iterator();
while( imageIter.hasNext() )
{
String key = (String)imageIter.next();
PDXObjectImage image = (PDXObjectImage)images.get( key );
String name = getUniqueFileName( key, image.getSuffix() );
System.out.println( "Writing image:" + name );
image.write2file( name );
}
}
}
这篇关于使用 Java 从 PDF 中提取图像的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文