使用Java从PDF中提取图像 [英] Extract Image from PDF using Java
本文介绍了使用Java从PDF中提取图像的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我需要仅从PDF中提取条形码(使用矩形),而不是将整个PDF转换为图像。
I need to extract bar-code from PDF only (using rectangle), not converting the whole PDF into image.
图像格式可以是jpg / png。
The image format can be jpg/png.
推荐答案
你可以使用Pdfbox
You can use Pdfbox
List pages = document.getDocumentCatalog().getAllPages();
Iterator iter = pages.iterator();
while( iter.hasNext() )
{
PDPage page = (PDPage)iter.next();
PDResources resources = page.getResources();
Map images = resources.getImages();
if( images != null )
{
Iterator imageIter = images.keySet().iterator();
while( imageIter.hasNext() )
{
String key = (String)imageIter.next();
PDXObjectImage image = (PDXObjectImage)images.get( key );
String name = getUniqueFileName( key, image.getSuffix() );
System.out.println( "Writing image:" + name );
image.write2file( name );
}
}
}
这篇关于使用Java从PDF中提取图像的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文