使用 Java 从 PDF 中提取图像 [英] Extract Image from PDF using Java

查看:46
本文介绍了使用 Java 从 PDF 中提取图像的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我只需要从 PDF 中提取条形码(使用矩形),而不是将整个 PDF 转换为图像.

I need to extract bar-code from PDF only (using rectangle), not converting the whole PDF into image.

图片格式可以是jpg/png.

The image format can be jpg/png.

推荐答案

可以使用 Pdfbox

You can use Pdfbox

List pages = document.getDocumentCatalog().getAllPages();
Iterator iter = pages.iterator();
while( iter.hasNext() )
{
    PDPage page = (PDPage)iter.next();
    PDResources resources = page.getResources();
    Map images = resources.getImages();
    if( images != null )
    {
        Iterator imageIter = images.keySet().iterator();
        while( imageIter.hasNext() )
        {
            String key = (String)imageIter.next();
            PDXObjectImage image = (PDXObjectImage)images.get( key );
            String name = getUniqueFileName( key, image.getSuffix() );
            System.out.println( "Writing image:" + name );
            image.write2file( name );
        }
    }
}

参考源代码

这篇关于使用 Java 从 PDF 中提取图像的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆