使用字体从PDF中提取文本 [英] Extract Text from PDF with font

查看:81
本文介绍了使用字体从PDF中提取文本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

大家好



我正在尝试开发一个应用程序,其中我使用Accusoft pdfXpress矩形工具在PDF上绘制一个矩形,现在我有段落的坐标我选择。现在我要做的是从这个区域用文本提取字体。

我已经从许多库中提取了纯文本,如itextsharp,PDFBOX,Aspose但我无法用字体提取文本。请提供一些帮助。



-Thanks

Hi all

I m trying to develop an application in which i Draw a rectangle on PDF using Accusoft pdfXpress rectangle tool, Now i have coordinates of the paragraph i selected. Now what i want to do is Text extract from this region with font.
I've already extracted plain text from many libraries like itextsharp, PDFBOX, Aspose but i m unable to fetch text with font. Please Provide some help regarding this.

-Thanks

推荐答案

我使用了 http://www.pdf2txt.com/ [ ^ ]在我的一个项目中;我还需要具有与您相同的功能,并且该文件帮助我获取pdf文档的字体信息。它创建了提供的pdf文件的文本文件。
I used pdftotxt provided by http://www.pdf2txt.com/[^] in one of my projects; I was also required to have almost the same functionality like yours and that file helped me getting the font information of a pdf document. It creates a text file of the provided pdf file.


这篇关于使用字体从PDF中提取文本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆