寻找一个PDF文件解析器 [英] Looking for a PDF file parser

查看:139
本文介绍了寻找一个PDF文件解析器的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

有谁知道我可以用它来从纯文本的PDF文件拉出来的文字部分的PDF文件分析器的? Specifially我想一个办法能够可靠地拉出来的文字具体说明的部分?

Does anyone know of a PDF file parser that I could use to pull out sections of text from the plaintext pdf file? Specifially I want a way to be able to reliably pull out the section of text specific to annotations?

Delphi中,C#正则表达式我不介意。

Delp C# RegEx I dont mind.

推荐答案

文件分析器上xactpro文章似乎正是你需要的。它解释了PDF的格式,并附带了一个解析器完整的源代码(以及其他项目为模型的可视化)。

The PDF File Parser article on xactpro seems to be exactly what you need. It explains the format of the PDF and comes with full source code for a parser (and another project for visualisation of the model).

解析器使用特定的格式条款,但你可以很容易地使用Visualiser的要学会寻找什么。

The parser uses format-specific terms, but you could easily use the visualiser to learn what to look for.

这篇关于寻找一个PDF文件解析器的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆