寻找一个PDF文件解析器 [英] Looking for a PDF file parser
问题描述
有谁知道我可以用它来从纯文本的PDF文件拉出来的文字部分的PDF文件分析器的? Specifially我想一个办法能够可靠地拉出来的文字具体说明的部分?
Does anyone know of a PDF file parser that I could use to pull out sections of text from the plaintext pdf file? Specifially I want a way to be able to reliably pull out the section of text specific to annotations?
Delphi中,C#正则表达式我不介意。
Delp C# RegEx I dont mind.
推荐答案
文件分析器一>上xactpro文章似乎正是你需要的。它解释了PDF的格式,并附带了一个解析器完整的源代码(以及其他项目为模型的可视化)。
The PDF File Parser article on xactpro seems to be exactly what you need. It explains the format of the PDF and comes with full source code for a parser (and another project for visualisation of the model).
解析器使用特定的格式条款,但你可以很容易地使用Visualiser的要学会寻找什么。
The parser uses format-specific terms, but you could easily use the visualiser to learn what to look for.
这篇关于寻找一个PDF文件解析器的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!