寻找一个PDF文件解析器 [英] Looking for a PDF file parser

查看:112
本文介绍了寻找一个PDF文件解析器的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

有没有人知道一个PDF文件解析器,我可以用来从plaintext pdf文件中提取文本部分?具体来说,我想要一种能够可靠地提取特定于注释的文本部分的方法?



Delphi,C#RegEx我不介意。

解决方案

PDF文件解析器关于xactpro的文章似乎正是您需要的。它解释了PDF的格式,并提供了解析器的完整源代码(以及用于可视化模型的另一个项目)。



解析器使用格式特定的术语,但是您可以轻松地使用显影剂来了解要查找的内容。


Does anyone know of a PDF file parser that I could use to pull out sections of text from the plaintext pdf file? Specifially I want a way to be able to reliably pull out the section of text specific to annotations?

Delphi, C# RegEx I dont mind.

解决方案

The PDF File Parser article on xactpro seems to be exactly what you need. It explains the format of the PDF and comes with full source code for a parser (and another project for visualisation of the model).

The parser uses format-specific terms, but you could easily use the visualiser to learn what to look for.

这篇关于寻找一个PDF文件解析器的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆