使用C#使用Pdfbox提取pdf文件的标题和内容 [英] Extract the title and content of a pdf file with Pdfbox using C#

查看:165
本文介绍了使用C#使用Pdfbox提取pdf文件的标题和内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个pdf文件,我想提取:
-文字标题.
-文字内容.
请帮助我.

I have a pdf file and I want extract:
- The title to text.
- The content to text.
Please help me.

推荐答案

如果您在任何搜索引擎中都输入了相同的内容,那么您的问题就是您的答案.

查看以下链接:
http://naspinski.net/post/ParsingReading- a-PDF-file-with-C-and-AspNet-to-text.aspx [ http://pdfbox.apache.org/userguide/text_extraction.html [ http://pdfbox.apache.org/userguide/tutorials.html [
Your question is your answer if you would have typed the same in any search engine.

Check out the below links:
http://naspinski.net/post/ParsingReading-a-PDF-file-with-C-and-AspNet-to-text.aspx[^]
http://pdfbox.apache.org/userguide/text_extraction.html[^]

Official site of pdfbox
http://pdfbox.apache.org/userguide/tutorials.html[^]

Hope this will help

Thanks,
Hemant


这篇关于使用C#使用Pdfbox提取pdf文件的标题和内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆