使用C#使用Pdfbox提取pdf文件的标题和内容 [英] Extract the title and content of a pdf file with Pdfbox using C#
本文介绍了使用C#使用Pdfbox提取pdf文件的标题和内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个pdf文件,我想提取:
-文字标题.
-文字内容.
请帮助我.
I have a pdf file and I want extract:
- The title to text.
- The content to text.
Please help me.
推荐答案
如果您在任何搜索引擎中都输入了相同的内容,那么您的问题就是您的答案.
查看以下链接:
http://naspinski.net/post/ParsingReading- a-PDF-file-with-C-and-AspNet-to-text.aspx [ http://pdfbox.apache.org/userguide/text_extraction.html [ http://pdfbox.apache.org/userguide/tutorials.html [
Your question is your answer if you would have typed the same in any search engine.
Check out the below links:
http://naspinski.net/post/ParsingReading-a-PDF-file-with-C-and-AspNet-to-text.aspx[^]
http://pdfbox.apache.org/userguide/text_extraction.html[^]
Official site of pdfbox
http://pdfbox.apache.org/userguide/tutorials.html[^]
Hope this will help
Thanks,
Hemant
这篇关于使用C#使用Pdfbox提取pdf文件的标题和内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文