使用Asp.net从Pdf中提取矩形文本 [英] Rectangle Text Extract from Pdf using Asp.net
本文介绍了使用Asp.net从Pdf中提取矩形文本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我在我的编码中使用Pdf阅读器和提取器。我的问题是下面的代码是提取一页文本,但我只需要矩形或突出显示的文本。
Hi,
I am using Pdf reader and Extractor in My Coding.My problem is Below code is Extract one page Text, but i need rectangle or highlighted text only.
PdfReader reader = new PdfReader(Server.MapPath(path));
//Document document = new Document();
StringBuilder text = new StringBuilder();
iTextSharp.text.Rectangle size = reader.GetPageSizeWithRotation(1);
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
iTextSharp.text.Rectangle rect = new iTextSharp.text.Rectangle(10, 30, 50, 70);
RenderFilter[] renderFilter = new RenderFilter[1];
renderFilter[0] = new RegionTextRenderFilter(rect);
ITextExtractionStrategy textExtractionStrategy = newFilteredTextRenderListener(new LocationTextExtractionStrategy(), renderFilter);
// string text = PdfTextExtractor.GetTextFromPage(reader, 1, textExtractionStrategy);
TextBox1.Text = PdfTextExtractor.GetTextFromPage(reader,reader.NumberOfPages,strategy).ToString();
推荐答案
这篇关于使用Asp.net从Pdf中提取矩形文本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文