使用Asp.net从Pdf中提取矩形文本 [英] Rectangle Text Extract from Pdf using Asp.net

查看:95
本文介绍了使用Asp.net从Pdf中提取矩形文本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述



我在我的编码中使用Pdf阅读器和提取器。我的问题是下面的代码是提取一页文本,但我只需要矩形或突出显示的文本。



Hi,
I am using Pdf reader and Extractor in My Coding.My problem is Below code is Extract one page Text, but i need rectangle or highlighted text only.

  PdfReader reader = new PdfReader(Server.MapPath(path));
//Document document = new Document();
StringBuilder text = new StringBuilder();
iTextSharp.text.Rectangle size = reader.GetPageSizeWithRotation(1);
       
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
        
iTextSharp.text.Rectangle rect = new iTextSharp.text.Rectangle(10, 30, 50, 70);
RenderFilter[] renderFilter = new RenderFilter[1];
renderFilter[0] = new RegionTextRenderFilter(rect);
ITextExtractionStrategy textExtractionStrategy = newFilteredTextRenderListener(new LocationTextExtractionStrategy(), renderFilter);
  // string text = PdfTextExtractor.GetTextFromPage(reader, 1, textExtractionStrategy);
TextBox1.Text = PdfTextExtractor.GetTextFromPage(reader,reader.NumberOfPages,strategy).ToString();

推荐答案

这篇关于使用Asp.net从Pdf中提取矩形文本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆