文本提取用粗体和斜体标识 [英] Text Extraction with bold and italics identification

查看:63
本文介绍了文本提取用粗体和斜体标识的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

亲爱的朋友们,



我想用粗体和斜体标识从pdf中提取文本。例如,需要像这样提取粗体字母。< b> TEST< / b>并且斜体必须像< i>一样被包含在内。 test< / i>

目前我正在使用texttopdf.exe来提取文本..准确性很好。但是无法识别粗体斜体。



任何人有另一个想法或相同的pdftoexe有这个功能?



先谢谢

Dear friends,

I want to extract text from pdf with bold and italics identifiction. for example bold letters need t be extracted like this.<b>TEST</b> and italics must be enclosed like <i> test </i>
Currently i am using texttopdf.exe to extract text..the accuracy was good.but not able to identify bold italics.

any one have another idea or the same pdftoexe having the feature?

Thanks in Advance

推荐答案

这篇关于文本提取用粗体和斜体标识的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆