如何从PDF文件中提取突出显示的部分 [英] How to extract Highlighted Parts from PDF files

查看:354
本文介绍了如何从PDF文件中提取突出显示的部分的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

是否可以通过编程方式从PDF文件中提取突出显示的文本?欢迎使用任何语言.我发现了几个使用Python,Java和PHP编写的库,但是它们都不起作用.

Is there any way to extract highlighted text from a PDF file programmatically? Any language is welcome. I have found several libraries with Python, Java, and also PHP but none of them do the job.

推荐答案

好吧,在找到之后,我找到了一种将突出显示的文本从pdf导出到文本文件的解决方案.不是很辛苦:

Ok, after looking I found a solution for exporting highlighted text from a pdf to a text file. Is not very hard:

  1. 首先,使用您要使用的工具突出显示文本(在我的情况下,当我使用Goodreader应用在iPad上阅读时突出显示文本).

  1. First, you highlight your text with the tool you like to use (in my case, I highlight while I'm reading on an iPad using Goodreader app).

将您的pdf转移到计算机上,然后使用Skim(可免费在网上轻松找到的pdf阅读器)打开它

Transfer your pdf to a computer and open it using Skim (a pdf reader, free and easy to find on the web)

在文件上,选择转换注释",然后将文档的所有注释转换为跳过注释".

On FILE, choose CONVERT NOTES and convert all the notes of your document to SKIM NOTES.

仅此而已:只需选择导出",然后选择导出笔记".它将为您导出突出显示的文本列表.打开后,该列表可以再次导出为txt格式文件.

That's all: simply go to EXPORT an choose EXPORT SKIM NOTES. It will export you a list of your highlighted text. Once opened this list can be exported again to a txt format file.

没有太多的工作要做,结果是非常棒的.

Not much work to do, and the result is fantastic.

这篇关于如何从PDF文件中提取突出显示的部分的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆