使用javascript从pdf文件中提取文本 [英] Extract text from pdf file using javascript

查看:113
本文介绍了使用javascript从pdf文件中提取文本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想在客户端仅使用Javascript从pdf文件中提取文本,而不使用服务器。我已经在以下链接中找到了一个javascript代码:在Javascript中从pdf中提取文本

I want to extract text from pdf file using only Javascript in the client side without using the server. I've already found a javascript code in the following link: extract text from pdf in Javascript

然后在

http://hublog.hubmed.org/archives/001948.html

and in:

https://github.com/hubgit/hubgit.github.com/tree/master/2011/11/pdftotext

1)我想要请知道从以前的文件中提取这些文件所需的文件是什么。
2)我不确切知道如何在应用程序中修改这些代码,而不是在网络中。

1) I want please to know what are the files which are necessary for these extraction from the previous ones. 2) I don't know exactly how to adapt these codes in an application, not in the web.

欢迎任何答案。谢谢。

推荐答案

这是一个很好的例子,说明了如何使用pdf.js来提取文本:
< a href =http://git.macropus.org/2011/11/pdftotext/example/\"rel =noreferrer> http://git.macropus.org/2011/11/pdftotext/example/

here is a nice example of how to use pdf.js for extracting the text: http://git.macropus.org/2011/11/pdftotext/example/

当然你必须为你的目的删除大量代码,但它应该这样做

of course you have to remove a lot of code for your purpose, but it should do it

这篇关于使用javascript从pdf文件中提取文本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆