使用javascript从pdf文件中提取文本 [英] Extract text from pdf file using javascript
问题描述
我想在客户端仅使用Javascript从pdf文件中提取文本,而不使用服务器。我已经在以下链接中找到了一个javascript代码:在Javascript中从pdf中提取文本
I want to extract text from pdf file using only Javascript in the client side without using the server. I've already found a javascript code in the following link: extract text from pdf in Javascript
然后在
http://hublog.hubmed.org/archives/001948.html
and in:
https://github.com/hubgit/hubgit.github.com/tree/master/2011/11/pdftotext
1)我想要请知道从以前的文件中提取这些文件所需的文件是什么。
2)我不确切知道如何在应用程序中修改这些代码,而不是在网络中。
1) I want please to know what are the files which are necessary for these extraction from the previous ones. 2) I don't know exactly how to adapt these codes in an application, not in the web.
欢迎任何答案。谢谢。
推荐答案
这是一个很好的例子,说明了如何使用pdf.js来提取文本:
< a href =http://git.macropus.org/2011/11/pdftotext/example/\"rel =noreferrer> http://git.macropus.org/2011/11/pdftotext/example/
here is a nice example of how to use pdf.js for extracting the text: http://git.macropus.org/2011/11/pdftotext/example/
当然你必须为你的目的删除大量代码,但它应该这样做
of course you have to remove a lot of code for your purpose, but it should do it
这篇关于使用javascript从pdf文件中提取文本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!