怎么样? PDF解析器以JavaScript数组? [英] How? Parser PDF to Javascript Array?

查看:169
本文介绍了怎么样? PDF解析器以JavaScript数组?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

如何手动解析PDF文档到使用JavaScript的话阵列。我不关心图像,数字,表格 - 唯一的话,因为我可以使用它作为JavaScript对象

How can I manually parse PDF-document to array of words using JavaScript. I don't care about images, digits, tables - only words, for I can work with it as JavaScript objects.

推荐答案

使用 pdf.js ,我会做这样的:

var pdf = require("pdf.js");
PDFJS.getDocument('document.pdf').then(function(pdf){
  pdf.getPage(1).then(function(page){
    page.getTextContent().then(function(txt){
      var arrayOfText = items.map(function(item){
        return item.str;
      });
    });
  });
});

这篇关于怎么样? PDF解析器以JavaScript数组?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆