pdf-reader相关内容
我正在尝试使用 iText 的 PdfReader 检查给定的 PDF 文件是否受密码保护,但出现此异常: 线程“主线程"中的异常 java.lang.NoClassDefFoundError:org/bouncycastle/asn1/ASN1OctetString 但是当针对非密码保护的文件测试相同的代码时,它运行良好.完整代码如下: 试试{PdfReader pdf = new
..
我正在开发 PDF 阅读器应用程序.如果我显示 pdf 文件,那么我无法更改它的字体大小. 所以我在 UIWebView 中显示 ePub 文件.但我的问题是如何像 iBook 和 kindle 应用程序那样在 UIWebView 中添加页面卷曲动画. 解决方案 我已经创建了一个名为 myWebView 的 UIWebView,点击按钮后会在 webview 上显示 curl 效果:
..
我正在尝试在应用程序中实现此功能. 就像在Windows中一样,我在搜索框中输入内容,如果在设置中选中了文件内容,则无论是文本文件还是pdf/word文件,搜索都会向我返回包含字符串的文件.搜索框. 因此,我已经想出了一个用于文件和文件夹搜索的应用程序,该应用程序对于文本文件和Word文件的文件内容搜索来说非常有效.我正在使用互操作单词作为单词文件. 我知道,我可以使用 iTex
..
我正在一个有链接的网页上工作,单击它会在新窗口上打开一个pdf文件.我必须阅读该pdf文件,以对照完成的交易验证一些数据.一种方法是下载该文件,然后使用它.谁能帮我这个忙.我必须在IE 11上工作 在此先感谢. 解决方案 使用PDFBox和FontBox. 公共字符串readPDFInURL()引发EmptyFileException,IOException {WebDriver驱
..
使用下面的代码,我试图将pdf页面导入到现有的canvas对象中并保存为PDF.这通常可以很好地工作,但是我注意到当我尝试使用从扫描的文档生成的PDF时,它会导致空白页.有没有人? from reportlab.pdfgen import canvas from pdfrw import PdfReader from pdfrw.buildxobj import pagexobj from
..
我正在使用此示例为最新的Itext7填写文档,我收到此错误:iText.Kernel.Crypto.BadPasswordException:PdfReader未使用所有者密码打开 PdfReader.unethicalreading = true;找到了解决此错误的方法,但是当我尝试使用相同的代码时,它说PDFReader中没有名为unethicalreading 的定义. 这是我拥有的代码
..
我正在尝试通过以下方式在python中读取Pdf文件: from PyPDF2 import PdfFileReader, PdfFileWriter test_reader = PdfFileReader(file("test.pdf", "rb")) 以上行引发错误: PyPDF2.utils.PdfReadError: Could not find xref table at
..
这是我的代码.这听起来像是多余的问题,但是我的情况有所不同,因为我没有将QLPreviewController添加为子视图,而是作为控制器存在. 从保管箱下载后,我将其显示为- self.pdfViewController = [[QLPreviewController alloc] init]; self.pdfViewController.delegate = se
..
我正在使用pdfminer使用python从pdf文件中提取数据.我想提取pdf中存在的所有数据,而不管它是图像还是文本,无论它是什么.我们可以在一行中执行此操作吗?任何帮助表示赞赏.预先感谢 解决方案 我们可以在一行中执行此操作吗(如果需要,可以执行两行,而无需太多工作). 不,您不能. Pdfminer功能强大,但级别较低. 不幸的是,文档并不完全详尽.多亏了Denis
..
我想编写一个显示PDF文件的python3/PyGTK3应用程序,但是我找不到一个允许我执行此操作的python软件包. 有 pypoppler ,但它看起来已经过时(?),而且似乎不支持python3(?) 您有什么建议吗? 编辑:请注意,我不需要花哨的功能,例如pdf表单,操作或书写. 解决方案 事实证明,新版本的poppler-glib不需要这样的绑定.它们与GObject
..
正在开发PDF阅读应用程序,并使用QuartzCore(VFR)框架实现PDF阅读.现在需要实现的是突出显示用户正在搜索的文本.如何实现? 注意:我已经通过 Fast PDF KIT ,但是无法获得任何东西. 解决方案 尝试使用 https://github.com/KurtCode/PDFKitten .
..
我想从我的.net应用程序中读取PDF文件.有免费的图书馆吗? 解决方案 如果您正在寻找免费的PDF Read/Write .Net库,则可以访问 https://itextpdf.com/(以前是itextsharp) 注意:正如Dexters所提到的,该库不再出于商业目的免费提供.它属于 Affero通用公共许可证(AGPL)
..
我正在寻找一种检查PDF是否缺少文件字符结尾的方法.到目前为止,我发现我可以使用pdf阅读器gem并捕获MalformedPDFError异常,或者当然我可以只打开整个文件并检查最后一个字符是否为EOF.我需要处理大量可能很大的PDF,并且我想加载尽可能少的内存. 注意:我要检测的所有文件都缺少EOF标记,因此我觉得这是一种比检测一般PDF“损坏"更具体的情况.最好的,最快的方法是什么?
..
我正在构建一个程序,以从pdf中提取文本,将其以结构化格式放置,然后发送给数据库.我大约有1400个单独的pdf文件,它们都遵循类似的格式,但是这些文件所总结的措辞和计划设计上的细微差别使它变得棘手. 我在python中使用了几个不同的pdf阅读器,包括tabula-py和pdfminer,但是它们都不完全符合我的意愿. Tabula很好地阅读了所有文本,但是它拉动了所有内容,因为它明确地水平放
..
使用命令pip install textract我无法在Ubuntu 16.04,Python 2上安装textract. 我收到以下错误: Collecting textract Requirement already satisfied: python-pptx==0.6.5 in ./anaconda2/lib/python2.7/site-packages (from text
..
我正在使用PyPDF2读取python中的PDF文件.尽管该库对英语和欧洲语言(英语字母)非常有效,但该图书馆无法读取日文和中文等亚洲语言.我尝试了encode('utf-8'),decode('utf-8'),但似乎没有任何效果.它只是在提取文本时打印一个空白字符串. 我尝试了其他库,例如textract和PDFMiner,但没有成功. 当我从PDF复制文本并将其粘贴到笔记本上时,字
..
谁能给我一个如何从MemoryStream获取PdfReader的示例吗?我可以看到PdfReader类有几个看起来像候选方法的方法(GetStreamBytes& GetStreamBytesRaw),但是这些方法似乎想要特定于iText的流,而我只是常规的Byte[]或MemoryStream. 这使用的是C#和.NET 4. iTextSharp.text.pdf.PdfRead
..
我正在尝试检查要上传的PDF文档是否具有以下文档属性 - 内容复制&内容复制允许/不允许使用iTextSharp PDFReader访问辅助功能。是否有任何属性可以验证此功能。我已粘贴了一个未返回预期结果的示例代码。 使用iTextSharp寻找解决方案 示例代码: 使用(PdfReader r = new PdfReader(@“xxx \yyy.pdf”)) { if(P
..
我正在尝试将pdf转换为csv文件。 pdf文件具有表格格式的数据,第一行作为标题。我已达到可以从单元格中提取文本的级别,比较表格中的文本基线并检测换行符,但我需要比较表格边框以检测表格的开始。我不知道如何检测和比较PDF中的行。任何人都可以帮助我吗? 谢谢!!! 解决方案 As你已经看过(希望如此),PDF没有表格的概念,只是放置在特定位置的文字和围绕它们绘制的线条。文本和行之间没
..
我在字节数组中获得了pdf。我想将pdf的第一页转换为图像。 我已经厌倦了 com.lowagie.text.pdf 如下 - PdfReader reader = new PdfReader(输入); reader.selectPages(“1”); 文件文件=新文件(“D:/img1.jpg”); BufferedImage pdfImage = ImageIO.rea
..