pdf-reader相关内容

如何检查 PDF 是否受密码保护

我正在尝试使用 iText 的 PdfReader 检查给定的 PDF 文件是否受密码保护,但出现此异常: 线程“主线程"中的异常 java.lang.NoClassDefFoundError:org/bouncycastle/asn1/ASN1OctetString 但是当针对非密码保护的文件测试相同的代码时,它运行良好.完整代码如下: 试试{PdfReader pdf = new ..
发布时间:2022-01-22 08:33:01 Java开发

如何在 webView 中赋予页面卷曲动画?

我正在开发 PDF 阅读器应用程序.如果我显示 pdf 文件,那么我无法更改它的字体大小. 所以我在 UIWebView 中显示 ePub 文件.但我的问题是如何像 iBook 和 kindle 应用程序那样在 UIWebView 中添加页面卷曲动画. 解决方案 我已经创建了一个名为 myWebView 的 UIWebView,点击按钮后会在 webview 上显示 curl 效果: ..
发布时间:2022-01-19 21:58:10 移动开发

文件内容搜索C#

我正在尝试在应用程序中实现此功能. 就像在Windows中一样,我在搜索框中输入内容,如果在设置中选中了文件内容,则无论是文本文件还是pdf/word文件,搜索都会向我返回包含字符串的文件.搜索框. 因此,我已经想出了一个用于文件和文件夹搜索的应用程序,该应用程序对于文本文件和Word文件的文件内容搜索来说非常有效.我正在使用互操作单词作为单词文件. 我知道,我可以使用 iTex ..
发布时间:2021-05-09 19:45:05 C#/.NET

如何使用硒读取pdf文件

我正在一个有链接的网页上工作,单击它会在新窗口上打开一个pdf文件.我必须阅读该pdf文件,以对照完成的交易验证一些数据.一种方法是下载该文件,然后使用它.谁能帮我这个忙.我必须在IE 11上工作 在此先感谢. 解决方案 使用PDFBox和FontBox. 公共字符串readPDFInURL()引发EmptyFileException,IOException {WebDriver驱 ..
发布时间:2021-05-02 20:34:47 Java开发

ReportLab和pdfrw:导入扫描的PDF

使用下面的代码,我试图将pdf页面导入到现有的canvas对象中并保存为PDF.这通常可以很好地工作,但是我注意到当我尝试使用从扫描的文档生成的PDF时,它会导致空白页.有没有人? from reportlab.pdfgen import canvas from pdfrw import PdfReader from pdfrw.buildxobj import pagexobj from ..
发布时间:2020-07-02 20:01:57 其他开发

itext 7-使用所有者密码未打开PdfReader错误

我正在使用此示例为最新的Itext7填写文档,我收到此错误:iText.Kernel.Crypto.BadPasswordException:PdfReader未使用所有者密码打开 PdfReader.unethicalreading = true;找到了解决此错误的方法,但是当我尝试使用相同的代码时,它说PDFReader中没有名为unethicalreading 的定义. 这是我拥有的代码 ..
发布时间:2020-07-02 20:01:55 C#/.NET

QLPreviewController委托方法在iOS 10中不会被调用,但是如果运行于iOS 10之前,则会被调用

这是我的代码.这听起来像是多余的问题,但是我的情况有所不同,因为我没有将QLPreviewController添加为子视图,而是作为控制器存在. 从保管箱下载后,我将其显示为- self.pdfViewController = [[QLPreviewController alloc] init]; self.pdfViewController.delegate = se ..
发布时间:2020-07-02 20:00:50 移动开发

使用python pdfminer提取整个pdf数据

我正在使用pdfminer使用python从pdf文件中提取数据.我想提取pdf中存在的所有数据,而不管它是图像还是文本,无论它是什么.我们可以在一行中执行此操作吗?任何帮助表示赞赏.预先感谢 解决方案 我们可以在一行中执行此操作吗(如果需要,可以执行两行,而无需太多工作). 不,您不能. Pdfminer功能强大,但级别较低. 不幸的是,文档并不完全详尽.多亏了Denis ..
发布时间:2020-07-02 20:00:46 Python

使用python3显示PDF文件

我想编写一个显示PDF文件的python3/PyGTK3应用程序,但是我找不到一个允许我执行此操作的python软件包. 有 pypoppler ,但它看起来已经过时(?),而且似乎不支持python3(?) 您有什么建议吗? 编辑:请注意,我不需要花哨的功能,例如pdf表单,操作或书写. 解决方案 事实证明,新版本的poppler-glib不需要这样的绑定.它们与GObject ..
发布时间:2020-07-02 20:00:43 其他开发

.NET中的PDF阅读器

我想从我的.net应用程序中读取PDF文件.有免费的图书馆吗? 解决方案 如果您正在寻找免费的PDF Read/Write .Net库,则可以访问 https://itextpdf.com/(以前是itextsharp) 注意:正如Dexters所提到的,该库不再出于商业目的免费提供.它属于 Affero通用公共许可证(AGPL) ..
发布时间:2020-05-25 04:13:20 C#/.NET

在Ruby中检查PDF是否已损坏(或只是缺少EOF)的最快方法?

我正在寻找一种检查PDF是否缺少文件字符结尾的方法.到目前为止,我发现我可以使用pdf阅读器gem并捕获MalformedPDFError异常,或者当然我可以只打开整个文件并检查最后一个字符是否为EOF.我需要处理大量可能很大的PDF,并且我想加载尽可能少的内存. 注意:我要检测的所有文件都缺少EOF标记,因此我觉得这是一种比检测一般PDF“损坏"更具体的情况.最好的,最快的方法是什么? ..
发布时间:2020-05-25 04:12:32 其他开发

使用python提取pdf表中包含的文本的最佳方法是什么?

我正在构建一个程序,以从pdf中提取文本,将其以结构化格式放置,然后发送给数据库.我大约有1400个单独的pdf文件,它们都遵循类似的格式,但是这些文件所总结的措辞和计划设计上的细微差别使它变得棘手. 我在python中使用了几个不同的pdf阅读器,包括tabula-py和pdfminer,但是它们都不完全符合我的意愿. Tabula很好地阅读了所有文本,但是它拉动了所有内容,因为它明确地水平放 ..
发布时间:2020-05-19 19:34:09 其他开发

如何读取亚洲语言(中文,日文,泰文等)的PDF文件并以python字符串形式存储

我正在使用PyPDF2读取python中的PDF文件.尽管该库对英语和欧洲语言(英语字母)非常有效,但该图书馆无法读取日文和中文等亚洲语言.我尝试了encode('utf-8'),decode('utf-8'),但似乎没有任何效果.它只是在提取文本时打印一个空白字符串. 我尝试了其他库,例如textract和PDFMiner,但没有成功. 当我从PDF复制文本并将其粘贴到笔记本上时,字 ..
发布时间:2020-05-18 00:53:47 Python

来自MemoryStream()的PdfReader

谁能给我一个如何从MemoryStream获取PdfReader的示例吗?我可以看到PdfReader类有几个看起来像候选方法的方法(GetStreamBytes& GetStreamBytesRaw),但是这些方法似乎想要特定于iText的流,而我只是常规的Byte[]或MemoryStream. 这使用的是C#和.NET 4. iTextSharp.text.pdf.PdfRead ..
发布时间:2020-05-08 22:43:02 C#/.NET

iTextSharp - 检查PDF文档属性 - 内容复制,内容复制以获取辅助功能

我正在尝试检查要上传的PDF文档是否具有以下文档属性 - 内容复制&内容复制允许/不允许使用iTextSharp PDFReader访问辅助功能。是否有任何属性可以验证此功能。我已粘贴了一个未返回预期结果的示例代码。 使用iTextSharp寻找解决方案 示例代码: 使用(PdfReader r = new PdfReader(@“xxx \yyy.pdf”)) { if(P ..
发布时间:2018-11-16 17:39:00 C#/.NET

如何在itextSharp中检测表启动?

我正在尝试将pdf转换为csv文件。 pdf文件具有表格格式的数据,第一行作为标题。我已达到可以从单元格中提取文本的级别,比较表格中的文本基线并检测换行符,但我需要比较表格边框以检测表格的开始。我不知道如何检测和比较PDF中的行。任何人都可以帮助我吗? 谢谢!!! 解决方案 As你已经看过(希望如此),PDF没有表格的概念,只是放置在特定位置的文字和围绕它们绘制的线条。文本和行之间没 ..
发布时间:2018-11-16 17:08:17 其他开发