pdf-reader - IT屋-程序员软件开发技术分享社区

如何检查 PDF 是否受密码保护

我正在尝试使用 iText 的 PdfReader 检查给定的 PDF 文件是否受密码保护，但出现此异常: 线程“主线程"中的异常 java.lang.NoClassDefFoundError:org/bouncycastle/asn1/ASN1OctetString 但是当针对非密码保护的文件测试相同的代码时，它运行良好.完整代码如下: 试试{PdfReader pdf = new ..

发布时间：2022-01-22 08:33:01 java passwords itext file-permissions pdf-reader Java开发

如何在 webView 中赋予页面卷曲动画?

我正在开发 PDF 阅读器应用程序.如果我显示 pdf 文件，那么我无法更改它的字体大小. 所以我在 UIWebView 中显示 ePub 文件.但我的问题是如何像 iBook 和 kindle 应用程序那样在 UIWebView 中添加页面卷曲动画. 解决方案我已经创建了一个名为 myWebView 的 UIWebView，点击按钮后会在 webview 上显示 curl 效果: ..

发布时间：2022-01-19 21:58:10 iphone ios pdf uiwebview pdf-reader 移动开发

文件内容搜索C#

我正在尝试在应用程序中实现此功能. 就像在Windows中一样，我在搜索框中输入内容，如果在设置中选中了文件内容，则无论是文本文件还是pdf/word文件，搜索都会向我返回包含字符串的文件.搜索框. 因此，我已经想出了一个用于文件和文件夹搜索的应用程序，该应用程序对于文本文件和Word文件的文件内容搜索来说非常有效.我正在使用互操作单词作为单词文件. 我知道，我可以使用 iTex ..

发布时间：2021-05-09 19:45:05 c# wpf winforms full-text-search pdf-reader C#/.NET

如何使用硒读取pdf文件

我正在一个有链接的网页上工作，单击它会在新窗口上打开一个pdf文件.我必须阅读该pdf文件，以对照完成的交易验证一些数据.一种方法是下载该文件，然后使用它.谁能帮我这个忙.我必须在IE 11上工作在此先感谢. 解决方案使用PDFBox和FontBox. 公共字符串readPDFInURL()引发EmptyFileException，IOException {WebDriver驱 ..

发布时间：2021-05-02 20:34:47 java pdf selenium-webdriver download pdf-reader Java开发

ReportLab和pdfrw:导入扫描的PDF

使用下面的代码，我试图将pdf页面导入到现有的canvas对象中并保存为PDF.这通常可以很好地工作，但是我注意到当我尝试使用从扫描的文档生成的PDF时，它会导致空白页.有没有人? from reportlab.pdfgen import canvas from pdfrw import PdfReader from pdfrw.buildxobj import pagexobj from ..

发布时间：2020-07-02 20:01:57 reportlab pdf-reader pdfrw 其他开发

我正在使用此示例为最新的Itext7填写文档，我收到此错误:iText.Kernel.Crypto.BadPasswordException:PdfReader未使用所有者密码打开 PdfReader.unethicalreading = true;找到了解决此错误的方法，但是当我尝试使用相同的代码时，它说PDFReader中没有名为unethicalreading 的定义. 这是我拥有的代码 ..

发布时间：2020-07-02 20:01:55 c# asp.net pdf-generation itext7 pdf-reader C#/.NET

PdfFileReader:PdfReadError:在指定位置找不到外部参照表

我正在尝试通过以下方式在python中读取Pdf文件: from PyPDF2 import PdfFileReader, PdfFileWriter test_reader = PdfFileReader(file("test.pdf", "rb")) 以上行引发错误: PyPDF2.utils.PdfReadError: Could not find xref table at ..

发布时间：2020-07-02 20:00:53 pypdf pdf-reader 其他开发

QLPreviewController委托方法在iOS 10中不会被调用，但是如果运行于iOS 10之前，则会被调用

这是我的代码.这听起来像是多余的问题，但是我的情况有所不同，因为我没有将QLPreviewController添加为子视图，而是作为控制器存在. 从保管箱下载后，我将其显示为- self.pdfViewController = [[QLPreviewController alloc] init]; self.pdfViewController.delegate = se ..

发布时间：2020-07-02 20:00:50 objective-c ios10 qlpreviewcontroller pdf-reader 移动开发

使用python pdfminer提取整个pdf数据

我正在使用pdfminer使用python从pdf文件中提取数据.我想提取pdf中存在的所有数据，而不管它是图像还是文本，无论它是什么.我们可以在一行中执行此操作吗?任何帮助表示赞赏.预先感谢解决方案我们可以在一行中执行此操作吗(如果需要，可以执行两行，而无需太多工作). 不，您不能. Pdfminer功能强大，但级别较低. 不幸的是，文档并不完全详尽.多亏了Denis ..

发布时间：2020-07-02 20:00:46 python pdf-reader Python

使用python3显示PDF文件

我想编写一个显示PDF文件的python3/PyGTK3应用程序，但是我找不到一个允许我执行此操作的python软件包. 有 pypoppler ，但它看起来已经过时(?)，而且似乎不支持python3(?) 您有什么建议吗? 编辑:请注意，我不需要花哨的功能，例如pdf表单，操作或书写. 解决方案事实证明，新版本的poppler-glib不需要这样的绑定.它们与GObject ..

发布时间：2020-07-02 20:00:43 python-3.x pygtk pygobject pdf-reader pdf-rendering 其他开发

如何在PDF阅读器中突出显示搜索到的单词?

正在开发PDF阅读应用程序，并使用QuartzCore(VFR)框架实现PDF阅读.现在需要实现的是突出显示用户正在搜索的文本.如何实现? 注意:我已经通过 Fast PDF KIT ，但是无法获得任何东西. 解决方案尝试使用 https://github.com/KurtCode/PDFKitten . ..

发布时间：2020-05-25 04:48:36 iphone pdf pdf-reader quartz-core 移动开发

.NET中的PDF阅读器

我想从我的.net应用程序中读取PDF文件.有免费的图书馆吗? 解决方案如果您正在寻找免费的PDF Read/Write .Net库，则可以访问 https://itextpdf.com/(以前是itextsharp) 注意:正如Dexters所提到的，该库不再出于商业目的免费提供.它属于 Affero通用公共许可证(AGPL) ..

发布时间：2020-05-25 04:13:20 c# .net pdf pdf-reader C#/.NET

在Ruby中检查PDF是否已损坏(或只是缺少EOF)的最快方法?

我正在寻找一种检查PDF是否缺少文件字符结尾的方法.到目前为止，我发现我可以使用pdf阅读器gem并捕获MalformedPDFError异常，或者当然我可以只打开整个文件并检查最后一个字符是否为EOF.我需要处理大量可能很大的PDF，并且我想加载尽可能少的内存. 注意:我要检测的所有文件都缺少EOF标记，因此我觉得这是一种比检测一般PDF“损坏"更具体的情况.最好的，最快的方法是什么? ..

发布时间：2020-05-25 04:12:32 ruby pdf pdf-reader 其他开发

使用python提取pdf表中包含的文本的最佳方法是什么?

我正在构建一个程序，以从pdf中提取文本，将其以结构化格式放置，然后发送给数据库.我大约有1400个单独的pdf文件，它们都遵循类似的格式，但是这些文件所总结的措辞和计划设计上的细微差别使它变得棘手. 我在python中使用了几个不同的pdf阅读器，包括tabula-py和pdfminer，但是它们都不完全符合我的意愿. Tabula很好地阅读了所有文本，但是它拉动了所有内容，因为它明确地水平放 ..

发布时间：2020-05-19 19:34:09 python-3.x pdf ocr pdf-reader 其他开发

无法安装textract

使用命令pip install textract我无法在Ubuntu 16.04，Python 2上安装textract. 我收到以下错误: Collecting textract Requirement already satisfied: python-pptx==0.6.5 in ./anaconda2/lib/python2.7/site-packages (from text ..

发布时间：2020-05-18 01:03:36 pip nlp sentiment-analysis text-extraction pdf-reader 其他开发

如何读取亚洲语言(中文，日文，泰文等)的PDF文件并以python字符串形式存储

我正在使用PyPDF2读取python中的PDF文件.尽管该库对英语和欧洲语言(英语字母)非常有效，但该图书馆无法读取日文和中文等亚洲语言.我尝试了encode('utf-8')，decode('utf-8')，但似乎没有任何效果.它只是在提取文本时打印一个空白字符串. 我尝试了其他库，例如textract和PDFMiner，但没有成功. 当我从PDF复制文本并将其粘贴到笔记本上时，字 ..

发布时间：2020-05-18 00:53:47 python unicode nlp text-extraction pdf-reader Python

来自MemoryStream()的PdfReader

谁能给我一个如何从MemoryStream获取PdfReader的示例吗?我可以看到PdfReader类有几个看起来像候选方法的方法(GetStreamBytes& GetStreamBytesRaw)，但是这些方法似乎想要特定于iText的流，而我只是常规的Byte[]或MemoryStream. 这使用的是C#和.NET 4. iTextSharp.text.pdf.PdfRead ..

发布时间：2020-05-08 22:43:02 c# itext memorystream pdf-reader C#/.NET

iTextSharp - 检查PDF文档属性 - 内容复制，内容复制以获取辅助功能

我正在尝试检查要上传的PDF文档是否具有以下文档属性 - 内容复制&内容复制允许/不允许使用iTextSharp PDFReader访问辅助功能。是否有任何属性可以验证此功能。我已粘贴了一个未返回预期结果的示例代码。使用iTextSharp寻找解决方案示例代码：使用（PdfReader r = new PdfReader（@“xxx \yyy.pdf”）） { if（P ..

发布时间：2018-11-16 17:39:00 c# itext pdf-reader C#/.NET

如何在itextSharp中检测表启动？

我正在尝试将pdf转换为csv文件。 pdf文件具有表格格式的数据，第一行作为标题。我已达到可以从单元格中提取文本的级别，比较表格中的文本基线并检测换行符，但我需要比较表格边框以检测表格的开始。我不知道如何检测和比较PDF中的行。任何人都可以帮助我吗？谢谢!!! 解决方案 As你已经看过（希望如此），PDF没有表格的概念，只是放置在特定位置的文字和围绕它们绘制的线条。文本和行之间没 ..

发布时间：2018-11-16 17:08:17 pdf csv itextsharp pdf-reader pdf-parsing 其他开发

从pdf的字节数组中获取pdf的第一页作为图像

我在字节数组中获得了pdf。我想将pdf的第一页转换为图像。我已经厌倦了 com.lowagie.text.pdf 如下 - PdfReader reader = new PdfReader（输入）; reader.selectPages（“1”）; 文件文件=新文件（“D：/img1.jpg”）; BufferedImage pdfImage = ImageIO.rea ..

发布时间：2018-11-16 16:40:02 java image bytearray itext pdf-reader Java开发

pdf-reader相关内容