iterparse - IT屋-程序员软件开发技术分享社区

Lxml etree.iterparse错误&Quot；TypeError：读取文件对象必须返回纯字符串

我想使用lxml解析一个HTML文档。我使用的是python3.2.3和lxml 2.3.4(http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml) 我正在使用etree.iterparse分析文档，但它返回以下运行时错误： Traceback (most recent call last): File "D:Eclipse Project ..

Python:XPath 在 ElementTree 中不可用

我正在尝试使用 ElementTree 的 iterparse() 解析 iTunes 播放列表，但出现以下错误: AttributeError: 'Element' 对象没有属性 'xpath' 代码如下: 导入 xml.etree.ElementTree 作为 ET上下文 = ET.iterparse(文件，事件 =(“开始"，“结束"))# 把它变成一个迭代器上下文 = 迭代器(上下文 ..

发布时间：2022-01-10 20:35:07 python xml-parsing python-2.7 elementtree iterparse Python

iterparse 无法解析字段，而其他类似的都可以

我使用 Python 的 iterparse 来解析 nessus 扫描的 XML 结果(.nessus 文件).意外记录解析失败，但类似的记录已正确解析. XML 文件的一般结构是很多记录，如下所示: 9.3你好10.0世界 ..

发布时间：2022-01-10 20:16:09 python xml xml-parsing iterparse Python

为什么 lxml.etree.iterparse() 占用了我所有的内存?

这最终消耗了我所有的可用内存，然后进程被终止.我尝试将标签从 schedule 更改为“较小"标签，但这并没有什么区别. 我做错了什么/如何使用 iterparse() 处理这个大文件? import lxml.etree对于 lxml.etree.iterparse('really-big-file.xml', tag='schedule') 中的计划:打印“为什么这会消耗我所有的内存? ..

发布时间：2021-12-21 10:09:56 python xml memory lxml iterparse Python

使用 lxml 和 iterparse() 来解析一个大 (+- 1Gb) XML 文件

我必须解析具有如下结构的 1Gb XML 文件，并提取标签“作者"和“内容"中的文本: MM/DD/YY姓氏Lorem ipsum dolor sat amet, consectetur adipiscing elit.Maecenas dictum dictum vehicula.M ..

发布时间：2021-12-03 14:29:00 python xml parsing lxml iterparse Python

使用 python 对大型 XML 进行迭代解析

这让我一整天都发疯了，如果能在解析大型 XML 文件方面得到一些帮助，我将不胜感激... files 包含超过 900,000 行，并以 gzip 格式下载，我确实使用数据提取进行了一些工作，用于测试和用 minidom 解析它，但这只是不会为完整文件剪切它，所以我我正在查看 iterparse，但我无法让任何示例工作，甚至无法导入错误......我可以开始工作的唯一导入是导入 xml.eT ..

发布时间：2021-07-02 20:27:07 python xml raspberry-pi2 iterparse Python

使用 Python 2.7 使用 lxml iterparse 函数的字符串绕过文件作为参数

我正在使用 lxml.tree 函数 iterparse() 对 xml 树进行交互. 这适用于输入文件 xml_source = "formatted_html_diff.xml";context = ET.iterparse(xml_source, events=(“start",))事件，root = context.next() 但是，我想在文件中使用包含相同信息的字符串. ..

发布时间：2021-06-26 19:18:00 python-2.7 lxml iterparse 其他开发

Python:xPath在ElementTree中不可用

我正在尝试使用 ElementTree 的 iterparse()来解析iTunes播放列表，但出现以下错误: AttributeError:“元素"对象没有属性"xpath" 代码如下: 将xml.etree.ElementTree导入为ETcontext = ET.iterparse(file，events =("start"，"end"))#把它变成一个迭代器上下文= iter(上 ..

发布时间：2021-05-03 20:56:12 python xml-parsing python-2.7 elementtree iterparse Python

如何使用ElementTree在具有名称空间的XML文件中查找和编辑标签

我想在我的XML文档中找到特定的标签并编辑它们的文本或属性.我的XML文件包含名称空间(据我所知，它是嵌套的名称空间).我要用于此目的的工具是ElementTree.我设法通过 iterparse 读取了XML文件，但是我不知道如何保存已编辑的XML，因为 iterparse 没有 write 元素.我需要一种解决方案，通过 parse 读取XML文件，并剥离其名称空间和嵌套名称空间或，以保存迭代 ..

发布时间：2021-05-03 20:55:41 python xml parsing elementtree iterparse Python

lxml.etree iterparse()和完全解析元素

我有一个XML文件，其节点如下所示: 41.3681107 2015-04-11T03:52:33.000Z 3.9598 我正在使用lxml.etree.iterparse()迭代解析树.我遍 ..

发布时间：2020-07-23 19:09:10 python lxml elementtree iterparse Python

iterparse抛出“找不到元素:第1行，第0列"，我不确定为什么

我有一个网络应用程序(使用Twisted)，该应用程序通过Internet接收xml块(因为整个xml可能不会在单个数据包中全部出现).我的思维过程是在接收到XML消息时慢慢构建它.我已经从xml.etree.ElementTree“坐定"在iterparse上.我一直在摸索一些代码，以下代码(非扭曲代码)可以正常工作: import xml.etree.ElementTree as etr ..

发布时间：2020-07-23 19:09:03 python xml iterparse Python

iterparse无法解析字段，而其他类似字段也可以

我使用Python的iterparse来解析nessus扫描(.nessus文件)的XML结果.解析意外记录失败，除非已正确解析相似记录. XML文件的一般结构是许多记录，例如以下记录: 9.3 hello ..

发布时间：2020-07-23 19:08:58 python xml xml-parsing iterparse Python

ElementTree iterparse策略

我必须处理足够大(最大1GB)的xml文档，并使用python解析它们.我正在使用 iterparse()函数(SAX样式解析). 以下是我的担心，假设您有一个像这样的xml Simpson ..

发布时间：2020-07-23 19:07:52 python xml sax elementtree iterparse Python

为什么elementtree.ElementTree.iterparse使用如此多的内存?

我正在使用elementtree.ElementTree.iterparse解析大型(371 MB)xml文件. 我的代码基本上是这样的: outf = open('out.txt', 'w') context = iterparse('copyright.xml') context = iter(context) dummy, root = context.next() for ..

发布时间：2020-05-08 19:15:49 python xml memory elementtree iterparse Python

python中的lxml iterparse无法处理名称空间

from lxml import etree import StringIO data= StringIO.StringIO('OneTwoThree') docs = etree.iterparse(data,tag='a') a,b = docs.next( ..

发布时间：2020-05-04 08:33:50 python lxml iterparse Python

使用Python lxml和Iterparse解析大型XML文件

我正在尝试使用lxml和iterparse方法编写解析器，以逐步浏览包含许多项目的非常大的xml文件. 我的文件格式为: Item 1 Description 1 http://www.url1.com ..

发布时间：2020-05-04 08:25:36 python xml lxml large-files iterparse Python

Iterparse大XML，具有较低的内存占用量，并获取所有(甚至嵌套的)Sequence Elements

我写了一个小的python脚本，用于基于 Liza解析XML数据Daly的博客用Python编写.但是，我的代码无法解析所有节点.因此，例如，当一个人有多个地址时，它仅使用第一个可用地址. XML树如下所示: - lgs - entities - entity - id - name - addr ..

发布时间：2020-05-04 08:23:40 python xml lxml sequence iterparse Python

迭代解析HTML(使用lxml?)

我目前正在尝试迭代解析一个非常大的HTML文档(我知道.. yuck)，以减少所使用的内存量.我遇到的问题是我遇到了XML语法错误，例如: lxml.etree.XMLSyntaxError: Attribute name redefined, line 134, column 59 这将导致一切停止. 有没有一种方法可以迭代分析HTML而不会出现语法错误呢? 此刻，我正在 ..

发布时间：2020-05-04 08:22:29 python html-parsing lxml iterparse Python

为什么lxml.etree.iterparse()占用了我所有的内存?

这最终会消耗我所有的可用内存，然后该进程被终止.我尝试将标签从schedule更改为“较小"的标签，但这没什么区别. 我在做什么错/如何使用iterparse()处理这个大文件? import lxml.etree for schedule in lxml.etree.iterparse('really-big-file.xml', tag='schedule'): prin ..

发布时间：2020-05-04 08:19:46 python xml memory lxml iterparse Python

使用lxml和iterparse()解析大(+-1Gb)XML文件

我必须解析具有如下结构的1Gb XML文件，并提取标签“作者"和“内容"中的文本: MM/DD/YY Last Name, Name Lorem ipsum dolor sit amet, consectetur a ..

发布时间：2020-05-04 08:19:10 python xml parsing lxml iterparse Python

iterparse相关内容