lxml相关内容

删除 lxml 中的所有命名空间?

我正在使用一些 google 的数据 API,使用 python 中的 lxml 库.命名空间在这里是一个巨大的麻烦.对于我正在做的很多工作(主要是 xpath 的东西),最好直接忽略它们. 是否有一种简单的方法可以忽略 python/lxml 中的 xml 命名空间? 谢谢! 解决方案 如果您想从元素和属性中删除所有命名空间,我建议使用下面显示的代码. 上下文:在我的应 ..
发布时间:2021-11-15 03:27:46 Python

使用 ElementTree getpath() 动态获取 Xpath

我需要编写一个动态函数,通过动态构建元素的 XPath 来查找 ATOM xml 子树上的元素. 为此,我写了这样的东西: tree = etree.parse(xmlFileUrl)e = etree.XPathEvaluator(tree, namespaces={'def':'http://www.w3.org/2005/Atom'})entry = e('//def:entry' ..
发布时间:2021-10-02 19:29:59 Python

使用 Python 请求提取 href URL

我想使用 python 中的请求包从 xpath 中提取 URL.我可以得到文本,但我没有尝试给出 URL.有人可以帮忙吗? ipdb>网页.xpath(xpath_url + '/text()')['URL 文本']ipdb>网页.xpath(xpath_url + '/a()')*** lxml.etree.XPathEvalError: 无效的表达式ipdb>网页.xpath(xpath_ ..
发布时间:2021-10-02 19:29:27 Python

使用 Python 解析 XML 并创建 excel 报告 - Elementree/lxml

我正在尝试解析许多 XML 测试结果文件并将必要的数据(如测试用例名称、测试结果、失败消息等)转换为 excel 格式.我决定使用 Python. 我的 XML 文件很大,格式如下.失败的案例有一条消息,&而通过的只有 .我的要求是创建一个带有测试用例名称、测试状态(通过/失败)、测试失败消息的 excel. ..
发布时间:2021-10-02 18:45:57 Python

用 Python 解析 Google Earth KML 文件(lxml,命名空间)

我正在尝试使用 xml 模块将 .kml 文件解析为 Python(之后未能在 BeautifulSoup 中完成这项工作,我将其用于 HTML). 由于这是我第一次这样做,我遵循了官方教程,一切顺利直到我尝试构造一个迭代器来通过根迭代提取我的数据: from lxml import etreetree=etree.parse('kmlfile') 这是我试图模仿的教程中的示例: ..
发布时间:2021-10-01 20:13:19 Python

命名空间错误 lxml xpath python

我正在将 word 文档转换为 xml 以使用以下代码进行比较: word = win32com.client.Dispatch('Word.Application')wd = word.Documents.Open(inFile)# 将单词 infile 转换为 xml outfilewd.SaveAs(outFile,11)wd.Close()dom=解析(输出文件) 我得到的 xml 文 ..
发布时间:2021-10-01 19:58:00 Python

使用 Python lxml 处理嵌套元素

给定以下简单的 XML 数据: 我的第一本书摘要的第一段摘要的第二段第一个关键词第二个关键词第三个关键词 如何使用 lxml 遍历树,并获取“抽象"元素中的所有段落,以及“keywordSet ..
发布时间:2021-10-01 19:41:17 Python

在 Python 中生成非常大的 XML 文件?

有谁知道在 Python 中生成非常大的 xml 文件(例如 100-500 MiB)的内存有效方法吗? 我一直在使用 lxml,但内存使用量已经达到顶峰. 解决方案 也许您可以使用模板引擎而不是自己生成/构建 xml? Genshi 例如基于 xml 并支持流输出.一个非常基本的例子: from genshi.template import MarkupTemplatetp ..
发布时间:2021-10-01 19:33:32 Python

使用 lxml 解析段落标记的子项时丢失子项

我正在使用 Python 库 lxml 对从 这个网址.过去我在使用 lxml 时没有遇到任何问题,但是我可能刚刚遇到了一个错误,即缺少子元素(在 lxml 树中)的形式,该错误明显出现在 HTML 中. 这是我用来解析 HTML 的 Python 代码: from urllib.request import urlopen从 lxml 导入 etreehtml_response = ur ..
发布时间:2021-09-23 20:24:46 前端开发

Python ElementTree XML修改具有多个值的元素

使用Python 2.7和 lxml ,如何修改具有多个值的XML元素? 例如 1冒险喜剧动作 直接修改 Playcount ,因为它只有一个值.如何修改流派,女巫具有多个值? 例如: 如何删除除第一类以外的所有内容? ..
发布时间:2021-05-30 21:53:20 Python

对Python使用lxml-Windows 7 64位

当我尝试安装lxml时,得到以下信息.我曾尝试下载C ++ redist和我发现的许多其他内容,但没有任何效果. 我已经尝试了以下链接中的所有内容: 如何在Windows上安装lxml 我有python版本3.5.1.我 Microsoft Windows [版本6.1.7601]版权所有 (c) 2009 Microsoft Corporation.版权所有.C:\ Use ..
发布时间:2021-05-30 21:53:17 Python

如何使用lxml选择和更新混合内容中的文本节点?

我需要检查XML文件中所有 text()节点中的所有单词.我正在使用XPath //text()选择文本节点,并使用正则表达式选择单词.如果该单词存在于一组关键字中,则需要将其替换为某些内容并更新XML. 通常使用 .text 设置元素的文本,但是 _Element 上的 .text 只会更改第一个子文本节点.在混合内容元素中,其他文本节点实际上是之前兄弟姐妹的 .tail . 如何更 ..
发布时间:2021-05-30 21:53:03 Python