lxml 第5页 - IT屋-程序员软件开发技术分享社区

删除 lxml 中的所有命名空间?

我正在使用一些 google 的数据 API，使用 python 中的 lxml 库.命名空间在这里是一个巨大的麻烦.对于我正在做的很多工作(主要是 xpath 的东西)，最好直接忽略它们. 是否有一种简单的方法可以忽略 python/lxml 中的 xml 命名空间? 谢谢！解决方案如果您想从元素和属性中删除所有命名空间，我建议使用下面显示的代码. 上下文:在我的应 ..

使用 ElementTree getpath() 动态获取 Xpath

我需要编写一个动态函数，通过动态构建元素的 XPath 来查找 ATOM xml 子树上的元素. 为此，我写了这样的东西: tree = etree.parse(xmlFileUrl)e = etree.XPathEvaluator(tree, namespaces={'def':'http://www.w3.org/2005/Atom'})entry = e('//def:entry' ..

发布时间：2021-10-02 19:29:59 python xpath lxml elementtree Python

我想使用 python 中的请求包从 xpath 中提取 URL.我可以得到文本，但我没有尝试给出 URL.有人可以帮忙吗? ipdb>网页.xpath(xpath_url + '/text()')['URL 文本']ipdb>网页.xpath(xpath_url + '/a()')*** lxml.etree.XPathEvalError: 无效的表达式ipdb>网页.xpath(xpath_ ..

发布时间：2021-10-02 19:29:27 python python-3.x xpath python-requests lxml Python

使用 Python 解析 XML 并创建 excel 报告 - Elementree/lxml

我正在尝试解析许多 XML 测试结果文件并将必要的数据(如测试用例名称、测试结果、失败消息等)转换为 excel 格式.我决定使用 Python. 我的 XML 文件很大，格式如下.失败的案例有一条消息，&而通过的只有 .我的要求是创建一个带有测试用例名称、测试状态(通过/失败)、测试失败消息的 excel. ..

发布时间：2021-10-02 18:45:57 python pandas xml-parsing lxml elementtree Python

如何在python中使用xpath查询带有命名空间的xml数据

我正在尝试使用以下代码将 XPath 查询应用于具有命名空间的 XML 数据: from lxml import etree从 io 导入 StringIOxml = ''' ..

发布时间：2021-10-02 18:38:35 python xml xpath lxml xml-namespaces Python

用 Python 解析 Google Earth KML 文件(lxml，命名空间)

我正在尝试使用 xml 模块将 .kml 文件解析为 Python(之后未能在 BeautifulSoup 中完成这项工作，我将其用于 HTML). 由于这是我第一次这样做，我遵循了官方教程，一切顺利直到我尝试构造一个迭代器来通过根迭代提取我的数据: from lxml import etreetree=etree.parse('kmlfile') 这是我试图模仿的教程中的示例: ..

发布时间：2021-10-01 20:13:19 python xml xpath lxml xml-namespaces Python

使用命名空间获取 lxml 标记属性

我的 XML 看起来像: ...... 我有代码: from lxml import etree...对于 root.iterfind('.//termEntry') 中的 term_entry:打印 term_entry.attrib['id']打印 term_entry.nsmap对于 term_en ..

发布时间：2021-10-01 20:09:25 python xml namespaces lxml Python

命名空间错误 lxml xpath python

我正在将 word 文档转换为 xml 以使用以下代码进行比较: word = win32com.client.Dispatch('Word.Application')wd = word.Documents.Open(inFile)# 将单词 infile 转换为 xml outfilewd.SaveAs(outFile,11)wd.Close()dom=解析(输出文件) 我得到的 xml 文 ..

发布时间：2021-10-01 19:58:00 python xml xpath lxml Python

如何使用 lxml 解析包含前缀但没有命名空间声明的 XML?

我有一堆使用前缀但没有相应命名空间声明的 XML 文件. 类似的东西: ... 或: ... 我知道这些前缀的来源，我尝试了以下方法，但没有成功: from lxml import etree as ElementTreeElementTree.register_namespace("i18n", "http://namespaces.zope.org") ..

发布时间：2021-10-01 19:41:30 python xml lxml xml-namespaces Python

使用 Python lxml 处理嵌套元素

给定以下简单的 XML 数据: 我的第一本书摘要的第一段摘要的第二段第一个关键词第二个关键词第三个关键词如何使用 lxml 遍历树，并获取“抽象"元素中的所有段落，以及“keywordSet ..

发布时间：2021-10-01 19:41:17 python xml lxml Python

在 Python 中生成非常大的 XML 文件?

有谁知道在 Python 中生成非常大的 xml 文件(例如 100-500 MiB)的内存有效方法吗? 我一直在使用 lxml，但内存使用量已经达到顶峰. 解决方案也许您可以使用模板引擎而不是自己生成/构建 xml? Genshi 例如基于 xml 并支持流输出.一个非常基本的例子: from genshi.template import MarkupTemplatetp ..

发布时间：2021-10-01 19:33:32 python xml lxml Python

使用 lxml etree 将 html 标签打印为字符串

可打印文本 ..

发布时间：2021-09-23 20:32:38 python html xpath lxml elementtree 前端开发

使用 lxml 解析段落标记的子项时丢失子项

我正在使用 Python 库 lxml 对从这个网址.过去我在使用 lxml 时没有遇到任何问题，但是我可能刚刚遇到了一个错误，即缺少子元素(在 lxml 树中)的形式，该错误明显出现在 HTML 中. 这是我用来解析 HTML 的 Python 代码: from urllib.request import urlopen从 lxml 导入 etreehtml_response = ur ..

发布时间：2021-09-23 20:24:46 python html xpath xml-parsing lxml 前端开发

使用 Python 2.7 使用 lxml iterparse 函数的字符串绕过文件作为参数

我正在使用 lxml.tree 函数 iterparse() 对 xml 树进行交互. 这适用于输入文件 xml_source = "formatted_html_diff.xml";context = ET.iterparse(xml_source, events=(“start",))事件，root = context.next() 但是，我想在文件中使用包含相同信息的字符串. ..

发布时间：2021-06-26 19:18:00 python-2.7 lxml iterparse 其他开发

Python ElementTree XML修改具有多个值的元素

使用Python 2.7和 lxml ，如何修改具有多个值的XML元素? 例如 1冒险喜剧动作直接修改 Playcount ，因为它只有一个值.如何修改流派，女巫具有多个值? 例如: 如何删除除第一类以外的所有内容? ..

发布时间：2021-05-30 21:53:20 python xml lxml Python

对Python使用lxml-Windows 7 64位

发布时间：2021-05-30 21:53:17 python windows lxml Python

Python使用lxml将标签添加到XML

我有以下输入XML: test_startup_0029 ..

发布时间：2021-05-30 21:53:14 python xml lxml Python

如何在python中将xml元素对象转换为带有名称空间前缀的字符串?

我有以下代码: 从lxml.etree中的导入到字符串，元素，子元素元素=元素('mytag')sub_element = SubElement(element，'mysubtag')打印(tostring(element，pretty_print = True).decode('utf-8')) 输出: 我应该以哪种方式对 ..

发布时间：2021-05-30 21:53:10 python xml python-3.x lxml Python

lxml网络抓取返回空值

我正在尝试从此网站获取所有食品类别 https://www.walmart.com/cp/976759 这是类别容器的快照 ..

发布时间：2021-05-30 21:53:06 python-3.x web-scraping lxml 其他开发

如何使用lxml选择和更新混合内容中的文本节点?

我需要检查XML文件中所有 text()节点中的所有单词.我正在使用XPath //text()选择文本节点，并使用正则表达式选择单词.如果该单词存在于一组关键字中，则需要将其替换为某些内容并更新XML. 通常使用 .text 设置元素的文本，但是 _Element 上的 .text 只会更改第一个子文本节点.在混合内容元素中，其他文本节点实际上是之前兄弟姐妹的 .tail . 如何更 ..

发布时间：2021-05-30 21:53:03 python xml xpath lxml Python

lxml相关内容