lxml相关内容

builtins.TypeError:必须是 str,而不是字节

我已将脚本从 Python 2.7 转换为 3.2,但出现错误. # -*- 编码:utf-8 -*-导入时间从日期时间导入日期从 lxml 导入 etree从集合导入 OrderedDict# 创建根元素page = etree.Element('结果')# 创建一个新的文档树doc = etree.ElementTree(页面)# 添加子元素pageElement = etree.SubEl ..
发布时间:2021-12-02 17:23:35 Python

lxml 运行时错误:原因:库版本不兼容:etree.so 需要版本 12.0.0 或更高版本,但 libxml2.2.dylib 提供版本 10.0.0

我有一个令人困惑的问题.我用过 mac 10.9 版,anaconda 3.4.1,python 2.7.6. 使用 python-amazon-product-api 开发 Web 应用程序.我已经克服了关于安装 lxml 的障碍,参考 clang 错误:未知参数:'-mno-fused-madd'(python 包安装失败). 但是发生了另一个运行时错误.这是网页浏览器的输出. ..
发布时间:2021-11-27 08:42:13 Python

在 Windows 7 32 位上使用 Python 3.3 的 LXML 3.3

我在安装时遇到了重大问题.请提供详细的分步指南. 解决方案 这些说明适用于使用 Python3.3 的 Windows7 或 Windows8. 但是,它们应该适用于各种版本,因为 Python 的发行版和其他相应的先决条件发生了变化/发展: 安装Python3.3: 从下载页面下载 Python3.3 的最新版本(当前为 3.3.5)这里 Win32 MSI 安装程序的直 ..
发布时间:2021-11-26 14:28:30 Python

在 Windows 7 32 位上使用 Python 3.3 的 LXML 3.3

我在安装时遇到了重大问题.请提供详细的分步指南. 解决方案 这些说明适用于使用 Python3.3 的 Windows7 或 Windows8. 但是,它们应该适用于各种版本,因为 Python 的发行版和其他相应的先决条件发生了变化/发展: 安装Python3.3: 从下载页面下载 Python3.3 的最新版本(当前为 3.3.5)这里 Win32 MSI 安装程序的直 ..
发布时间:2021-11-24 23:12:11 C#

删除 lxml 中的所有命名空间?

我正在使用一些 google 的数据 API,使用 python 中的 lxml 库.命名空间在这里是一个巨大的麻烦.对于我正在做的很多工作(主要是 xpath 的东西),最好直接忽略它们. 是否有一种简单的方法可以忽略 python/lxml 中的 xml 命名空间? 谢谢! 解决方案 如果您想从元素和属性中删除所有命名空间,我建议使用下面显示的代码. 上下文:在我的应 ..
发布时间:2021-11-15 03:27:46 其他开发

使用 ElementTree getpath() 动态获取 Xpath

我需要编写一个动态函数,通过动态构建元素的 XPath 来查找 ATOM xml 子树上的元素. 为此,我写了这样的东西: tree = etree.parse(xmlFileUrl)e = etree.XPathEvaluator(tree, namespaces={'def':'http://www.w3.org/2005/Atom'})entry = e('//def:entry' ..
发布时间:2021-10-02 19:29:59 其他开发

使用 Python 请求提取 href URL

我想使用 python 中的请求包从 xpath 中提取 URL.我可以得到文本,但我没有尝试给出 URL.有人可以帮忙吗? ipdb>网页.xpath(xpath_url + '/text()')['URL 文本']ipdb>网页.xpath(xpath_url + '/a()')*** lxml.etree.XPathEvalError: 无效的表达式ipdb>网页.xpath(xpath_ ..
发布时间:2021-10-02 19:29:27 其他开发

使用 Python 解析 XML 并创建 excel 报告 - Elementree/lxml

我正在尝试解析许多 XML 测试结果文件并将必要的数据(如测试用例名称、测试结果、失败消息等)转换为 excel 格式.我决定使用 Python. 我的 XML 文件很大,格式如下.失败的案例有一条消息,&而通过的只有 .我的要求是创建一个带有测试用例名称、测试状态(通过/失败)、测试失败消息的 excel. ..
发布时间:2021-10-02 18:45:57 其他开发

用 Python 解析 Google Earth KML 文件(lxml,命名空间)

我正在尝试使用 xml 模块将 .kml 文件解析为 Python(之后未能在 BeautifulSoup 中完成这项工作,我将其用于 HTML). 由于这是我第一次这样做,我遵循了官方教程,一切顺利直到我尝试构造一个迭代器来通过根迭代提取我的数据: from lxml import etreetree=etree.parse('kmlfile') 这是我试图模仿的教程中的示例: ..
发布时间:2021-10-01 20:13:19 其他开发

使用命名空间获取 lxml 标记属性

我的 XML 看起来像: ...... 我有代码: from lxml import etree...对于 root.iterfind('.//termEntry') 中的 term_entry:打印 term_entry.attrib['id']打印 term_entry.nsmap对于 term_en ..
发布时间:2021-10-01 20:09:25 其他开发

命名空间错误 lxml xpath python

我正在将 word 文档转换为 xml 以使用以下代码进行比较: word = win32com.client.Dispatch('Word.Application')wd = word.Documents.Open(inFile)# 将单词 infile 转换为 xml outfilewd.SaveAs(outFile,11)wd.Close()dom=解析(输出文件) 我得到的 xml 文 ..
发布时间:2021-10-01 19:58:00 其他开发

使用 Python lxml 处理嵌套元素

给定以下简单的 XML 数据: 我的第一本书摘要的第一段摘要的第二段第一个关键词第二个关键词第三个关键词 如何使用 lxml 遍历树,并获取“抽象"元素中的所有段落,以及“keywordSet ..
发布时间:2021-10-01 19:41:17 其他开发

在 Python 中生成非常大的 XML 文件?

有谁知道在 Python 中生成非常大的 xml 文件(例如 100-500 MiB)的内存有效方法吗? 我一直在使用 lxml,但内存使用量已经达到顶峰. 解决方案 也许您可以使用模板引擎而不是自己生成/构建 xml? Genshi 例如基于 xml 并支持流输出.一个非常基本的例子: from genshi.template import MarkupTemplatetp ..
发布时间:2021-10-01 19:33:32 其他开发

使用 lxml 解析段落标记的子项时丢失子项

我正在使用 Python 库 lxml 对从 这个网址.过去我在使用 lxml 时没有遇到任何问题,但是我可能刚刚遇到了一个错误,即缺少子元素(在 lxml 树中)的形式,该错误明显出现在 HTML 中. 这是我用来解析 HTML 的 Python 代码: from urllib.request import urlopen从 lxml 导入 etreehtml_response = ur ..
发布时间:2021-09-23 20:24:46 其他开发

Python ElementTree XML修改具有多个值的元素

使用Python 2.7和 lxml ,如何修改具有多个值的XML元素? 例如 1冒险喜剧动作 直接修改 Playcount ,因为它只有一个值.如何修改流派,女巫具有多个值? 例如: 如何删除除第一类以外的所有内容? ..
发布时间:2021-05-30 21:53:20 其他开发