elementtree相关内容

Python元素树 - 从元素中提取文本,剥离标签

使用 Python 中的 ElementTree,如何从节点中提取所有文本,剥离该元素中的所有标签并仅保留文本? 例如,假设我有以下内容: 一些例子文本 我想返回一些示例文本.我该怎么做呢?到目前为止,我所采取的方法都产生了相当灾难性的后果. 解决方案 如果你在 Python 3.2+ 下运行,你可以使用 itertext. itertext 创建一 ..
发布时间:2022-01-10 19:39:13 Python

Python 内存不足,使用 cElementTree.iterparse 解析 XML

我的 XML 解析函数的简化版本在这里: 导入 xml.etree.cElementTree 作为 ET定义分析(xml):it = ET.iterparse(file(xml))计数 = 0for (ev, el) 其中:计数 += 1打印('计数:{0}'.格式(计数)) 这会导致 Python 内存不足,这没有多大意义.我实际存储的唯一内容是计数,一个整数.为什么要这样做: 看到最 ..
发布时间:2021-12-31 00:00:54 Python

ElementTree 和 unicode

我在一个 xml 文件中有这个字符: fumè 我尝试使用以下代码生成 ElementTree 的实例: string_data = open('file.xml')x = ElementTree.fromstring(unicode(string_data.encode('utf-8'))) 我收到以下错误: UnicodeEn ..
发布时间:2021-12-26 13:51:13 Python

从 ElementTree findall 返回的空列表

我是 xml 解析和 Python 的新手,所以请耐心等待.我正在使用 lxml 来解析 wiki 转储,但我只想要每个页面、它的标题和文本. 现在我有这个: from xml.etree import ElementTree as etree定义解析器(文件名):文档 = etree.parse(file_name)titles = document.findall('.//title' ..
发布时间:2021-12-12 23:45:41 Python

忠实地保留已解析 XML 中的注释

我希望在操作 XML 时尽可能忠实地保留注释. 我设法保留了注释,但内容正在被 XML 转义. #!/usr/bin/env python# add_host_to_tomcat.py导入 xml.etree.ElementTree 作为 ET从 CommentedTreeBuilder 导入 CommentedTreeBuilder解析器 = CommentedTreeBuilder() ..
发布时间:2021-12-08 12:51:01 Python

可以告诉 ElementTree 保留属性的顺序吗?

我已经使用 ElementTree 在 python 中编写了一个相当简单的过滤器来处理一些 xml 文件的上下文.它或多或少地起作用. 但是它重新排列了各种标签的属性,我希望它不要那样做. 有谁知道我可以扔一个开关来让它们保持指定的顺序吗? 上下文 我正在使用并开发一个粒子物理工具,该工具具有基于 xml 文件的复杂但奇怪的有限配置系统.以这种方式设置的众多内容包括各种静 ..
发布时间:2021-12-03 14:29:44 Python

如何让 Python 的 ElementTree 漂亮地打印到 XML 文件?

背景 我正在使用 SQLite 访问数据库并检索所需的信息.我在 Python 2.6 版中使用 ElementTree 来创建包含该信息的 XML 文件. 代码 导入 sqlite3导入 xml.etree.ElementTree 作为 ET# 注意:省略了访问数据库的代码,# 拉取数据,并将元素添加到树中树 = ET.ElementTree(root)# 漂亮地打印到 Pytho ..
发布时间:2021-12-03 14:20:37 Python

为什么xml包在Python3中修改了我的xml文件?

我使用 Python3.5 中的 xml 库来读取和写入一个 xml 文件.我不修改文件.只需打开并写入.但是库修改了文件. 为什么要修改? 我该如何防止这种情况发生?例如我只想在一个非常复杂的 xml 文件中替换特定标签或其值,而不会丢失任何其他信息. 这是示例文件 这是代码 导入 xml.etree.ElementTree 作为 ET树 = ET.parse('x.nfo ..
发布时间:2021-12-02 17:10:30 其他开发