lxml 第6页 - IT屋-程序员软件开发技术分享社区

Python-如何使用lxml.objectify多次附加相同的XML元素

我尝试使用lxml.objectify 包重新创建以下XML> home 555-555-5555单元格 999-999-9999 home ..

发布时间：2021-05-30 21:53:00 python lxml Python

在python中使用lxml解析HTML文档

我刚刚下载了lxml来解析损坏的HTML文档.我正在阅读lxml的文档，但是找不到给定的HTML文档，我们如何使用lxml检索文档中的文本.如果有人可以帮助我，我将承担义务. 解决方案这很简单: 从LXML导入HTML的 html_document = ...#从文件或任何其他文件中获取文档内容树= html.fromstring(html_document)text_documen ..

发布时间：2021-05-30 21:52:57 python lxml Python

创建！ENTITY定义

使用python lxml如何创建！ENTITY定义，请注意，我想创建而不是解析. 那是我想创建一些包含另一个文件的 xml，因此需要一个 !ENTITY 定义解决方案您应该能够将doctype声明(带有具有ENTITY声明的内部子集)创建为字符串，并在序列化时传递它(使用tostring()或write()). 示例... 来自lxml导入etree的 doctype ..

发布时间：2021-05-30 21:52:51 python xml lxml Python

找到特定标签后，如何正确地将XML文件分割成几个其他文件?

问题: 我试图通过在找到标签后重新编写XML来拆分XML.但是结果不能正确地显示出来，因为在遍历元素并将它们添加到新的ET中时，它没有复制其子元素.一旦迭代通过该元素，最终将添加子项，因此，即使我找到了将子项添加到新ET的方法，它最终也将成为重复项. 我尝试过的: 我试图用lxml的ElementTree解析XML，然后遍历元素. 如果元素的标签不匹配，则将该元素记录到ET ..

发布时间：2021-05-30 21:52:50 python xml lxml Python

使用路径和值从xml文件创建数据框

这是xml文件中的数据， ADD土地索引 ..

发布时间：2021-05-30 21:52:39 python xml dataframe loops lxml Python

这是我必须对多个.xml文件的uuid进行排序的python脚本: import os将lxml.etree导入为ETinputpath ="C:\\ projects \\ xmlformat \\ uuid \\"xsltfile =" C:\\ projects \\ xmlformat \\ uuid \\ uuid.xslt"outpath ="C:\\ projects \\ xm ..

发布时间：2021-05-30 21:52:34 python xml lxml Python

python lxml在某些情况下无法解析日语

我正在使用lxml 4.5.0从网站上抓取数据. 在以下示例中效果很好 chrome_ua ="Mozilla/5.0(Macintosh; Intel Mac OS X 10_13_6)AppleWebKit/537.36" \“(KHTML，例如Gecko)Chrome/77.0.3864.0 Safari/537.36"与request.Session()为s:s.headers. ..

发布时间：2021-05-30 21:52:31 python python-requests lxml Python

解析前在lxml中注册名称空间

我正在使用lxml从具有名称空间的外部服务中解析XML，但未在 xmlns 中注册它们.我正在尝试使用 register_namespace 手动注册它，但这似乎不起作用. 从lxml导入etree的 xml =“"“ bar“"etree.register_namespace('xsi'，'http://www.w3.or ..

发布时间：2021-05-30 21:52:28 python xml lxml xml-namespaces Python

Python-硒和lxml中的相同xpath结果不同

我有这个网站 http://www.google-proxy.net/，我需要获取第一个代理的ip:port. br = webdriver.Firefox()br.get("http://www.google-proxy.net/")ip = br.find_element_by_xpath("//tr [@ class ='odd']/td [1]").text;time.sleep(ra ..

发布时间：2021-05-30 21:52:25 python selenium lxml Python

真的很奇怪...无法设置内置/扩展类型为'lxml.etree._Element'的属性

在没有问题之前，我已经更改了其他类的属性._Element显然不是内置的. 从lxml.etree中的导入_Element_Element.new_attr = 54 导致: TypeError: 无法设置内置/扩展类型 'lxml.etree._Element' 的属性解决方案 _Element 是 ..

发布时间：2021-05-30 21:52:21 python mocking lxml monkeypatching Python

使用lxml在python中解析多个名称空间XML

..

发布时间：2021-05-30 21:52:18 python xml parsing namespaces lxml Python

为什么不能将lxml.etree._ElementUnicodeResult转换为字符串?

print(type(players [1]))对于玩家中的玩家:玩家= str(玩家)打印(类型(玩家[1])) 输出为: 我需要将此ElementUnicode对象转换为字符串，以便可以在其上调用子字符串，但是此f ..

发布时间：2021-05-30 21:52:12 python html xpath lxml 前端开发

通过lxml从根而不是元素开始进行xpath查找

我想在漂亮的汤中做同样的事情，找到 find_all 元素，并对其进行迭代以在每个迭代的元素中找到一些其他元素.即: soup = bs4.BeautifulSoup(源)文章= soup.find_all('div'，class ='v-card')对于文章中的文章:名称= article.find('span'，itemprop ='name').text地址= article.find( ..

发布时间：2021-05-30 21:52:09 python xpath web-scraping lxml Python

保存麻烦的网页并重新导入Python

我正在尝试从各种页面中提取一些信息，并且有些挣扎.这显示了我的挑战: 导入请求从lxml导入htmlurl ="https://www.soccer24.com/match/C4RB2hO0/#match-summary"响应= requests.get(URL)打印(response.content) 如果将输出复制到记事本中，则无法在输出的任何位置找到值"9.20"(A组赔率在网页右下方 ..

发布时间：2021-05-30 21:52:08 python html python-requests lxml save-as 前端开发

强制xpath返回字符串lxml

我正在使用 lxml 并且我有一个来自 Google Scholar 的废弃页面.以下是一个最小的工作示例以及我尝试过的事情. 在[56]中:seed ="https://scholar.google.com/citations?view_op=search_authors&hl=zh-CN&mauthors=label:machine_learning"在[60]中:page = urllib ..

发布时间：2021-05-30 21:52:05 python xpath lxml Python

在lxml中查找具有未知名称空间的元素

我有一个具有多个级别的XML.每个级别可能都有附加的名称空间.我想找到一个我知道其名称但不知道其名称空间的特定元素.例如: my_file.xml ..

发布时间：2021-05-30 21:51:45 python xml lxml Python

Python解析XML提要错误:XPathEvalError:未定义的名称空间前缀

我正在尝试处理XML文件，但出现此错误: XPathEvalError:未定义的名称空间前缀在此行: 打印"category ="，item.xpath("./g:google_product_category") 这是XML文件: ..

发布时间：2021-05-30 21:51:42 python xml lxml Python

如何在Python 3中将SubElement的内容包装在XML标记中?

我有一个示例XML文件，如下所示: 她进行了没有去去学校. 我想创建一个名为的子元素，并将其中的所有内容放入其中.也就是说，她进行了没有去去学校. 我知道用ElementTree或lxml制作子元素很热，但是我不知道 ..

发布时间：2021-05-30 21:51:39 python lxml elementtree Python

lmxl增量XML序列化重复名称空间

我目前正在使用lxml在Python中序列化一些较大的XML文件.我想为此使用增量编写器.我的XML格式严重依赖于名称空间和属性.当我运行以下代码从IO导入BytesIO的从lxml导入etree接收器= BytesIO()nsmap = {'test':'http://test.org'，'foo':'http://foo.org'，'bar':'http://bar.org'，}使用e ..

发布时间：2021-05-30 21:51:36 python xml xml-serialization lxml xml-namespaces Python

在lxml中查找元素的结束标记的行号

在使用lxml解析XML文档时，我想查找特定标签的开始和结束行号.我可以通过使用 lxml.etree.Element 上的 sourceline 属性来找到起始标签的位置，但是我在努力寻找结束标签的行号. 我尝试的一个简单例子: 将lxml.etree导入为ETxml_sample = b''' ..

发布时间：2021-05-30 21:51:33 python lxml Python

lxml相关内容