lxml相关内容

绕过ElementTree

在程序中,我需要在程序的各种功能中使用ElementTree对象. 更具体地说,我正在这样做: tree = etree.parse('somefile.xml') 我正在程序中传递这棵树. 我想知道这是否是一种好方法,或者我可以这样做: 创建全局树(我来自 C ++背景,我知道全局是 不好) 根据需要再次创建树. 或者我的方法还可以吗? 解决方案 在P ..
发布时间:2020-05-04 08:40:21 Python

从路径/值列表中写入xml

这是上一个问题的后续内容:用路径和值.现在,我要添加另外两个内容:1)属性和2)具有父节点的多个项目.这是我的路径列表: [ {'Path': 'Item/Info/Name', 'Value': 'Body HD'}, {'Path': 'Item/Info/Synopsis', 'Value': 'A great movie'}, {'Path': 'Item/Locales ..
发布时间:2020-05-04 08:40:19 Python

"SOAP请求必须使用SOAP 1.1 ..."

我正在编写一些生成XML的代码,并使用requests库将XML POST到Salesforce.com的SOAP服务.这是我用来生成XML的代码: from lxml import etree class SalesforceLeadConverter(object): def __init__(self, session_id, lead_id, **kwargs): ..
发布时间:2020-05-04 08:40:15 其他开发

在XPath(lxml)中管理引号

我想从给定网站的“制造概览"表中提取Web元素.但是该行的名称带有'(单引号).这干扰了我的语法.我该如何克服这个问题?该代码适用于其他行. import requests from lxml import html, etree ism_pmi_url = 'https://www.instituteforsupplymanagement.org/ismreport/mfgrob.cfm ..
发布时间:2020-05-04 08:40:08 Python

lxml按名称查找元素,但在搜索中使用变量

我对lXML中的find函数有问题.但是我认为这是一个更常见的问题,如何告诉我要对照值而不是对象引用进行检查. 这是有效的代码: step = xml_obj.find('.//step/name[text()="Design"]').getparent() 如果我尝试用对象替换字符串,则结果始终为None. stepn = 'Design' step = xml_obj.f ..
发布时间:2020-05-04 08:40:06 Python

LXML无法检索错误为“无法加载HTTP资源"的网页.

嗨,所以我尝试在浏览器中打开下面的链接,它可以工作,但在代码中不起作用.该链接实际上是新闻站点的组合,然后是从另一个文件url.txt调用的文章扩展名的组合.我在一个普通的网站(www.google.com)上尝试了该代码,并且效果很好. import sys import MySQLdb from mechanize import Browser from bs4 import Beaut ..
发布时间:2020-05-04 08:39:58 Python

使Urllib2在页面之间移动

我正在尝试刮除 http://targetstudy.com/school/schools-in -chhattisgarh.html 我正在使用lxml.html,urllib2 我想以某种方式,通过单击下一页链接来关注所有页面并下载其源代码. 并使其停在最后一页. 下一页的href是['?recNo = 25'] 有人可以建议如何做吗, 预先感谢. 这是我的代码, ..
发布时间:2020-05-04 08:39:56 其他开发

安装lxml OSX Mavericks 10.9.2

我试图在10.9.2 Mavericks上安装lxml,我使用了提到的所有解决方案cc -fno-strict-aliasing -fno-common -dynamic -arch x86_64 -arch i386 -g -Os -pipe -fno-common -fno-strict-aliasing -fwrapv -mno-fused-madd -DENABLE_DTRACE -DMA ..
发布时间:2020-05-04 08:39:52 Python

带有lxml.html TypeError的Cx_freeze

import lxml.html 当我想使用cx_freeze进行编译时,给我错误: Traceback (most recent call last): File "C:\Python27\Scripts\cxfreeze", line 5, in main() File "C:\Python27\lib\site-packages\cx_Fre ..
发布时间:2020-05-04 08:39:46 Python

在lxml中重写ElementTree代码

我正在编写一个代码,使用ElementTree从xml文件中提取文本,但是我发现lxml具有xpath功能,这更加方便.所以我想知道如何在lxml 中重写这一行 if x.nodeName == 'a:pPr' and x.getAttribute('lvl') == '2' and x.hasAttribute('marL') == False: 目前,我建议使用它. '/p:sl ..
发布时间:2020-05-04 08:39:44 Python

无法在CentOS上安装lxml

我正在尝试安装lxml,但遇到一些困难: [root@ip-xx-xxx-xx-113 init.d]# pip install lxml Downloading/unpacking lxml Running setup.py egg_info for package lxml /usr/lib64/python2.6/distutils/dist.py:266: UserWar ..
发布时间:2020-05-04 08:39:31 Python

在带有gcc 4.2的Mac OS X 10.6.8上安装lxml

我已经使用 osx-gcc-installer .下载XCode将花费很多时间,但是我设法下载并安装了这个170 Mb的程序包,并且能够使用iostream和std::cout编译Hello, world!程序. 然后我尝试使用python的easy_install lxml安装lxml.找不到gcc-4.0.我添加了指向gcc-4.2的gcc-4.0符号链接.这就是我得到的,任何帮助,我们 ..
发布时间:2020-05-04 08:39:24 C/C++开发