lxml 第11页 - IT屋-程序员软件开发技术分享社区

绕过ElementTree

在程序中，我需要在程序的各种功能中使用ElementTree对象. 更具体地说，我正在这样做: tree = etree.parse('somefile.xml') 我正在程序中传递这棵树. 我想知道这是否是一种好方法，或者我可以这样做: 创建全局树(我来自 C ++背景，我知道全局是不好) 根据需要再次创建树. 或者我的方法还可以吗? 解决方案在P ..

发布时间：2020-05-04 08:40:21 python lxml Python

从路径/值列表中写入xml

这是上一个问题的后续内容:用路径和值.现在，我要添加另外两个内容:1)属性和2)具有父节点的多个项目.这是我的路径列表: [ {'Path': 'Item/Info/Name', 'Value': 'Body HD'}, {'Path': 'Item/Info/Synopsis', 'Value': 'A great movie'}, {'Path': 'Item/Locales ..

发布时间：2020-05-04 08:40:19 python xml xpath lxml Python

"SOAP请求必须使用SOAP 1.1 ..."

我正在编写一些生成XML的代码，并使用requests库将XML POST到Salesforce.com的SOAP服务.这是我用来生成XML的代码: from lxml import etree class SalesforceLeadConverter(object): def __init__(self, session_id, lead_id, **kwargs): ..

发布时间：2020-05-04 08:40:15 xml soap lxml 其他开发

使用lxml在多行中拆分长XML标记

我的python(2.7)脚本正在使用lxml库输出以下XML: ..

发布时间：2020-05-04 08:40:11 python xml lxml pretty-print Python

在XPath(lxml)中管理引号

我想从给定网站的“制造概览"表中提取Web元素.但是该行的名称带有'(单引号).这干扰了我的语法.我该如何克服这个问题?该代码适用于其他行. import requests from lxml import html, etree ism_pmi_url = 'https://www.instituteforsupplymanagement.org/ismreport/mfgrob.cfm ..

发布时间：2020-05-04 08:40:08 python parsing xpath lxml elementtree Python

lxml按名称查找元素，但在搜索中使用变量

我对lXML中的find函数有问题.但是我认为这是一个更常见的问题，如何告诉我要对照值而不是对象引用进行检查. 这是有效的代码: step = xml_obj.find('.//step/name[text()="Design"]').getparent() 如果我尝试用对象替换字符串，则结果始终为None. stepn = 'Design' step = xml_obj.f ..

发布时间：2020-05-04 08:40:06 python lxml Python

python:使用lxml xpath从更改span类中获取数据

我想从wsj网站提取“资产回报".但是，我的代码不够健壮，无法在不同条件下工作. 我可以使用以下代码提取代码"SCGM"的数据，但对于"AASIA"，其结果为失败 from lxml import html import requests StockData =['SCGM','AASIA'] pag ..

发布时间：2020-05-04 08:40:02 python html xpath lxml 前端开发

嗨，所以我尝试在浏览器中打开下面的链接，它可以工作，但在代码中不起作用.该链接实际上是新闻站点的组合，然后是从另一个文件url.txt调用的文章扩展名的组合.我在一个普通的网站(www.google.com)上尝试了该代码，并且效果很好. import sys import MySQLdb from mechanize import Browser from bs4 import Beaut ..

发布时间：2020-05-04 08:39:58 python lxml lxml.html Python

使Urllib2在页面之间移动

我正在尝试刮除 http://targetstudy.com/school/schools-in -chhattisgarh.html 我正在使用lxml.html，urllib2 我想以某种方式，通过单击下一页链接来关注所有页面并下载其源代码. 并使其停在最后一页. 下一页的href是['?recNo = 25'] 有人可以建议如何做吗，预先感谢. 这是我的代码， ..

发布时间：2020-05-04 08:39:56 python-2.7 urllib2 lxml lxml.html 其他开发

Python解析:lxml仅获取标签文本的一部分

我正在使用Python编写类似如下的HTML.我正在使用lxml进行解析，但同样可以愉快地使用pyquery: NameDave Davies Address123 Greyfriars Road, London 无论使用哪种库，都很难拔出“名称"和“地 ..

发布时间：2020-05-04 08:39:54 python screen-scraping lxml Python

安装lxml OSX Mavericks 10.9.2

我试图在10.9.2 Mavericks上安装lxml，我使用了提到的所有解决方案cc -fno-strict-aliasing -fno-common -dynamic -arch x86_64 -arch i386 -g -Os -pipe -fno-common -fno-strict-aliasing -fwrapv -mno-fused-madd -DENABLE_DTRACE -DMA ..

发布时间：2020-05-04 08:39:52 python macos lxml osx-mavericks cc Python

通过lxml/Python中的xpath选择所有带有href属性的锚标签，其中href属性包含多个值之一

我需要自动扫描大量html文档以查找被锚标记包围的广告横幅，例如: 作为使用xpath的新手，我可以通过lxml这样选择锚点: text = ''' ..

发布时间：2020-05-04 08:39:50 python xpath operators lxml contains Python

带有lxml.html TypeError的Cx_freeze

import lxml.html 当我想使用cx_freeze进行编译时，给我错误: Traceback (most recent call last): File "C:\Python27\Scripts\cxfreeze", line 5, in main() File "C:\Python27\lib\site-packages\cx_Fre ..

发布时间：2020-05-04 08:39:46 python lxml cx-freeze Python

在lxml中重写ElementTree代码

我正在编写一个代码，使用ElementTree从xml文件中提取文本，但是我发现lxml具有xpath功能，这更加方便.所以我想知道如何在lxml 中重写这一行 if x.nodeName == 'a:pPr' and x.getAttribute('lvl') == '2' and x.hasAttribute('marL') == False: 目前，我建议使用它. '/p:sl ..

发布时间：2020-05-04 08:39:44 python xml python-2.7 lxml elementtree Python

lxml :: etree :: __ ElementStringResult.getparent()工作不正常

我没有找到任何解释此错误的人... 我正在使用lxml 3.1.0. 当有这样的HTML/XML时: Lange XT 100 LV Ski Boots 2014 运行时将返回字符串"XT 100 LV滑雪靴2014"的_ElementStringResult: >> ..

发布时间：2020-05-04 08:39:40 python lxml Python

使用lxml生成xml文档，并根据逻辑改变元素文本和属性

我有这样的lxml代码 from lxml import etree import sys fd = open('D:\\text.xml', 'wb') xmlns = "http://www.fpml.org/FpML-5/confirmation" xsi = "http://www.w3.org/2001/XMLSchema-instance" fpmlVersion="http: ..

发布时间：2020-05-04 08:39:36 lxml 其他开发

无法在CentOS上安装lxml

我正在尝试安装lxml，但遇到一些困难: [root@ip-xx-xxx-xx-113 init.d]# pip install lxml Downloading/unpacking lxml Running setup.py egg_info for package lxml /usr/lib64/python2.6/distutils/dist.py:266: UserWar ..

发布时间：2020-05-04 08:39:31 python centos lxml Python

在带有gcc 4.2的Mac OS X 10.6.8上安装lxml

我已经使用 osx-gcc-installer .下载XCode将花费很多时间，但是我设法下载并安装了这个170 Mb的程序包，并且能够使用iostream和std::cout编译Hello, world!程序. 然后我尝试使用python的easy_install lxml安装lxml.找不到gcc-4.0.我添加了指向gcc-4.2的gcc-4.0符号链接.这就是我得到的，任何帮助，我们 ..

发布时间：2020-05-04 08:39:24 c++ python macos gcc lxml C/C++开发

用BeautifulSoup包装标签的内容

我想用BeautifulSoup包装标签的内容. 这个: Footnote 1 Footnote 2 应该变成这样: Footnote 1 Footnote 2 ..

发布时间：2020-05-04 08:39:21 python beautifulsoup lxml Python

在Python中删除空格和不可打印的字符

我正在使用lxml etree xpath方法处理xml文件.我的代码是 from lxml import etree File="c:\file.xml" doc=etree.parse(File) alltext = doc.xpath('descendant-or-self::text()') clump = "".join(alltext) clump 我得到以下输出: ..

发布时间：2020-05-04 08:39:17 python python-2.7 xpath xml-parsing lxml Python

lxml相关内容