lxml 第2页 - IT屋-程序员软件开发技术分享社区

python setuptool 如何为 libxml2-dev 和 libxslt1-dev 添加依赖项?

我的应用程序需要 lxml >= 2.1，但要安装 lxml 它需要安装 libxml2-dev libxslt1-dev否则在安装 lxml 时会引发错误，有没有一种方法可以使用 python 设置工具在我的 setup.py 中将其作为依赖项...... 解决方案不是真的... setuptools 只处理对已经属于 pypi 的包的依赖.所以如果你想要这些依赖，我认为你必须 ..

发布时间：2022-01-15 23:14:57 python dependencies lxml setuptools libxml2 Python

SSL:CERTIFICATE_VERIFY_FAILED 证书验证失败

从 lxml 导入 html导入请求url = "https://website.com/"page = requests.get(url)树 = html.fromstring(page.content)页面内容 -> SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] 证书验证失败 (_ssl.c:748) 我运行了这个脚本，但我得到了这个错误.我该怎 ..

发布时间：2022-01-15 21:37:49 python python-3.x ssl xmlhttprequest lxml Python

如何告诉 lxml.etree.tostring(element) 不要在 python 中编写命名空间?

我有一个巨大的 xml 文件 (1 Gig).我想将一些元素(条目)移动到具有相同标题和规范的另一个文件中. 假设原始文件包含带有标签的条目: ... ..

发布时间：2022-01-14 23:24:23 python namespaces lxml tostring elementtree Python

lxml:将命名空间添加到输入文件

我正在解析由外部程序生成的 xml 文件.然后我想使用我自己的命名空间向这个文件添加自定义注释.我的输入如下所示: 问题是lxml只在使用时声明命名空间，这意味着声明重复了很多次，就像这样(简化): 是否可以强制 lxml 在父元素中仅写入一次此声明，例如 sbml 或 listOfSpecies?还是有充分的理由不这样做?我想要的结果是: ..

发布时间：2022-01-14 23:11:20 python xml namespaces lxml sbml Python

使用 lxml 从 python 中的 xml 中删除命名空间和前缀

我需要打开一个 xml 文件并对其进行一些更改，其中一项更改是删除名称空间和前缀，然后保存到另一个文件.这是xml: 一些数据zh-CN 我可以进行我需要的其他更改，但不知道 ..

发布时间：2022-01-14 22:52:13 python xml namespaces lxml Python

无法在 Centos 上使用 Diazo (plone.app.theming)

我使用 plone4.1 和 Diazo 在我的 Mac 上创建了一个门户网站. 现在，我正在尝试将它部署在我的服务器 (CentO) 上，那里还有另一个带有 plone4.0.5 +collectivexdv 的站点. 当我使用我的 diazotheme 运行站点(在全新的构建中)时，我通过 shell(实例 fg)获得了这些行: 2011-09-27 09:32:10 错误 pl ..

发布时间：2022-01-13 21:25:32 centos plone lxml diazo deliverance 其他开发

在 Centos 7 上安装 lxml - 错误:命令“gcc"失败，退出状态为 4

我在虚拟环境中使用 python 3.4: (af)[root@domain backend]# pip --version来自/home/af/af-stage/backend/.ves/af/lib/python3.4/site-packages 的 pip 7.1.0 (python 3.4) lxml 安装失败“错误:命令 'gcc' 失败，退出状态为 4": (af)[root@d ..

发布时间：2022-01-13 21:18:34 python python-3.x centos lxml centos7 Python

从 lxml 中选择属性值

我想使用 xpath 表达式来获取属性的值. 我希望以下工作从 lxml 导入 etree对于 etree.parse('file.xml').getroot().findall('BOB') 中的客户:打印 customer.find('./@NAME') 但这给出了一个错误: Traceback(最近一次调用最后一次):文件“bob.py"，第 22 行，在打印 ..

发布时间：2022-01-13 18:04:50 python python-2.7 attributes lxml Python

在不使用 DOM 方法的情况下迭代解析大型 XML 文件

我有一个 xml 文件 .. 我想读取每个电子邮件标签的 xml 文件.也就是说，有一次我想读取电子邮件 id=1..从中提取正文，读取的电子邮件 id=2...并从中提取正文...等等 ..

发布时间：2022-01-10 20:36:32 python xml xml-parsing lxml Python

在 lxml 中解析 XML 时如何不加载注释

我尝试像这样使用 lxml 在 Python 中解析 XML 文件: objectify.parse(xmlPath, parserWithSchema) 但 XML 文件可能在奇怪的地方包含注释: Sample text1.23456 是一种在解 ..

发布时间：2022-01-10 19:52:49 python xml xml-parsing comments lxml Python

如何获取 Python 中两个 xml 标签之间的全部内容?

我尝试获取打开的 xml 标记和它的关闭对应项之间的全部内容. 像下面的 title 这样直接获取内容很容易，但是如果 mixed-content 被使用，我想保留内部标签? 一些测试的东西一些带有data ..

发布时间：2022-01-10 19:51:56 python xml xml-parsing lxml Python

XML 声明独立=“是"；lxml

我正在解析一个 xml，进行一些更改并保存到一个新文件中.它有我想保留的声明 .当我保存新文件时，我丢失了 standalone="yes" 位.我怎样才能把它留在里面?这是我的代码: templateXml = """ ..

发布时间：2022-01-10 19:49:33 python xml parsing xml-parsing lxml Python

即使在 pretty_print=True 时，使用 lxml 编写也不会产生空格

我正在使用 lxml 库来读取 xml 模板，插入/更改一些元素，并保存生成的 xml.我使用 etree.Element 和 etree.SubElement 方法动态创建的元素之一: tree = etree.parse(r'xml_archive\templates\metadata_template_pts.xml')根 = 树.getroot()流 = []对于 root.iter() ..

发布时间：2022-01-10 19:48:44 python xml xml-parsing lxml Python

lxml etree xmlparser 删除不需要的命名空间

我有一个我正在尝试使用 Etree.lxml 解析的 xml 文档 1一些东西我的代码是: path = "xml 文件的路径"从 lxml 导入 etree 作为 ET解析器 = ET.XMLParser(ns_clean=True)dom = ..

发布时间：2022-01-10 19:39:37 python lxml xml-parsing elementtree Python

是否可以在 Python 中针对 XSD 1.1 验证 XML 文件?

我想使用 lxml.XMLSchema 针对 XSD 文件验证 XML 文件.但问题是 XSD 在 1.1 中.所以它不起作用. 这是 XML 的一部分: ..

发布时间：2022-01-09 21:39:36 python xsd schema lxml Python

树莓派无法安装lxml pip包

我在安装 BeautifulSoup4 包后尝试安装 lxml 包. 在终端输入: sudo pip install lxml 这是我得到的 sudo pip install lxml下载/解压 lxml为包 lxml 运行 setup.py egg_info构建 lxml 版本 3.6.1.没有 Cython 的构建.使用 libxslt 1.1.26 的构建配置在以下目录中针对 l ..

发布时间：2022-01-05 11:02:15 python beautifulsoup raspberry-pi pip lxml Python

使用 Python/Scrapy 在 h1 中提取 p

我正在使用 Scrapy 从网站中提取有关音乐会的一些数据.我正在使用的至少一个网站(错误地，根据 W3C - 在 HTML5 中的标题标签内有段落元素是否有效(P 在 H1 内)?)在 h1 元素内的 ap 元素.尽管如此，我还是需要提取 p 元素中的文本，但不知道如何提取. 我已经阅读了文档并查看了示例用途，但我对 Scrapy 比较陌生.我知道该解决方案与将 Selector 类型设置 ..

发布时间：2022-01-04 21:05:51 python html scrapy lxml 前端开发

Scrapy 抓取下一页

我有这个用于scrapy框架的代码: # -*- 编码:utf-8 -*-导入scrapy从scrapy.contrib.spiders 导入规则从scrapy.linkextractors 导入LinkExtractor从 lxml 导入 html类 Scrapy1Spider(scrapy.Spider):名称 = "scrapy1"allowed_domains = ["sfbay.cra ..

发布时间：2022-01-04 20:46:47 python scrapy lxml scrapy-spider Python

如何使用 lxml、XPath 和 Python 从网页中提取链接?

我有这个 xpath 查询: /html/body//tbody/tr[*]/td[*]/a[@title]/@href 它提取具有标题属性的所有链接 - 并在 hrefrel="nofollow noreferrer">FireFox 的 Xpath 检查器附加组件. 但是，我似乎无法将它与 lxml 一起使用. from lxml import etreeparsedPage = ..

发布时间：2022-01-02 08:42:45 python screen-scraping hyperlink lxml extraction Python

lxml/requests 可以选择下拉选项然后解析生成的ajax吗?

我有一个要测试的网站，虽然我可以在下拉列表中获得选项列表，但我不确定如何选择它?没有提交按钮，所以如果我选择它，那么它会在下面加载一个 ajax 表. 我只是不确定 lxml/requests 是否可以做到这一点，或者如何做到这一点?如果有人可以确认或知道可以执行此操作的功能，我将不胜感激? 编辑:我的网站是内部网站，无法访问，但这里有一个示例网站:https://www.tsx.co ..

发布时间：2021-12-31 20:16:43 python web-scraping python-requests lxml Python

lxml相关内容