lxml 第34页 - IT屋-程序员软件开发技术分享社区

在Ubuntu服务器上安装软件包时出现内存不足问题

我使用的是有限的512MB RAM和20 GB硬盘的Ubuntu云服务器。它的450MB + RAM已被进程使用。我需要安装一个名为 lxml 的新程序包， Cpython 安装及其非常繁重的过程，因此它总是以错误退出gcc：内部编译器错误：Killed（程序cc1）这是由于没有RAM可用于运行。升级机器是一个选择，但它有它自己的问题，很少有我的服务/网站从这个服务器本身。 ..

发布时间：2018-04-20 17:07:03 python gcc ubuntu memory-management lxml Python

从lxml.objectify.ObjectifiedElement剥离python命名空间属性

可能重复：如何从一个 lxml.objectify.ObjectifiedElement ？示例： In [1]：from lxml import etree ，objectify In [2]：foo = objectify.Element（“foo”） In [3]：foo.bar =“hi” In [4]：foo.baz = 1 In [5]：foo.fr ..

发布时间：2018-02-04 11:30:15 python formatting lxml objectify elementtree Python

部署到AWS时无效的requirements.txt。 PIP无法安装lxml

将Flask应用程序部署到AWS EC2实例时遇到问题。可能用 pip 安装 lxml 。但是我不知道该如何解决这个问题。 AWS EC2： b $ p $ b 从 eb create ： CalledProcessError：Command'/ opt / python / run / venv / bin / pip install -r /opt/python/ ..

发布时间：2017-12-12 21:36:49 amazon-ec2 flask pip lxml requirements.txt 其他开发

Python XML解析算法速度

我目前在heroku上的一个python-flask webapp中解析了以下格式的大XML文件： li 1内容 li 2内容 ..

发布时间：2017-12-11 23:37:33 python xml optimization flask lxml Python

与POST的Flask示例

假设以下路线访问xml文件，用特定的xpath（？key =）替换特定标签的文本： def update_text（）：＃CODE pre> 然后，我将使用如下所示的cURL： $ b $ $ $ p $ curl -X POST http：// ip：5000 / resource？key = listOfUsers / user1 -d“John” ..

发布时间：2017-12-11 23:32:28 python rest flask lxml Python

如何使用LXML递归地查找xml标签？

使用lxml有可能递归地查找标签“f1”，我试过findall方法，但它只适用于直接的孩子。我想我应该为BeautifulSoup做这个工作!!! 可以使用XPath来递归搜索： p> >>> from lxml import etree >>> q = etree.fromstring（' a b ..

发布时间：2017-11-09 21:01:03 python xml find lxml elementtree Python

Python Lxml：添加和删除标签

我正在尝试在xml树中添加和删除标签（下面的剪辑）。我有一个布尔值的dict，用于确定是添加还是删除标签。如果该值为true，并且该元素不存在，则它将创建该标记（如果该值不存在）。如果是false，它会删除该值。但是，似乎不起作用，我找不到原因。 27913.769923 5 ..

发布时间：2017-10-01 18:38:36 python parsing exception-handling lxml Python

如何从selenium webdriver中的网页获取数据

我想从这个链接获取公司名称，电子邮件，电话号码，并将这些内容在一个excel文件。我想为网站的所有页面做同样的事情。我有了在浏览器中获取链接并在它们之间切换的逻辑。我无法从网站获取数据。任何人都可以提供对我写的代码的增强。以下是我写的代码：从selenium import webdriver 从selenium.common.exceptions导入NoSuchElementEx ..

发布时间：2017-09-23 21:14:14 python-2.7 excel-vba selenium selenium-webdriver lxml Office

python - lxml中xpath获取本节点及以下所有节点的text()方法？

问题商品名称：养生堂天然维生素E软胶囊商品编号：720135 品牌：养生堂以上是网页源码，现通过xpath匹配所有 ..

发布时间：2017-09-06 11:53:56 lxml python Python

python2.7 - C++ 嵌入 Python 不能导入 lxml.html 的问题

我在系统中安装了 Python2.7 和 lxml，通过命令行执行 import lxml.html 没有问题。但是我在 C++ 中嵌入 Python，调用 PyRun_SimpleString("import lxml.html"); 就会提示下面的错误我已经把 Python 安装目录下的 DLLs Lib python27.dll 都拷贝到了我 C++ 程序的目录下了，请问大神 ..

发布时间：2017-09-06 11:50:59 lxml c c++ python2.7 python C/C++开发

python - pip安装lxml失败

pip安装lxml库，试了很多次，都会卡在这里：用top命令查看系统资源，发现物理内存基本耗尽，但是虚拟内存没怎么用：该用什么办法安装lxml呢？服务器性能没办法改善了。 ..

发布时间：2017-09-06 10:48:54 pip python lxml linux 服务器开发

网页爬虫 - python中使用lxml解析中文网页出现编码问题，如何解决？

问题爬取IT之家网页http://it.ithome.com/category... 在使用requests.get得到网页后用lxml解析，但是打印出来后中文无法正常显示，而打印requests.get得到的内容却可以正常显示。求原因及解决方法（BeautifulSoup可正常解析）。代码 # coding: utf-8 import requests from lx ..

发布时间：2017-09-06 08:51:48 编码网页爬虫 lxml python Python

python - pyquery+lxml空标签被自闭合问题

问题 from pyquery import PyQuery as pq html=" " a=pq(html) print(a.html()) //会输出 ,其他html标签也是如此当一个标签是空的时候，他就自动自闭合了。我想不让他自动闭合，应该怎么办？ pyquery用的是lxml解析的html，我用lxml单独试了一下，问题依旧，希望高人指点。 ..

发布时间：2017-09-06 03:22:08 lxml pyquery python Python

xpath - python怎么用lxml处理

问题例如：没 aa 没 aa 没 aa 没就是在p标签里可能会出现同样的em标签，而且数量不定，那我怎 ..

发布时间：2017-09-06 02:39:51 python xpath lxml Python

python2.7 - 利用爬虫爬取链家二手房所在小区数据时遇到的问题

原网页及使用chrome检查结果如图：我的目的是提取该二手房所在的小区信息，包括小区均价，建筑年代，建筑类型，楼栋总数，户型总数，源代码为： >>>from lxml import etree >>>import requests >>>url = 'http://bj.lianjia.com/chengjiao/101101498110.html' >>>r = requests. ..

发布时间：2017-09-05 23:58:19 lxml xpath python爬虫 python2.7 其他开发

python3.x - centos python 安装lxml 报错阿里云ECS

问题阿里云主机，原本centos内置python 2.7 ，安装了python 3.6 然后因为要使用lxml 解析文档，结果使用 pip3 install lxml Collecting lxml HTTP error 404 while getting http://mirrors.aliyun.com/pypi/packages/0a/75/d54af657adc8 ..

发布时间：2017-09-05 22:01:27 centos lxml beautifulsoup python3.x python Python

我已经在python中编写了一些代码来解析标题和从网页链接。最初，我试图解析左侧栏中的链接，然后通过跟踪每个链接从每个页面中删除上述文档。我完美无瑕。我尝试将不同链接的文档保存在单个excel文件中的不同页面中。但是，它创建了几个“表格”，从脚本中的标题变量中提取所需部分作为工作表名称。我遇到的问题是 - 当保存数据时，链接中每页的最后一条记录将保存在我的excel表中，而不是完整的记录。这是我尝 ..

发布时间：2017-09-04 01:20:28 python excel xpath web-scraping lxml Python

从转义的html - >到常规html？ - Python

我使用BeautifulSoup处理通过REST API收集的XML文件。响应包含HTML代码，但BeautifulSoup转义所有HTML标签，以便它可以显示得很好。不幸的是我需要HTML代码。如何将转义的HTML转换成适当的标记？帮助将非常感谢！ / p> 解决方案我想你想要 xml.sax.saxutils.unescape 从Python标准库。 ..

发布时间：2017-08-29 00:21:42 python html escaping beautifulsoup lxml 前端开发

lxml中的HTML元素被错误地编码为&＃x41D;&＃x430;&＃x439;

我需要从网页打印RSS链接，但是这个链接被解码不正确。这是我的代码： import urllib2 from lxml import html，etree import chardet data = urllib2.urlopen（'http://facts-and-joy.ru/'） S = data.read（） encoding = chardet.detect（ ..

发布时间：2017-08-17 01:28:12 python encoding lxml Python

使用lxml解析xml和html页面，并在python中请求包

我一直在尝试使用lxml解析xml和html页面，并在python中请求打包。为此，我使用以下代码：在python中： import requests import lxml.etree url =“” req = requests.get（url） tree = html.fromstring（req.content） root = tree.xpath（''）为 ..

发布时间：2017-08-17 01:18:41 python parsing encoding python-requests lxml Python

lxml相关内容