beautifulsoup 第103页 - IT屋-程序员软件开发技术分享社区

与beautifulsoup和python提取标签信息

说我有一些XML像＆LT;项目名称=面包重量=“5”食用=“YES”＆GT; ＆LT;身体GT;一些废话＆LT; /身体GT; ＆LT;项目＆GT;＆LT;项目名称=鸡蛋的重量=“5”食用=“YES”＆GT; ＆LT;身体GT;一些废话＆LT; /身体GT; ＆LT;项目＆GT;＆LT;项目名称=肉的重量=“5”食用=“YES”＆GT; ＆LT;身体GT;一些废话＆LT; /身体GT; ＆LT ..

XPath的不工作的屏幕抓取

我使用Scrapy的屏幕抓取项目时遇到的一个XPath的问题。我想从下面的图片的94218，但我已经使用的XPath和CSS是行不通的。这是从该页面： https://fancy.com/things/280558613/ I％27米-FINE-T恤我已经试过多次的XPath和CSS与Scrapy但一切都返回空白。下面是一些例子：response.xpath('/html/bo ..

发布时间：2016-08-05 19:14:41 python web-scraping beautifulsoup scrapy screen-scraping Python

添加父标签与美丽的汤

我有包含这些code片段各个部分的HTML多页：＆LT; DIV CLASS =“脚注”ID =“脚注-1”＆GT; ＆LT; H3＆GT;参考：LT; / H3 GT＆; ＆LT;表格的cellpadding =“0”CELLSPACING =“0”级=“漂浮物”的风格=“保证金底：0;” WIDTH =“100％”＆GT; ＆所述; TR＆GT; ＆LT; TD VALIGN =“顶” ..

发布时间：2016-08-05 19:14:38 python html-parsing beautifulsoup Python

使用/进口美丽的汤4，无需安装

随着美丽的汤文件说：如果一切都失败了，对美丽的汤许可，您可以与打包应用程序的整个库。您也可以下载压缩包，复制其BS4目录到应用程序的codeBase类，并用美丽的汤，不安装它。这正是我想要的，我做了什么......最多我的code。使用它的地步。我不知道如何导入美丽的汤4.不同于V3，没有独立的 BeautifulSoup.py ，仅仅是 BS4 与一群Python脚本的目录。有没 ..

发布时间：2016-08-05 19:14:36 python beautifulsoup Python

刮Flipkart.com所有手机

我想凑全部来自www.flipkart.com的手机。现在，我还以为做的是，我可以从这里刮的所有手机。 http://www.flipkart.com/mobiles/pr?p[]=sort%3Dprice_asc&sid=tyy%2C4io&layout=grid 现在的问题是，在这个网站，我不得不preSS'显示更多结果“来查看更多结果。但是，我怎么能做到这一点使用code？我使用Bea ..

发布时间：2016-08-05 19:14:33 python web-scraping beautifulsoup Python

检索使用美丽的汤一关闭和开启HTML标记之间的所有内容

我解析使用Python的内容和美味的汤，然后将其写入到CSV文件，并已运行到获得一组特定的数据问题的开溜。数据通过TidyHTML的实现，我制作的，然后其他不需要的数据剥离出来跑了。问题是，我需要一组之间获取所有数据＆LT; H3方式＆gt; 标签样本数据：＆LT; H3＆GT;＆LT; A HREF =“卷-1页-001.pdf”＆GT;页1-18 LT; / A＆GT;＆LT; / ..

发布时间：2016-08-05 19:14:31 python beautifulsoup Python

BeautifulSoup和＆安培; NBSP;

我的code： HTML =“＆LT;标签＆GT;＆安培; NBSP;＆LT; /标签＆gt;”中从BS4进口BeautifulSoup 打印BeautifulSoup（HTML）.renderContents（）输出：＆LT;标签＆GT;┬á＆LT; /标签＆GT; 所需的输出：＆LT;标签＆GT;＆安培; NBSP;＆LT; /标签＆GT; BeautifulSoup似乎 ..

发布时间：2016-08-05 19:14:28 python html beautifulsoup 前端开发

从价值HREF源蟒蛇提取物ID

我已经成功地提取HREF URI的使用beautifulsoup从页面的源代码，但是我现在想提取下面的例子中的多个实例的UID值：例如＆LT; A HREF =“？test.html的UID = 5444974”＆GT; ＆LT;“？test.html的UID = 5444972”A HREF =＆GT; ＆LT;“？test.html的UID = 54444972”A HREF =＆GT ..

发布时间：2016-08-05 19:14:25 python regex beautifulsoup Python

与BeautifulSoup更改元素的值返回空元素

从BeautifulSoup进口BeautifulStoneSoupxml_data =“”“ ＆LT;＆DOC GT; ＆LT;试验＆gt;测试与LT; /试验＆gt; ＆LT;富：酒吧＆GT;世界，你好＆LT; /富：酒吧＆GT; ＆LT; / DOC＆GT; “”“汤= BeautifulStoneSoup（xml_data）打印汤。prettify（）使= soup.find（ ..

发布时间：2016-08-05 19:14:22 python xml parsing beautifulsoup Python

为什么BeautifulSoup修改我自闭的元素呢？

这是剧本我有：进口BeautifulSoup如果__name__ ==“__main__”：数据=“”“ ＆LT;根和GT; ＆所述;物镜的id =“3”/＆GT; ＆LT; OBJ ID =“10”/＆GT; ＆所述;物镜的id =“3”/＆GT; ＆LT; /根＆GT; “”“ 汤= Beautifu ..

发布时间：2016-08-05 19:14:16 python xml beautifulsoup Python

哪个版本BeautifulSoup与GAE（蟒蛇2.5）的作品？

当我写从BeautifulSoup进口BeautifulSoup 我收到以下错误：没有名为BeautifulSoup模块所有文件都保存在项目文件夹，子文件夹BeautifulSoup。和它的作品好，如果BeautifulSoup.py放在哪里main.py是相同的文件夹中。解决方案如果您要包括 BeautifulSoup 从子包（子目录），确保目录下有个 __ __初始化。P ..

发布时间：2016-08-05 19:14:14 python google-app-engine beautifulsoup Python

Python模块BeautifulSoup提取锚HREF

我使用BeautifulSoup模块通过这种方式来选择所有的HTML HREF：高清extract_links（HTML）：汤= BeautifulSoup（HTML）锚= soup.findAll（'A'）打印锚链接= [] 对于在锚： links.append（一[“HREF']）返回链接但有时它未能通过此错误消息：回溯（最后最近一次调用）： ..

发布时间：2016-08-05 19:14:11 python html beautifulsoup 前端开发

beautifulsoup 4：分段故障（核心转储）

我爬到以下页面： http://www.nasa.gov/topics/地球/功能/平原，龙卷风，20120417.html 不过，我打电话时分段故障（核心转储）：BeautifulSoup（page_html），其中page_html是请求库的内容。这是BeautifulSoup的错误吗？有没有什么办法来解决这件事？即使是像接近尝试...除了会帮助我，让我的code运行。先谢谢了。在co ..

发布时间：2016-08-05 19:14:08 python screen-scraping web-scraping beautifulsoup Python

可美丽的汤输出发送到浏览器？

我已经最近推出的pretty新的蟒蛇，但有我的大部分用PHP的经验。在PHP与HTML工作时已经为它去一件事（这并不奇怪）是echo语句输出HTML浏览器。这可让您使用内置的浏览器开发工具，如萤火虫。有没有一种方法使用工具时重新路由命令行的浏览器输出的Python / Django的美丽汤？理想情况下，code的每次运行将打开一个新的浏览器选项卡。解决方案如果它是你使用，你可以的渲染 ..

发布时间：2016-08-05 19:14:05 python html browser beautifulsoup html-parsing 前端开发

存储大量数据最聪明的方式

我想用REST请求访问Flickr的API和下载大约元数据。 1神达照片（也许更多）。我想将它们存储在一个.csv文件，并将其导入然后进入MySQL数据库进行进一步的处理。我想知道什么是处理这种大数据的最聪明的方式。什么我不知道的是如何将它们存储访问网站的Python中，将它们传递给.csv文件，并从那里到数据库后。那是一个很大的问号。请告诉我现在发生的事情（我的理解，见code以下） ..

发布时间：2016-08-05 19:14:02 python database web-scraping beautifulsoup bigdata Python

蟒蛇BeautifulSoup得到select.value不是文本

＆LT;选择＆GT; ＆LT;期权价值=“0”＆GT; 2002/12＆LT; /选项＆GT; ＆LT;期权价值=“1”＆GT; 2003/12＆LT; /选项＆GT; ＆LT;期权价值=“2”＆GT; 2004/12＆LT; /选项＆GT; ＆LT;期权价值=“3”＆GT; 2005/12＆LT; /选项＆GT; ＆LT;期权价值=“4”＆GT; 2006/12＆LT; /选项＆GT; ..

发布时间：2016-08-05 19:13:59 python html select beautifulsoup 前端开发

点击使用蟒蛇beautifulsoup链接

在机械化我们点击通过使用follow_link或click_link链接。是否有一个类似的一种美丽的汤的事情点击网页上的链接？解决方案 BeautifulSoup 是一个HTML 解析器进一步讨论实际上取决于具体的情况你是在和特定网页的复杂程度。如果你需要用网页交互：提交表单，点击按钮，滚动等 - 你需要使用一个工具，利用真正的浏览器，像的硒。在某些情况下，例如，如果没有 ..

发布时间：2016-08-05 19:13:57 python web-scraping beautifulsoup Python

无法从BeautifulSoup页面获得实际标记

我想凑这个网址与组合 BeautifulSoup 和 Selinium http://starwood.ugc.bazaarvoice.com/3523si-en_us/115/reviews.djs?format=embeddedhtml&page=2&scrollToTop=true 我已经试过这code active_review_page_html = browser.page_ ..

发布时间：2016-08-05 19:13:54 python selenium python-3.x web-scraping beautifulsoup Python

通过与BeautifulSoup / Python中的DOM遍历

我有这样的DOM：＆LT; H2＆GT;主要章节＆lt; / H2＆GT; ＆LT; P＆GT;唧唧歪歪＆LT; P＆GT; ＆LT; H3＆GT;款中，LT; / H3 GT＆; ＆LT; P＆GT;一些更多的信息＆LT; / P＆GT;＆LT; H3＆GT;分段2'; / H3 GT＆; ＆LT; P＆GT;即使更多信息＆LT;！/ P＆GT; ＆LT; H2＆GT;主营第2版; / H＆ ..

发布时间：2016-08-05 19:13:51 python html parsing html-parsing beautifulsoup 前端开发

查找HTML第一层级中的所有文本使用美丽的汤 - 的Python

我需要用美丽的汤完成以下示例HTML ＆LT; DIV ID =“DIV1”＆GT; 文本1 ＆LT; DIV ID =“DIV2＆GT; 文本2 ＆LT; DIV ID =“DIV3”＆GT; 文本3 ＆LT; / DIV＆GT; ＆LT; / DIV＆GT; ＆LT; / DIV＆GT; 我需要在这做一个搜索，返回到我的列表的不同实例文本 ..

发布时间：2016-08-05 19:13:47 python html-parsing beautifulsoup findall Python

beautifulsoup相关内容