beautifulsoup 第104页 - IT屋-程序员软件开发技术分享社区

使用`find_all`无论是否有它的元素Beautifulsoup找到文本元素

例如 BS = BeautifulSoup（“＆LT; HTML＆GT;＆LT; A＆GT; sometext＆LT; / A＆GT;＆LT; / HTML＆gt;”中）打印bs.find_all（“一”，文本= re.compile（R“一些”））收益 [＆LT; A＆GT; sometext＆LT; / A＆GT;] 但当元素搜索有一个孩子，即 IMG BS = Beautif ..

发布时间：2016-08-05 19:13:45 python beautifulsoup Python

Django的视图中BeautifulSoup使WSGI超时

有关一个奇怪的原因，当我实例化的 BeautifulSoup 的Django的视图中的对象时，WSGI超时。任何帮助是pciated因为我敲我的头撞在墙上几个小时，无法找到这个问题的根源AP $ P $。视图：高清指数（要求）：汤= BeautifulSoup（'＆LT; B＆GT;大胆＆LT; / B＆GT;'）＃删除此行解决proble 返回的Htt prespons ..

发布时间：2016-08-05 19:13:42 django beautifulsoup mod-wsgi 其他开发语言

使用BeautifulSoup第一个孩子标记之前提取文本

从这个HTML源代码：＆LT; DIV CLASS =“category_link”＆GT; 类别：＆LT; A HREF =“/类别/个人”＆GT;个人及LT; / A＆GT; ＆LT; / DIV＆GT; 我想提取文本类别：下面是使用Python / BeautifulSoup我尝试（与输出为注释 - 在＃之后）解析= BeautifulSoup（sample_htm ..

发布时间：2016-08-05 19:13:39 python beautifulsoup Python

我试图通过使用argparse python脚本登录到我的Instagram。这似乎连接，但它打印出“的此页面无法加载。如果您在您的浏览器禁用了Cookie，oryou在私人模式浏览，请尝试启用Cookie或关闭私人模式，然后重试你的行动的“ 这里是我的code：进口argparse 进口mechanicalsoup 从BS4进口BeautifulSoup解析器= argparse.Argu ..

发布时间：2016-08-05 19:13:37 python beautifulsoup mechanize Python

＆是什么QUOT;模块对象不是可调用的＆QUOT;意思？

我使用的是与机械化，这似乎打印出我想要的HTML .get_data（）方法。我还要检查一下它打印出的类型，类型是'str的“ 但是，当我尝试解析与BeautifulSoup的海峡，我得到以下错误： -------------------------------------- ------------------------------------- 类型错误回溯（最新最后调用）＆LT; ..

发布时间：2016-08-05 19:13:34 python html beautifulsoup mechanize 前端开发

使用Beatiful汤摆脱非类部分数据

我还是很新手学习Python和美丽的汤。我一般都是挂了如何从非类HTML的一部分得到的文本。这是HTML的我一起工作的片段：＆lt;节类=“userbody”＆GT; ＆LT;脚本类型=“文/ JavaScript的”＆GT;＆LT; / SCRIPT＆GT; ＆LT;人物类=“IW”＆GT; ＆LT; DIV ID =“CI”＆GT; ..

发布时间：2016-08-05 19:13:29 python parsing python-2.7 html-parsing beautifulsoup Python

屏幕抓取建议：互动图

我最近随后就如何使用Python用BeautifulSoup一些教程，并学会了如何简单地刮去网页上的文字和网址。现在我想从以下链接，抽取数据 http://www.study.cam.ac.uk/undergraduate /应用/统计/ 有位于页面底部的交互式图形发生器，我想凑从它的所有数据，而无需花费大量时间不厌其烦地从生成的所有可能的图形手写下来的价值观。我试图用我的可怜的初学者技巧，但 ..

发布时间：2016-08-05 19:13:26 javascript python html web-scraping beautifulsoup 前端开发

Python的3 - 不能打印使用重新库

我有这样的code：进口要求从BS4进口BeautifulSoup 进口重 URL =“http://www.rockefeller.edu/research/areas/summary.php?id=1” R = requests.get（URL）汤= BeautifulSoup（r.content，'html.parser'）在X（soup.find_all（字符串= re.co ..

发布时间：2016-08-05 19:13:23 python-3.x beautifulsoup python-requests 其他开发语言

美丽的汤4 CSS选择器不相同的方式工作教程节目

我运行的样品CSS选择器的codeS由[美丽的汤4教程页] [1]，但结果是不同的，有的给出正确的结果，有些则没有。在网站上，他们说应该以同样的方式在Python 2.7和3。我的Python 2.7和安装美丽的汤4。有没有人有同样的问题？从BS4进口BeautifulSoup 进口的urllib2html_doc =“”“ ＆LT; HTML和GT;＆LT; HEAD＆GT;＆LT;标题 ..

发布时间：2016-08-05 19:13:21 python html css css-selectors beautifulsoup 前端开发

如何使用BeautifulSoup一个链接后附加一个标签

从这样一个HTML输入启动：＆LT; P＆GT; ＆LT; A HREF =“http://www.foo.com”＆gt;这如果富＆LT; / A＆GT; ＆LT; A HREF =“http://www.bar.com”＆gt;这如果巴≤; / A＆GT; ＆所述; / P＆GT; 使用BeautifulSoup ，我想在改变这个网站：＆LT; P＆GT; ＆LT; A HRE ..

发布时间：2016-08-05 19:13:17 python beautifulsoup Python

COM pressing＆QUOT; N＆QUOT; -time对象的成员通话

有任何非显性为办法调用成员 N 倍于一个对象？我在想一些的map / reduce /λ的办法，但我不能想出一个办法做到这一点 - 如果可能的话我想补充的背景下，我使用 BeautifulSoup ，而且我提取HTML表格中的一些元素;我提取一些元素，然后在最后一个。因为我有：＃第一个值打印value.text＃第二个值值= value.nextSibling 打印value. ..

发布时间：2016-08-05 19:13:15 python for-loop lambda beautifulsoup Python

HTML code。使用Python来显示劈裂data_frame在一个HTML页面

我在HTML / CSS新手如此具有有关数据以HTML格式显示的问题。我已经是一个长长的名单，我想分裂和HTML格式显示为两个独立的columns.For例如，而不是： COL1 col2的 1 2 3 4 5 b 6气泡 7 b 的8B 我想看到文本 COL1 col2的COL1 col2的 1 5 B 2 6气泡 3 7 b 4的8B 应该如何我HTML / CSS code看 ..

发布时间：2016-08-05 19:12:53 python html css pandas beautifulsoup 前端开发

美丽的汤获得的第一个孩子

我怎样才能获得的第一个孩子？＆LT; DIV CLASS =“城市”＆GT; ＆LT; DIV ID =“3232”＆GT;伦敦＆LT; / DIV＆GT; ＆LT; DIV ID =“131”＆GT;纽约＆LT; / DIV＆GT; ＆LT; / DIV＆GT; 我怎样才能得到伦敦？在nsoup.find_all格（类_ ='城市'）： ..

发布时间：2016-08-05 19:12:51 python beautifulsoup Python

Beautifulsoup，最大递归深度达到

这是抓住所有的＆LT中含量 beautifulsoup 程序; P＆GT; HTML标签。抓住一些网页上的内容后，我得到的，说最大递归深度超过了一个错误。高清printText（标签）：在标签标签：如果标签.__ class__ == NavigableString：打印标签，其他： printTe ..

发布时间：2016-08-05 19:12:48 python beautifulsoup Python

beautifulsoup解析 - 处理上标？

这是HTML片段我试图提取信息：＆LT; TD类=“yfnc_tablehead1”WIDTH =“74％”＆GT;市值（盘中）LT;字体大小=“ - 1”＆GT;＆LT;想喝＆GT; 5℃ /坐席＆GT;＆下; /字体＆GT;：其中; / TD＆GT;＆下; TD类=“yfnc_tabledata1”＆GT;＆下;跨度的id =“yfs_j10_aal”＆GT; 33.57B＆下; /跨度 ..

发布时间：2016-08-05 19:12:47 python html beautifulsoup 前端开发

的Python：使用Beatifulsoup从HTML获取文本

我试图提取此链接链接例如排名文本编号：kaggle用户排名NO1 。图像中更清楚：我用下面的code：高清get_single_item_data（item_url）：来源$ C $ C = requests.get（item_url）明文=源$ C $ c.text 汤= BeautifulSoup（明文）对于ITEM_NAME在soup ..

发布时间：2016-08-05 19:12:44 python html beautifulsoup html-parsing 前端开发

'NoneType'对象不是可调用beautifulsoup错误，而使用get_text

我写这篇code从网页中提取所有文本：从BeautifulSoup进口BeautifulSoup 进口的urllib2汤= BeautifulSoup（urllib2.urlopen（'http://www.pythonforbeginners.com'）.read（））打印（soup.get_text（））问题是我得到这个错误：打印（soup.get_text（））类型错误：'No ..

发布时间：2016-08-05 19:12:40 python beautifulsoup typeerror Python

BeautifulSoup不给我的Uni code

我用美丽的汤抽取数据。该BS文档指出BS应该总是返回的Uni code，但我似乎无法得到统一code。这里有一个code段进口的urllib2 从libs.BeautifulSoup进口BeautifulSoup＃获取和分析数据 URL ='http://wiki.gnhlug.org/twiki2/bin/view/Www/PastEvents2007?skin=print.pattern“ ..

发布时间：2016-08-05 19:12:37 python unicode character-encoding beautifulsoup Python

查找使用BeautifulSoup HTML中的所有表

我想找到使用BeautifulSoup HTML中的所有表。内蒙古表应包括在外部表。我已经创造了一些code这工作，它给期望的输出。但是，我不喜欢这样的解决方案，因为它破坏了'汤'对象。你知道如何做到这一点的更优雅的方式？从BeautifulSoup进口BeautifulSoup作为BS输入='''＆LT; HTML和GT;＆LT; HEAD＆GT;＆LT;标题＆GT;标题＆LT; / ..

发布时间：2016-08-05 19:12:35 python screen-scraping beautifulsoup Python

刮使用美丽的汤preserving＆放大器; NBSP;实体

我想从网上刮一张桌子和保持＆放大器; NBSP;完整的实体，这样我以后可以重新发布为HTML。 BeautifulSoup虽然似乎被转换到这些空间。例如：从BS4进口BeautifulSoupHTML =“＆LT; HTML和GT;＆LT;身体GT;＆LT;表＆gt;＆LT; TR＆gt;”中 HTML + =“＆LT; TD＆GT;＆安培; NBSP;＆打招呼放大器; NBSP;＆LT; / ..

发布时间：2016-08-05 19:12:31 python html web-scraping beautifulsoup html-entities 前端开发

beautifulsoup相关内容