beautifulsoup相关内容

Django的视图中BeautifulSoup使WSGI超时

有关一个奇怪的原因,当我实例化的 BeautifulSoup 的Django的视图中的对象时,WSGI超时。任何帮助是pciated因为我敲我的头撞在墙上几个小时,无法找到这个问题的根源AP $ P $。 视图: 高清指数(要求): 汤= BeautifulSoup('< B>大胆< / B>')#删除此行解决proble 返回的Htt prespons ..
发布时间:2016-08-05 19:13:42 其他开发语言

使用BeautifulSoup第一个孩子标记之前提取文本

从这个HTML源代码: < D​​IV CLASS =“category_link”> 类别: < A HREF =“/类别/个人”>个人及LT; / A> < / DIV> 我想提取文本类别: 下面是使用Python / BeautifulSoup我尝试(与输出为注释 - 在#之后)解析= BeautifulSoup(sample_htm ..
发布时间:2016-08-05 19:13:39 Python

错误日志记录与蟒蛇的Instagram

我试图通过使用argparse python脚本登录到我的Instagram。这似乎连接,但它打印出“的此页面无法加载。如果您在您的浏览器禁用了Cookie,oryou在私人模式浏览,请尝试启用Cookie或关闭私人模式,然后重试你的行动的“ 这里是我的code: 进口argparse 进口mechanicalsoup 从BS4进口BeautifulSoup解析器= argparse.Argu ..
发布时间:2016-08-05 19:13:37 Python

&是什么QUOT;模块对象不是可调用的"意思?

我使用的是与机械化,这似乎打印出我想要的HTML .get_data()方法。我还要检查一下它打印出的类型,类型是'str的“ 但是,当我尝试解析与BeautifulSoup的海峡,我得到以下错误: -------------------------------------- ------------------------------------- 类型错误回溯(最新最后调用) < ..
发布时间:2016-08-05 19:13:34 前端开发

屏幕抓取建议:互动图

我最近随后就如何使用Python用BeautifulSoup一些教程,并学会了如何简单地刮去网页上的文字和网址。现在我想从以下链接,抽取数据 http://www.study.cam.ac.uk/undergraduate /应用/统计/ 有位于页面底部的交互式图形发生器,我想凑从它的所有数据,而无需花费大量时间不厌其烦地从生成的所有可能的图形手写下来的价值观。我试图用我的可怜的初学者技巧,但 ..
发布时间:2016-08-05 19:13:26 前端开发

美丽的汤4 CSS选择器不相同的方式工作教程节目

我运行的样品CSS选择器的codeS由[美丽的汤4教程页] [1],但结果​​是不同的,有的给出正确的结果,有些则没有。在网站上,他们说应该以同样的方式在Python 2.7和3。我的Python 2.7和安装美丽的汤4。有没有人有同样的问题? 从BS4进口BeautifulSoup 进口的urllib2html_doc =“”“ < HTML和GT;< HEAD><标题 ..
发布时间:2016-08-05 19:13:21 前端开发

如何使用BeautifulSoup一个链接后附加一个标签

从这样一个HTML输入启动: < P> < A HREF =“htt​​p://www.foo.com”>这如果富< / A> < A HREF =“htt​​p://www.bar.com”>这如果巴≤; / A> &所述; / P> 使用BeautifulSoup ,我想在改变这个网站:< P> < A HRE ..
发布时间:2016-08-05 19:13:17 Python

COM pressing" N" -time对象的成员通话

有任何非显性为办法调用成员 N 倍于一个对象? 我在想一些的map / reduce /λ的办法,但我不能想出一个办法做到这一点 - 如果可能的话 我想补充的背景下,我使用 BeautifulSoup ,而且我提取HTML表格中的一些元素;我提取一些元素,然后在最后一个。 因为我有: #第一个值 打印value.text#第二个值 值= value.nextSibling 打印value. ..
发布时间:2016-08-05 19:13:15 Python

HTML code。使用Python来显示劈裂data_frame在一个HTML页面

我在HTML / CSS新手如此具有有关​​数据以HTML格式显示的问题。我已经是一个长长的名单,我想分裂和HTML格式显示为两个独立的columns.For例如,而不是: COL1 col2的 1 2 3 4 5 b 6气泡 7 b 的8B 我想看到文本 COL1 col2的COL1 col2的 1 5 B 2 6气泡 3 7 b 4的8B 应该如何我HTML / CSS code看 ..
发布时间:2016-08-05 19:12:53 前端开发

美丽的汤获得的第一个孩子

我怎样才能获得的第一个孩子? < D​​IV CLASS =“城市”> < D​​IV ID =“3232”>伦敦< / DIV> < D​​IV ID =“131”>纽约< / DIV> < / DIV> 我怎样才能得到伦敦? 在nsoup.find_all格(类_ ='城市'): ..
发布时间:2016-08-05 19:12:51 Python

Beautifulsoup,最大递归深度达到

这是抓住所有的&LT中含量 beautifulsoup 程序; P> HTML标签。抓住一些网页上的内容后,我得到的,说最大递归深度超过了一个错误。 高清printText(标签): 在标签标签: 如果标签.__ class__ == NavigableString: 打印标签, 其他: printTe ..
发布时间:2016-08-05 19:12:48 Python

beautifulsoup解析 - 处理上标?

这是HTML片段我试图提取信息: < TD类=“yfnc_tablehead1”WIDTH =“74%”>市值(盘中)LT;字体大小=“ - 1”><想喝> 5℃ /坐席>&下; /字体>:其中; / TD>&下; TD类=“yfnc_tabledata1”>&下;跨度的id =“yfs_j10_aal”> 33.57B&下; /跨度 ..
发布时间:2016-08-05 19:12:47 前端开发

BeautifulSoup不给我的Uni code

我用美丽的汤抽取数据。该BS文档指出BS应该总是返回的Uni code,但我似乎无法得到统一code。这里有一个code段 进口的urllib2 从libs.BeautifulSoup进口BeautifulSoup#获取和分析数据 URL ='http://wiki.gnhlug.org/twiki2/bin/view/Www/PastEvents2007?skin=print.pattern“ ..
发布时间:2016-08-05 19:12:37 Python

查找使用BeautifulSoup HTML中的所有表

我想找到使用BeautifulSoup HTML中的所有表。内蒙古表应包括在外部表。 我已经创造了一些code这工作,它给期望的输出。但是,我不喜欢这样的解决方案,因为它破坏了'汤'对象。 你知道如何做到这一点的更优雅的方式? 从BeautifulSoup进口BeautifulSoup作为BS输入='''< HTML和GT;< HEAD><标题>标题< / ..
发布时间:2016-08-05 19:12:35 Python

刮使用美丽的汤preserving&放大器; NBSP;实体

我想从网上刮一张桌子和保持&放大器; NBSP;完整的实体,这样我以后可以重新发布为HTML。 BeautifulSoup虽然似乎被转换到这些空间。例如: 从BS4进口BeautifulSoupHTML =“< HTML和GT;<身体GT;<表>< TR>”中 HTML + =“< TD>&安培; NBSP;&打招呼放大器; NBSP;< / ..
发布时间:2016-08-05 19:12:31 前端开发