beautifulsoup 第2页 - IT屋-程序员软件开发技术分享社区

Beautiful Soup findAll 没有找到它们

..

发布时间：2022-01-31 19:40:21 python html python-3.x beautifulsoup 前端开发

TypeError:需要一个类似字节的对象，而不是 python 和 CSV 中的“str"

TypeError: 需要一个类似字节的对象，而不是 'str' 在执行以下 python 代码以将 HTML 表数据保存在 Csv 文件中时出现上述错误.不知道怎么搭车.请帮帮我. 导入csv导入请求从 bs4 导入 BeautifulSoupurl='http://www.mapsofindia.com/districts-india/'响应=requests.get(url)html ..

发布时间：2022-01-31 19:25:47 python python-3.x csv beautifulsoup html-table Python

BeautifulSoup 在 instagram html 页面中查找

我在查找 bs4 时遇到了问题. 我正在尝试在 html instagram 页面中自动查找一些 url，并且 (知道我是 python 菜鸟)我找不到在 html 源代码中自动搜索的方法示例中 "display_url": http..." 之后的 url. 我想让我的脚本搜索多个显示为“display_url"的url并下载它们.它们必须在源代码中出现的次数被提取. 用 bs ..

发布时间：2022-01-20 17:13:45 python web-scraping beautifulsoup find instagram Python

replaceWith() 后的 find() 不起作用(使用 BeautifulSoup)

请考虑以下 python 会话: >>>从 BeautifulSoup 导入 BeautifulSoup>>>s = BeautifulSoup(" 这个是一个测试. ");myi = s.find("i")>>>myi.replaceWith(BeautifulSoup("was"))>>>s.find("我")>>>s = BeautifulSoup(" ..

发布时间：2022-01-20 17:01:41 python find beautifulsoup Python

使用 beautifulsoup 查找下一个兄弟姐妹，直到某个兄弟姐妹

网页是这样的: section1 文章文章文章 section2 文章文章文章我怎样才能找到其中包含文章的每个部分?即找到h2后，找到nextsiblings 直到下一个h2. 如果网页是这样的:(通常是这种情况) 部分 1 文章文 ..

发布时间：2022-01-20 16:43:26 python find beautifulsoup scrape siblings Python

如何从 HTML 字符串中获取美丽汤中的开始和结束标记?

我正在使用漂亮的汤编写一个 python 脚本，我必须从包含一些 HTML 代码的字符串中获取一个开始标签. 这是我的字符串: string = ... 我想在名为 opening_tag 的变量中获取并在名为的变量中获取关闭标签.我已经搜索了文档，但似乎没有找到解决方案.谁能给我建议? 解决方案有一种方法可以使用 BeautifulSoup ..

发布时间：2022-01-18 21:40:42 python tags beautifulsoup Python

Python - beautifulsoup，应用于文件夹中的每个文本文件并生成新的文本文件

我正在使用以下 Python - Beautifulsoup 代码从文本文件中删除 html 元素: 从 bs4 导入 BeautifulSoup使用 open("textFileWithHtml.txt") 作为标记:汤 = BeautifulSoup(markup.read())使用 open("strip_textFileWithHtml.txt", "w") 作为 f:f.write(s ..

发布时间：2022-01-18 21:38:57 python html tags beautifulsoup 前端开发

在 BeautifulSoup 中使用字典解析脚本标签

为 this 问题提供部分答案，我来了bs4.element.Tag 是一堆嵌套的字典和列表(s，下面). 有没有办法使用 re.find_all 返回包含在 s 中的 url 列表?有关此标签结构的其他评论也很有帮助. 从 bs4 导入 BeautifulSoup导入请求链接 = 'https://stackoverflow.com/jobs?med=site-ui&ref=jobs-t ..

发布时间：2022-01-18 21:38:11 python python-3.x beautifulsoup tags Python

Beautifulsoup 通过 <br/> 分割标签中的文本

是否可以通过 br 标签从标签中拆分文本? 我有这个标签内容:[u'+420 777 593 531', , u'+420 776 593 531', , u'+420 775593 531'] 我只想得到数字.有什么建议吗? 编辑: [x for x in dt.find_next_sibling('dd').contents if x!=' ' ..

发布时间：2022-01-18 21:36:18 python text tags beautifulsoup newline Python

使用 Find_All 函数返回意外的结果集

我正在使用 python 3.8.2 和 bs4 BeautifulSoup.我正在尝试查找标签的所有实例，并将每个实例都列在结果集中，每行一个.但是，返回的结果集包含的行数比网站的原始抓取要多.这是因为结果集的第一行包含该标记的所有实例.下一行包含除第一个实例之外的所有实例，第三行包含除第一个和第二个之外的所有实例，依此类推，结果集的其余部分. 代码如下: 从 bs4 导入 Beauti ..

发布时间：2022-01-18 21:01:16 python html beautifulsoup python-requests tags 前端开发

如何找到评论标签美丽汤?

我尝试了 soup.find('!--') 但它似乎不起作用.提前致谢. 编辑:感谢您提供有关如何查找所有评论的提示.我有一个后续问题.我如何专门搜索评论? 例如，我有以下评论标签: 星期三 110518(05:00PM) --> 我真的只是想要这些东西 Wednesday ..

发布时间：2022-01-18 21:00:19 python html tags beautifulsoup 前端开发

Buildozer 编译 apk，但它在 android 上崩溃

我能够构建一个 .apk，但是在我将它安装到我的 android 手机上之后，它只是在启动时崩溃了.我失败的想法是我正在使用 3rd 方库，例如(beautifulsoup). 这就是我的导入在 main.py 中的样子: 从 kivy.app 导入 App从 kivy.properties 导入 ListProperty、StringProperty从 kivy.uix.boxlayou ..

发布时间：2022-01-15 09:04:46 android python-2.7 beautifulsoup apk kivy 移动开发

当我的机器人发送时，Discord 没有嵌入链接

我的代码运行良好，机器人发送了链接，但 Discord 无法识别它，也没有嵌入它.当我自己复制并粘贴它时，它会将其识别为链接并嵌入图像.这是我的代码: 导入请求从 bs4 导入 BeautifulSoup如果 message.content.startswith(".dog"):response = requests.get("https://dog.ceo/api/breeds/image/r ..

发布时间：2022-01-15 08:48:05 python python-3.x beautifulsoup discord discord.py Python

用 beautifulsoup 提取属性值

我正在尝试提取单个“值"的内容；特定“输入"中的属性网页上的标签.我使用以下代码: 导入urllibf = urllib.urlopen("http://58.68.130.147")s = f.read()f.close()从 BeautifulSoup 进口 BeautifulStoneSoup汤 = BeautifulStoneSoup(s)inputTag = soup.findAll( ..

发布时间：2022-01-13 17:29:35 python parsing attributes beautifulsoup Python

将 io.BytesIO 转换为 io.StringIO 以解析 HTML 页面

我正在尝试解析通过 pyCurl 检索到的 HTML 页面，但 pyCurl WRITEFUNCTION 将页面返回为 BYTES 而不是字符串，因此我无法使用 BeautifulSoup 解析它. 有没有办法将 io.BytesIO 转换为 io.StringIO? 或者有没有其他方法可以解析 HTML 页面? 我正在使用 Python 3.3.2. 解决方案一种天真 ..

发布时间：2022-01-13 08:10:00 html beautifulsoup pycurl stringio type-conversion 前端开发

超出最大递归深度.多处理和 bs4

我正在尝试让解析器使用 beautifulSoup 和多处理.我有一个错误: RecursionError: 超出最大递归深度我的代码是: import bs4, requests, time从 multiprocessing.pool 导入池html = requests.get('https://www.avito.ru/moskva/avtomobili/bmw/x6?sgt ..

发布时间：2022-01-12 12:57:39 python parsing beautifulsoup multiprocessing Python

有没有类似BeautifulSoup for Android 的东西?

我想找到一个非常宽容的 xml 解析器.就像 Python 的 BeautifulSoup 一样.那里有东西吗? 解决方案好的，我找到了 Jsoup.像 BeautifulSoup 这样的许可 XML 解析器的 Java 版本. http://jsoup.org/ 我会试试看效果如何. 谢谢 ..

发布时间：2022-01-10 20:41:06 android xml-parsing beautifulsoup 移动开发

BeautifulSoup 计数标签而不深入解析它们

我在写这个问题的答案时考虑了以下. 假设我有一个像这样深度嵌套的 xml 文件(但嵌套更多且更长): 部分内容 ...等等 len(soup.find_all ..

发布时间：2022-01-10 20:10:48 python xml xml-parsing beautifulsoup Python

如何让 BeautifulSoup 4 尊重自闭标签?

这个问题是针对 BeautifulSoup4 的问题，这使得它不同于以前的问题: BeautifulSoup 为什么要修改我的自闭合元素? BeautifulSoup 中的 selfClosingTags 由于 BeautifulStoneSoup 已经消失(之前的 xml 解析器)，我怎样才能让 bs4 尊重一个新的自闭合标签?例如: 进口bs4S = ''' ..

发布时间：2022-01-10 19:44:27 python xml xml-parsing beautifulsoup Python

如何使用 BeautifulSoup 访问命名空间的 XML 元素?

我有一个这样的 XML 文档: 40000 我的问题是如何使用 Python 中的 BeautifulSoup 之类的库来访问它们? xmlDom.web["Web"].Total ?不工作? 解决方案 BeautifulSoup ..

发布时间：2022-01-10 19:40:03 python xml xml-parsing beautifulsoup xml-namespaces Python

beautifulsoup相关内容