beautifulsoup相关内容
..
TypeError: 需要一个类似字节的对象,而不是 'str' 在执行以下 python 代码以将 HTML 表数据保存在 Csv 文件中时出现上述错误.不知道怎么搭车.请帮帮我. 导入csv导入请求从 bs4 导入 BeautifulSoupurl='http://www.mapsofindia.com/districts-india/'响应=requests.get(url)html
..
我在查找 bs4 时遇到了问题. 我正在尝试在 html instagram 页面中自动查找一些 url,并且 (知道我是 python 菜鸟)我找不到在 html 源代码中自动搜索的方法示例中 "display_url": http..." 之后的 url. 我想让我的脚本搜索多个显示为“display_url"的url并下载它们.它们必须在源代码中出现的次数被提取. 用 bs
..
请考虑以下 python 会话: >>>从 BeautifulSoup 导入 BeautifulSoup>>>s = BeautifulSoup("
这个是一个测试.
");myi = s.find("i")>>>myi.replaceWith(BeautifulSoup("was"))>>>s.find("我")>>>s = BeautifulSoup("
..
网页是这样的:
section1
文章
文章
文章
section2
文章
文章
文章
我怎样才能找到其中包含文章的每个部分?即找到h2后,找到nextsiblings 直到下一个h2. 如果网页是这样的:(通常是这种情况)
部分 1
文章
文
..
我正在使用漂亮的汤编写一个 python 脚本,我必须从包含一些 HTML 代码的字符串中获取一个开始标签. 这是我的字符串: string =
...
我想在名为 opening_tag 的变量中获取
并在名为 的变量中获取
关闭标签.我已经搜索了文档,但似乎没有找到解决方案.谁能给我建议? 解决方案 有一种方法可以使用 BeautifulSoup
..
我正在使用以下 Python - Beautifulsoup 代码从文本文件中删除 html 元素: 从 bs4 导入 BeautifulSoup使用 open("textFileWithHtml.txt") 作为标记:汤 = BeautifulSoup(markup.read())使用 open("strip_textFileWithHtml.txt", "w") 作为 f:f.write(s
..
为 this 问题提供部分答案,我来了bs4.element.Tag 是一堆嵌套的字典和列表(s,下面). 有没有办法使用 re.find_all 返回包含在 s 中的 url 列表?有关此标签结构的其他评论也很有帮助. 从 bs4 导入 BeautifulSoup导入请求链接 = 'https://stackoverflow.com/jobs?med=site-ui&ref=jobs-t
..
是否可以通过 br 标签从标签中拆分文本? 我有这个标签内容:[u'+420 777 593 531',
, u'+420 776 593 531',
, u'+420 775593 531'] 我只想得到数字.有什么建议吗? 编辑: [x for x in dt.find_next_sibling('dd').contents if x!='
'
..
我正在使用 python 3.8.2 和 bs4 BeautifulSoup.我正在尝试查找标签的所有实例,并将每个实例都列在结果集中,每行一个.但是,返回的结果集包含的行数比网站的原始抓取要多.这是因为结果集的第一行包含该标记的所有实例.下一行包含除第一个实例之外的所有实例,第三行包含除第一个和第二个之外的所有实例,依此类推,结果集的其余部分. 代码如下: 从 bs4 导入 Beauti
..
我尝试了 soup.find('!--') 但它似乎不起作用.提前致谢. 编辑:感谢您提供有关如何查找所有评论的提示.我有一个后续问题.我如何专门搜索评论? 例如,我有以下评论标签: 星期三 110518(05:00PM)
--> 我真的只是想要这些东西 Wednesday
..
我能够构建一个 .apk,但是在我将它安装到我的 android 手机上之后,它只是在启动时崩溃了.我失败的想法是我正在使用 3rd 方库,例如(beautifulsoup). 这就是我的导入在 main.py 中的样子: 从 kivy.app 导入 App从 kivy.properties 导入 ListProperty、StringProperty从 kivy.uix.boxlayou
..
我的代码运行良好,机器人发送了链接,但 Discord 无法识别它,也没有嵌入它.当我自己复制并粘贴它时,它会将其识别为链接并嵌入图像.这是我的代码: 导入请求从 bs4 导入 BeautifulSoup如果 message.content.startswith(".dog"):response = requests.get("https://dog.ceo/api/breeds/image/r
..
我正在尝试提取单个“值"的内容;特定“输入"中的属性网页上的标签.我使用以下代码: 导入urllibf = urllib.urlopen("http://58.68.130.147")s = f.read()f.close()从 BeautifulSoup 进口 BeautifulStoneSoup汤 = BeautifulStoneSoup(s)inputTag = soup.findAll(
..
我正在尝试解析通过 pyCurl 检索到的 HTML 页面,但 pyCurl WRITEFUNCTION 将页面返回为 BYTES 而不是字符串,因此我无法使用 BeautifulSoup 解析它. 有没有办法将 io.BytesIO 转换为 io.StringIO? 或者有没有其他方法可以解析 HTML 页面? 我正在使用 Python 3.3.2. 解决方案 一种天真
..
我正在尝试让解析器使用 beautifulSoup 和多处理.我有一个错误: RecursionError: 超出最大递归深度 我的代码是: import bs4, requests, time从 multiprocessing.pool 导入池html = requests.get('https://www.avito.ru/moskva/avtomobili/bmw/x6?sgt
..
我想找到一个非常宽容的 xml 解析器.就像 Python 的 BeautifulSoup 一样.那里有东西吗? 解决方案 好的,我找到了 Jsoup.像 BeautifulSoup 这样的许可 XML 解析器的 Java 版本. http://jsoup.org/ 我会试试看效果如何. 谢谢
..
我在写这个问题的答案时考虑了以下. 假设我有一个像这样深度嵌套的 xml 文件(但嵌套更多且更长): 部分内容
...等等 len(soup.find_all
..
这个问题是针对 BeautifulSoup4 的问题,这使得它不同于以前的问题: BeautifulSoup 为什么要修改我的自闭合元素? BeautifulSoup 中的 selfClosingTags 由于 BeautifulStoneSoup 已经消失(之前的 xml 解析器),我怎样才能让 bs4 尊重一个新的自闭合标签?例如: 进口bs4S = '''
..
我有一个这样的 XML 文档: 40000 我的问题是如何使用 Python 中的 BeautifulSoup 之类的库来访问它们? xmlDom.web["Web"].Total ?不工作? 解决方案 BeautifulSoup
..