网页爬虫 - Python 爬虫 BS4扩展包的问题请教

查看:121
本文介绍了网页爬虫 - Python 爬虫 BS4扩展包的问题请教的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

使用BS4的扩展包

在用find_all的时候,怎么像find后面追加用text.strip()取值?

a = request.get(xxxxx)
soup_base = BeautifulSoup(a, "html.parser")
c = soup_base.find_all(class_='xxxx')

在用find 的时候

soup_base.find(class_='xxxx').text.strip()

可以取值。但是find_all就会提示报错
有什么方法find_all可以取值吗?
for 去遍历也太麻烦了,谢谢

解决方案

不用正常的循环,可以使用列表推导式(或者改成生成器推导式也可以,看你的需求):

c = [x.text.strip() for x in soup_base.find_all(class_='xxxx')]

如果需要把这些存在列表中的text拼成一个字符串,就再join一下就好了

c = ''.join(c)

这篇关于网页爬虫 - Python 爬虫 BS4扩展包的问题请教的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆