网页爬虫 - Python 爬虫 BS4扩展包的问题请教

查看：121 发布时间：2017/9/5 20:24:57 beautifulsoup 网页爬虫 python

本文介绍了网页爬虫 - Python 爬虫 BS4扩展包的问题请教的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题

使用BS4的扩展包

在用find_all的时候，怎么像find后面追加用text.strip()取值？

a = request.get(xxxxx)
soup_base = BeautifulSoup(a, "html.parser")
c = soup_base.find_all(class_='xxxx')

在用find 的时候

soup_base.find(class_='xxxx').text.strip()

可以取值。但是find_all就会提示报错
有什么方法find_all可以取值吗？
for 去遍历也太麻烦了，谢谢

解决方案

不用正常的循环，可以使用列表推导式（或者改成生成器推导式也可以，看你的需求）：

c = [x.text.strip() for x in soup_base.find_all(class_='xxxx')]

如果需要把这些存在列表中的text拼成一个字符串，就再join一下就好了

c = ''.join(c)

这篇关于网页爬虫 - Python 爬虫 BS4扩展包的问题请教的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文