python - beautifulsoup获取网页内容的问题

查看:90
本文介绍了python - beautifulsoup获取网页内容的问题的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

我要的是这个里面的内容
<div class="talk-article__body talk-transcript__body">

PYTHON代码:

neirong=soup.find('div',{'class':'talk-article__body talk-transcript__body'})

但是返回的结果是空。这个选择器是不是写错了?

解决方案

  • 个人觉得用BeautifulSoup来解析网页的时候,如果楼主打算通过css特性来进行元素的定位的话,最好还是使用soup.select(),这个方法可以用class的value当参数也可以用标签的的attribute当参数,很方便,用于搜索单一标签最好用,同时参数支持css选择器字符串,比如:soup.select("#id > .class a.title").

  • soup.find()方法目前好像用的不多,不知道是不是BeautifulSoup4弃用了。现在一般只要出现find,就是find_all()等方法。
    以上详细参考超级汤的中文文档:http://beautifulsoup.readthed...

这篇关于python - beautifulsoup获取网页内容的问题的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆