python - beautifulsoup获取网页内容的问题

查看：90 发布时间：2017/9/5 23:21:43

本文介绍了python - beautifulsoup获取网页内容的问题的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题

我要的是这个里面的内容
<div class="talk-article__body talk-transcript__body">

PYTHON代码：

neirong=soup.find('div',{'class':'talk-article__body talk-transcript__body'})

但是返回的结果是空。这个选择器是不是写错了？

解决方案

个人觉得用BeautifulSoup来解析网页的时候，如果楼主打算通过css特性来进行元素的定位的话，最好还是使用soup.select()，这个方法可以用class的value当参数也可以用标签的的attribute当参数，很方便，用于搜索单一标签最好用，同时参数支持css选择器字符串，比如：soup.select("#id > .class a.title").
soup.find()方法目前好像用的不多，不知道是不是BeautifulSoup4弃用了。现在一般只要出现find，就是find_all()等方法。
以上详细参考超级汤的中文文档：http://beautifulsoup.readthed...

这篇关于python - beautifulsoup获取网页内容的问题的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文