【自学python】网络爬虫，关于BeautifulSoup的问题

查看：80 发布时间：2017/9/5 21:42:03

本文介绍了【自学python】网络爬虫，关于BeautifulSoup的问题的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

问题

自学看书，总是遇到BeautifulSoup，但是书上也没有说到底这个是啥意思，如图：

图中为了标记方便，我把有疑问的代码用红线标注，分为A行和B行
A行我可以理解为，用urlopen函数把http://www.pythonscraping.com...
这一行地址的网页打开，然后把里面所有的源代码，作为一个整体，给html这个自定义的变量。
那么我想问B这一行是啥意思？为什么每次遇到爬虫，总会需要

BeautifulSoup(html)

这样弄一下？
这里的BeautifulSoup 具体执行什么任务？

解决方案

hmtl 只是文本，BeautifulSoup 内部维护了一个树形结构，方便你各种操作

因此第一步一般都是需要实例化一个 BeautifulSoup 可操作的对象

这篇关于【自学python】网络爬虫，关于BeautifulSoup的问题的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

【自学python】网络爬虫，关于BeautifulSoup的问题

问题描述

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

【自学python】 网络爬虫，关于BeautifulSoup的问题

问题描述

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

【自学python】网络爬虫，关于BeautifulSoup的问题

登录关闭