python - urllib爬虫下载图片,很简单的程序,但是输出结果却不定,很奇怪
本文介绍了python - urllib爬虫下载图片,很简单的程序,但是输出结果却不定,很奇怪的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
1.此程序需要第三方模块 bs4 ,请先确保该模块已安装再实验。
2.爬虫网站为【http://tieba.baidu.com/p/2772...】,里面的楼主发了130张手机壁纸
3.问题参见代码里的注释
#-*-coding:utf-8 -*-
from bs4 import BeautifulSoup
import urllib
def getContent(url):
html=urllib.urlopen(url)
content=html.read()
html.close()
return content
info = getContent('http://tieba.baidu.com/p/2772656630')
def getImages(info):
soup=BeautifulSoup(info,'lxml')
all_img=soup.find_all('img',class_='BDE_Image')
num=len(all_img)
x=1
for img in all_img:
print img['src']
image_name="%s.jpg"%x
urllib.urlretrieve(img['src'],image_name)
'''
为什么大部分时候输出是【x=121,num=120】,少数情况是【x=131,num=130】???
'''
x=x+1
print x
print num
getImages(info)
解决方案
我實測三次都是 131 130
輸出不定是隨機(一下121 120, 一下 131 130), 還是之前幾次是 121 120, 後來變成 131 130
猜測會不會是因為有新的圖被加上去了
我回答過的問題: Python-QA
这篇关于python - urllib爬虫下载图片,很简单的程序,但是输出结果却不定,很奇怪的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文