python - re小问题,新手轻喷

查看:119
本文介绍了python - re小问题,新手轻喷的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

尝试抓取instagram图片分享地址从而下载图片

# -*- coding: utf-8 -*-
import urllib2
import re

response = urllib2.urlopen('https://www.instagram.com/p/BG5SpsYuSr-/')
html = response.read()  
#print html

catch = re.compile(r'//*[display_src="(.+?\.jpg)"]')
urls = re.findall(catch,html)
for i, url in enumerate(urls):
    print url
    

查看源代码发现图片地址在这两个地方

想请教一下各位怎样抓取图片的下载地址?

这个问题已被关闭,原因:问题已解决 - 问题已解决,且对他人无借鉴意义

解决方案

from pyquery import PyQuery as Q
import urllib2

response = urllib2.urlopen('https://www.instagram.com/p/BG5SpsYuSr-/')
html = response.read()
print Q(html).find('meta[property="og:image"]').attr('content')

这篇关于python - re小问题,新手轻喷的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆