javascript - cookie与验证码下的爬虫模拟登录
本文介绍了javascript - cookie与验证码下的爬虫模拟登录的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
学习爬虫中,初次涉及在cookie与验证码的环境下模拟登录一个站点 https://www.aaej.cn/cas/login
计划用requests库
目前困扰在以下几点:
A:为什么在一次请求页面之后,每次查看该页面源码,源码中‘lt’和‘execution’的值都会变?
B:在试图requests.get(https://www.aaej.cn/cas/login)怎样一并获取验证码图片(以便接下来的识别)
C:综上,模拟登录该页面的正确思路大概是怎样?大概分几步?
解决方案
因为它们就是变的,你不要去考虑细节,只需要找到这两个值就行
-
验证码是有地址的,
obj.src = ctxPath + "/kaptcha.jpg?_=" + Math.random(); var ctxPath = null;
获取页面,解析登录必须的值,然后post到响应地址,建议使用requests.session对象来请求。
这篇关于javascript - cookie与验证码下的爬虫模拟登录的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文