javascript - cookie与验证码下的爬虫模拟登录

查看:264
本文介绍了javascript - cookie与验证码下的爬虫模拟登录的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

学习爬虫中,初次涉及在cookie与验证码的环境下模拟登录一个站点 https://www.aaej.cn/cas/login
计划用requests库

目前困扰在以下几点:
A:为什么在一次请求页面之后,每次查看该页面源码,源码中‘lt’和‘execution’的值都会变?
B:在试图requests.get(https://www.aaej.cn/cas/login)怎样一并获取验证码图片(以便接下来的识别)
C:综上,模拟登录该页面的正确思路大概是怎样?大概分几步?

这个问题已被关闭,原因:问题质量差 - 问题太水、伸手党

解决方案

  1. 因为它们就是变的,你不要去考虑细节,只需要找到这两个值就行

  2. 验证码是有地址的,

    obj.src = ctxPath + "/kaptcha.jpg?_=" + Math.random();
    var ctxPath = null;

  3. 获取页面,解析登录必须的值,然后post到响应地址,建议使用requests.session对象来请求。

这篇关于javascript - cookie与验证码下的爬虫模拟登录的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆