网页爬虫 - 浏览器爬虫插件

查看:149
本文介绍了网页爬虫 - 浏览器爬虫插件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

请推荐一些,Google,火狐浏览器的爬虫插件。另外,小弟的爬虫老卡在有验证码登录的系统上,有各位大侠有什么经验之谈么

解决方案

插件:

FoxySpider

解决验证码登录思路:

1、尝试绕过验证码
2、将验证码的链接交给解码平台去解析,解析后返回。(通常要收费,如http://www.ruokuai.com/)
3、自己写一个,通常涉及机器学习和深度学习,才有较高的解析成功率。学习和开发成本较高
4、有验证码出现时,向爬虫使用者进行交互,手动输入验证码

这篇关于网页爬虫 - 浏览器爬虫插件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆