首页
Python
Scrapy 和代理

Scrapy 和代理 [英] Scrapy and proxies

查看：30 发布时间：2021/6/25 19:45:05 python scrapy

本文介绍了Scrapy 和代理的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

您如何利用 Python 网页抓取框架 Scrapy 的代理支持?

解决方案

来自 Scrapy 常见问题、

<块引用>

Scrapy 是否适用于 HTTP 代理?

是的.通过 HTTP 代理下载器中间件提供对 HTTP 代理的支持(自 Scrapy 0.8 起).请参阅HttpProxyMiddleware.

使用代理的最简单方法是设置环境变量http_proxy.这是如何完成的取决于您的外壳.

<前>C:\>设置http_proxy=http://proxy:portcsh% setenv http_proxy http://proxy:portsh$ 导出 http_proxy=http://proxy:port如果你想使用https代理并访问https web，设置环境变量http_proxy你应该按照下面，
<前>C:\>设置 https_proxy=https://proxy:portcsh% setenv https_proxy https://proxy:portsh$ 导出 https_proxy=https://proxy:port
How do you utilize proxy support with the python web-scraping framework Scrapy?
 解决方案 
From the Scrapy FAQ,

Does Scrapy work with HTTP proxies?
Yes. Support for HTTP proxies is provided (since Scrapy 0.8) through the HTTP Proxy downloader middleware. See HttpProxyMiddleware.
The easiest way to use a proxy is to set the environment variable http_proxy.  How this is done depends on your shell.
C:\>set http_proxy=http://proxy:port
csh% setenv http_proxy http://proxy:port
sh$ export http_proxy=http://proxy:port
if you want to use https proxy and visited https web,to set the environment variable http_proxy you should follow below,
C:\>set https_proxy=https://proxy:port
csh% setenv https_proxy https://proxy:port
sh$ export https_proxy=https://proxy:port


                        
这篇关于Scrapy 和代理的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            Scrapy Python 设置用户代理;
                        
                    
                    
                        
                            如何在scrapy中同时使用http和https代理?;
                        
                    
                    
                        
                            在scrapy中使用Tor代理;
                        
                    
                    
                        
                            使用带有scrapy-splash的代理;
                        
                    
                    
                        
                            Scrapy Shell 和 Scrapy Splash;
                        
                    
                    
                        
                            没有项目的scrapy代理中间件;
                        
                    
                    
                        
                            python - 代理导致Scrapy无法访问网站？;
                        
                    
                    
                        
                            无法在 Scrapy 项目中使用代理;
                        
                    
                    
                        
                            python - scrapy 怎么设置爬100次换代理;
                        
                    
                    
                        
                            Scrapy - 爬行时访问数据并随机更改用户代理;
                        
                    
                    
                        
                            设置Scrapy代理中间件以根据每个请求轮换;
                        
                    
                    
                        
                            设置 Scrapy 代理中间件在每个请求上轮换;
                        
                    
                    
                        
                            Scrapy - 在请求中更改用户代理的正确方法;
                        
                    
                    
                        
                            Scrapy - 抓取和抓取网站;
                        
                    
                    
                        
                            Scrapy/Python 和 SQL Server;
                        
                    
                    
                        
                            Scrapy - 了解 CrawlSpider 和 LinkExtractor;
                        
                    
                    
                        
                            python和scrapy编码问题;
                        
                    
                    
                        
                            Scrapy:如何设置 HTTP 代理以连接到 HTTPS 网站(HTTP 有效)?;
                        
                    
                    
                        
                            设置代理隐藏我的IP地址以使用scrapy抓取网页;
                        
                    
                    
                        
                            BeautifulSoup 和 Scrapy 爬虫的区别?;
                        
                    
                    
                        
                            在 Scrapy 中抓取和连接;
                        
                    
                    
                        
                            用scrapy和selenium提取链接;
                        
                    
                    
                        
                            使用 Scrapy 和 selenium 抓取网站;
                        
                    
                    
                        
                            scrapy 和 xpath 函数“匹配"语法;
                        
                    
                    
                        
                            使用 Scrapy 和 Selenium 进行抓取;


    
        
            Python最新文章
            
                    
                        
                            类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;
                        
                    
                    
                        
                            bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;
                        
                    
                    
                        
                            系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;
                        
                    
                    
                        
                            （unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;
                        
                    
                    
                        
                            将pandas dataframe中的列从int转换为string;
                        
                    
                    
                        
                            Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;
                        
                    
                    
                        
                            Sparksql过滤与多个条件（与where子句中选择）;
                        
                    
                    
                        
                            JSONDe codeError：期待值：1行1列（CHAR 0）;
                        
                    
                    
                        
                            Cmake不能找到Python库;
                        
                    
                    
                        
                            Python  - 将Dataframe中的所有项目转换为字符串;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.