pyspider0.3.8 crawl_config 参数设置不生效

查看:478
本文介绍了pyspider0.3.8 crawl_config 参数设置不生效的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

我试了一下官方部署的DEMO是没有问题的,我在Win和Linux下都是新安装部署的都不行,旧版的就可以。。。为什么?
部署环境:(Win8.1+Python2.7 CentOS6.8+Python2.7)
配置如下:

class Handler(BaseHandler):
    crawl_config = {
        "proxy":"172.16.2.2:3128",
        "headers":{
            "Proxy-Connection": "keep-alive",
            "Pragma": "no-cache",
            "Cache-Control": "no-cache",
            "User-Agent": "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/52.0.2743.116 Safari/537.36",
            "Accept": "*/*",
            "DNT": "1",
            "Accept-Encoding": "gzip, deflate, sdch",
            "Accept-Language": "zh-CN,zh;q=0.8,en-US;q=0.6,en;q=0.4",

        }
    } 
    ...

执行的时候如下,fetch是空的:

{
  "fetch": {},
  "process": {
    "callback": "index_page"
  },
  "project": "news_top",
  "schedule": {
    "age": 864000
  },
  "taskid": "73804bb407415e0129e69659e1678264",
  "url": "http://www.cwrank.com/"
}

解决方案

参考该链接:
config配置不生效

这篇关于pyspider0.3.8 crawl_config 参数设置不生效的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆