urllib2相关内容
我使用python Requests库来做HTTP相关的事情。我在我的计算机上使用免费的ntlmaps设置了一个代理服务器,作为代理来回答公司ISA服务器的NTLM挑战。但是,响应似乎总是空的,如下所示: >>>导入请求 >>> r = requests.get('https://www.google.com') >>> r.text u' \\\\ n'
..
这项工作很好: import urllib2 opener = urllib2.build_opener( urllib2.HTTPHandler(), urllib2.HTTPSHandler(), urllib2.ProxyHandler({'http':'http:// user:pass @ proxy:3128'})) urllib2.install_opener
..
我正在尝试使用Python中的Cookie进行HTTP POST。 我有URL,POST数据和cookie的值。 import urllib2 url =“http://localhost/testing/posting.php” data =“subject = Alice-subject& ; addbbcode18 =%23444444&安培; addbbcode20 =
..
对于给定的URL,如何在HTTP重定向后检测最终的Internet位置,而无需使用python下载最终页面(例如HEAD请求。)。我正在尝试编写一个大规模下载器,我的下载机制需要在下载之前知道页面的互联网位置。 编辑 我最终做到了这一点,我希望这有助于其他人。我仍然对其他方法持开放态度。 import urlparse import httplib def getF
..
当我使用urllib2并列出标题时,我看不到“位置”标题。 在[19]中:p = urllib2.urlopen('http://www.example.com') 在[21]中:p.headers.items() Out [21 ]: [('transfer-encoding','chunked'), ('vary','Accept-Encoding'), ('server',
..
我遇到了一个奇怪的错误:urllib2捕获404错误,同时打开一个有效的URL。我在浏览器中尝试了它,可以打开网址。我也传递了用户代理。 将urllib.request导入为urllib2 uri ='https://i.ytimg.com/vi/8Sii8G5CNvY /hqdefault.jpg?custom=true&w=196&h=110&stc=true&jpg444=true
..
我正在尝试使用Python的urllib2模块执行简单的HTTP get请求。它有时会工作,但有时我会得到 HTTP错误400:错误请求。我知道这不是URL的问题,因为如果我使用 urllib 而只需执行 urllib.urlopen(url)它工作正常 - 但是当我添加标题并执行 urllib2.urlopen()我在某些网站上收到错误请求。 以下代码不起作用: # - * -
..
我正在制作一个python URL抓取程序。为了我的目的,我希望它真的很快超时,所以我正在做 urllib2.urlopen(“http://。 ../“,超时= 2) 当然它应该正确超时。但是,它并不打算关闭与服务器的连接,因此服务器认为客户端仍然连接。如何请求urllib2在超时后关闭连接? 运行gc.collect()不起作用我想不使用httplib如果我无能为力。
..
我正在尝试使用urllib2库获取一些网址。 a = urllib2.urlopen(“http:// www .google.com“) ret = a.read() 以上代码正常运行很好,并给出了预期的结果。但是当我创建网址https时,它会出现“网络无法访问”错误 a = urllib2.urlopen(“https:// www.google.com“)
..
我正在使用自己的解析器,并希望使用urllib2来连接到IP(在urllib2中没有解析),我想自己设置HTTP Host-header。但是urllib2只是忽略了我的Host-header: txheaders = {'User-Agent':UA,“Host:”: nohttp_url} robots = urllib2.Request(“http://”+ ip +“/robo
..
希望这是一个非常简单的问题,但它让我发疯。 我在ubuntu 12.10服务器的开箱即用安装上使用Python 2.7.3。我一直在关注这个问题直到我得到这个片段: import urllib2 x = urllib2.urlopen(“http ://casacinema.eu/movie-film-Matrix+trilogy+123+streaming-6165.html“,ti
..
有一个gif图片链接,但urllib2无法下载。 将urllib.request作为urllib2导入 uri ='http://ums.adtechjp.com/mapuser?providerid=1074; userid=AapfqIzytwl7ks8AA_qiU_BNUs8AAAFYqnZh4Q' try: req = urllib2.Request(uri,headers =
..
我正在尝试访问REST API。 我可以在Curl / REST Client(UI工具)中使用它,并启用了抢先身份验证。 但是,使用urllib2,默认情况下它似乎不支持这个,我找不到打开它的方法。 谢谢:) 解决方案 这是一个简单的抢占式HTTP基本身份验证处理程序,基于 urllib2.HTTPBasicAuthHandler 。它可以以完全相同的方式使用,除了授权
..
我正在通过POST将带有urllib2的相当大的文件上传到服务器端脚本。我想显示一个显示当前上传进度的进度指示器。是否有urllib2提供的钩子或回调允许我监控上传进度?我知道你可以通过连续调用连接的read()方法来下载,但我没有看到write()方法,你只需要向请求中添加数据。 解决方案 这是可能的,但你需要做一些事情: 假urllib2子系统通过附加 __ len __ 属性将
..
我正在使用python的urllib2库向特定主机发出几个http请求。每次发出请求时,都会创建一个新的tcp和http连接,这需要花费大量时间。是否有任何方法可以使用urllib2保持tcp / http连接活动? 解决方案 如果切换到
..
我很困惑为什么我无法从 FriendFeed 下载某些JSON响应的全部内容使用 urllib2 。 >>> import urllib2 >>> stream = urllib2.urlopen('http://friendfeed.com/api/room/the-life-scientists/profile?format=json') >>> stream.hea
..
我想发一个POST请求,使用python将文件上传到Web服务(并获得响应)。例如,我可以使用 curl 执行以下POST请求: curl -F“file=@style.css”-F output = json http://jigsaw.w3.org/css-validator/validator 如何使用python urllib / urllib2发出相同的请求?到
..
这只需要在单个子网上工作,不会被恶意使用。 我有一个用Python编写的负载测试工具,它基本上会在URL上发出HTTP请求。我需要针对基于IP的负载均衡器运行性能测试,因此请求必须来自一系列IP。大多数商业性能工具都提供此功能,但我想将其构建为我自己的。 该工具使用Python的urllib2进行传输。是否可以为构成请求的数据包发送带有欺骗性IP地址的HTTP请求? 解决方案
..
我想抓住一个特定的http错误而不是整个家庭中的任何一个.. 我想要做的是 - import urllib2 try: urllib2.urlopen(“some url”) 除了urllib2.HTTPError: 但我最终得到的是任何类型的http错误,但我想抓住的只是指定的网页不存在!!可能那是HTTP错误404 ..但我不知道如何指
..
在尝试 urlopen 来自维基百科的某个页面时,我有一个奇怪的错误。这是页面: http: //en.wikipedia.org/wiki/OpenCola_(drink) 这是shell会话: >>> f = urllib2.urlopen('http://en.wikipedia.org/wiki/OpenCola_(drink)') Traceback(最近一次调用最后
..