urllib相关内容

使用python urllib从url下载图像,但接收HTTP错误403:禁止

我想使用python模块“urllib.request”从url下载图像文件,该模块适用于某些网站(例如mangastream.com),但不适用于另一个(mangadoom.co)接收错误“HTTP错误403 :禁止“。对于后一种情况可能是什么问题以及如何解决? 我在OSX上使用python3.4。 import urllib.request #不工作 img_url =' ..
发布时间:2017-07-13 09:33:55 开发方法

Python'请求'库 - 定义特定的DNS?

在我的项目中,我使用python 处理所有HTTP请求请求库。 现在,我需要使用特定的DNS查询http服务器 - 有两个环境,每个使用它自己的DNS和更改是独立的。 所以,当代码运行时,它应该使用特定于环境的DNS,而不是我的互联网连接中指定的DNS有人试过这个使用python请求吗? 我只找到了urllib2的解决方案: https://stackoverflow.co ..
发布时间:2017-06-09 19:48:50 Python

Django请求具有SSL IO错误的XML文件

我正在制作一个Django网站,并且是相当新的。在这个webapp中,我需要使用这个API,它将从数据库中吐出一个带有请求的数据的xml文件。 基本上API的URL是: https:// adminuser:password@url.to.database.com/database.getdata?arg = 1& arg2 = 0 所以在我的python views.py我有: ..
发布时间:2017-05-31 01:49:27 其他开发

Python urllib下载一个在线目录的内容

我正在尝试制作一个程序来打开一个目录,然后使用正则表达式获取powerpoint的名称,然后在本地创建文件并复制其内容。当我运行它,它似乎工作,但是,当我实际上尝试打开文件,他们说版本是错误的。 来自urllib.request import urlopen import re urlpath = urlopen('http://www.divms.uiowa.edu/~jni/ ..
发布时间:2017-05-26 21:50:50 Python

循环通过Web上的目录,并通过Python显示其内容(文件和其他目录)

与将一组文件从源目录处理到Python中的目标目录我想知道是否可以创建一个函数,当给定一个Web目录时,它将列出文件中的文件说目录一些类似... 文件[] 在urllib.listdir(dir)中的文件: 如果file.isdir: #将此作为目录 否则: #将文件作为文件 我假设我需要使用urllib库,但似乎并没有一个简单的方法,至少我已经看到了。 解决方 ..
发布时间:2017-05-26 21:16:26 Python

使用urllib进行编码时,请保持url参数的顺序

我试图用python来模拟一个get请求。我有一个参数字典,并且使用urllib.urlencode来对它们进行编码。 我注意到尽管字典有以下形式: {“k1”:“v1”,“k2”:“v2”,“k3”:“v3”,..} 对于urlencoding,参数的顺序切换到: /?k1 = v1& k3 = v3%k2 = v2 ... 为什么会发 ..
发布时间:2017-05-24 20:50:49 Python

只有满足条件才能添加到dict

我正在使用 urllib.urlencode 来构建Web POST参数,但是有一些值,我只想添加一个非$ > apple ='green' orange ='orange ' params = urllib.urlencode({ 'apple':apple, 'orange':orange }) pre> 可以正常工作,但是如果我将橙色变量选为可选项,那我该如何防止 ..
发布时间:2017-05-21 17:23:31 Python

使用urlencode python构建查询字符串

我正在尝试建立一个网址,以便我可以使用 urllib 模块发送获取请求。 让我们假设我的 final_url 应该是 url =“www。 example.com/find.php?data=http%3A%2F%2Fwww.stackoverflow.com&search=Generate+value“ 现在,我尝试了以下方式: >>> initial_ur ..
发布时间:2017-05-21 16:52:15 Python

从网页上传图片

我想实施类似于此 http://www.tineye.com的功能/parse?url=yahoo.com - 允许用户从任何网页上传图片。 我的主要问题是,它需要太多时间 我是在Django(使用curl或urllib)根据下面的方案这样做: 抓取网页的html(大页大约需要1秒): code> file = urllib.urlopen(requested_url) ..
发布时间:2017-03-06 05:41:00 Python

如何使用python解压缩URL?

我已经看过这个主题了 - 如何取消暂停网址使用python? 我的问题与解决的答案(即使用unshort.me API)是我专注于不收缩youtube链接。由于unshort.me很容易使用,这会返回几乎90%的结果与我无法解决的验证码。 到目前为止我一直在使用: def unshorten_url url): resolvedURL = urllib2.urlopen(ur ..
发布时间:2017-03-05 22:14:52 Python

与urllib的cookie

这可能看起来像一个非常简单的问题,我很困惑为什么这对我很难。 我想写一个函数它需要三个输入:[url,data,cookies],它将使用urllib(而不是urllib2)来获取请求的URL的内容。 我想这很简单,所以我写了以下: def fetch(url,data = None ,cookies = None): if isinstance(data,dict):data ..
发布时间:2017-01-06 19:30:42 Python

多线程网络刮板在启用Cookie的网站上使用urlretrieve

我想写我的第一个Python脚本,并且有很多Google搜索,我认为我只是做了。 我需要写一个脚本,登录到启用Cookie的网站,抓取一堆链接,然后产生几个进程下载文件。我有程序运行在单线程,所以我知道代码工作。但是,当我试图创建一个下载工作者池,我遇到了一堵墙。 #manager.py import Fetch#多处理导入池中 的模块名 def FetchReports(l ..
发布时间:2017-01-06 12:46:51 Python

以python错误下载大文件:压缩文件在达到流末标记之前结束

我从互联网下载一个压缩文件: 与lzma.open(urllib.request.urlopen(url) )as file: for line in file: ... 下载并处理了大部分文件,我最终得到错误: 文件“/usr/lib/python3.4/ (“压缩文件在”EOFError:压缩文件之前结束 在到达流标记结束之前结束 结束)之前,在 ..
发布时间:2016-12-25 13:31:42 Python

如何下载任何(!)网页与正确的字符集在python?

问题 当使用python屏幕抓取网页时,必须知道网页的字符编码。编码错误比你的输出会被打乱。 人们通常使用一些基本的技术来检测编码。他们使用标头中的字符集或元标记中定义的字符集,或者使用编码检测器(它不关心元标记或头)。 浏览器用这种方法: 元标记总是优先(或xml定义) 在标头中定义的编码没有在元标记中定义字符集 如果根本没有定义编码,那么它是编码检测的时间。 ..
发布时间:2016-11-19 12:45:20 Python

的Python:点击一个按钮

我在点击这个按钮看起来在HTML code这样的问题: <形式方法=“邮报”> < BR> <输入类型=“隐藏”值=“6”NAME =“deletetree”> <输入类型=“提交”值=“删除树”NAME =“推”> < /表及GT; 和需要生成看起来像这样的网址: ..
发布时间:2016-08-16 22:18:40 Python