urllib2相关内容

python urllib2文件发送问题

我想通过python发布一个文件到服务器,为此我需要将这个文件命名为“xmlfile”,以便服务器识别输入。 import urllib2 url =“http:// somedomain” to_send = open('test.xml')。read() data = {} data ['xmlfile'] = to_send f = urllib2.urlopen( ..
发布时间:2017-03-06 01:18:52 Python

在python中打开网站框架或图像

所以我相当流利的python和已经使用urllib2和饼干很多的网站自动化。我只是偶然发现了“webbrowser”模块,可以在默认浏览器中打开一个网址。我想知道是否可能从该URL只选择一个对象,并打开它。具体来说,我想打开一个“验证码”,以便用户可以输入它,并继续做别的事情。 这是包含html中的验证码的行,我认为: script type =“text / javascript” ..
发布时间:2017-01-06 16:48:03 Python

使用urllib2中的selenium的会话cookie

我尝试使用Selenium登录网站,然后使用urllib2来发出RESTy请求。为了使它工作,我需要urllib2能够使用同一会话Selenium使用。 使用selenium登录工作非常好,我可以调用 self.driver.get_cookies() 并且我有一个列表,列出了所有的selenium知道的cookie,它最终看起来像这样: [{u'domai ..
发布时间:2017-01-06 13:42:51 Python

多线程网络刮板在启用Cookie的网站上使用urlretrieve

我想写我的第一个Python脚本,并且有很多Google搜索,我认为我只是做了。 我需要写一个脚本,登录到启用Cookie的网站,抓取一堆链接,然后产生几个进程下载文件。我有程序运行在单线程,所以我知道代码工作。但是,当我试图创建一个下载工作者池,我遇到了一堵墙。 #manager.py import Fetch#多处理导入池中 的模块名 def FetchReports(l ..
发布时间:2017-01-06 12:46:51 Python

urllib2用饼干

我试图向使用python的需要cookie的RSS提要发出请求。我认为使用urllib2和添加适当的标题就足够了,但请求仍然说不受欢迎。 猜测这可能是远程站点上的问题,但不能确定。如何使用urllib2和cookies?是有更好的包(例如httplib,mechanize,curl) 解决方案 import urllib2 opener = urllib2.build_open ..
发布时间:2017-01-06 12:08:19 Python

如何“保持活跃”与cookielib和httplib在python?

在python中,我使用httplib,因为它“保持活动”http连接(与urllib(2)相反)。现在,我想使用cookielib与httplib,但他们似乎恨对方! (没有办法将它们接合在一起)。 有人知道解决这个问题吗? 解决方案 您应该考虑使用 请求 library而不是最早的机会,你必须重构你的代码。在同一时间; HACK ALERT! :) 我会走其他建议的方 ..
发布时间:2017-01-06 12:02:36 Python

关闭urllib2连接

我使用urllib2从ftp-和http-servers加载文件。 一些服务器每个IP只支持一个连接。问题是,urllib2不会立即关闭连接。看看示例程序。 来自urllib2 import urlopen 从时间导入sleep url ='ftp:// user:pass@host/big_file.ext' def load_file(url): f = urlop ..
发布时间:2016-12-28 15:01:10 Python

Python urllib2.urlopen()很慢,需要更好的方法来读几个网址

正如标题所示,我正在一个网站编写的python,它做了几个调用urllib2模块来阅读网站。我然后解析他们与BeautifulSoup。 由于我必须读取5-10个网站,所以网页需要一段时间才能载入。 我只是想知道是否有一种方法来立即读取网站? 添加:也可以使用任何一种方法来使它更快,比如我应该在每次阅读后关闭urllib2.urlopen,如果我只是切换到PHP,这将是更快的抓取 ..
发布时间:2016-12-26 14:24:50 Python

urllib2开头提供错误的字符集

当我打开网址阅读它,我不能认出它。但是当我检查内容头,它说它被编码为utf-8。所以我试图将其转换为unicode,并抱怨UnicodeDecodeError:'ascii'编解码器无法解码字节0x8b在位置1:序数不在范围(128)使用unicode()。 .encode(“utf-8”)产生 UnicodeDecodeError:'ascii'编解码器无法解码位置1中的字节0x8b:在 ..
发布时间:2016-11-19 13:12:25 Python

如何下载任何(!)网页与正确的字符集在python?

问题 当使用python屏幕抓取网页时,必须知道网页的字符编码。编码错误比你的输出会被打乱。 人们通常使用一些基本的技术来检测编码。他们使用标头中的字符集或元标记中定义的字符集,或者使用编码检测器(它不关心元标记或头)。 浏览器用这种方法: 元标记总是优先(或xml定义) 在标头中定义的编码没有在元标记中定义字符集 如果根本没有定义编码,那么它是编码检测的时间。 ..
发布时间:2016-11-19 12:45:20 Python

为python中的每个HTTP请求创建新的TCP连接

对于我的大学项目,我试图开发一个基于python的流量生成器。我在vmware上创建了2个CentOS机器,我使用1作为我的客户端和1作为我的服务器。我使用IP别名技术来增加客户端和服务器数量,只使用单个客户端/服务器机器。到目前为止,我在我的客户端机器上创建了50个IP别名,并在我的服务器机器上创建了10个IP别名。我也使用多处理模块从所有50个客户端到所有10个服务器并发生成流量。我还开发了几 ..
发布时间:2016-11-14 11:21:41 Python

的Python:点击一个按钮

我在点击这个按钮看起来在HTML code这样的问题: <形式方法=“邮报”> < BR> <输入类型=“隐藏”值=“6”NAME =“deletetree”> <输入类型=“提交”值=“删除树”NAME =“推”> < /表及GT; 和需要生成看起来像这样的网址: ..
发布时间:2016-08-16 22:18:40 Python

在Python里打开一个网站的框架或图像

所以我相当流利使用Python和已经使用的urllib2和Cookies很多关于网站的自动化。我只是偶然发现了“网页浏览器”模块,可在您的默认浏览器中打开一个URL。我想知道如果可以选择从URL只是一个对象,并打开了。具体来说,我想开一个“验证码”,使用户可以输入它,然后继续做别的事情。 包含在HTML中的验证码,这是行,我想: 脚本类型=“文/ JavaScript的” src=\"http ..
发布时间:2016-08-15 15:02:28 Python

蟒蛇 - 获取URL的浏览器重定向到

我想验证与API的应用程序。结果 具体方法如下: 我打开使用 webbrowser.open 的URL。 的用户进行身份验证的应用,并重定向到另一个网址,这是结果 https://stackexchange.com/oauth/login_success 带参数带这个URL codeD。结果 样本重定向网址是:结果 ... / login_success#=的access_toke ..
发布时间:2016-08-15 14:26:59 Python

从使用python网页检索基本数据

下面是一个网页,我下载了urlretrieve(urllib模块)的一部分。我想只写在下面给出另一个文本文件作为网页这样的数据: 工程数学-IV,4,36,40,F 环境研究,47,36,83,P ... .. 。 likeways .. 哪些模块,我应该使用?这所有的命令?? 感谢名单提前..:) 的网页的部分< TD>工程数学-IV抑制剂; / TD> ..
发布时间:2016-08-05 19:22:35 Python

prettify()使用Python 2.7的错误

code: 进口的urllib2 从BS4进口BeautifulSoup第1页= urllib2.urlopen(“http://en.wikipedia.org/wiki/List_of_human_stampedes”) 汤= BeautifulSoup(第1页)打印(汤。prettify()) 错误:回溯(最后最近一次调用): 文件“C:\\用户\\索尼\\桌面\\垃圾桶\\履带尝 ..
发布时间:2016-08-05 19:20:55 其他开发语言