urllib2相关内容
两部分问题.我正在尝试从互联网存档下载多个存档的 Cory Doctorow 播客.旧的没有进入我的 iTunes 提要.我已经编写了脚本,但下载的文件格式不正确. 问题 1 - 下载 zip mp3 文件时需要更改什么?Q2 - 将变量传递到 URL 的更好方法是什么? # 和基本网址.def dlfile(file_name,file_mode,base_url):从 urllib2
..
urllib2 是否支持 DELETE 或 PUT 方法?如果是,请提供任何示例.我需要使用活塞 API. 解决方案 你可以使用 httplib: 导入httplibconn = httplib.HTTPConnection('www.foo.com')conn.request('PUT', '/myurl', body)resp = conn.getresponse()content
..
我收到了一个网址:https://www.packtpub.com/virtualization-and-cloud/citrix-xenapp®-75-desktop-virtualization-solutions;它来自 BeautifulSoup. url=u'https://www.packtpub.com/virtualization-and-cloud/citrix-xenapp\
..
使用 urllib 运行请求但不断收到此错误: 回溯(最近一次调用最后一次):文件“/Library/Frameworks/Python.framework/Versions/3.6/lib/python3.6/urllib/request.py",第 1318 行,在 do_openencode_chunked=req.has_header('传输编码'))文件“/Library/Framew
..
是否可以使用 urllib 或 urllib2 不发送带有 POST 请求的数据?听起来很奇怪,但我使用的 API 在 POST 请求中发送空白数据. 我尝试了以下方法,但由于没有 POST 数据,它似乎发出了 GET 请求. url = 'https://site.com/registerclaim?cid=' + int(cid)值 = {}标题 = {'用户代理' : 'Mozill
..
我有疑问. st = "b%C3%BCrokommunikation"urllib2.unquote(st) 输出:'b\xc3\xbcrokommunikation'但是,如果我打印它: 打印 urllib2.unquote(st) 输出:bürokommunikation 为什么会有不同?我必须将 bürokommunikation 而不是 'b\xc3\xbcrokommuni
..
这是我的代码,你们也可以测试一下.我总是得到混乱的字符而不是页面源. Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}Req = urllib2.Request
..
好的,我尝试使用 urllib 打开一个 url,但问题是文件太大,所以当我打开 url 时,python 冻结,我也使用 wxpython,当我打开 url 时它也会冻结打开网址时,我的 CPU 几乎达到 100% 有什么解决办法吗?有没有办法我可以分块打开网址,并且可能在那里有一个 time.sleep(0.5) 这样它就不会冻结?这是我的代码: f = open("hello.txt
..
我在 Python 中使用 urllib 和 urllib2 打开和阅读网页,但有时,我得到的文本不可读.例如,如果我运行这个: 导入urllibtext = urllib.urlopen('http://tagger.steve.museum/steve/object/141913').read()打印文本 我收到一些无法阅读的文本.我读过这些帖子: 来自 urlopen 的胡言乱语
..
不久前刚开始使用python,我正在学习使用“post"方法直接与服务器通信.我现在正在编写的一个有趣的脚本是在 wordpress 上发表评论.该脚本确实在我的本地站点上发表评论,但我不知道为什么它会引发 HTTP 错误 404,这意味着找不到页面.这是我的代码,请帮我找出问题所在: 导入 urllib2导入 urlliburl='http://localhost/wp-comments-po
..
我有用于 Web 界面的客户端,用于长时间运行的进程.我希望该过程的输出显示出来.与 urllib.urlopen() 配合使用效果很好,但它没有 timeout 参数.另一方面,使用 urllib2.urlopen() 输出被缓冲.有没有简单的方法可以禁用该缓冲区? 解决方案 我想到的一个快速技巧是使用 urllib.urlopen() 和 threading.Timer() 模拟超时.
..
我需要使用 python3 计算网页中的单词.我应该使用哪个模块?网址库? 这是我的代码: def web():f =("urllib.request.urlopen("https://americancivilwar.com/north/lincoln.html")lu = f.read()打印(卢) 解决方案 通过下面的自我解释代码,您可以获得一个很好的起点来计算网页中的字数:
..
是否可以只从某个 URL 获取一些字节,然后关闭与 urllib/urllib2 的连接?或者甚至可能是从第 n 个字节到第 k 个字节的一部分?那边有一个页面,我不需要加载整个页面,只需要加载其中的一部分. 解决方案 可以设置Range头来请求一定范围的字节,但是您依赖服务器来满足请求: 导入 urllib2req = urllib2.Request('http://www.pytho
..
我正在使用 urllib2 的 urlopen 函数尝试从 StackOverflow api 获取 JSON 结果. 我正在使用的代码: >>>导入 urllib2>>>conn = urllib2.urlopen("http://api.stackoverflow.com/0.8/users/")>>>conn.readline() 我得到的结果: '\x1f\x8b\x08\
..
比如我想在输入用户名和密码后下载这个页面: http://forum.ubuntu-it.org/ 我尝试过 wget,但没有用. python 有解决方案吗? 您可以使用这些用户名和密码进行测试: 用户名:johnconnor密码:你好你好 解决方案 就像@robert 所说,使用机械化. 让您开始: from mechanize import Browserb =
..
我正用这个头撞墙.我一直在尝试每个示例,阅读我可以在网上找到的有关 urllib2 的基本 http 授权的最后一点,但我无法弄清楚是什么导致了我的特定错误. 更令人沮丧的是,该代码适用于一个页面,但不适用于另一个页面.登录 www.mysite.com/adm 非常顺利.它验证没有问题.但是,如果我将地址更改为“http://mysite.com/adm/items.php?n=20110
..
我刚刚开始使用 urllib3,我马上就遇到了一个问题.根据他们的手册,我从一个简单的例子开始: Python 2.7.1+ (r271:86832, 2011 年 4 月 11 日,18:13:53)[GCC 4.5.2] 在 linux2 上输入“帮助"、“版权"、“信用"或“许可"以获取更多信息.>>>导入 urllib3>>>>>>http = urllib3.PoolManager()
..
我有以下简单的代码: 导入 urllib2导入系统sys.path.append('../BeautifulSoup/BeautifulSoup-3.1.0.1')从 BeautifulSoup 进口 *page='http://en.wikipedia.org/wiki/Main_Page'c=urllib2.urlopen(页面) 此代码生成以下错误消息: c=urllib2.urlo
..
我有一个正在测试的简单网站.它在本地主机上运行,我可以在我的网络浏览器中访问它.索引页只是“运行"这个词.urllib.urlopen 将成功读取页面,但 urllib2.urlopen 不会.这是一个演示问题的脚本(这是实际脚本,而不是其他测试脚本的简化): 导入 urllib, urllib2打印 urllib.urlopen("http://127.0.0.1").read() # 打
..
我想登录这个网站:https://www.fitbit.com/login这是我使用的代码: 导入 urllib2导入 urllib导入cookieliblogin_url = 'https://www.fitbit.com/login'acc_pwd = {'login':'Log In','email':'username','password':'pwd'}cj = cookielib.C
..