urllib2相关内容
我正在尝试抓取网页以从请求响应返回的文本数据中获取表值. 实际上,tbody 类中存在一些数据,但是`我无法使用请求访问该数据. 这是我的代码 server = "http://www.ebi.ac.uk/QuickGO/GProtein"header =
..
由于某些原因,我从以下 url 获取 JSON 数据的这部分有时只能工作.有时它会返回 404 错误,并抱怨缺少 header 属性.如果我将其粘贴到 Web 浏览器上,它将在 100% 的时间内工作.所以我确定链接没有损坏或其他什么. 我在 Python 中遇到以下错误: AttributeError: 'HTTPError' 对象没有属性 'header' 这是什么原因,可以
..
所以,我想使用 Kenneth 出色的请求模块.在尝试使用 Freebase API 时偶然发现了这个问题. 基本上,他们的 API 如下所示: https://www.googleapis.com/freebase/v1/mqlread?query=... 作为查询,他们期望一个 JSON 对象,这里有一个 返回葡萄酒列表他们的国家和酒精度百分比: [{“国家":空,“名称":空,“
..
我需要在 BeautifulSoup 中使用 urllib2.我找到了 BeautifulSoup 的下载文件并安装了它,但是我找不到 urllib2 的任何下载文件,还有其他方法可以安装该模块吗? 解决方案 Python自带的模块,直接导入即可: 导入 urllib2 如果您使用的是 Python3,urllib 将替换为 urllib.请求.Urllib PEP (Python3)
..
您好,我想了解 Google Play 商店中某个应用的说明.(https://play.google.com/store/apps/details?id=com.wetter.androidclient&hl=de) 导入 urllib2从 bs4 导入 BeautifulSoup汤 = BeautifulSoup(urllib2.urlopen("https://play.google.co
..
我想获取我使用 urllib2 打开的网页的标题.什么是最好的方法来做到这一点,解析 html 并找到我需要的东西(现在只有 -tag,但将来可能需要更多). 是否有一个很好的解析库用于这个目的? 解决方案 是的,我会推荐 BeautifulSoup 如果您要获得标题,那就是: soup = BeautifulSoup(html)myTitle = 汤.html.head.t
..
扫描urllib2源后,似乎即使您指定了keep-alive,连接也会自动关闭. 这是为什么? 现在我只使用 httplib 作为我的持久连接......但想知道为什么在 urllib2 中禁用(或者可能只是模棱两可). 解决方案 这是众所周知的 urllib2(以及 urllib)限制.恕我直言,迄今为止修复它并使其正确的最佳尝试是 Garry Bodsworth 的 cod
..
我正在尝试像这样通过python打开一个网址 导入 urllib2f = urllib2.urlopen('http://www.futurebazaar.com/Search/laptop') 它抛出以下错误 文件“C:\Python26\lib\urllib2.py",第 1134 行,在 do_open 中r = h.getresponse() 文件“C:\Python26\li
..
我正在使用此处的说明,尝试检查正在执行的 HTTP 命令发送到我的网络服务器. 但是,我没有看到如教程中建议的那样在控制台上打印 HTTP 命令.有谁知道如何在 CLI 中显示/调试 HTTP 命令? 我在 Linux Ubuntu 上运行 Python 2.6.5 解决方案 教程信息似乎已弃用. 现在使用 urllib2 进行调试的正确方法是: 导入 urllib2r
..
python urllib2 urlopen 响应: > 预期: {"token":"mYWmzpunvasAT795niiR"} 解决方案 您需要将生成的类文件对象绑定到一个变量,否则解释器只会通过 repr 转储它: >>>导入 urllib2>>>urllib2.urlopen('http://www.google.com')
..
我正在构建一个“API API",它基本上是一个内部 REST Web 服务的包装器,Web 应用程序将向该服务发出大量请求.一些 Web 服务调用需要 GET 而不是 post,而是传递参数. 是否有将字典编码为查询字符串的“最佳实践"方法?例如:?foo=bar&bla=blah 我正在查看 urllib2 文档,看起来它由本身是否使用 POST 或 GET 基于是否传递参数,但也
..
我已经在这个网站上发帖了,并得到了非常有用的指导,我带着另一个问题回来了. 我哪里出错了,我很确定这是从各个站点访问信息所必需的.在这种情况下,芝商所集团. 导入 urllib2url = "http://www.cmegroup.com/trading/energy/natural-gas/natural-gas.html"请求= urllib2.Request(url)句柄 = ur
..
在下面的代码中,到远程服务器的连接是保持打开状态直到 close() 被调用还是每次 read() 被调用时重新创建?在下面的代码中,我确实看到每次调用 read() 时都会发生新的网络通信,而不是在调用 urlopen() 时立即缓冲远程文件. 导入 urllib2handle = urllib2.urlopen('http://download.thinkbroadband.com/5MB.
..
import urllib2, sys如果 len(sys.argv) !=3:打印“用法:download.py "sys.exit(1)站点 = urllib2.urlopen(sys.argv[1])元 = site.info()打印“大小:",meta.getheaders(“内容长度")f = open(sys.argv[2],'wb')f.write(site.read())f.cl
..
我正在使用 python 运行一个脚本,该脚本使用 urllib2 从天气 api 获取数据并将其显示在屏幕上.我遇到的问题是,当我查询服务器时,出现“没有与主机名关联的地址"错误.我可以使用 Web 浏览器查看 api 的输出,我可以使用 wget 下载文件,但我必须强制 IPv4 才能使其工作.使用 urllib2.urlopen 时是否可以在 urllib2 中强制使用 IPv4? 解
..
我使用 urllib2 加载网页,我的代码是: httpRequest = urllib2.Request("http://www....com")pageContent = urllib2.urlopen(httpRequest)pageContent.readline() 如何获取套接字属性来设置TCP_NODELAY? 在普通套接字中,我将使用函数: socket.setsock
..
如何强制 urllib2/requests 模块使用相对路径而不是完整/绝对 URL?? 当我使用 urllib2/requests 发送请求时,我在代理中看到它解析为: GET https://xxxx/path/to/something HTTP/1.1 不幸的是,我将它发送到的服务器无法理解该请求并给了我奇怪的 302.我知道它在 RFC 中,它只是不起作用,我正在尝试在 pyth
..
我使用以下python代码下载html页面: response = urllib2.urlopen(current_URL)msg = response.read()打印消息 对于诸如 这个,它打开url没有错误,但只打印了html页面的一部分! 在以下几行中,您可以找到 html 页面的 http 标头.我认为问题是由于“传输编码:分块"造成的. 似乎 urllib2 只返回第一
..
嗨,我正在尝试使用 python 访问使用 urllib2 的 API URL: 导入 urllib2url = 'https://XXXXXXXXXX.com/'用户名 = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'密码 = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX'passman = urllib2.HTTPP
..
我正在使用 urllib2 制作恢复下载器,大致基于 这个 方法.我可以结束程序并重新启动它,它会从停止的地方开始下载,下载的文件大小与一次下载的文件大小相同. 但是,我在禁用和重新启用网络时对其进行了测试,但无法正确下载.文件大小最终超过文件应有的大小,并且文件无法正常工作.是不是我遗漏了什么,或者这可能是 urllib2 的错误? 导入 urllib2开瓶器 = urllib2.bu
..