urllib2相关内容

Python:使用 url 从谷歌驱动器下载文件

我正在尝试从谷歌驱动器下载文件,但我只有驱动器的 URL. 我读过关于 google API 的一些drive_service 和 MedioIO,这也需要一些凭据(主要是 JSON file/OAuth).但我不知道它是如何工作的. 另外,尝试了 urllib2.urlretrieve,但我的情况是从驱动器中获取文件.也试过 wget 但没有用. 尝试了 PyDrive 库.它 ..
发布时间:2022-01-02 16:27:07 Python

Python 请求多部分 HTTP POST

我想知道您如何使用 Python 请求翻译这样的内容?在 urllib2 中,您可以手动操作通过线路发送到 API 服务的数据,但 Requests 声称分段文件上传很容易.但是,当尝试使用 Requests 库发送相同的请求时,我相信它没有正确地为两个部分中的每一个指定内容类型中的一些关键参数.有人可以对这个问题有所了解.提前谢谢你! def upload_creative(self, acc ..
发布时间:2021-12-31 20:15:58 Python

python请求很慢

我正在开发一个下载管理器.使用 python 中的 requests 模块检查有效链接(以及可能已损坏的链接).我用于检查以下链接的代码: url = 'http://pyscripter.googlecode.com/files/PyScripter-v2.5.3-Setup.exe'r = requests.get(url, allow_redirects=False) # 这一行需要 40 ..
发布时间:2021-12-31 19:58:35 Python

Python urllib2 >HTTP代理>HTTPS 请求

这个工作正常: 导入 urllib2开瓶器 = urllib2.build_opener(urllib2.HTTPHandler(),urllib2.HTTPSHandler(),urllib2.ProxyHandler({'http': 'http://user:pass@proxy:3128'}))urllib2.install_opener(开瓶器)打印 urllib2.urlopen(' ..
发布时间:2021-12-31 19:28:38 Python

Python:在 urllib2 中禁用 http_proxy

我使用代理集作为环境变量(导出 http_proxy=example.com).对于使用 urllib2 的一次调用,我需要暂时禁用它,即.取消设置 http_proxy.我已经尝试了文档和网络中建议的各种方法,但到目前为止还无法取消设置代理.到目前为止,我已经尝试过: # 不起作用req = urllib2.Request('http://www.google.com')req.set_pro ..
发布时间:2021-12-31 19:27:16 Python

PayPal 的 Python 接口 - urllib.urlencode 非 ASCII 字符失败

我正在尝试实施 PayPal IPN 功能.基本协议如下: 客户从我的网站重定向到 PayPal 的网站以完成付款.他登录自己的帐户,授权付款. PayPal 调用我服务器上的一个页面,将详细信息作为 POST 传递.详细信息包括一个人的姓名、地址和付款信息等. 我需要从我的处理页面内部调用 PayPal 站点上的 URL,将在上面传递的所有参数和一个名为“cmd"的附加参数传回,其值为 ..
发布时间:2021-12-29 17:31:49 Python

Python urllib2 自动填表和检索结果

我希望能够在网站上查询运行此脚本的机器的保修信息.如果需要,它应该能够填写表格(例如 HP 的服务站点的情况),然后能够检索结果网页. 我已经有一些位来解析报告回来的结果 html 我只是在处理需要做的事情时遇到了麻烦,以便对需要放入字段中的数据进行 POST能够检索结果页面. 解决方案 如果你绝对需要使用 urllib2,基本要点是这样的: 导入urllib导入 urllib2u ..
发布时间:2021-12-29 13:13:06 Python

从存储的 .html 页面中提取新闻文章内容

我正在从 html 文件中读取文本并进行一些分析.这些 .html 文件是新闻文章. 代码: html = open(filepath,'r').read()raw = nltk.clean_html(html)raw.unidecode(item.decode('utf8')) 现在我只需要文章内容,而不是其他文本,如广告、标题等.如何在 python 中相对准确地做到这一点? ..
发布时间:2021-12-23 20:36:15 Python

如何从 Python 中查看 Tumblr 帖子的所有注释?

假设我查看以下 Tumblr 帖子:http://ronbarak.tumblr.com/post/40692813…… 它(目前)有 292 个笔记. 我想使用 Python 脚本(例如,通过 urllib2、BeautifulSoup、simplejson 或 tumblr Api)获取所有上述注释.一些广泛的谷歌搜索没有产生任何与 Tumblr 中的笔记提取相关的项目. 谁能为 ..
发布时间:2021-12-23 20:08:23 Python

如何使用 BeautifulSoup 将 UTF-8 编码的 HTML 正确解析为 Unicode 字符串?

我正在运行一个 Python 程序,它获取一个 UTF-8 编码的网页,我使用 BeautifulSoup 从 HTML 中提取了一些文本. 但是,当我将此文本写入文件(或在控制台上打印)时,它以意外的编码写入. 示例程序: import urllib2从 BeautifulSoup 导入 BeautifulSoup# 获取网址url = 'http://www.voxnow.de/ ..
发布时间:2021-12-23 19:46:36 Python

Python URLLib/URLLib2 POST

我正在尝试使用 wx/Python 创建一个超级简单的虚拟输入/输出板.对于我将要存储数据的服务器的请求之一,我已准备好以下代码: data = urllib.urlencode({'q': 'Status'})u = urllib2.urlopen('http://myserver/inout-tracker', 数据)对于 u.readlines() 中的行:印刷线 没有什么特别的.我遇到 ..
发布时间:2021-12-18 14:29:19 Python

如何使用 Python 抓取带有动态生成的 URL 的页面?

我正在尝试抓取 http://www.dailyfinance.com/quote/NYSE/international-business-machines/IBM/financial-ratios,但传统的 url 字符串构建技术不起作用,因为“完整公司名称已插入-the-path"字符串.确切的“公司全名"事先并不知道.只有公司符号“IBM"是已知的. 本质上,我抓取的方式是遍历公司符号 ..
发布时间:2021-12-17 13:58:52 Python

获取 Python 中脚本标签内的变量数据或从 js 添加的内容

我想从另一个 url 中获取数据,我正在使用 urllib 和 Beautiful Soup ,我的数据在 table 标签内(我已经使用 Firefox 控制台弄清楚了).但是当我尝试使用他的 id 获取表时,结果是 None ,那么我猜这个表必须通过一些 js 代码动态添加. 我已经尝试了所有的解析器 'lxml', 'html5lib' 但我仍然无法获取该表数据. 我还尝试了另一 ..
发布时间:2021-12-17 13:38:34 前端开发

并行获取文件

为了下载文件,我创建了一个 urlopen 对象(urllib2 类)并分块读取. 我想多次连接到服务器并在六个不同的会话中下载文件.这样做,下载速度应该会更快.许多下载管理器都有此功能. 我想过在每个会话中指定我想要下载的文件部分,并以某种方式同时处理所有会话.我不确定如何实现这一目标. 解决方案 听起来您想使用 可用的 HTTP 范围. edit 更新了指向 w3.o ..
发布时间:2021-12-14 20:51:07 Python