urllib相关内容

Urllib Unicode 错误,不涉及 Unicode

编辑:我主要编辑了这篇文章的内容,以明确我的问题: 我正在编写一个程序来下载网络漫画,但在下载漫画页面时出现了这个奇怪的错误.我正在运行的代码基本上归结为以下行,后跟错误.我不知道是什么导致了这个错误,这让我很困惑. >>>urllib.request.urlopen("http://abominable.cc/post/47699281401")回溯(最近一次调用最后一次):文件“ ..
发布时间:2021-09-15 18:35:44 Python

对梵文文本使用 urlencode

以下代码: import simplejson,urllib,urllib2查询=[u'नेपाल']urlbase="http://search.twitter.com/search.json"values={'q':query[0]}数据=urllib.urlencode(值)req=urllib2.Request(urlbase,data)响应=urllib2.urlopen(req)js ..
发布时间:2021-09-15 18:35:41 Python

如何下载和阅读带有通用换行符的 URL?

我在 Python 2.7 中使用 urllib.urlopen,但我需要处理下载的 HTML 文档及其包含的换行符(在 元素内). urllib docs 表明 urlopen 不会使用通用换行符.我该怎么做? 解决方案 除非 HTML 文件已经在您的磁盘上,urlopen() 将正确处理所有格式的换行符 (\n、\r\n 和 \r) 在您要解析的 HTML 文件中(也就是说,它将把 ..
发布时间:2021-09-15 18:35:38 Python

从 api url 中提取信息

我试图从这个 API 中从一堆不同的邮政编码中提取温度的平均值.我目前可以通过手动更改 API 的 URL 中的邮政编码来实现,但我希望它能够遍历邮政编码列表或要求输入并使用这些邮政编码.但是,我是新手,不知道如何将变量和内容添加到链接中,要么是这样,要么是我过于复杂了.所以基本上我正在寻找一些方法来向链接添加变量或具有相同效果的东西,以便我可以随时更改它. 导入 urllib.request导 ..
发布时间:2021-09-15 18:35:32 Python

如果 url 太大,urllib 会冻结!

好的,我尝试使用 urllib 打开一个 url,但问题是文件太大,所以当我打开 url 时,python 冻结,我也使用 wxpython,当我打开 url 时它也会冻结打开网址时,我的 CPU 几乎达到 100% 有什么解决办法吗?有没有办法我可以分块打开网址,并且可能在那里有一个 time.sleep(0.5) 这样它就不会冻结?这是我的代码: f = open("hello.txt ..
发布时间:2021-09-15 18:35:30 Python

Python从URL读取页面?更好的文档?

我在使用 Python 文档时遇到了很多麻烦.有没有类似 Mozilla 开发者网络的东西? 我正在做一个 Python 拼图网站,我需要能够阅读页面的内容.我在一个网站上看到了以下内容: 导入 urllib2urlStr = 'http://www.python.org/'尝试:fileHandle = urllib2.urlopen(urlStr)str1 = fileHandle.r ..
发布时间:2021-09-15 18:35:27 Python

如何使用美丽的汤从维基百科中提取表格

我正在尝试编写一个从 this 维基百科页面中提取表格的抓取工具.问题是,我可以提取页面上的所有表格,除了我实际需要的表格(该表格包含在美国进行的所有选举的统计数据).我不认为问题出在我的标签上. 这是我的代码 from urllib.error import HTTPError从 urllib.error 导入 URLError从 bs4 导入 BeautifulSoup从 urllib.r ..
发布时间:2021-09-15 18:35:24 其他开发

tarfile 无法打开 tgz

我正在尝试从该网站下载 tgz 文件:https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo07 这是我的脚本: 导入操作系统从 6.moves 导入 urllib导入 tarfilespam_path=os.path.join('ML', '垃圾邮件')root_download='https://plg.uwaterloo.ca/cg ..
发布时间:2021-09-15 18:35:18 Python

Python - 使用 BeautifulSoup 抓取问题

我正在尝试使用 Beautiful Soup 4 和 URLLIB 作为个人项目来抓取 Stack Overflow 作业页面.我正面临一个问题,即我试图抓取每页上列出的 50 个工作的所有链接.我正在使用正则表达式来识别这些链接.即使我正确引用了标签,我也面临以下两个具体问题: 与源代码中清晰可见的 50 个链接不同,我每次只得到 25 个结果作为我的输出(在考虑删除初始不相关链接之后) ..
发布时间:2021-09-15 18:35:15 其他开发

urlretrieve 返回类型错误

我不知道为什么我的代码会返回这个错误,我似乎无法调试它. TypeError: 预期的字符串或类似字节的对象 这是我用来下载的 self.headers = { 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8' }self.request = urllib.request.Reque ..
发布时间:2021-09-15 18:35:09 其他开发

HTML 数据对 urllib 隐藏

如何从该页面获取真实内容:http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv 我从下面的代码中得到的只是一些指向 javascript 和 CSS 文件的链接.有没有办法解决这个问题? from urllib.request import urlop ..
发布时间:2021-09-15 18:35:06 Python

创建 ZipFile 时出现 AttributeError

问题 我在尝试从文件路径创建 zipfile.ZipFile 时收到 AttributeError: 'tuple' object has no attribute 'seek'. 我不知道为什么,回溯对我的代码没有任何意义,这是 zipfile 模块中的错误,还是我没有正确设置? 我尽可能地遵循了所有文档,但无济于事. 我正在做的事情有什么问题,是否有解决方法/修复方法? ..
发布时间:2021-09-15 18:35:04 Python

Python3(Urllib)-<0x03281BD0处的绑定方法HTTPResponse.read

导入 urllib.requesthtml = urllib.request.urlopen('http://jshawl.com/python-playground/')s = html.read印刷) 这是我得到的错误: > 我该如何解决这个错误?我犯了什么错误? 解决方案 您看到的不是错误 - 您看到的是 HTTPResponse 实例方法字符串表示.要获取方法返回的内 ..
发布时间:2021-09-15 18:35:01 Python

python 3.7 urllib.request 不遵循重定向 URL

我正在使用带有 urllib 的 Python 3.7.一切正常,但在收到 http 重定向请求 (307) 时似乎无法自动重定向. 这是我得到的错误: ERROR 2020-06-15 10:25:06,968 HTTP 错误 307:临时重定向 我必须使用 try-except 来处理它并手动向新位置发送另一个请求:它工作正常,但我不喜欢它. 这些是我用来执行请求的代码: ..
发布时间:2021-09-15 18:34:55 Python

直接在 Python 中处理来自网络的 pdf?

我正在尝试使用 Python 直接从网络读取 .pdf 文件,而不是将它们全部保存到我的计算机上.我所需要的只是 .pdf 中的文本,我将阅读大量(约 60k)个文本,因此我宁愿实际上不必将它们全部保存. 我知道如何使用 urllib 从互联网保存 .pdf 并使用 PyPDF2 打开它.(示例) 我想跳过保存到文件的步骤. import urllib, PyPDF2urllib.u ..
发布时间:2021-09-15 18:34:52 Python