urllib相关内容
编辑:我主要编辑了这篇文章的内容,以明确我的问题: 我正在编写一个程序来下载网络漫画,但在下载漫画页面时出现了这个奇怪的错误.我正在运行的代码基本上归结为以下行,后跟错误.我不知道是什么导致了这个错误,这让我很困惑. >>>urllib.request.urlopen("http://abominable.cc/post/47699281401")回溯(最近一次调用最后一次):文件“
..
以下代码: import simplejson,urllib,urllib2查询=[u'नेपाल']urlbase="http://search.twitter.com/search.json"values={'q':query[0]}数据=urllib.urlencode(值)req=urllib2.Request(urlbase,data)响应=urllib2.urlopen(req)js
..
我在 Python 2.7 中使用 urllib.urlopen,但我需要处理下载的 HTML 文档及其包含的换行符(在 元素内). urllib docs 表明 urlopen 不会使用通用换行符.我该怎么做? 解决方案 除非 HTML 文件已经在您的磁盘上,urlopen() 将正确处理所有格式的换行符 (\n、\r\n 和 \r) 在您要解析的 HTML 文件中(也就是说,它将把
..
这是我的代码,你们也可以测试一下.我总是得到混乱的字符而不是页面源. Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}Req = urllib2.Request
..
我试图从这个 API 中从一堆不同的邮政编码中提取温度的平均值.我目前可以通过手动更改 API 的 URL 中的邮政编码来实现,但我希望它能够遍历邮政编码列表或要求输入并使用这些邮政编码.但是,我是新手,不知道如何将变量和内容添加到链接中,要么是这样,要么是我过于复杂了.所以基本上我正在寻找一些方法来向链接添加变量或具有相同效果的东西,以便我可以随时更改它. 导入 urllib.request导
..
好的,我尝试使用 urllib 打开一个 url,但问题是文件太大,所以当我打开 url 时,python 冻结,我也使用 wxpython,当我打开 url 时它也会冻结打开网址时,我的 CPU 几乎达到 100% 有什么解决办法吗?有没有办法我可以分块打开网址,并且可能在那里有一个 time.sleep(0.5) 这样它就不会冻结?这是我的代码: f = open("hello.txt
..
我在使用 Python 文档时遇到了很多麻烦.有没有类似 Mozilla 开发者网络的东西? 我正在做一个 Python 拼图网站,我需要能够阅读页面的内容.我在一个网站上看到了以下内容: 导入 urllib2urlStr = 'http://www.python.org/'尝试:fileHandle = urllib2.urlopen(urlStr)str1 = fileHandle.r
..
我正在尝试编写一个从 this 维基百科页面中提取表格的抓取工具.问题是,我可以提取页面上的所有表格,除了我实际需要的表格(该表格包含在美国进行的所有选举的统计数据).我不认为问题出在我的标签上. 这是我的代码 from urllib.error import HTTPError从 urllib.error 导入 URLError从 bs4 导入 BeautifulSoup从 urllib.r
..
我正在尝试使用请求和shutil 库从带有Python 的URL 下载图像.我的代码如下: 导入请求进口商铺image_url = "https://www.metmuseum.org/-/media/images/visit/met-fifth-avenue/fifthave_teaser.jpg";使用 open("image1.jpg", "wb") 作为文件:响应 = requests.
..
我正在尝试从该网站下载 tgz 文件:https://plg.uwaterloo.ca/cgi-bin/cgiwrap/gvcormac/foo07 这是我的脚本: 导入操作系统从 6.moves 导入 urllib导入 tarfilespam_path=os.path.join('ML', '垃圾邮件')root_download='https://plg.uwaterloo.ca/cg
..
我正在尝试使用 Beautiful Soup 4 和 URLLIB 作为个人项目来抓取 Stack Overflow 作业页面.我正面临一个问题,即我试图抓取每页上列出的 50 个工作的所有链接.我正在使用正则表达式来识别这些链接.即使我正确引用了标签,我也面临以下两个具体问题: 与源代码中清晰可见的 50 个链接不同,我每次只得到 25 个结果作为我的输出(在考虑删除初始不相关链接之后)
..
试图在 Azure Notebooks 中获取 TensorFlow 对象检测 API 模型,但我尝试的一切都给出了 403 Forbidden.在本地或 AWS 上检索文件没有问题. import Six.moves.urllib 作为 urlliburl = 'http://download.tensorflow.org/models/object_detection/rfcn_resnet
..
我不知道为什么我的代码会返回这个错误,我似乎无法调试它. TypeError: 预期的字符串或类似字节的对象 这是我用来下载的 self.headers = { 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8' }self.request = urllib.request.Reque
..
如何从该页面获取真实内容:http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv 我从下面的代码中得到的只是一些指向 javascript 和 CSS 文件的链接.有没有办法解决这个问题? from urllib.request import urlop
..
问题 我在尝试从文件路径创建 zipfile.ZipFile 时收到 AttributeError: 'tuple' object has no attribute 'seek'. 我不知道为什么,回溯对我的代码没有任何意义,这是 zipfile 模块中的错误,还是我没有正确设置? 我尽可能地遵循了所有文档,但无济于事. 我正在做的事情有什么问题,是否有解决方法/修复方法?
..
导入 urllib.requesthtml = urllib.request.urlopen('http://jshawl.com/python-playground/')s = html.read印刷) 这是我得到的错误: > 我该如何解决这个错误?我犯了什么错误? 解决方案 您看到的不是错误 - 您看到的是 HTTPResponse 实例方法字符串表示.要获取方法返回的内
..
我在 Python 中使用 urllib 和 urllib2 打开和阅读网页,但有时,我得到的文本不可读.例如,如果我运行这个: 导入urllibtext = urllib.urlopen('http://tagger.steve.museum/steve/object/141913').read()打印文本 我收到一些无法阅读的文本.我读过这些帖子: 来自 urlopen 的胡言乱语
..
我正在使用带有 urllib 的 Python 3.7.一切正常,但在收到 http 重定向请求 (307) 时似乎无法自动重定向. 这是我得到的错误: ERROR 2020-06-15 10:25:06,968 HTTP 错误 307:临时重定向 我必须使用 try-except 来处理它并手动向新位置发送另一个请求:它工作正常,但我不喜欢它. 这些是我用来执行请求的代码:
..
我正在尝试使用 Python 直接从网络读取 .pdf 文件,而不是将它们全部保存到我的计算机上.我所需要的只是 .pdf 中的文本,我将阅读大量(约 60k)个文本,因此我宁愿实际上不必将它们全部保存. 我知道如何使用 urllib 从互联网保存 .pdf 并使用 PyPDF2 打开它.(示例) 我想跳过保存到文件的步骤. import urllib, PyPDF2urllib.u
..
我正在尝试使用 urrlib 下载 GIF 文件,但它抛出此错误: urllib.error.HTTPError: HTTP Error 403: Forbidden 当我从其他博客站点下载时不会发生这种情况.这是我的代码: 导入请求导入 urllib.requesturl_1 = 'https://goodlogo.com/images/logos/small/nike_classic_l
..