urllib相关内容

Python urllib 冻结特定 URL

我正在尝试获取一个页面并且 urlopen 挂起并且从不返回任何内容,尽管该网页非常轻巧并且可以使用任何浏览器打开而没有任何问题 导入 urllib.request使用 urllib.request.urlopen("http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm") 作为响应:打印(响应.读()) ..
发布时间:2021-09-15 18:34:45 Python

Python http.client.RemoteDisconnected

尝试使用 python 通过网络服务运行多个 id,我收到“http.client.RemoteDisconnected: Remote end closed connection without response"错误.我不想尝试/捕获这个错误,我想调查为什么我得到这个响应.我已经能够得到 400 和 500 级错误 引发 HTTPError(req.full_url, code, msg, ..
发布时间:2021-09-15 18:34:42 Python

Python:Urllib.urlopen 非数字端口

对于下面的代码 theurl = "https://%s:%s@members.dyndns.org/nic/update?hostname=%s&myip=%s&wildcard=NOCHG&mx=NOCHG&backmx=NOCHG" %(用户名、密码、主机名、ip)conn = urlopen(theurl) # 向url发送请求print(conn.read()) # 读取响应conn. ..
发布时间:2021-09-15 18:34:37 Python

python 3的urllib

python3中这段代码有问题: 导入 urllib.requestfhand=urllib.request.urlopen('http://www.py4inf.com/code/romeo.txt')打印(fhand.read()) 它的输出是: b'但是透过那扇窗户打破的光线是柔和的'b'这是东方,朱丽叶是太阳'b'升起美丽的太阳,杀死嫉妒的月亮'b'谁已经病了,悲痛得脸色苍白' 为 ..
发布时间:2021-09-15 18:34:34 Python

“发布"直接与服务器通信的方法

不久前刚开始使用python,我正在学习使用“post"方法直接与服务器通信.我现在正在编写的一个有趣的脚本是在 wordpress 上发表评论.该脚本确实在我的本地站点上发表评论,但我不知道为什么它会引发 HTTP 错误 404,这意味着找不到页面.这是我的代码,请帮我找出问题所在: 导入 urllib2导入 urlliburl='http://localhost/wp-comments-po ..
发布时间:2021-09-15 18:34:31 Python

使用 urllib 和 minidom 获取 XML 数据

我正在尝试从 XML 服务中获取数据……这个. http://xmlweather.vedur.is/?op_w=xml&type=forec&lang=is&view=xml&ids=1 我正在使用 urrlib 和 minidom,但似乎无法使其正常工作.我已经将 minidom 用于文件而不是 url. 这是我尝试使用的代码 xmlurl = 'http://xmlwea ..
发布时间:2021-09-15 18:34:28 Python

无缓冲的 urllib2.urlopen

我有用于 Web 界面的客户端,用于长时间运行的进程.我希望该过程的输出显示出来.与 urllib.urlopen() 配合使用效果很好,但它没有 timeout 参数.另一方面,使用 urllib2.urlopen() 输出被缓冲.有没有简单的方法可以禁用该缓冲区? 解决方案 我想到的一个快速技巧是使用 urllib.urlopen() 和 threading.Timer() 模拟超时. ..
发布时间:2021-09-15 18:34:25 Python

urllib.request: POST 数据应该是字节、可迭代的字节或文件对象

我需要访问一个 HTML 网站并在该网站上搜索图片.它可能不那么漂亮,但我可以访问该网站,我只需要一些有关搜索 IMG 的最佳方法的指导. 我试图把它当作一个文件,但我收到一个错误,提示我需要将数据转换为字节. 告诉我你的想法. 来自 urllib 导入请求进口重新website = request.urlopen('https://www.google.com', "rb")ht ..
发布时间:2021-09-15 18:34:22 Python

加速 urlib.urlretrieve

我正在从 Internet 下载图片,结果证明我需要下载大量图片.我正在使用以下代码片段的一个版本(实际上是循环访问我打算下载和下载图片的链接: 导入urlliburllib.urlretrieve(链接,文件名) 我每 15 分钟下载大约 1000 张图片,根据我需要下载的图片数量,这非常慢. 为了效率,我每 5 秒设置一个超时时间(仍然有很多下载持续时间更长): 导入套接字sock ..
发布时间:2021-09-15 18:34:19 Python

类型错误:无法连接“str"和“instance"对象(python urllib)

编写一个python程序,在使用urllib.urlopen函数时出现了这个错误. 回溯(最近一次调用最后一次): 中的文件“ChurchScraper.py",第 58 行html = GetAllChurchPages()文件“ChurchScraper.py",第 48 行,在 GetAllChurchPages 中CPs = CPs + urllib.urlopen(url)类型错误:无 ..
发布时间:2021-09-15 18:34:16 Python

在 Python 中重试连接前暂停

我正在尝试连接到服务器.有时我无法访问服务器,想在重试之前暂停几秒钟.我将如何在 Python 中实现暂停功能.这是我到目前为止所拥有的.谢谢. 为真:尝试:响应 = urllib.request.urlopen(http)除了 URLError 为 e:继续休息 我使用的是 Python 3.2 解决方案 这会阻塞线程 2 秒然后继续: 导入时间时间.sleep(2) ..
发布时间:2021-09-15 18:34:13 Python

计算网页内的单词

我需要使用 python3 计算网页中的单词.我应该使用哪个模块?网址库? 这是我的代码: def web():f =("urllib.request.urlopen("https://americancivilwar.com/north/lincoln.html")lu = f.read()打印(卢) 解决方案 通过下面的自我解释代码,您可以获得一个很好的起点来计算网页中的字数: ..
发布时间:2021-09-15 18:34:11 其他开发

在python中打印网页源代码

我想打印一个网页源代码,但 python 打印命令只打印空白空间,我认为这是因为它的尺寸很大.有没有办法在 shell 或文件中的列表中打印页面源代码?我曾尝试在文件中打印,但发生此错误: UnicodeEncodeError: 'charmap' codec can't encode character '\u06cc' in position 11826: character maps to ..
发布时间:2021-09-15 18:34:08 Python

将其中包含非 ASCII 符号的 Unicode 对象转换为字符串对象(在 Python 中)

我想发送要由在线服务翻译的中文字符,并返回生成的英文字符串.为此,我使用了简单的 JSON 和 urllib. 是的,我声明. # -*- 编码:utf-8 -*- 在我的代码之上. 现在,如果我向 urllib 提供字符串类型对象,则一切正常,即使该对象包含 Unicode 信息.我的函数叫做translate. 例如: stringtest1 = '风景的美丽'打印翻译 ..
发布时间:2021-09-15 18:33:59 Python

从 URL 中获取前 n 个字节

是否可以只从某个 URL 获取一些字节,然后关闭与 urllib/urllib2 的连接?或者甚至可能是从第 n 个字节到第 k 个字节的一部分?那边有一个页面,我不需要加载整个页面,只需要加载其中的一部分. 解决方案 可以设置Range头来请求一定范围的字节,但是您依赖服务器来满足请求: 导入 urllib2req = urllib2.Request('http://www.pytho ..
发布时间:2021-09-15 18:33:56 Python

将python字节类型更改为字符串

我正在使用 python 来玩 stackoverflow API.我运行以下命令: f = urllib.request.urlopen('http://api.stackoverflow.com/1.0/stats')d = f.read() d 的类型是“字节"类,如果我打印它,它看起来像: b'\x1f\x8b\x08\x00\x00\x00 .... etc 我尝试了 d=f.r ..
发布时间:2021-09-15 18:33:53 Python