urlopen相关内容

告诉 urllib2 使用自定义 DNS

我想告诉 urllib2.urlopen(或自定义开启器)使用 127.0.0.1(或 ::1) 来解析地址.但是,我不会更改我的 /etc/resolv.conf. 一种可能的解决方案是使用dnspython 之类的工具来查询地址,使用httplib 之类的工具来构建自定义网址开启器.不过,我更愿意告诉 urlopen 使用自定义名称服务器.有什么建议吗? 解决方案 看起来名称解析 ..
发布时间:2022-01-04 13:48:27 Python

防止“隐藏"在 Python 中使用 urlopen() 重定向

我正在使用 BeautifulSoup 进行网页抓取,并且在使用 urlopen 时遇到特定类型网站的问题.网站上的每个项目都有自己独特的页面,并且项目有不同的格式(例如:500 mL、1L、2L...). 当我使用 Internet 浏览器打开产品的 URL (www.example.com/product1) 时,我会看到一张 500 mL 格式的图片,以及有关它的信息 (价格、数量、风 ..
发布时间:2021-12-23 20:46:22 Python

在 Python 中解析 HTTP 响应

我想操作 THIS 网址中的信息.我可以成功打开它并阅读其内容.但我真正想做的是把我不想要的东西都扔掉,把我想保留的东西操纵起来. 有没有办法将字符串转换为 dict 以便我可以迭代它?还是我只需要按原样解析它(str 类型)? from urllib.request import urlopenurl = 'http://www.quandl.com/api/v1/datasets/FR ..
发布时间:2021-11-15 00:43:21 其他开发

python urllib2 urlopen 响应

python urllib2 urlopen 响应: > 预期: {"token":"mYWmzpunvasAT795niiR"} 解决方案 您需要将生成的类文件对象绑定到一个变量,否则解释器只会通过 repr 转储它: >>>导入 urllib2>>>urllib2.urlopen('http://www.google.com') ..
发布时间:2021-09-15 18:38:21 Python

Python 2.6 之前版本中 urllib2.urlopen() 的超时

urllib2 文档 表示添加了 timeout 参数在 Python 2.6 中.不幸的是,我的代码库一直在 Python 2.5 和 2.4 平台上运行. 有没有其他方法可以模拟超时?我想要做的就是让代码在固定的时间内与远程服务器通话. 也许有任何替代的内置库?(不想安装 3rd 方,比如 pycurl) 解决方案 您可以使用以下方法为所有套接字操作(包括 HTTP 请求) ..
发布时间:2021-09-15 18:37:31 Python

urllib2.urlopen() 是否缓存东西?

他们在python文档中没有提到这一点.最近我正在测试一个网站,只是使用 urllib2.urlopen() 刷新网站以提取某些内容,我注意到有时当我更新网站时 urllib2.urlopen() 似乎没有获得新添加的内容.所以我想知道它是否在某处缓存了东西,对吧? 解决方案 所以我想知道它会在某处缓存东西,对吗? 它没有. 如果您没有看到新数据,这可能有很多原因.大多数大 ..
发布时间:2021-09-15 18:37:11 Python

HTML 数据对 urllib 隐藏

如何从该页面获取真实内容:http://kursuskatalog.au.dk/da/course/74960/105E17-Demokrati-og-diktatur-i-komparativt-perspektiv 我从下面的代码中得到的只是一些指向 javascript 和 CSS 文件的链接.有没有办法解决这个问题? from urllib.request import urlop ..
发布时间:2021-09-15 18:35:06 Python

Python urllib 冻结特定 URL

我正在尝试获取一个页面并且 urlopen 挂起并且从不返回任何内容,尽管该网页非常轻巧并且可以使用任何浏览器打开而没有任何问题 导入 urllib.request使用 urllib.request.urlopen("http://www.planalto.gov.br/ccivil_03/_Ato2007-2010/2008/Lei/L11882.htm") 作为响应:打印(响应.读()) ..
发布时间:2021-09-15 18:34:45 Python

Python:Urllib.urlopen 非数字端口

对于下面的代码 theurl = "https://%s:%s@members.dyndns.org/nic/update?hostname=%s&myip=%s&wildcard=NOCHG&mx=NOCHG&backmx=NOCHG" %(用户名、密码、主机名、ip)conn = urlopen(theurl) # 向url发送请求print(conn.read()) # 读取响应conn. ..
发布时间:2021-09-15 18:34:37 Python

无缓冲的 urllib2.urlopen

我有用于 Web 界面的客户端,用于长时间运行的进程.我希望该过程的输出显示出来.与 urllib.urlopen() 配合使用效果很好,但它没有 timeout 参数.另一方面,使用 urllib2.urlopen() 输出被缓冲.有没有简单的方法可以禁用该缓冲区? 解决方案 我想到的一个快速技巧是使用 urllib.urlopen() 和 threading.Timer() 模拟超时. ..
发布时间:2021-09-15 18:34:25 Python

使用 urlopen 打开 url 列表

我有一个 Python 脚本,可以获取网页并对其进行镜像.它适用于一个特定的页面,但我无法让它在多个页面上工作.我假设我可以将多个 URL 放入一个列表中,然后将其提供给函数,但我收到此错误: 回溯(最近一次调用最后一次): 中的文件“autowget.py",第 46 行获取网址()文件“autowget.py",第 43 行,在 getUrl 中响应 = urllib.request.url ..
发布时间:2021-09-15 18:33:47 Python

为什么 urllib.urlopen.read() 与源代码不对应?

我正在尝试获取以下网页: 导入urlliburllib.urlopen("http://www.gallimard-jeunesse.fr/searchjeunesse/advanced/(order)/author?catalog[0]=1&SearchAction=1").read() 结果与我使用谷歌浏览器检查网页源代码时看到的不符. 你能告诉我为什么会发生这种情况以及我如何改进我 ..
发布时间:2021-09-15 18:32:15 Python