wget相关内容

如何在 post 变量中使用 wget 发布文件内容?

我有一个非常简单的 php 脚本: 我正在尝试使用 wget 发布本地文件 (unix) 的内容. wget --post-data='operation=upload' --post-file myfile 似乎发布但未附加到任何“字段". 我该怎么做? 解决方案 你真的需要 wget 吗?实际上,在阅读 wget 手册页时... wget 无法执行您希望它执行的操作. ..
发布时间:2021-09-24 20:11:54 PHP

使用 wget 伪造浏览器?

我想抓取一个网站以构建其站点地图. 问题是,该站点使用 htaccess 文件来阻止蜘蛛,因此以下命令仅下载主页(index.html)并停止,尽管它确实包含指向其他页面的链接: wget -mkEpnp -e robots=off -U Mozilla http://www.acme.com 由于我使用浏览器访问网站的其余部分没有问题,因此我认为“-e robots=off -U Mo ..
发布时间:2021-09-24 20:11:51 其他开发

Wget:如果文件已经存在就跳过下载?

如果文件存在于 wget 中,则跳过下载? 的答案使用 -nc 或 --no-clobber,但 -nc 不会阻止 HTTP 请求的发送和随后的下载文件.如果文件已经被完全检索,它在下载文件后不会做任何事情.如果文件已经存在,是否有办法阻止发出 HTTP 请求? 我安装了 wget 1.16.3 使用自制软件.运行下面的命令后,wget 对每个已经存在的文件说make HTTP reques ..
发布时间:2021-09-24 20:11:48 其他开发

使用 wget 从谷歌驱动器下载文件

我想将在这个地址可见的文件下载到一个 linux 远程: https://drive.google.com/file/d/0Bz7KyqmuGsilT0J5dmRCM0ROVHc/view?usp=sharing 我希望我可以用 wget 做到这一点. 我试过了 wget https://drive.google.com/file/d/0Bz7KyqmuGsilT0J5dmRC ..
发布时间:2021-09-24 20:11:45 其他开发

wget - 下载子目录

如何使用 wget 仅下载子目录?我可以指定我需要下载的子目录吗? 谢谢! 解决方案 您可以: wget -r -l1 --no-parent http://www.domain.com/subdirectory/ 哪里: -r:递归检索-l1:设置最大递归深度为1--no-parent:不上升到父级;仅从指定的子目录和向下层次结构下载 ..
发布时间:2021-09-24 20:11:42 其他开发

带有用户名和密码的 HTTPS 的正确 wget 命令语法是什么?

我想使用 wget 通过此 URL 远程下载文件: https://test.mydomain.com/files/myfile.zip 站点 test.mydomain.com 需要登录.我想使用此命令在我的另一台服务器中下载该文件,但它不起作用(未完全下载文件): wget --user=myusername --password=mypassword https://test.mydo ..
发布时间:2021-09-24 20:11:39 其他开发

如何仅镜像网站的一部分?

我无法让 wget 镜像网站的一部分(根目录下的文件夹路径) - 它似乎只能在网站主页上工作. 我尝试了很多选择 - 这是一个例子 wget -rkp -l3 -np http://somewebsite/subpath/down/here/ 虽然我只想镜像该 URL 下方的内容链接 - 我还需要下载不在该路径中的所有页面资产. 主页 (/) 似乎工作正常,但我无法为任何子文件夹使 ..
发布时间:2021-09-24 20:11:36 其他开发

为什么wget只下载某些网站的index.html?

我正在尝试使用 wget 命令: wget -p http://www.example.com 获取主页上的所有文件.对于某些网站,它可以工作,但在大多数情况下,它只下载 index.html.我试过 wget -r 命令,但它不起作用.有谁知道如何获取页面上的所有文件,或者只是给我一个页面上的文件列表和相应的网址? 解决方案 Wget 还可以下载整个网站.但是因为这会给服务器带来沉重 ..
发布时间:2021-09-24 20:11:33 其他开发

检查 wget 的返回值

我正在编写一个脚本来下载一堆文件,我希望它在某个特定文件不存在时发出通知. r=`wget -q www.someurl.com`如果 [ $r -ne 0 ]然后回声“不在那里"否则回声“好"菲 但它在执行时出现以下错误: ./file: line 2: [: -ne: 期望的一元运算符 怎么了? 解决方案 $r 是 wget 的文本输出(您用反引号捕获了它).要访问返回 ..
发布时间:2021-09-24 20:11:31 其他开发

如何用wget指定下载位置?

我需要将文件下载到/tmp/cron_test/.我的 wget 代码是 wget --random-wait -r -p -nd -e robots=off -A".pdf" -U mozilla http://math.stanford.edu/undergrad/ 那么是否有一些参数来指定目录? 解决方案 来自手册页: -P 前缀--directory-prefix=前缀将目录 ..
发布时间:2021-09-24 20:11:28 其他开发

给定 wget 命令的 Python 等价物

我正在尝试创建一个与此 wget 命令执行相同操作的 Python 函数: wget -c --read-timeout=5 --tries=0 "$URL" -c - 如果下载中断,则从上次中断的地方继续. --read-timeout=5 - 如果超过 5 秒没有新数据传入,则放弃并重试.给定 -c 这意味着它会从它停止的地方再次尝试. --tries=0 - 永远重试. ..
发布时间:2021-09-24 20:11:25 Python

如何并行化文件下载?

我可以一次下载一个文件: 导入 urllib.requesturls = ['foo.com/bar.gz', 'foobar.com/barfoo.gz', 'bar.com/foo.gz']对于 url 中的你:urllib.request.urlretrieve(u) 我可以尝试这样subprocess: 导入子流程导入操作系统def parallelized_commandline( ..
发布时间:2021-09-24 20:11:22 Python

如何使用 Wget 从 URL 将所有图像下载到单个文件夹中?

我正在使用 wget 从网站下载所有图像,它工作正常,但它存储了站点的原始层次结构以及所有子文件夹,因此图像散布在周围.有没有办法让它只将所有图像下载到一个文件夹中?我目前使用的语法是: wget -r -A jpeg,jpg,bmp,gif,png http://www.somedomain.com 解决方案 试试这个: wget -nd -r -P/save/location -A j ..
发布时间:2021-09-24 20:11:19 其他开发

如何使用 Wget 跳过登录页面?

我正在尝试使用 Wget 下载页面,但我无法通过登录屏幕. 如何使用登录页面上的帖子数据发送用户名/密码,然后以经过身份验证的用户身份下载实际页面? 解决方案 基于手册页: # 登录服务器.这只需要做一次.wget --save-cookies cookies.txt \--keep-session-cookies \--post-data 'user=foo&password=b ..
发布时间:2021-09-24 20:11:16 其他开发

使用 wget 调用 Web 服务

我可以使用 CURL 从 Linux 命令行调用 Web 服务.现在我正在尝试使用 wget 来调用 Web 服务,但我总是收到以下错误:500 内部服务器错误. 我使用以下语法: wget http://--post-file=soapRequest.xml --header="Content-Type: application/soap+xml" --output-document=s ..
发布时间:2021-09-24 19:15:48 其他开发

带有“wget"方法并指定额外 wget 选项的 R download.file

我有一个关于在 R 中使用 wget 选项和使用一些 wget 额外选项在 R 中使用 download.file 函数的可能相当基本的问题,但我不能让它工作. 我想要做的是:下载一个网页的本地副本(实际上是几个网页,但目前的挑战是即使只有 1 个网页也能正常工作). 挑战:我需要本地副本看起来与在线版本完全一样,这也意味着包含链接/图标等.我发现 wget 是一个很好的工具,我想指定 ..
发布时间:2021-09-24 18:51:46 其他开发

是否有任何 javascript(和客户端)wget 实现?

为了向网站管理员提供服务,我需要下载他们网站的公共部分.我目前在我的服务器上使用 wget 来做这件事,但它引入了很多负载,我想把那部分移到客户端. JavaScript 中是否存在 wget 的实现? 如果存在,我可以压缩文件并将它们发送到我的服务器进行处理,这样我就可以专注于应用的核心业务. 我知道 Js 中存在一些压缩库(例如 zip.js),但我无法找到 wget 对应项 ..
发布时间:2021-09-22 20:31:43 前端开发

相当于Python中的wget下载网站和资源

2.5 年前在 在 Python 中下载网页及其所有资源文件,但没有得到答案,并且“请参阅相关主题"并不是真正在问同样的事情. 我想下载页面上的所有内容,以便仅从文件中查看. 命令 wget --page-requisites --domains=DOMAIN --no-parent --html-extension --convert-links --restrict-file ..
发布时间:2021-09-22 20:28:33 Python

通过 wget 命令抓取 sitemap.xml 的链接

我尝试抓取 sitemap.xml 的所有链接以重新缓存网站.但是 wget 的递归选项不起作用,我只能得到响应: 远程文件存在但不包含任何链接 - 无法检索. 但可以肯定的是,sitemap.xml 充满了“http://..."链接. 我几乎尝试了 wget 的所有选项,但没有任何效果: wget -r --mirror http://mysite.com/sitemap. ..
发布时间:2021-09-22 20:28:24 其他开发

用 Python 下载网页及其所有资源文件

我希望能够使用 Python 下载页面及其所有相关资源(图像、样式表、脚本文件等).我(有点)熟悉 urllib2 并且知道如何下载单个 url,但是在我开始在 BeautifulSoup + urllib2 上进行黑客攻击之前,我想确保还没有等效于“wget --page-requisites http://www.google.com". 我特别感兴趣的是收集有关下载整个网页(包括所有资 ..
发布时间:2021-09-15 18:37:39 Python