wget“镜像” pdf链接到不同的域 [英] wget "mirroring" pdf linked to different domain

查看:86
本文介绍了wget“镜像” pdf链接到不同的域的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

网页包含链接到pdf (请注意不同的域)。

Webpage contains a link to a pdf (note the different domains).

我可以使用wget直接下载pdf,但似乎无法识别正确的wget命令行选项来镜像包含此链接pdf的网页。我尝试使用选项的组合,例如

I can use wget to directly download the pdf, but cannot seem to identify the correct wget command line options to "mirror" the webpage including this linked pdf. I tried to use combinations of options like


  • -p

  • -跨主机

  • -D

  • -接受

  • -p
  • --span-hosts
  • -D
  • --accept

可以使用wget(或其他命令行工具)下载链接的pdf-s吗?

Can wget (or some other command line tool) be used to download linked pdf-s?

谢谢

推荐答案

虽然在浏览器中显示了pdf链接,但是页面源不包含下载链接。因此, wget 不能看到/关注该链接,因为它并不能真正处理该页面。

While the pdf link is shown in browsers, the page source does not contain the download link. So wget does not get to see/follow the link, as it doesn't really "process" the page.

这篇关于wget“镜像” pdf链接到不同的域的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆