wget“镜像” pdf链接到不同的域 [英] wget "mirroring" pdf linked to different domain
本文介绍了wget“镜像” pdf链接到不同的域的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
Webpage contains a link to a pdf (note the different domains).
我可以使用wget直接下载pdf,但似乎无法识别正确的wget命令行选项来镜像包含此链接pdf的网页。我尝试使用选项的组合,例如
I can use wget to directly download the pdf, but cannot seem to identify the correct wget command line options to "mirror" the webpage including this linked pdf. I tried to use combinations of options like
- -p
- -跨主机
- -D
- -接受
- -p
- --span-hosts
- -D
- --accept
无
可以使用wget(或其他命令行工具)下载链接的pdf-s吗?
Can wget (or some other command line tool) be used to download linked pdf-s?
谢谢
推荐答案
虽然在浏览器中显示了pdf链接,但是页面源不包含下载链接。因此, wget
不能看到/关注该链接,因为它并不能真正处理该页面。
While the pdf link is shown in browsers, the page source does not contain the download link. So wget
does not get to see/follow the link, as it doesn't really "process" the page.
这篇关于wget“镜像” pdf链接到不同的域的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文