wget - segmentfault可以被站点镜像?
本文介绍了wget - segmentfault可以被站点镜像?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
问 题
我发现这个命令,可以每隔两秒,以断点重续的方式镜像站点 https://segmentfault.com/
wget -c -w 2 -m https://segmentfault.com/
镜像一个站点有两种方式:
1。获得整个网站的目录结构
2。通过网页链接的方式进行遍历。
先谈方式1。
目前的apache服务器,默认开启了禁止站点目录list的功能。
外部访问者在默认情况下,无法list这个站点的目录结构。
再谈方式2。
wget 先下载第一个网页 index.html之类,然后通过递归的方式,将说有可以找到的链接全部下载。
我用wget -c -w 2 -m https://segmentfault.com/ ,运行了十几秒后的结果。
请问:wget获得了部分网页,是通过方式2获得的吧?还是wget有办法突破apache禁止列目录的功能?
解决方案
方式2。
-m
等价于-r -N -l inf --no-remove-listing
,其中的-r
就是递归。
其实目录list也是递归。
这篇关于wget - segmentfault可以被站点镜像?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文