wget - segmentfault可以被站点镜像?

查看:115
本文介绍了wget - segmentfault可以被站点镜像?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

我发现这个命令,可以每隔两秒,以断点重续的方式镜像站点 https://segmentfault.com/
wget -c -w 2 -m https://segmentfault.com/

镜像一个站点有两种方式:
1。获得整个网站的目录结构
2。通过网页链接的方式进行遍历。

先谈方式1。
目前的apache服务器,默认开启了禁止站点目录list的功能。
外部访问者在默认情况下,无法list这个站点的目录结构。

再谈方式2。
wget 先下载第一个网页 index.html之类,然后通过递归的方式,将说有可以找到的链接全部下载。

我用wget -c -w 2 -m https://segmentfault.com/ ,运行了十几秒后的结果。

请问:wget获得了部分网页,是通过方式2获得的吧?还是wget有办法突破apache禁止列目录的功能?

解决方案

方式2。

-m等价于-r -N -l inf --no-remove-listing,其中的-r就是递归。

其实目录list也是递归。

这篇关于wget - segmentfault可以被站点镜像?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆