linux – wget递归下载,但我不想关注所有链接

我正在尝试使用wget镜像一个网站,但我不想下载大量文件,所以我使用wget的–reject选项来保存所有文件.但是wget仍然会下载所有文件,然后如果它与我的拒绝选项匹配则删除该文件.

有没有办法告诉wget如果匹配某些shell通配符不遵循某些链接?如果wget无法做到这一点,是否有其他常见的linux命令可以做到这一点?

解决方法

您也可以尝试 HTTrack,IMO,更灵活,更直观的包含/排除逻辑.这样的东西……
httrack "https://example.com" -O ExampleMirrorDirectory \
"-*" \
"+https://example.com/images/*" \
"-*.swf"

规则将按顺序应用,并将覆盖以前的规则……

>排除一切
>但包括https://example.com/images/ *>但排除以swf结尾的任何内容

相关文章

linux常用进程通信方式包括管道(pipe)、有名管道(FIFO)、...
Linux性能观测工具按类别可分为系统级别和进程级别,系统级别...
本文详细介绍了curl命令基础和高级用法,包括跳过https的证书...
本文包含作者工作中常用到的一些命令,用于诊断网络、磁盘占满...
linux的平均负载表示运行态和就绪态及不可中断状态(正在io)的...
CPU上下文频繁切换会导致系统性能下降,切换分为进程切换、线...