如何完成一个网页的资源抓取?

问题描述

我想要一个包含所有资源(.css、.html、.favicon、,js 等...)的网页

目前,我正在使用此命令来执行此操作。

wget -E -H -k -K -e robots=off -p https://example.com -P ./myDir

但是,在某些页面上,下载的文件夹缺少文件

例如,这是一个网站模板,没有 .html 文件

wget -E -H -k -K -e robots=off -p https://nicepage.com/html-templates/preview/zero-waste-166766?device=desktop -P ./myDir

您知道抓取网页的更好方法吗?我正在使用 node.js,所以你也可以告诉我一些 node.js 包。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)