如何镜像MOSS抄袭检测的结果？

MOSS 是著名的软件抄袭检查服务器。它允许教师发送作业提交，计算不同提交之间的相似度，并为非常相似的代码块着色。 Here is an example of the results of the comparison。如您所见，它非常简单：它包含一个带有可疑文件索引的 HTML 文件，并包含指向特定 HTML 文件的链接以供比较。

结果会在 MOSS 网站上保存两周。我想将所有结果下载到我的计算机中，以便以后查看。我使用this command on Linux：

wget -mkEpnp http://moss.stanford.edu/results/5/7683916027631/index.html

我得到的是以下内容：

如您所见，仅下载了 index.html 文件。从 index.html 链接的其他文件，例如match0.html 和 match1.html，未下载。

我尝试使用不同的工具 - Web httrack 镜像同一个网站 - 但得到了完全相同的结果 - 只有索引文件被镜像，而不是 match 文件。

HTML 看起来很简单，所以我无法弄清楚为什么镜像不起作用。我该怎么做才能正确反映结果？

附言如果相关，robots.txt 文件包含以下内容：

User-agent: *
disallow: /

你需要忽略robots.txt文件例如

如何镜像MOSS抄袭检测的​​结果？