手动登录,因为之后会进行reCaptcha进行网络抓取

问题描述

我想用reCaptcha保护的登录表单后面的整个网站(用AngularJS编写)。刮板应从http://sub.example.com/contents/pt/table-of-contents开始,保存页面,然后一次又一次地浏览内容中的所有链接。但是当我们未经身份验证时,网站会将我们重定向https://example.com/user/login?url=http://sub.example.com/,以便首先登录

我在IDM(Internet下载管理器)中使用了“站点抓取器”,但是它太老了,无法带我通过。它显示脚本错误,因为它无法加载jQuery。

我还品尝了PhantomJS,SlimerJS和httrack,但似乎他们无法显示登录表单,等待我手动解决验证码。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)