问题描述
我正在尝试抓取一个特别麻烦的网站。尽管所有参数都匹配并且引用匹配,但我在 perl 运行它时看到的结果与我查看开发工具时看到的结果不同。
当我从开发工具执行 copy-as-curl 时,我无法确认是否相同的唯一标题是 -H 'Cookie:
及其内容。运行该 curl 命令会给我正确的结果,就像我在浏览器中收到的一样。
那么,我使用 WWW::Mechanize 的什么语法来明确设置 cookie 的值,而不是让 Mechanize 根据过去的获取/发布为我做这件事?
另外,我如何查看它想要将 cookie 的值设置为什么?
解决方法
要检查从 WWW::Mechanize 请求返回的 cookie,请使用以下命令:
my $cookie_jar = $mech->cookie_jar; # returns a HTTP::Cookies object
print $cookie_jar->as_string,"\n”;
要设置一个 cookie 以供 WWW::Mechanize 在请求中使用,您需要执行以下操作:
$mech->cookie_jar->set_cookie(-name=>'YourCookieName',-value=>'YourCookieValue',-host=>'www.your website.com',-expires=>'Sun,31 Jan 2021 18:45:47 GMT',-path=>'/'
-secure=>'false');
有关其他有用的方法,请参阅 HTTP::Cookies 文档。