防止HtmlUnit 2.13执行JavaScript

这是我的代码获取页面
WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage(url);

问题是webClient总是自动执行javascript,并给我一个错误列表.我只想得到原始来源.如何防止它执行脚本?我发现在版本2.9中有一种方法

webClient.setJavaScriptEnabled(false);

但是不建议使用setJavaScriptEnabled()函数.有谁知道如何解决这个问题?请帮帮我.非常感谢.

解决方法

尽管setJavaScriptEnabled(boolean)已被弃用,但已添加到WebClient的WebClientOptions成员.这是 doc.

为了禁用JavaScript,您应该这样做:

webClient.getoptions().setJavaScriptEnabled(false);

另外,如果你想从网页上获取原始的HTML代码,你应该看看这个问题:

How to get the pure HTML of a page with HTMLUnit while ignoring scripts and other contents

考虑到即使是asXml()方法也可以更改格式以及您获取的网页的内容(即使JavaScript被禁用).

相关文章

Mip是什么意思以及作用有哪些
怎么测试Mip页面运行情况
MIP安装的具体步骤有哪些
HTML添加超链接、锚点的方法及作用详解(附视频)
MIP的规则有哪些
Mip轮播图组件中的重要属性讲解