Jsoup connectURL获取编码

问题描述

使用Jsoup连接到URL时遇到一些问题,我无法设置HTML的编码,标记中的文本仅显示为“?”。我已经在论坛和文档中进行了详尽的搜索,但是我无法提出任何可行的解决方案。

这是运行Jsoup connect时出现问题的HTML部分之一

Accent issue

运行连接时的结果是:

Printed HTML

如果我尝试使用解析器,则会收到以下消息:“请启用JavaScript以查看页面内容

如在stackoverflow中的某些线程中所述,我更改了输出编码以检查问题是否出在此,但结果是相同的。我尝试将内容保存到正确的iso中的文件中,但效果不佳,并带有问号。

我正在使用的代码段非常简单,因为我只是尝试获取HTML:

Document doc = Jsoup.connect(a)
        .header("Content-Type","application/x-www-form-urlencoded")
        .postDataCharset("ISO-8859-1") // tried other encodings but no success as well,same output
        .get();

System.out.println(doc);

在使用Jsoup的 connect()。get()之前,有人遇到过这个问题吗?

更新

使用其他网站不会出现此问题:

String a = "https://flatschart.com/html5/descricao.html";
        
Document doc = Jsoup.connect(a)
        .header("Content-Type","application/x-www-form-urlencoded")
        .postDataCharset("ISO-8859-1")
        .get();
        
System.out.println(doc);

Output

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)