使用更改div ID解析html

问题描述

我正在尝试解析以下HTML,以便通过使用jsoup到达我在下面标记链接

enter image description here

为此,我执行了以下操作:

Document doc = Jsoup.parse( url );
Elements links = doc.select(".list-item-wrapper").select(".list-item")----> HERE IM STUCK

我会继续使用:

doc.select(".list-item-wrapper").select(".list-item").select(#SEARCH_RESULT_RECORDID_dedupmrg914683993).select()....

但是问题在于_dedupmrg914683993在每个页面之间都被更改。

我也尝试过:

doc.select(".list-item-wrapper").select(".list-item").select(.list-item-primary-content result-item-primary-content layout-row).select()....

但是我得到了0个结果。

如何解析它,以便最终到达<img class="main-img fan-img-1"...>内部的链接

谢谢

解决方法

您可以搜索任何属性上的字符串匹配项,如果您的ID始终以SEARCH_RESULT_RECORDID字符串开头,则可以使用以下语法查找它

doc.select(".list-item-wrapper").select(".list-item").select('[id^=SEARCH_RESULT_RECORDID]').select()....

我假设选择器正在使用jquery方案