问题描述
我正在尝试解析以下HTML
,以便通过使用jsoup
到达我在下面标记的链接:
为此,我执行了以下操作:
Document doc = Jsoup.parse( url );
Elements links = doc.select(".list-item-wrapper").select(".list-item")----> HERE IM STUCK
我会继续使用:
doc.select(".list-item-wrapper").select(".list-item").select(#SEARCH_RESULT_RECORDID_dedupmrg914683993).select()....
但是问题在于_dedupmrg914683993
在每个页面之间都被更改。
我也尝试过:
doc.select(".list-item-wrapper").select(".list-item").select(.list-item-primary-content result-item-primary-content layout-row).select()....
但是我得到了0个结果。
如何解析它,以便最终到达<img class="main-img fan-img-1"...>
内部的链接?
谢谢
解决方法
您可以搜索任何属性上的字符串匹配项,如果您的ID始终以SEARCH_RESULT_RECORDID字符串开头,则可以使用以下语法查找它
doc.select(".list-item-wrapper").select(".list-item").select('[id^=SEARCH_RESULT_RECORDID]').select()....
我假设选择器正在使用jquery方案