如何根据班级名称的开头进行网页抓取?

问题描述

如何找到所有以特定字符串开头的类名称的元素?

我知道Cheerio可以做$(".item")之类的事情来获得具有该确切类名的事物。而且我知道您可以执行$("*:contains('hello')")获取内容中包含该字符串的所有元素。

但是如何根据部分类名进行过滤?

我的第一个想法是先刮掉所有的“ div”,然后再应用过滤器函数,但这似乎效率不高(还是没有?这是它会做什么吗?)我正在寻找类似{{1 }}

我看着这个问题Extract class name in scrapy,看来您可以使用$("div:classstartsWith('ItemBox_')")在python中完成它。 javascript和cheerio中的等效功能是什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)