Xpath中的BeautifulSoup表达式等效于什么?

问题描述

我正在尝试使用scrapy和BeautifulSoup刮擦link,但是由于某种原因,BeautifulSoup不能在蜘蛛中工作,它只能在刮擦的外壳中工作。我知道这听起来很傻,但是,如何将其转换为Xpath?

soup.find('li',{'class': 'at-listing__list-icons_location'})

我尝试过

response.xpath('//li[contains(text(),"at-listing__list icons_location")]/../descendant::text()').extract()

请参阅my other question,其中包含了我尝试使用splash和BeautifulSoup使事情正常运行的日志,但到目前为止所有尝试均失败。

解决方法

我想您正在尝试获取3个值“Süddeutschland”,“ Feste Anstellung”和“ Vollzeit”? 在这种情况下,下面的xpath对我有用:

response.xpath('//*[has-class("at-listing__list-icons_location")]/../descendant::text()').extract()

我认为您的xpath中的问题是您正在尝试在文本中查找值“ at-listing__list icons_location”,而不是类。

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...