问题描述
我正在尝试使用scrapy和BeautifulSoup刮擦link,但是由于某种原因,BeautifulSoup不能在蜘蛛中工作,它只能在刮擦的外壳中工作。我知道这听起来很傻,但是,如何将其转换为Xpath?
soup.find('li',{'class': 'at-listing__list-icons_location'})
我尝试过
response.xpath('//li[contains(text(),"at-listing__list icons_location")]/../descendant::text()').extract()
请参阅my other question,其中包含了我尝试使用splash和BeautifulSoup使事情正常运行的日志,但到目前为止所有尝试均失败。
解决方法
我想您正在尝试获取3个值“Süddeutschland”,“ Feste Anstellung”和“ Vollzeit”? 在这种情况下,下面的xpath对我有用:
response.xpath('//*[has-class("at-listing__list-icons_location")]/../descendant::text()').extract()
我认为您的xpath中的问题是您正在尝试在文本中查找值“ at-listing__list icons_location”,而不是类。