问题描述
所以我好几天都一团糟。我正在抓取一个网站以获取特定信息。问题是该网站有两个CSS类,但名称相同。我想使用第一个CSS类中的链接和文本。附件是我所拥有的图像。我只想使用1中的href值,而不要使用两个“区域”中的href值。
const cheerio = require('cheerio');
const axios = require("axios");
const siteUrl = "https://worldpostalcode.com/nigeria/abia/";
const fetchData = async () => {
const result = await axios.get(siteUrl);
return cheerio.load(result.data);
};
const getData = async (html) => {
const stateList = []
const $ = await fetchData();
const stateUrl = $('.regions',html);
//console.log(stateUrl.length)
console.log(stateUrl.length)
for (let index = 0; index < 1; index++) {
let firstRegion = $(stateUrl[index],'a')
stateList.push(firstRegion)
}
console.log(stateList)
}
getData()
请帮助
解决方法
我将使用以前的h2文本:
$('h2:contains(Regions) + div.regions a')