对于抓取数据，您如何导航到您创建的链接？那么，如何从新页面中抓取数据？

问题描述

这是我创建的示例代码。我已经能够创建一个新链接，但我很困惑如何跟随该链接并从跟随的链接中抓取数据。

library(tidyverse)
library(rvest)
library(xml2)

url<-"https://www.indeed.com/jobs?q=data%20analyst&l=San%20Diego%2C%20CA&vjk=0c2a6008b4969776"
page<-xml2::read_html(url)#function will read in the code from the webpage and break it down into different elements (<div>,<span>,<p>,etc.

#get job title
title<-page %>%
  html_nodes(".jobTitle") %>%
  html_text()
  
#get company Location
loc<-page %>%
  html_nodes(".companyLocation") %>%
  html_text()

#job snippet
page %>%
  html_nodes(".job-snippet") %>%
  html_text()

#Get link 
desc<- page %>%
  html_nodes("a[data-jk]") %>%
  html_attr("href") 

# Create combine link 
combined_link <- paste("https://www.indeed.com",desc,sep="")

如何跟踪组合链接并从新页面中抓取数据，是否可以在不使用功能的情况下进行？

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

r r web-scraping web-scraping-language

对于抓取数据，您如何导航到您创建的链接？那么，如何从新页面中抓取数据？

问题描述

解决方法

相关问答