Rvest'ing 在 R

问题描述

我的目标是从其中一个网站获取天气数据。我(在一些堆栈用户的帮助下,谢谢) 已经创建了包含 1440 个链接的列表的向量,并决定尝试使用“for”循环来迭代它们。 另外,每个页面都有每周的天气,所以我必须获得 7 行数据(每天一个),标记为 num0/num1/num2/num3。

这就是我想出的:

Links <- #here are the 1440 links i need to iterate over
library("rvest")
for (index in seq(from=1,to=length(Links),by=1)) {
  link = paste(Links[index])
  for (num in 0:7) {
  node_date <-paste(".num",num," .date",sep="")
  node_conditions<-paste(".num"," .cond span",sep="") 
#here I tried to create an 'embeded for loop' to iterate 7 times over varIoUs nodes consisting data
  page = read_html(link)
  DayOfWeek = page %>% html_nodes(node_date) %>% html_text()
  Conditions = page %>% html_nodes(node_conditions) %>% html_text()

    
}
} 

现在我收到一个错误

命令'open.connection(x,"rb")'中的错误:HTTP 错误 502

我真的很困惑我现在应该做什么。

还有其他方法可以实现这个目标吗?或者我在这方面犯了一些新手错误

先谢谢你!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)