审查R中的代码,基于特定名称从网站下载图片的问题

问题描述

R 中,我尝试根据 ICO 的 URL 和 CEO 的姓名从 ICOBench.com 网站下载 CEO 的个人资料图片。 我在 excel file (5Cx5L) 中有基本信息,如下所示:

col1 = ref col2 = nameICO col3 = token col4 = URL col5 = CEO 
第一行的

示例

1 
Max Crowdfund
MPG
https://icobench.com/ico/max-crowdfund
mark lloyd

在这里尝试做的是:

excel 文件中查找 ICO URL,进入团队网页,找到 CEO(根据文件中的名称),然后将其图片下载到我的计算机上。

我尝试了下面的 code(我应该说是混合代码:-),我访问了网页并“检查” 以查找参数。但也许我错过了 "href" 参数?

虽然它似乎没有错误,但它并没有那么清楚地下载任何图片,这不是我想让他做的:-/

您将在下面看到,不是每次都告诉 R 去查找每一行的名称,而是将其缩小到与 CEO Mark Lloyd 合作的第一个 ICO。主要是因为我还没到名字的查找部分...

请问,有人可以帮忙吗? 我采用了这种方法,但我认为还有其他方法可以做到这一点,所以真的 欢迎任何提示,也在 Python(如果更好?)

谢谢!

代码

icoss <- read_excel(input_file)

 for(i in 1:nrow(icoss)){
 dir.create(paste("file_path_computer",icoss[i,1],"/",sep = ""))

  urls <- as.character(icoss[i,4])
 teamm <- read_html(paste(urls,"/team",sep = ""))
 teamm <- html_nodes(teamm,".row")

  a <- paste(((as.character(teamm[3:length(teamm)-2]))),collapse =  " ")
  b <- strsplit(a,"title")

    for(j in 1:length(b[[1]])){
     if( grepl("Mark Lloyd",tolower(b[[1]][j])) == T){
     ceo<-"CEO"
     ppersonname <- gsub("class.*","",b[[1]][j])
     ppersonname <- gsub("\\(.*",gsub(">",trimws(gsub("[\"]",gsub("=",ppersonname)))))
     ppersonname <- gsub("[^[:alnum:][:blank:]?&/\\-]",ppersonname)
     ppersonname <- gsub("/",ppersonname)
  
  vvurl <- paste("icobench.com",gsub("[']",gsub("[(]",gsub(".*url",gsub(");.*",b[[1]][j])))),sep = "")
  eextension <- gsub(".*\\.",b[[1]][j])))))
  
  GET(vvurl,write_disk(paste(paste("file_path",sep = ""),ppersonname,"_",ceo,founder,paste(".",eextension,sep="")))
      }
    }
  }
  print(i)
}

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)