问题描述
在 R
中,我尝试根据 ICO 的 URL 和 CEO 的姓名从 ICOBench.com 网站下载 CEO 的个人资料图片。
我在 excel file (5Cx5L)
中有基本信息,如下所示:
col1 = ref col2 = nameICO col3 = token col4 = URL col5 = CEO
第一行的示例:
1
Max Crowdfund
MPG
https://icobench.com/ico/max-crowdfund
mark lloyd
我在这里尝试做的是:
在 excel
文件中查找 ICO URL,进入团队网页,找到 CEO(根据文件中的名称),然后将其图片下载到我的计算机上。
我尝试了下面的 code
(我应该说是混合代码:-),我访问了网页并“检查” 以查找参数。但也许我错过了 "href" 参数?
虽然它似乎没有“错误”,但它并没有那么清楚地下载任何图片,这不是我想让他做的:-/
您将在下面看到,不是每次都告诉 R
去查找每一行的名称,而是将其缩小到与 CEO Mark Lloyd 合作的第一个 ICO。主要是因为我还没到名字的查找部分...
请问,有人可以帮忙吗?
我采用了这种方法,但我认为还有其他方法可以做到这一点,所以真的
欢迎任何提示,也在 Python
(如果更好?)
谢谢!
icoss <- read_excel(input_file)
for(i in 1:nrow(icoss)){
dir.create(paste("file_path_computer",icoss[i,1],"/",sep = ""))
urls <- as.character(icoss[i,4])
teamm <- read_html(paste(urls,"/team",sep = ""))
teamm <- html_nodes(teamm,".row")
a <- paste(((as.character(teamm[3:length(teamm)-2]))),collapse = " ")
b <- strsplit(a,"title")
for(j in 1:length(b[[1]])){
if( grepl("Mark Lloyd",tolower(b[[1]][j])) == T){
ceo<-"CEO"
ppersonname <- gsub("class.*","",b[[1]][j])
ppersonname <- gsub("\\(.*",gsub(">",trimws(gsub("[\"]",gsub("=",ppersonname)))))
ppersonname <- gsub("[^[:alnum:][:blank:]?&/\\-]",ppersonname)
ppersonname <- gsub("/",ppersonname)
vvurl <- paste("icobench.com",gsub("[']",gsub("[(]",gsub(".*url",gsub(");.*",b[[1]][j])))),sep = "")
eextension <- gsub(".*\\.",b[[1]][j])))))
GET(vvurl,write_disk(paste(paste("file_path",sep = ""),ppersonname,"_",ceo,founder,paste(".",eextension,sep="")))
}
}
}
print(i)
}
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)