rentrez entrez_summary过早的EOF

问题描述

尝试摆脱RISmed带来的麻烦(请参阅Problems with RISmed and large(ish) data sets),我决定使用rentrez和entrez_summary从查询中检索大量发布的标题

set_entrez_key("######") #I did provide my real API key here
Sys.getenv("ENTREZ_KEY")
rm(list=ls())
library(rentrez)
query="(United States[AD] AND France[AD] AND 1995:2020[PDAT])"
results<-entrez_search(db="pubmed",term=query,use_history=TRUE)
results
results$web_history
for (seq_start in seq(0,results$count,100)) {
    if (seq_start == 0) {
        summary.append.l <- entrez_summary(
            db = "pubmed",web_history = results$web_history,retmax = 100,retstart = seq_start
        )
    } 
    Sys.sleep(0.1) #slow things down in case THAT'S a factor here....
    summary.append.l <- append(
        summary.append.l,entrez_summary(
            db = "pubmed",retstart = seq_start
        )
    )
}

好消息...我没有像RISMed和EUtilsGet那样受到NCBI的强烈反对。坏消息……还没有完成。 (我要么得到

Error in curl::curl_fetch_memory(url,handle = handle) : 
  transfer closed with outstanding read data remaining

Error: parse error: premature EOF
                                       
                     (right here) ------^

我几乎认为在查询中使用从属关系搜索字符串是有问题的,因为如果我将查询更改为

query="monoclonal[Title] AND antibody[Title] AND 2010:2020[PDAT]"

它完成了运行,尽管要处理的记录数量大约相同。那么...有什么主意为什么特定的搜索字符串会导致NCBI服务器出现问题?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)