使用 R 从数据库导入数据时不允许重复的“row.names”

问题描述

使用这个从数据库(ArrayExpress)导入数据时 -

anno_AE <- getAE("Accessionid",path = raw_data_dir,type = "raw")
sdrf_location <- file.path(raw_data_dir,"Accessionid.sdrf.txt")
SDRF <- read.delim(sdrf_location)

此后-

rownames(SDRF) <- SDRF$Array.Data.File

出现这样的错误-

Error in `.rowNamesDF<-`(x,value = value) : 
  duplicate 'row.names' are not allowed
In addition: Warning message:
non-unique values when setting 'row.names':

如何解决这个问题?

解决方法

您可能在 SDRF$Array.Data.File 中有重复的值。尝试使用 make.unique 使值唯一。

rownames(SDRF) <- make.unique(SDRF$Array.Data.File)