.local.Object,...中的ViSEAGO :: create_topGOdata错误:allGenes必须是2级因子

问题描述

我正在尝试对在r中生成的RNAseq数据进行GO分析。 我感兴趣的DEG列表称为GRL4v3VisData,而我的背景列表是具有至少1个转录本的基因的全部集合名称。这应该使统计数据比斑马鱼基因组上的所有基因更有力。

#使用以下方式安装ViseaGO

if (!requireNamespace("BiocManager",quietly = TRUE))
  install.packages("BiocManager")

BiocManager::install("ViSEAGO")

#从wd上传数据表

GRL4v3VisData<-data.table::fread("GRL4v3ResultsViseaGO.txt",select = c("ensembl","padj"))

background <- data.table::fread("GRBgViseago.txt","padj"))

输入数据: GRL4v3VisData是2836个变量的2836个观测值

> head(GRL4v3VisData)
          ensembl      padj
1: ENSDARG00000028396 1.76e-115
2: ENSDARG00000023587  2.46e-58
3: ENSDARG00000075666  5.46e-47
4: ENSDARG00000043154  3.98e-44
5: ENSDARG00000039682  9.37e-42
6: ENSDARG00000022631  3.62e-40

背景是1个变量的18726个观测值

> head(background)
          ensembl
1: ENSDARG00000113107
2: ENSDARG00000084828
3: ENSDARG00000093924
4: ENSDARG00000102104
5: ENSDARG00000113105
6: ENSDARG00000103050

#从Ensembl创建所有GO注释的对象

Ensembl <- ViSEAGO::Ensembl2GO(biomart = "genes",host = "www.ensembl.org",version = NULL)

#使用Ensembl的GO注释对Zebrafish基因组进行注释

myGENE2GO<-ViSEAGO::annotate("drerio_gene_ensembl",Ensembl)

#创建生物过程的topGOdata:输入为:基因选择,基因背景, 使用的#GO术语类别(MF,BP或CC),GO术语(nodeSize)的注释基因最少。

BP<-ViSEAGO::create_topGOdata(geneSel=GRL4v3VisData,allGenes=background,gene2GO=myGENE2GO,ont="BP",nodeSize=5)

结果是:

Error in .local(.Object,...) : allGenes must be a factor with 2 levels

我想知道这是否是因为它正在比较两个文件的行名,它们是整数而不是确切的Ensembl ID?我了解错误或正确的因素应为0或1,但不确定如何解决此问题。

请帮助!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...