.local.Object，...中的ViSEAGO :: create_topGOdata错误：allGenes必须是2级因子

问题描述

我正在尝试对在r中生成的RNAseq数据进行GO分析。我感兴趣的DEG列表称为GRL4v3VisData，而我的背景列表是具有至少1个转录本的基因的全部集合名称。这应该使统计数据比斑马鱼基因组上的所有基因更有力。

＃使用以下方式安装ViseaGO

if (!requireNamespace("BiocManager",quietly = TRUE))
  install.packages("BiocManager")

BiocManager::install("ViSEAGO")

＃从wd上传数据表

GRL4v3VisData<-data.table::fread("GRL4v3ResultsViseaGO.txt",select = c("ensembl","padj"))

background <- data.table::fread("GRBgViseago.txt","padj"))

输入数据： GRL4v3VisData是2836个变量的2836个观测值

> head(GRL4v3VisData)
          ensembl      padj
1: ENSDARG00000028396 1.76e-115
2: ENSDARG00000023587  2.46e-58
3: ENSDARG00000075666  5.46e-47
4: ENSDARG00000043154  3.98e-44
5: ENSDARG00000039682  9.37e-42
6: ENSDARG00000022631  3.62e-40

背景是1个变量的18726个观测值

> head(background)
          ensembl
1: ENSDARG00000113107
2: ENSDARG00000084828
3: ENSDARG00000093924
4: ENSDARG00000102104
5: ENSDARG00000113105
6: ENSDARG00000103050

＃从Ensembl创建所有GO注释的对象

Ensembl <- ViSEAGO::Ensembl2GO(biomart = "genes",host = "www.ensembl.org",version = NULL)

＃使用Ensembl的GO注释对Zebrafish基因组进行注释

myGENE2GO<-ViSEAGO::annotate("drerio_gene_ensembl",Ensembl)

＃创建生物过程的topGOdata：输入为：基因选择，基因背景，使用的#GO术语类别（MF，BP或CC），GO术语（nodeSize）的注释基因最少。

BP<-ViSEAGO::create_topGOdata(genesel=GRL4v3VisData,allGenes=background,gene2GO=myGENE2GO,ont="BP",nodeSize=5)

结果是：

Error in .local(.Object,...) : allGenes must be a factor with 2 levels

我想知道这是否是因为它正在比较两个文件的行名，它们是整数而不是确切的Ensembl ID？我了解错误或正确的因素应为0或1，但不确定如何解决此问题。

请帮助！

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

r r rna-seq