问题描述
我正在尝试对在r中生成的RNAseq数据进行GO分析。 我感兴趣的DEG列表称为GRL4v3VisData,而我的背景列表是具有至少1个转录本的基因的全部集合名称。这应该使统计数据比斑马鱼基因组上的所有基因更有力。
#使用以下方式安装ViseaGO
if (!requireNamespace("BiocManager",quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("ViSEAGO")
#从wd上传数据表
GRL4v3VisData<-data.table::fread("GRL4v3ResultsViseaGO.txt",select = c("ensembl","padj"))
background <- data.table::fread("GRBgViseago.txt","padj"))
输入数据: GRL4v3VisData是2836个变量的2836个观测值
> head(GRL4v3VisData)
ensembl padj
1: ENSDARG00000028396 1.76e-115
2: ENSDARG00000023587 2.46e-58
3: ENSDARG00000075666 5.46e-47
4: ENSDARG00000043154 3.98e-44
5: ENSDARG00000039682 9.37e-42
6: ENSDARG00000022631 3.62e-40
背景是1个变量的18726个观测值
> head(background)
ensembl
1: ENSDARG00000113107
2: ENSDARG00000084828
3: ENSDARG00000093924
4: ENSDARG00000102104
5: ENSDARG00000113105
6: ENSDARG00000103050
#从Ensembl创建所有GO注释的对象
Ensembl <- ViSEAGO::Ensembl2GO(biomart = "genes",host = "www.ensembl.org",version = NULL)
#使用Ensembl的GO注释对Zebrafish基因组进行注释
myGENE2GO<-ViSEAGO::annotate("drerio_gene_ensembl",Ensembl)
#创建生物过程的topGOdata:输入为:基因选择,基因背景, 使用的#GO术语类别(MF,BP或CC),GO术语(nodeSize)的注释基因最少。
BP<-ViSEAGO::create_topGOdata(geneSel=GRL4v3VisData,allGenes=background,gene2GO=myGENE2GO,ont="BP",nodeSize=5)
结果是:
Error in .local(.Object,...) : allGenes must be a factor with 2 levels
我想知道这是否是因为它正在比较两个文件的行名,它们是整数而不是确切的Ensembl ID?我了解错误或正确的因素应为0或1,但不确定如何解决此问题。
请帮助!
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)