在大表的每一行上完成一个函数的最简单方法是什么?

问题描述

所以我想对 3000+ 行表的每一行进行 Fisher 精确测试(一侧),其格式与以下示例相匹配

基因 sample_alt sample_ref population_alt population_ref
一个 4 556 770 37000
两个 5 555 771 36999
三个 6 554 772 36998

理想情况下,我想让表格的另一列等同于

[(4+556)!(4+770)!(770+37000)!(556+37000)!]/[4!(556!)770!(37000!)(4+556+770+) 37000)!]

对于第一行数据,依此类推,对于表格的每一行。

我知道如何在 R 中对简单的 2x2 表进行 Fisher 测试,但我不知道如何将 fisher.test() 函数应用于大表的每一行。我也不能使用 excel 公式,因为数字随着阶乘变得太大,以至于它们达到 excel 的位数限制并导致 #NUM 错误。简单地完成此操作的最佳方法是什么?提前致谢!

解决方法

以桌面上的制表符分隔的文本文件(table.txt)开头,格式与词干问题中显示的格式相同

if(!require(psych)){install.packages("psych")}

multiFisher = function(file="Desktop/table.txt",saveit=TRUE,outfile="Desktop/table.csv",progress=T,verbose=FALSE,digits=3,... )
  
{

require(psych)

Data = read.table(file,skip=1,header=F,col.names=c("Gene","MD","WTD","MC","WTC"),...)

if(verbose){print(str(Data))}

Data$Fisher.p   = NA
Data$phi        = NA
Data$OR1        = format(0.123,nsmall=3)
Data$OR2        = NA

if(progress){cat("\n")}

for(i in 1:length(Data$Gene)){
  
  Matrix = matrix(c(Data$WTC[i],Data$MC[i],Data$WTD[i],Data$MD[i]),nrow=2)
  
  Fisher = fisher.test(Matrix,alternative = 'greater')

  Data$Fisher.p[i] = signif(Fisher$p.value,digits=digits) 

  Data$phi[i] = phi(Matrix,digits=digits)
  
  OR1 = (Data$WTC[i]*Data$MD[i])/(Data$MC[i]*Data$WTD[i])
  OR2 = 1 / OR1
  
  Data$OR1[i] = format(signif(OR1,digits=digits),nsmall=3)
  
  Data$OR2[i] = signif(OR2,digits=digits)
  
  if(progress) {cat(".")}

}  

if(progress){cat("\n"); cat("\n")}

if(saveit){write.csv(Data,outfile)}

return(Data)

}

multiFisher()

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...