计算字符串中给定字符的概率多项式似然

问题描述

我有几个示例,其中每个示例都有两个字符串。一个是原始字符串,另一个是替代字符串。例如,如果您考虑以下情况(下面附加的数据框图像中的第一个示例):

org_string = 'TACCA'
alternative_string = 'CGTTG'

enter image description here

对于每个字符,我都有每个替代字符的计数和频率。例如,在原始字符串中,我们在索引0处有一个 T (在图像中为 ref 列),在替代字符串中(该列为 > alt (在所附图片中)。因为我们对其进行了18次采样(请参见附件中的 AN )。只有1次(请参见图片中的 AC ),我们获得了 C ,频率为1/18 = 0.056(请参见图片中的 AF 列)附件)。我想计算在python中每个位置给定频率下观察计数的可能性。我正在考虑在python中使用script.stats.multinomial。但是我不太了解如何在这种情况下使用它。这是多项式,因为在给定位置字符可以是 A,G,C或T 。见解会有所帮助。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)