如何获得第 3 列的长度? Python

问题描述

我对此非常陌生,老实说我不太了解。有人可以帮我创建一个代码获取第 3 列的总和,对不起,如果这太傻了,希望你能帮助我。谢谢

这是一个标签文件

#打开文件(必须是 .tab 文件

file = open("chromosome_length.tab")

#根据READ ME文件,17号染色​​体是线粒体染色体。

##打印第 17 行

lines_to_print = [16]

for index,line in enumerate(file):
  if ( index in lines_to_print):
    print("Mitochondrial chromosome:")
    print(line)

#染色体有多长?

with open("chromosome_length.tab") as f:
    lines = f.read().split('\n')

values = [int(i.split()[2]) for i in lines]
print(sum(values))

#错误

Traceback (most recent call last):
  File "/Users/vc/Downloads/assig.py",line 19,in <module>
    values = [int(i.split()[2]) for i in lines]
  File "/Users/vc/Downloads/assig.py",in <listcomp>
    values = [int(i.split()[2]) for i in lines]
IndexError: list index out of range

Process finished with exit code 1

文件

3   NC_001135   316620
4   NC_001136   1531933
5   NC_001137   576874

解决方法

你可以这样做:

with open('chromosome_length.tab') as f:
    lines = f.read().split('\n')

values = [int(i.split()[2]) for i in lines if i]
print(sum(values))

说明:

以阅读模式打开文件chromosome_length.tab,阅读所有文本,将文本换行(\n
此时,我们的 lines 列表中有类似的内容:

[
    "1 NC1234 1234","2 NC4321 5678",...
]

为了得到每行的第3列,我们遍历lines中的每一行,将行按空格分割,所以我们有["1","NC1234","1234"],通过{{1}得到第3列} 并将其转换为 [2]

因此,我们拥有 int 列表中的所有值:values

最后,我们使用内置函数[1234,5678,...]sum()列表中的值求和并打印


UPD: 问题出在列表末尾的空字符串 values 中。为我们的 '' 循环添加过滤器 if i 解决了这个问题。


希望有帮助:)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...