问题描述
我是python文件数据处理的新手。我有以下文本文件,其中包含新大学校园的报告。我想从“学院”列中提取数据,并为“ book_IDs_1”中的block_ABC_top提取数据,该数据为23。我还想知道在colleges列中是否还有更多的block_ABC_top出现,并找到书籍IDs_1列的值。 文本文件中可以吗?还是必须将其更改为csv?如何为该数据处理编写代码?请帮助我!
java.time
我有一个数据列表,其中包含学院的数据,例如block_ABC_top,block_ABC_top_1,block_ABC_top,block_ABC_top_1 ...这是我的以下代码 我面临的问题是..它只接受data [0]的数据。.但是我有data [0]和data [2]具有相同的学历,并且我希望检查会发生两次。
java.time.format
解决方法
print [x.split(' ')[0] for x in open(file).readlines()] #colleges column
print [x.split(' ')[3] for x in open(file).readlines()] #book_IDs_1 column
尝试运行这些。
,最好不要使用split()
函数,因为要用|
符号分隔字段,而不是使用到达字段的确切位置。您可以遍历文件的各行并进行相应的处理。
for loop...:
line_values = line.split("|")
print(line_values[0]) # block_ABC_top
,
要提取“图书ID”列数据,请使用下面的代码
with open('report.txt') as f:
for line in f:
if 'block_ABC_top' in line:
line_values = line.split('|')
print(line_values[4]) # PRINTS 23 AND 5