问题描述
我已经提取了一个文件并得到了以下格式的文件。 XXXX 是要忽略的值。我试图做的是从数据框中提取值。我正在查看的值在 A 之后。以下是文件中的字符串的样子。第二张图是我试图获取数据框的图。
XXXXXX
XXXXX
XXXXXX
Date
Time
A
2021-01-17
2021-01-18
XXXXXX
XXXXX
XXXXXX
12
14
21
2
这就是我想让数据框看起来像的样子。
我试图读取分隔行的数据框,但不知道如何继续。
df = pd.read_csv(io.StringIO(text),sep='\n') # This puts the text into the data frame
df[7:14] # This would return a slice in the database
解决方法
import pandas as pd
import numpy as np
text = '''
# <your text value
'''
# cleaning the text
text = [j for j in [i for i in text.split('\n') if i != '' ] if j[0] != 'X']
text.insert(5,'B')
text.insert(8,'C')
text.remove('Date')
text.remove('Time')
text = [text[i*3:i*3+3] for i in range(3)]
df = pd.DataFrame(np.array(text).T)
print(df)