Python-子集-当关键字再次出现在第1列中时,通过巨大的日志文件创建新的数据框?分别保存每个数据框

问题描述

我有一个带有20000个数据行的长日志文件,由KEyword表分隔。每当关键字表再次出现时,我都可以创建一个新的数据框吗?

我目前的修复开始和结束方法无法满足以下要求:

def create_dataframe(df):
    start = 16920
    end = 17632
    df = df.iloc[start:end,:].reset_index(drop=True)
    return df

我的数据集如下表:

0   0   0   0   0   0   0
Table   COST                    
REAL    REAL    REAL    REAL            
IDnxska52P  154564564   421564564   364564564   456456  35635   
Table   Instruments 421564564   364564564   456456  53536   
STRING  REAL    REAL    REAL    REAL    REAL    REAL
IDnxska52P  3,5 50  3,5 50
IDnxska53P  6,5 7,5 6,5
IDnxska54P  3,5 50
IDnxska55P  6,5
IDnxska56P  3,5 50  6,5
Table   PC  50  6,5
STRING  REAL    REAL    REAL    REAL    REAL    REAL
HTZ30    0.000000000000000E+00   0.000000000000000E+00   0.000000000000000E+00   0.000000000000000E+00   0.000000000000000E+00   0.000000000000000E+00
HTZ31    0.000000000000000E+01   0.000000000000000E+01   0.000000000000000E+00   0.000000000000000E+01   0.000000000000000E+01   0.000000000000000E+01
HTZ30    0.000000000000000E+02   0.000000000000000E+02   0.000000000000000E+00   0.000000000000000E+02   0.000000000000000E+02   0.000000000000000E+02
HTZ31    0.000000000000000E+03   0.000000000000000E+03   0.000000000000000E+00   0.000000000000000E+03   0.000000000000000E+03   0.000000000000000E+03
HTZ32    0.000000000000000E+04   0.000000000000000E+04   0.000000000000000E+00   0.000000000000000E+04   0.000000000000000E+04   0.000000000000000E+04
HTZ33    0.000000000000000E+05   0.000000000000000E+05   0.000000000000000E+00   0.000000000000000E+05   0.000000000000000E+05   0.000000000000000E+05
HTZ34    0.000000000000000E+06   0.000000000000000E+06   0.000000000000000E+00   0.000000000000000E+06   0.000000000000000E+06   0.000000000000000E+06
HTZ35    0.000000000000000E+07   0.000000000000000E+07   0.000000000000000E+00   0.000000000000000E+07   0.000000000000000E+07   0.000000000000000E+07
HTZ36    0.000000000000000E+08   0.000000000000000E+08   0.000000000000000E+00   0.000000000000000E+08   0.000000000000000E+08   0.000000000000000E+08
HTZ37    0.000000000000000E+09   0.000000000000000E+09   0.000000000000000E+00   0.000000000000000E+09   0.000000000000000E+09   0.000000000000000E+09
HTZ38    0.000000000000000E+10   0.000000000000000E+10   0.000000000000000E+00   0.000000000000000E+10   0.000000000000000E+10   0.000000000000000E+10
HTZ39    0.000000000000000E+11   0.000000000000000E+11   0.000000000000000E+00   0.000000000000000E+11   0.000000000000000E+11   0.000000000000000E+11
HTZ40    0.000000000000000E+12   0.000000000000000E+12   0.000000000000000E+00   0.000000000000000E+12   0.000000000000000E+12   0.000000000000000E+12
HTZ41    0.000000000000000E+13   0.000000000000000E+13   0.000000000000000E+00   0.000000000000000E+13   0.000000000000000E+13   0.000000000000000E+13
HTZ42    0.000000000000000E+14   0.000000000000000E+14   0.000000000000000E+00   0.000000000000000E+14   0.000000000000000E+14   0.000000000000000E+14
HTZ43    0.000000000000000E+15   0.000000000000000E+15   0.000000000000000E+00   0.000000000000000E+15   0.000000000000000E+15   0.000000000000000E+15
HTZ44    0.000000000000000E+16   0.000000000000000E+16   0.000000000000000E+00   0.000000000000000E+16   0.000000000000000E+16   0.000000000000000E+16

您能帮我分离所有数据框并将其保存为唯一数据框吗? df1,df2,df3等。

我想使用的关键字是TABLE ,但我不知道如何。

访问数据文件http://www.filedropper.com/sample_172

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)