如何在python或R中分割带有编码为分隔符的txt文件?

问题描述

'þ'和'ÿ'是分隔符

1þ2þ3þ4þ5þ6ÿ7

1þ2þ3þ4þ5þ6ÿ7

输出数据帧应如下

1 2 3 4 5 6 7

1 2 3 4 5 6 7

我尝试将熊猫与以下内容一起使用来阅读,但没有用

df= pd.read_csv('~/Desktop/File.txt',encoding ='iso-8859-1',sep='[þ,ÿ]',engine ="python",header=None)

解决方法

这对我有用:

df= pd.read_csv('~/Desktop/File.txt',sep='[þ,ÿ]',engine ="python",header=None)
,

您可以尝试以下方法:

my_cols = [str(i) for i in range(7)]
df = pd.read_csv('test.csv',sep='þ|ÿ',engine='python',names=my_cols,header=None)
print(df)

   0  1  2  3  4  5  6
0  1  2  3  4  5  6  7
1  1  2  3  4  5  6  7