在Python Pandas中读取带有反斜杠和引号作为分隔符的csv文件

问题描述

我有一个csv文件,其数据在记事本中显示如下:

| Column A | Column B | Column C |    Column D    |
---------------------------------------------------
| "100053  | \"253\"  | \"Apple\"| \"2020-01-01\" |
| "100056  | \"254\"  | \"Apple\"| \"2020-01-01\" |
| "100063  | \"255\"  | \"Choco\"| \"2020-01-01\" |

我尝试过:

df = pd.read_csv("file_name.csv",sep='\t',low_memory=False)

但是我得到的输出

|    Column A     |  Column B  |    Column C   |  Column D  |
-------------------------------------------------------------
| 100053\t\253\"  | \"Apple\"  | \"2020-01-01\"|            |
| 100056\t\254\"  | \"Apple\"  | \"2020-01-01\"|            |
| 100063\t\255\"  | \"Choco\"  | \"2020-01-01\"|            |

如何在各个列中以正确的格式获取输出,并删除所有多余的字符? 我尝试了定界符,escapechar ..的不同变体..但是没有运气。也许我想念什么?

编辑:我想出了摆脱外部字符的方法

df["ColumnB"]=df["ColumnB"].map(lambda x: str(x)[2:-2])

上面的代码去除了前2个字符和后2个字符。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...