问题描述
| Column A | Column B | Column C | Column D |
---------------------------------------------------
| "100053 | \"253\" | \"Apple\"| \"2020-01-01\" |
| "100056 | \"254\" | \"Apple\"| \"2020-01-01\" |
| "100063 | \"255\" | \"Choco\"| \"2020-01-01\" |
我尝试过:
df = pd.read_csv("file_name.csv",sep='\t',low_memory=False)
但是我得到的输出是
| Column A | Column B | Column C | Column D |
-------------------------------------------------------------
| 100053\t\253\" | \"Apple\" | \"2020-01-01\"| |
| 100056\t\254\" | \"Apple\" | \"2020-01-01\"| |
| 100063\t\255\" | \"Choco\" | \"2020-01-01\"| |
如何在各个列中以正确的格式获取输出,并删除所有多余的字符? 我尝试了定界符,escapechar ..的不同变体..但是没有运气。也许我想念什么?
编辑:我想出了摆脱外部字符的方法
df["ColumnB"]=df["ColumnB"].map(lambda x: str(x)[2:-2])
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)