我正在尝试解析日期,当我从cvs文件中读取数据时.我使用的命令是
df = pd.read_csv('/Users/n....', names=names, parse_dates=['date']) )
它一般都在处理我的文件.
但我有几个数据集,其日期格式各不相同.我的意思是它的日期格式是这样的(09/20/15 09:59),而在其他行中有另一种格式就像是(2015-09-20 10:22:01.013)在同一个文件中.我上面写的命令对这些文件不起作用.它在我删除时工作(parse_dates = [‘date’]),但那次我不能使用date列作为datetime格式,它将该列读为整数.我很感激有人可以回答这个问题!
解决方法:
Pandas read_csv接受date_parser
参数,您可以定义自己的日期解析函数.例如,在您的情况下,您可以使用两种不同的日期时间格式:
import datetime
def date_parser(d):
try:
d = datetime.datetime.strptime("format 1")
except ValueError:
try:
d = datetime.datetime.strptime("format 2")
except:
# both formats not match, do something about it
return d
df = pd.read_csv('/Users/n....',
names=names,
parse_dates=['date1', 'date2']),
date_parser=date_parser)
然后,您可以在这些列中以不同格式解析这些日期.