问题描述
如果您运行的是熊猫的最新版本,则可以使用datetime属性dt
访问datetime组件:
In [6]:
df['date'] = pd.to_datetime(df['date'])
df['year'], df['month'] = df['date'].dt.year, df['date'].dt.month
df
Out[6]:
date Count year month
0 2010-06-30 525 2010 6
1 2010-07-30 136 2010 7
2 2010-08-31 125 2010 8
3 2010-09-30 84 2010 9
4 2010-10-29 4469 2010 10
看起来您正在运行的是较早版本的熊猫,在这种情况下,以下方法将起作用:
In [18]:
df['date'] = pd.to_datetime(df['date'])
df['year'], df['month'] = df['date'].apply(lambda x: x.year), df['date'].apply(lambda x: x.month)
df
Out[18]:
date Count year month
0 2010-06-30 525 2010 6
1 2010-07-30 136 2010 7
2 2010-08-31 125 2010 8
3 2010-09-30 84 2010 9
4 2010-10-29 4469 2010 10
关于为什么它没有将其解析为日期时间,read_csv
您需要传递列的顺序位置([0]
),因为当True
它尝试解析列时,[1,2,3]
请参见文档
In [20]:
t="""date Count
6/30/2010 525
7/30/2010 136
8/31/2010 125
9/30/2010 84
10/29/2010 4469"""
df = pd.read_csv(io.StringIO(t), sep='\s+', parse_dates=[0])
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns (total 2 columns):
date 5 non-null datetime64[ns]
Count 5 non-null int64
dtypes: datetime64[ns](1), int64(1)
memory usage: 120.0 bytes
因此,如果您将参数传递parse_dates=[0]
给,read_csv
则to_datetime
加载后无需再调用“日期”列。
解决方法
抱歉,这个问题似乎是重复性的-我希望答案会让我感觉像骨头一样……但是我对使用类似问题的答案感到不满意。
我正在通过导入数据read_csv
,但是由于某种原因(我无法弄清楚),我无法从数据框系列中提取年或月df['date']
。
date Count
6/30/2010 525
7/30/2010 136
8/31/2010 125
9/30/2010 84
10/29/2010 4469
df = pd.read_csv('sample_data.csv',parse_dates=True)
df['date'] = pd.to_datetime(df['date'])
df['year'] = df['date'].year
df['month'] = df['date'].month
但这返回:
AttributeError:“系列”对象没有属性“年份”
提前致谢。
更新:
df = pd.read_csv('sample_data.csv',parse_dates=True)
df['date'] = pd.to_datetime(df['date'])
df['year'] = df['date'].dt.year
df['month'] = df['date'].dt.month
这将生成相同的“ AttributeError:“ Series”对象没有属性“ dt””
跟进:
我将Spyder 2.3.1与64位Python 3.4.1配合使用,但是无法将熊猫更新为较新的版本(当前为0.14.1)。以下每个都会生成无效的语法错误:
conda update pandas
conda install pandas==0.15.2
conda install -f pandas
有任何想法吗?