创建data frame
f = pd.DataFrame(np.random.randn(3,4),index=pd.date_range('20160101',periods=3),columns = list('abcd'))
给一个字典来创建
df2 = pd.DataFrame({ 'A' : 1.,'B' : pd.Timestamp('20130102'),'C' : pd.Series(1,index=list(range(4)),dtype='float32'),'D' : np.array([3] * 4,dtype='int32'),'E' : pd.Categorical(["test","train","test","train"]),'F' : 'foo' })
df.column
df['column']
获取所有列类型 df.dtypes
获取索引 df.index
根据index倒序 df.sort_index(axis=0,ascending=False)
获取部分行和列返回一个子df df['2016-01-01':'2016-01-02',['b','d']]
获取某行某列对应的值 df.loc[dates[0],'A']
根据位置来获取某行 df.iloc[2,1]
列筛选 df[df.a > 0]
全筛选df[df>0]
全部正数变为负数df[df>0] = -df
添加一列df['e'] = np.nan
填充NaN
df1.fillna(value=5)