pandas

Series

apply

pandas的s.apply§相当于s中的数据使用p函数

在这里插入图片描述

drop

Return Series with specified index labels removed.

在这里插入图片描述

axis

axis=0表示跨行,axis=1表示跨列

在这里插入图片描述

dropna

Remove missing values.

在这里插入图片描述


Remove missing values.

transformer

import pandas as pd
import numpy as np

from sklearn.base import TransformerMixin

class DataFrameImputer(TransformerMixin):

    def __init__(self):
        """Impute missing values.

        Columns of dtype object are imputed with the most frequent value 
        in column.

        Columns of other types are imputed with mean of column.

        """
    def fit(self, X, y=None):

        self.fill = pd.Series([X[c].value_counts().index[0]
            if X[c].dtype == np.dtype('O') else X[c].mean() for c in X],
            index=X.columns)

        return self

    def transform(self, X, y=None):
        return X.fillna(self.fill)

data = [
    ['a', 1, 2],
    ['b', 1, 1],
    ['b', 2, 2],
    [np.nan, np.nan, np.nan]
]

X = pd.DataFrame(data)
xt = DataFrameImputer().fit_transform(X)

print('before...')
print(X)
print('after...')
print(xt)

concat

连接 Concatenate Series.

在这里插入图片描述

drop

在这里插入图片描述

notnull

在这里插入图片描述

enumerate

在这里插入图片描述


在这里插入图片描述

loc

根据列提取

在这里插入图片描述

get_dummies

在这里插入图片描述

  1. https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.apply.html
  2. https://blog.csdn.net/nuaadot/article/details/78304642

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...