pandas 面试题挑战五

------------恢复内容开始------------

计算两个Series之间的均方误差

现有两个Series如下:

truth = pd.Series(range(10))
pred = pd.Series(range(10)) + np.random.random(10)

计算两个Series之间的均方误差
解决办法:

np.mean((truth-pred)**2)

输出

0.4910588102724459

把Series中字符串的打头字母转化为大写

现有Series如下:

ser = pd.Series(['how',tokickass?'])

把打头字母转化为大写
解决办法如下:

ser.map(lambda x: x.title())

输出

0     How
1      To
2    Kick
3    Ass?
dtype: object

计算每个Series中字符串的长度

现有Series如下:

ser = pd.Series(['])

计算每个字符串的长度
解决方法如下:

ser.map(lambda x: len(x))

输出

0    3
1    2
2    4
3    4
dtype: int64

计算Series中每个元素与前面元素的差值

现有Series如下

ser = pd.Series([1,3,6,10,15,21,27,35])

计算每个元素与前面元素的差值
解决方法如下:

print(ser.diff().tolist())

输出

[nan,2.0,3.0,4.0,5.0,6.0,8.0]

如何把日期的字符串转换为时间序列

现有Series如下:

ser = pd.Series([01 Jan 201002-02-2011201203032013/04/042014-05-052015-06-06T12:20'])

进行转换如下:

pd.to_datetime(ser)

输出:

0   2010-01-01 00:00:00
1   2011-02-02 00:00:00
2   2012-03-03 00:00:00
3   2013-04-04 00:00:00
4   2014-05-05 00:00:00
5   2015-06-06 12:20:00
dtype: datetime64[ns]

 

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...