Python:在数据的直方图上可视化正常曲线

在此先感谢任何帮助或提示.

我正在尝试将我的数据框列之一的拟合法线可视化.到目前为止,我已经能够通过以下方式绘制直方图:

df.radon_adj.hist(bins=30)

我是’template‘,但我遇到了错误.

import pylab as py
import numpy as np
from scipy import optimize

# Generate a 
y = df.radon_adj
data = py.hist(y, bins = 25)

# Equation for Gaussian
def f(x, a, b, c):
    return a * py.exp(-(x - b)**2.0 / (2 * c**2))

# Generate data from bins as a set of points 
x = [0.5 * (data[1][i] + data[1][i+1]) for i in xrange(len(data[1])-1)]
y = data[0]

popt, pcov = optimize.curve_fit(f, x, y)

x_fit = py.linspace(x[0], x[-1], 100)
y_fit = f(x_fit, *popt)

plot(x_fit, y_fit, lw=4, color="r")

解决方法:

我不会通过定义高斯方程来重新发明轮子.站在scipy包的肩膀上:

from scipy.stats import norm  
df = pd.DataFrame({'A': np.random.normal(size=100)})

df.A.plot(kind='hist', normed=True)

range = np.arange(-4, 4, 0.001)
plt.plot(range, norm.pdf(range,0,1))

请注意,这里唯一的“魔法”是确保直方图是标准的.

相关文章

转载:一文讲述Pandas库的数据读取、数据获取、数据拼接、数...
Pandas是一个开源的第三方Python库,从Numpy和Matplotlib的基...
整体流程登录天池在线编程环境导入pandas和xrld操作EXCEL文件...
 一、numpy小结             二、pandas2.1为...
1、时间偏移DateOffset对象DateOffset类似于时间差Timedelta...
1、pandas内置样式空值高亮highlight_null最大最小值高亮背景...