问题描述
将因变量可视化为两个其他自变量的最佳方法是什么,其中每个自变量都是数据场的一列?
df= [ A: {0.96,1.12,0.93,1.34,1.04,0.92,1.52}
B: {55,62,58,64,70,71,66}
c: {0.66,0.63,0.69,0.71,0.68,0.64,0.69}]
df
是A,B,C三列的数据框:
我想将C绘制为A和B的函数(通过轮廓图或冲浪图或任何其他建议得到赞赏) 请注意,我有数百万个数据点,其中有些重叠。谢谢。
解决方法
假设您的自变量彼此完全独立(即,对于ID1的1个值,您只有ID2的1个值),我猜想三维图将是一个很好的观察方法。另外,您可以将带有“热”样式颜色的二维图形用于第二个独立变量。
,一个选项是对statsmodels.formula.api使用多元回归,进行预测,然后为视觉化绘制预测。这种语法使您可以一次查看多个独立变量。
results = smf.ols('income ~ educ + age',data=samples).fit()
此链接可能对您有所帮助:https://www.statsmodels.org/stable/index.html