在python中计算相关矩阵的最有效方法

问题描述

我需要计算 5000 种产品的销售相关性,这将产生 5000 x 5000 的相关矩阵。我正在尝试使用 df.corr() 在 Pandas 中完成此操作,但它导致内存问题。有没有更有效的方法来实现这一目标?

解决方法

使用 np.corrcoef...我能够在不到一分钟的时间内处理矩阵。