CSR矩阵:如何用np.nan而不是0替换缺失值?

问题描述

认情况下,似乎csr_matrix0填充了缺失值。那么如何用np.nan填充缺失的值?

from scipy.sparse import csr_matrix
row = np.array([0,1,2,2])
col = np.array([0,2])
data = np.array([0,3,4,5,6])
csr_matrix((data,(row,col)),shape=(3,3)).toarray()

输出

array([[0,2],[0,3],[4,6]])

预期:

array([[0,np.nan,[np.nan,6]])

解决方法

csr_matrix不可能,因为它定义为存储非零元素。

如果您真的需要这些nan,只需操纵密集的结果即可。

a=csr_matrix((data,(row,col)),shape=(3,3)).toarray()
a[a == 0] = np.nan
,

这是一个解决方法:

from scipy.sparse import csr_matrix
row = np.array([0,1,2,2])
col = np.array([0,2])
data = np.array([0,3,4,5,6])

mask = csr_matrix(([1]*len(data),3)).toarray()
mask[mask==0] = np.nan

csr_matrix((data,3)).toarray() * mask