问题描述
默认情况下,似乎csr_matrix
用0
填充了缺失值。那么如何用np.nan
填充缺失的值?
from scipy.sparse import csr_matrix
row = np.array([0,1,2,2])
col = np.array([0,2])
data = np.array([0,3,4,5,6])
csr_matrix((data,(row,col)),shape=(3,3)).toarray()
输出:
array([[0,2],[0,3],[4,6]])
预期:
array([[0,np.nan,[np.nan,6]])
解决方法
csr_matrix不可能,因为它定义为存储非零元素。
如果您真的需要这些nan,只需操纵密集的结果即可。
a=csr_matrix((data,(row,col)),shape=(3,3)).toarray()
a[a == 0] = np.nan
,
这是一个解决方法:
from scipy.sparse import csr_matrix
row = np.array([0,1,2,2])
col = np.array([0,2])
data = np.array([0,3,4,5,6])
mask = csr_matrix(([1]*len(data),3)).toarray()
mask[mask==0] = np.nan
csr_matrix((data,3)).toarray() * mask