问题描述
我只是想在这里了解使用scipy.sparse.csr_matrix
的优势。我知道它可以整体上加快庞大而稀疏矩阵的计算速度,但是有没有更好的方法可以迭代其中所有有效的正项?另外,最好使用np.array
或csr_matrix
计算行/列的平均值吗?
from numpy import np
from scipy.sparse import csr_matrix
from random import shuffle
# sparse matrix with missing values = 0
S = csr_matrix((np.linspace(1,29,1000),(shuffle(np.arange(1000)),shuffle(np.arange(1000)))),shape=(1000,1000))
# sparse matrix with missing values = NaN
A = S.toarray()
A = (A==0)*np.nan + A
def dosomething():
dosomething
# iterate over all valid entries
m,n = A.shape
for i in range(m):
for j in range(n):
if not np.isnan(A[i,j]):
dosomething()
for i in range(m):
for j in range(n):
if S[i,j]>0:
dosomething()
# calculate column averages
A_col_avg = np.nansum(A,axis=0) / (m - np.sum(np.isnan(A),axis=0))
A = A - A_col_avg
S_col_avg = np.sum(S,axis=0) / np.sum((S>0),axis=0)
S = S - S_col_avg
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)