删除零元素的对角线

问题描述

我正在尝试从原始形状重塑数组,以使每行的元素沿对角线下降:

np.random.seed(0) 
my_array = np.random.randint(1,50,size=(5,3))
array([[45,48,1],[ 4,4,40],[10,20,22],[37,24,7],[25,25,13]])

我希望结果看起来像这样:

my_array_2 = np.array([[45,0],[ 0,13]])

这是我所能获得的最接近的解决方案:

my_diag = []
for i in range(len(my_array)):
    my_diag_ = np.diag(my_array[i],k=0)
    my_diag.append(my_diag_)
my_array1 = np.vstack(my_diag)
array([[45,13]])

我认为可以从此处删除所有零对角线,但是我不确定该怎么做。

解决方法

使用numpy.pad的一种方式:

n = my_array.shape[1] - 1
np.dstack([np.pad(a,(i,n-i),"constant") 
           for i,a in enumerate(my_array.T)])

输出:

array([[[45,0],[ 4,48,[10,4,1],[37,20,40],[25,24,22],[ 0,25,7],13]]])
,

在numpy中可能有移位功能,但是我不熟悉,所以这里是使用熊猫的解决方案。将np.zeros连接到原始数组,并使行数等于ncols-1。然后遍历每个col并将其向下移动等于列号的数字。

import numpy as np
import pandas as pd
np.random.seed(0) 
my_array = np.random.randint(1,50,size=(5,3))
df = pd.DataFrame(np.concatenate((my_array,np.zeros((my_array.shape[1]-1,my_array.shape[1])))))

for col in df.columns:
    df[col] = df[col].shift(int(col))

df.fillna(0).values

输出

array([[45.,0.,0.],[ 4.,48.,[10.,4.,1.],[37.,20.,40.],[25.,24.,22.],[ 0.,25.,7.],13.]])
,
In [134]: arr = np.array([[45,...:        [ 4,...:        [10,...:        [37,...:        [25,13]])
In [135]: res= np.zeros((arr.shape[0]+arr.shape[1]-1,arr.shape[1]),arr.dtype)

np.diag如何索引对角线中获取提示,然后在arr的行上进行迭代:

In [136]: for i in range(arr.shape[0]):
     ...:     n = i*arr.shape[1]
     ...:     m = arr.shape[1]
     ...:     res.flat[n:n+m**2:m+1] = arr[i,:]
     ...: 
In [137]: res
Out[137]: 
array([[45,13]])
,

您可以使用简单的广播和填充为输出创建精美的索引。首先填充数据的结尾:

a = np.concatenate((a,np.zeros((a.shape[1] - 1,a.shape[1]),a.dtype)),axis=0)

现在创建一个索引,以使用它们的负索引获取元素。这将使滚动到末尾变得微不足道:

cols = np.arange(a.shape[1])
rows = np.arange(a.shape[0]).reshape(-1,1) - cols

现在只需索引:

result = a[rows,cols]

对于大型阵列,这可能不如运行小循环有效。同时,这避免了实际的循环,并允许您编写单线(但请不要这样做):

result = np.concatenate((a,axis=0)[np.arange(a.shape[0] + a.shape[1] - 1).reshape(-1,1) - np.arange(a.shape[1]),np.arange(a.shape[1])]