如何制作对角张量,为什么Tensorflow linalg.tensor_diag不这样做?

问题描述

我认为对角张量是形状(d1,...,dr)的张量t,除非分量相等,否则它们都为零。 因此,除非i == j == k == l,否则t [i,j,k,l] = 0。 创建此类张量的函数应采用形状(d1,...,dr)和长度为min(d1,...,dr)的向量[a1,...,ak],并将这些值沿对角线。

我想在Tensorflow中执行此操作,而我能找到的最相关的功能是tf.linalg.tensor_diag,但它并不能满足我的要求。例如,对角线输入是张量,输出张量始终是等级的两倍,因此永远不会输出奇数等级的张量。

文档说:“给出一个对角线,此操作将返回一个带有对角线的张量,其他所有内容都填充零”,但我不知道如何将其与实际行为相平方。

我的问题分为两个部分:

  1. 在TF中创建我称之为对角张量的最佳方法是什么?还有这个名字吗?

  2. 为什么linalg.tensor_diag像这样工作?预期用途是什么?

这是示例输出:

>>> tf.linalg.tensor_diag([1,2],[3,4]])

<tf.Tensor: shape=(2,2,2),dtype=int32,numpy=
array([[[[1,0],[0,0]],[[0,0]]],[[[0,4]]]],dtype=int32)>```

解决方法

因此,考虑这一点有些棘手,但我将尝试解释这种想法。

如果您进行tf.linalg.tensor_diag([1,2,3,4]),则可以直观地得出具有该对角线的矩阵:

[[1,0],[0,4]]

请注意,您从排名1上升到排名2,排名增加了一倍。因此,要“对角线化”,最终将使排名翻倍。

现在,您的问题tf.linalg.tensor_diag([[1,2],[3,4]])传递的是一个矩阵,因此为2级

[[1,4]]

但是现在,如何将其对角线化?因此它是2级,遵循该模式意味着我们将最终得到4级。在前面的示例中,对角线化将向量“拉”到较高的等级。而且“拉起”的每一步都从对角线取一个值并将其放在那里。

因此,此矩阵也将被“拉起”,并且每一步都留下一个值。因此,它将[[0,0]]变成4个正方形,并在每个正方形中减去该值。这会给我们

[[1,0]]
[[0,4]]

如果事物最初是原始的,那么最后它们将被“分组”(例如[1,2] idk怎么说更好),从而得出最终结果

[
 [
  [[1,0]],[[0,0]]
 ],[
  [[0,4]]
 ]
]

这确实使我们获得了第4名的成绩?

注意:您可能希望查看其他diag function,以使更多人尝试这样做

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...