为什么当我的函数 jax.grad 中有 np.power 时不能给我导数?

问题描述

我想训练一个简单的线性模型。 x 和 y 下面的这些是我的数据。

import numpy as np
x = np.linspace(0,1,100)
y = 2 * x + 3 + np.random.randn(100)

f 是计算所有数据均方误差的函数

def f(params,x,y):
  return np.mean(np.power((params['w'] * x + params['b'])-y,2))

from jax import grad
df = grad(f)
params = dict()
#initialize parameters
params['w'] = 2.4
params['b'] = 10.
df(params,y) # I will do this in a loop (implementing gradient decent part

这给了我一个错误

FilteredStackTrace: jax._src.errors.TracerArrayConversionError: The numpy.ndarray conversion method __array__() was called on the JAX Tracer object Traced<ConcreteArray

当我清除 np.power 代码时有效。为什么?

解决方法

JAX 无法计算 numpy 函数的梯度,但可以计算 jax.numpy 函数的梯度。如果您根据 jax.numpy 重写代码,它应该适合您:

import numpy as np
x = np.linspace(0,1,100)
y = 2 * x + 3 + np.random.randn(100)

import jax.numpy as jnp
def f(params,x,y):
  return jnp.mean(jnp.power((params['w'] * x + params['b'])-y,2))

from jax import grad
df = grad(f)
params = dict()

params['w'] = 2.4
params['b'] = 10.
df(params,y)
# {'b': DeviceArray(14.661432,dtype=float32),#  'w': DeviceArray(7.3792152,dtype=float32)}

您可以在 TracerArrayConversionError documentation page 中阅读更多详细信息。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...